<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      鴻海解析自家大語言模型FoxBrain技術(shù)亮點

      0
      分享至



      今年3月,鴻海研究院披露了自家大型語言模型FoxBrain,后來在Nvidia GTC大會中進(jìn)一步說明技術(shù)亮點,包括在預(yù)訓(xùn)練階段用LLM來過濾原始數(shù)據(jù)并分類、結(jié)合LLM和COSTAR框架來產(chǎn)出品質(zhì)更好的訓(xùn)練數(shù)據(jù),以及在后訓(xùn)練階段用LLM生成更多訓(xùn)練數(shù)據(jù)。甚至,他們也用LLM生成正確的推理過程,來強(qiáng)化FoxBrain推理能力,同時也用AI反饋強(qiáng)化學(xué)習(xí)(RLAIF)方法,來以AI為裁判,判斷FoxBrain產(chǎn)出的答案品質(zhì),用比人工更快的方式教導(dǎo)模型對齊人類價值觀。

      亮點1:用LLM過濾原始數(shù)據(jù)

      這個FoxBrain是以Llama 3.1 70B模型為基礎(chǔ),以120張H100 GPU、花4周訓(xùn)練而成,不只繁中能力超越Llama-3-Taiwan-70B,還具備良好的數(shù)學(xué)和邏輯推理能力,可執(zhí)行數(shù)據(jù)分析、決策輔助、文書協(xié)作和程序代碼生成等任務(wù)。

      FoxBrain的技術(shù)亮點之一,是用LLM來過濾原始數(shù)據(jù)和分類。鴻海研究院技術(shù)負(fù)責(zé)人Van Nhiem Tran在Nvidia GTC大會中指出,F(xiàn)oxBrain模型訓(xùn)練可分為連續(xù)預(yù)訓(xùn)練(Continual pretraining)后訓(xùn)練(Post-training)階段,在預(yù)訓(xùn)練階段,模型需要龐大訓(xùn)練數(shù)據(jù),因此團(tuán)隊從開源數(shù)據(jù)集、外部數(shù)據(jù)(如arXiv、PubMed、新聞媒體等)和內(nèi)部數(shù)據(jù)來收集訓(xùn)練數(shù)據(jù),同時根據(jù)期望模型具備的領(lǐng)域知識,來決定數(shù)據(jù)范圍,比如中英文數(shù)學(xué)和程序能力、臺灣和世界金融知識、鴻海知識、高端推理能力等。

      收集這些數(shù)據(jù)后,很重要的一步是數(shù)據(jù)過濾,篩選出可用的訓(xùn)練數(shù)據(jù)并分類。在這個階段,鴻海將收集到的141.13B Token原始數(shù)據(jù)(即1,413億個Token),先經(jīng)過一系列范式初始處理,再通過LLM進(jìn)行品質(zhì)過濾、篩掉一部分原始數(shù)據(jù),再由另一個LLM進(jìn)行領(lǐng)域分類,篩除7.33%的重復(fù)性數(shù)據(jù),最后產(chǎn)出不同子集的訓(xùn)練數(shù)據(jù)集,共97.71B Token。(如下圖)



      但如何用LLM過濾數(shù)據(jù)?Van Nhiem Tran解釋,他們設(shè)計了數(shù)據(jù)品質(zhì)評分標(biāo)準(zhǔn)與一套評分用的提示指令,當(dāng)LLM接收一筆數(shù)據(jù)后,會根據(jù)這套提示對原始數(shù)據(jù)評分。一旦超過規(guī)定分?jǐn)?shù),這筆數(shù)據(jù)就會被保留,再由另一個LLM歸類這筆數(shù)據(jù),比如科學(xué)、財經(jīng)等。有別于常見的重復(fù)性過濾,這個方法更能理解數(shù)據(jù)的語義表現(xiàn),更能篩選出高品質(zhì)數(shù)據(jù)。(如下圖)





      亮點2:用LLM強(qiáng)化訓(xùn)練數(shù)據(jù)品質(zhì)

      另一個技術(shù)亮點是用LLM來進(jìn)行數(shù)據(jù)增強(qiáng)。這一步是在數(shù)據(jù)過濾和分類后,通過LLM來改寫這些數(shù)據(jù),讓數(shù)據(jù)變得更有結(jié)構(gòu)、文意更清楚易懂,且包含更多觀點。

      要改寫數(shù)據(jù),還需要一套統(tǒng)一的標(biāo)準(zhǔn)。于是,團(tuán)隊先用COSTAR框架來設(shè)計提示,讓LLM根據(jù)提示要求,改寫數(shù)據(jù)(補(bǔ)充說明:COSTAR是常見的提示詞寫作框架,包含背景資訊Context、具體目標(biāo)Objective、寫作風(fēng)格Style、語氣Tone、受眾Audience和回復(fù)格式Response,但鴻海團(tuán)隊將其用來設(shè)計改寫提示)。比如,產(chǎn)生一份關(guān)于計算機(jī)和電子產(chǎn)品的網(wǎng)頁內(nèi)容(對應(yīng)C)、給高中生閱讀(對應(yīng)O)且簡單易懂的版本(對應(yīng)S)。(如下圖)



      有了提示標(biāo)準(zhǔn),團(tuán)隊再來要找出各類別最適合改寫的LLM,而非用一套LLM改寫所有類別的數(shù)據(jù)。因此,他們根據(jù)數(shù)據(jù)過濾和分類后產(chǎn)生的類別,分別找出各類別代表性數(shù)據(jù),再用幾個小型LLM來改寫這些數(shù)據(jù)。接著,他們用一套LLM作為評審,來評估這些改寫后的數(shù)據(jù)分?jǐn)?shù),進(jìn)而找出哪個LLM最適合改寫哪個類別。(如下圖)



      他們評估小型LLM表現(xiàn)的指標(biāo)有幾個,比如文意清晰度、初衷保留度、深度、描述性、觀點多樣性等等。他們評估的模型有Qwen 2.0、Llama 3.0與3.1、Gemma 2和DeepSeek-V2等,也成功找出各類別最適合用來改寫/增強(qiáng)的模型,比如Gemma 2最適合用來強(qiáng)化科學(xué)類數(shù)據(jù)。(如下圖)



      有了這些資訊,他們就構(gòu)建一套工作流程,來根據(jù)篩選后的數(shù)據(jù)類別,以最擅長該類別的LLM來改寫,進(jìn)而提高訓(xùn)練數(shù)據(jù)品質(zhì)。

      亮點3:用LLM生成更多訓(xùn)練數(shù)據(jù)

      上述的數(shù)據(jù)過濾分類和數(shù)據(jù)增強(qiáng),都是為預(yù)訓(xùn)練數(shù)據(jù)的準(zhǔn)備。預(yù)訓(xùn)練之后是后訓(xùn)練階段,有別于預(yù)訓(xùn)練需要大量數(shù)據(jù),后訓(xùn)練聚焦模型特定領(lǐng)域能力,通過相對少量的數(shù)據(jù)來微調(diào)。

      在這個階段,團(tuán)隊也用不少AI輔助方法,其一是用LLM生成數(shù)據(jù)。他們先用模型生成問題,再用其他LLM來回答問題,產(chǎn)出各自的答案。這時,還會有套LLM根據(jù)規(guī)則來評分這些答案并分類,最后,這些問題-答案組就會納入后訓(xùn)練數(shù)據(jù)集。(如下圖)



      亮點4:用AI輔助模型訓(xùn)練

      同樣是在后訓(xùn)練階段,團(tuán)隊還有些特別的技術(shù),來微調(diào)模型。

      其中一種方法是Adaptive Reasoning Reflection(ARRT),來讓模型學(xué)習(xí)自主推理。鴻海研究所AI所長栗永徽說明,這個方法需要團(tuán)隊準(zhǔn)備許多問題及相對應(yīng)的答案,而且,這些答案不只有最后的解答,還有中間的推理過程。為節(jié)省推理過程數(shù)據(jù)收集的時間,鴻海團(tuán)隊用AI大模型,來針對各種問題,產(chǎn)出正確的推理過程。(如下圖)



      同時,為確保模型不會一直無限制推理、消耗太多Token,鴻海團(tuán)隊還設(shè)計一種方法,來讓模型學(xué)習(xí),如何根據(jù)題目難易度來自動決定推理所需的Token量,以此作為限制條件,也就是Adaptive的意思。

      栗永徽點出,經(jīng)ARRT訓(xùn)練的FoxBrain模型變得聰明許多,與DeepSeek相比,有些簡單問題, DeepSeek可能會一直思考才給答案,但FoxBrain對難的問題會多思考,對簡單的問題則思考快一些,在適當(dāng)?shù)臅r間內(nèi)產(chǎn)出正確答案。

      除了ARRT,團(tuán)隊還用了AI反饋的強(qiáng)化學(xué)習(xí)方法(RLAIF)來進(jìn)行后訓(xùn)練,也就是以AI作為裁判,來在模型產(chǎn)出回答后,判斷回答好不好,進(jìn)而教導(dǎo)模型對齊人類偏好的答案,大幅提高效率。(如下圖)



      最后,為了讓FoxBrain更貼近實用場景、能在計算資源有限的設(shè)備上執(zhí)行,鴻海團(tuán)隊還使用壓縮技術(shù),比如剪枝、參數(shù)或權(quán)重稀疏(Sparsity)、量化等方法,來減少模型所需的內(nèi)存和計算資源,兼顧速度和模型表現(xiàn)。

      以上圖片來源/鴻海研究院

      #大數(shù)據(jù)# #鴻海# #人工智能#

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      詹姆斯:克利夫蘭承載著許多記憶我充滿感恩,哽咽是因為沉浸當(dāng)下

      詹姆斯:克利夫蘭承載著許多記憶我充滿感恩,哽咽是因為沉浸當(dāng)下

      懂球帝
      2026-01-29 12:09:05
      Angelababy所穿品牌創(chuàng)始人道歉:文化差異造成的誤會

      Angelababy所穿品牌創(chuàng)始人道歉:文化差異造成的誤會

      悠悠說世界
      2026-01-27 18:30:44
      歷史上的黃金漲勢何時開始耗盡?

      歷史上的黃金漲勢何時開始耗盡?

      匯通網(wǎng)
      2026-01-28 18:59:10
      港影:香港電影公司為何不強(qiáng)推《無雙2》和《寒戰(zhàn)3》救市?

      港影:香港電影公司為何不強(qiáng)推《無雙2》和《寒戰(zhàn)3》救市?

      唐淚
      2026-01-28 12:41:10
      第一集就重口拉滿,這部新劇太生猛啦

      第一集就重口拉滿,這部新劇太生猛啦

      來看美劇
      2026-01-28 19:46:29
      楊絳:喜歡把家里打掃很干凈的人,表面整潔,實則暴露了人生真相

      楊絳:喜歡把家里打掃很干凈的人,表面整潔,實則暴露了人生真相

      詩詞中國
      2026-01-19 20:01:58
      足壇繼續(xù)打擊“假賭黑” 去年中超16支球隊中11支被罰分 李鐵等73人終身“禁足”

      足壇繼續(xù)打擊“假賭黑” 去年中超16支球隊中11支被罰分 李鐵等73人終身“禁足”

      紅星新聞
      2026-01-29 15:43:23
      周海媚去世2年多,演員李勤勤曬出收養(yǎng)的周海媚的兩條金毛近況,并配文:以愛赴諾,跨越山海的思念與成全

      周海媚去世2年多,演員李勤勤曬出收養(yǎng)的周海媚的兩條金毛近況,并配文:以愛赴諾,跨越山海的思念與成全

      魯中晨報
      2026-01-28 21:23:06
      3選1定終身!全紅嬋無緣退役安置,效仿張家齊帶貨能穩(wěn)賺?

      3選1定終身!全紅嬋無緣退役安置,效仿張家齊帶貨能穩(wěn)賺?

      卿子書
      2026-01-18 09:27:36
      昔年混入紅軍的土匪頭子,建國后毛主席指示賀晉年:此人一定要抓

      昔年混入紅軍的土匪頭子,建國后毛主席指示賀晉年:此人一定要抓

      鶴羽說個事
      2026-01-22 11:51:54
      伊朗被包圍后,俄防長致電董軍,重大協(xié)議正落實,美航母突然后撤

      伊朗被包圍后,俄防長致電董軍,重大協(xié)議正落實,美航母突然后撤

      榮亭小吏
      2026-01-29 12:21:41
      美國大使威脅:若加拿大不推進(jìn)采購88架F-35戰(zhàn)機(jī) 美軍戰(zhàn)機(jī)將更頻繁進(jìn)入加領(lǐng)空

      美國大使威脅:若加拿大不推進(jìn)采購88架F-35戰(zhàn)機(jī) 美軍戰(zhàn)機(jī)將更頻繁進(jìn)入加領(lǐng)空

      財聯(lián)社
      2026-01-27 22:04:25
      全職媽媽熬夜學(xué)開無人機(jī):收入就是我的底氣

      全職媽媽熬夜學(xué)開無人機(jī):收入就是我的底氣

      新京報
      2026-01-28 18:43:20
      外交部:有關(guān)中國企業(yè)是通過市場方式獲得了達(dá)爾文港的租約,其合法權(quán)益應(yīng)該受到充分保護(hù)

      外交部:有關(guān)中國企業(yè)是通過市場方式獲得了達(dá)爾文港的租約,其合法權(quán)益應(yīng)該受到充分保護(hù)

      每日經(jīng)濟(jì)新聞
      2026-01-29 10:03:01
      “流氓有文化更可怕”,退休老干部頻繁聯(lián)系女幼師,聊天記錄曝光

      “流氓有文化更可怕”,退休老干部頻繁聯(lián)系女幼師,聊天記錄曝光

      妍妍教育日記
      2026-01-27 19:58:28
      “根在歐洲”,奔馳CEO拒絕將總部遷至美國

      “根在歐洲”,奔馳CEO拒絕將總部遷至美國

      觀察者網(wǎng)
      2026-01-29 15:22:07
      王菲花上百萬為李嫣治療唇裂!如今嘴是治好了,臉卻變得越來越奇怪

      王菲花上百萬為李嫣治療唇裂!如今嘴是治好了,臉卻變得越來越奇怪

      八星人
      2026-01-24 15:10:53
      退休老干部頻繁“聯(lián)系”女幼師,聊天記錄被公開,網(wǎng)友看上癮了

      退休老干部頻繁“聯(lián)系”女幼師,聊天記錄被公開,網(wǎng)友看上癮了

      烏娛子醬
      2026-01-28 16:52:21
      凈勝球優(yōu)勢出線!穆帥瘋狂慶祝 4-2皇馬逆天改命 門將98分鐘絕殺

      凈勝球優(yōu)勢出線!穆帥瘋狂慶祝 4-2皇馬逆天改命 門將98分鐘絕殺

      念洲
      2026-01-29 06:52:16
      歷史第一人!詹姆斯常規(guī)賽出場時間突破60000分鐘大關(guān)

      歷史第一人!詹姆斯常規(guī)賽出場時間突破60000分鐘大關(guān)

      大眼瞄世界
      2026-01-29 10:21:47
      2026-01-29 16:48:49
      十輪網(wǎng) incentive-icons
      十輪網(wǎng)
      聚合、聚焦科技資訊
      15202文章數(shù) 4176關(guān)注度
      往期回顧 全部

      科技要聞

      周亞輝的AI新賭局:國內(nèi)太卷 出海另起爐灶

      頭條要聞

      女大學(xué)生到東北游玩暈倒雪地凍傷 三根手指或面臨截肢

      頭條要聞

      女大學(xué)生到東北游玩暈倒雪地凍傷 三根手指或面臨截肢

      體育要聞

      詹姆斯哭了!騎士視頻致敬41歲超巨

      娛樂要聞

      張譯不再隱瞞!公開回應(yīng)退圈息影真相

      財經(jīng)要聞

      崔東樹:中國汽車未來年銷或達(dá)5000萬輛

      汽車要聞

      車長超5米還帶后輪轉(zhuǎn)向 比亞迪海豹08/海獅08將亮相

      態(tài)度原創(chuàng)

      旅游
      數(shù)碼
      親子
      房產(chǎn)
      軍事航空

      旅游要聞

      投資30億,一年收入500萬,玉龍雪山觀光火車關(guān)停的蛛絲馬跡

      數(shù)碼要聞

      這種電熱水袋國家早已禁售:別再用了

      親子要聞

      一個現(xiàn)象:縣城里的孕婦越來越少了

      房產(chǎn)要聞

      萬科難眠夜:前董事長郁亮失聯(lián),三筆債券靠深鐵才通過展期

      軍事要聞

      中國代表:支持伊朗國家穩(wěn)定 武力解決不了問題

      無障礙瀏覽 進(jìn)入關(guān)懷版