<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      Python大模型應用開發實戰:基于ChatGPT微調,附代碼(文末贈書)

      0
      分享至

      OpenA對GPT-3.5 開放微調 API,允許 AI開發人員通過專門的數據在專門的任務上實現更高的性能。OpenAI聲稱,最終的定制模型在某些特定任務上可以匹配或超過GPT-4的能力。也就是說,每個企業或個人將擁有自己的專屬OpenAI。

      OpenAI 的大語言模型 ChatGPT 已經在大量文本上進行了預訓練,而微調可以讓其更適合特定的應用場景。微調的步驟包括:準備和上傳數據;訓練新的微調模型;評估結果,并在需要時繼續迭代;微調結束后使用模型。

      在準備數據階段,OpenAI對數據集以及內容格式有一定的要求。首先要求數據集為JSONL 格式,數據格式如下:


      如果是對話式聊天格式,且預訓練模型為 gpt-3.5-turbo、babbage-002 和 davinci-002也可以按照下面的數據格式進行微調。


      準備好數據集之后,需要將數據集切分成訓練數據集和測試數據集。而每條訓練數據的大小也受到基礎模型的限制。對于 gpt-3.5-turbo-0125,每個訓練樣本限制為 16385 個Token;對于 gpt-3.5-turbo-0613,每個訓練樣本限制為 4096個 Token。超過最大長度限制的部分將被截斷。

      在進行微調之前,可以先使用數據集格式驗證工具對數據集進行檢查,以驗證數據集中的每個對話是否都符合微調接口所要求的格式;還可以通過一些輕量級分析,提前識別數據集中存在的問題,例如缺少系統/用戶消息等,并提供對消息數和Token數的統計分析,用來估算微調成本。

      下面將通過使用 Fine-Tuning UI、CLI命令和 API的方式來介紹 OpenAl的微調。

      1.使用Fine-Tuning Ul 微調

      OpenAl 支持通過 Fine-Tuning UI進行大語言模型的微調。如果要進入 OpenAI 的微調Web 頁面,需要打開相應的頁面(https://platform.openai.com/finetune),在左側的導航欄單擊"Fine-tuning"即可,如以下圖所示。


      在 Fine-tuning 頁面中,左側展示可微調的所有任務,右側展示選中任務的詳細信息單擊“+Create”按鈕就可以創建微調任務,如下圖所示。在創建微調任務的頁面,完成微調任務的創建需要如下幾個步驟:



      • 選擇基礎大模型:OpenAI提供的基礎模型有 babbage-002、davinci-002、gpt-3.5-turbo-0125、gpt-3.5-turbo-0613 和 gpt-3.5-turbo-1106。添加訓練數據集:可以上傳或者選擇一個已經存在的json1文件。添加驗證數據集:可以上傳或者選擇一個已經存在的.jsonl 文件。設置模型后綴:給輸出的模型添加一個自定義的后綴。

      • 設置隨機種子:隨機種子用來控制任務的可重復性。如果未設置種子,則會自動生成一個。

      • 配置超參數:超參數需要設置批大小、學習率和訓練周期,默認值都是 auto。

      • 創建微調任務:完成上面的步驟后,單擊“Create”即可完成訓練任務的創建。

      • 評估微調結果:通過監控微調過程,確定使用模型,還是重新迭代。

      • 使用微調模型:完成微調之后,就可以使用微調模型了。


      2.使用CLI 命令微調

      OpenAI提供了命令行工具,可以幫助我們快速處理數據集、操作文件、創建微調任務和使用模型等,下面介紹一些常用的命令行工具。

      使用命令行工具需要先安裝 openai庫,代碼如下:

      pip3 install --upgrade openai

      在需要運行的環境(Linux、macOs)中,配置 OpenAl 的 api key,代碼如下:

      export OPEN_API_KEY="自己的api key"

      使用幫助工具查看 tools 和 api 分別支持的相關命令,代碼如下:* *

      openai tools-h或openai tools --help  openai api -h或openai api --help

      從幫助工具的查看結果可以發現,命令行工具支持圖像、音頻、文件和模型等,具體使用方法見表:


      使用 prepare data 進行數據的準備,參數 -f用于指定本地的數據,代碼如下:* *

      openai tools fine_tunes.prepare_data -f ./tmp/data.txt

      準備數據的過程,會對本地數據進行分析和處理,最終生成一個新的JSONL格式的文件,如下圖所示。


      使用 fles.create 方法將數據上傳到 OpenAI服務器,參數-p用于指定文件的用途(purpose),如fine-tune、answers 和search,代碼如下:* *

      openai api files.create -f ./training_data.jsonl -p fine-tune

      創建微調任務,參數 -t用于指定訓練數據集,--model用于指定基礎模型,代碼如下:

      openai api fine_tunes.create -t 訓練文件ID --model 選擇的基礎模型

      查看所有微調任務及其狀態信息,代碼如下:

       openai api fine_tunes.list

      根據任務ID,查看微調任務的詳細信息,代碼如下:

        openai api fine_tunes.get -i 微調任務ID

      當微調任務結束并完成模型評估后,就可以使用微調后的模型了,代碼如下:

       openai api completions.create -m 模型名稱 -p 提示詞

      還可以添加更多參數來控制文本的生成,如最大生成長度、溫度和生成數量等,代碼如下:* *

       openai api completions.create -m 模型名稱-p 提示詞 --max-tokens 100 --temperature 0.7 --n 1

      通過上述示例可以看出,使用 OpenAI的 CLI命令工具,用戶可以很方便地創建微調任務,包括準備和上傳數據集文件、創建微調任務、檢查任務狀態和使用模型等。

      3.使用API微調

      對于大多數開發者而言,使用 Fime-Tuning Ul和 CLI命令微調僅用于測試。在實際的生產環境中,需要通過編程實現微調。為此,OpenAI提供了相關的 API。先初始化 OpenAI的客戶端,配置自己的 api key,代碼如下:* *

      from openai import OpenAI

      api key = "填寫自己申請的 OpenAI的 api key" client = OpenAI(api key=api key)

      假設已經準備好微調的數據集為 mydata.jsonl文件,將 mydata.json 文件上傳到 OpenAI服務器,并指定目的是fine-tune,代碼如下:

      data_file_path ="mydata.jsonl" client.files.create(file=open(data_file_path, "rb"), purpose="fine-tune")

      根據數據集返回的文件ID,基于基礎模型 gpt-3.5-turbo 創建一個微調任務,代碼如下:

      file_id ="file-xxx" client.fine_tuning.jobs.create(training_file=file_id, model="gpt-3.5-turbo", suffix="2024-07-10")

      可以對微調任務進行列出、查詢和取消等一系列操作,代碼如下:

      client.fine_tuning.jobs.list(limit=5) fine_tuning_job_id = "ftiob-xxx" client.fine_tuning.jobs.retrieve(fine_tuning_job_id) client.fine_tuning.jobs.cancel(fine_tuning_job_id) client.fine_tuning.jobs.list_events(fine_tuning_job_id=fine_tuning_job_id, limit=5)

      微調和評估結束后,就可以使用微調出的模型了,代碼如下:

      model = "ft:gpt-3.5-turbo:demo:suffix:2024-07-10" completion = client.chat.completions.create(     model=model,     messages=[         {"role": "system", "content": "你是一個虛擬助手。"},         {"role": "assistant", "content": "您好。"},         {"role": "user", "content": "您好。"}     ] )

      本節介紹了 3種用于 ChatGPT 微調的方法:Fine-Tuning UI、CLI命令和 API。雖然這三種方法可以滿足大部分需求,但它們僅依賴于 ChatGPT。本節內容不僅適用于大多數場景,還可以作為了解和使用 ChatGPT的基礎。然而,為了滿足更多更復雜的使用場景,接下來我們將探討一些其他的微調最佳實踐。這些實踐將幫助你更靈活地利用大語言模型。以實現更出色的性能和更廣泛的應用。

      注:本文節選自機械工業出版社出版的《Python大模型應用開發:核心技術與項目實戰》,略有改動,以紙質書出版為準。

      編輯推薦

      (1)打通完整Python開發鏈條:系統梳理大模型應用開發全流程,涵蓋分詞、詞嵌入、向量數據庫、提示詞工程、模型微調與部署等關鍵技術,幫助開發者構建成體系的技能框架。

      (2)主流工具一網打盡:聚焦Hugging Face、LangChain、RAG等當前最熱門的大模型開發框架,講解其原理與實操方法,配合可運行的代碼與實戰案例,快速上手、易于應用。

      (3)項目實戰導向,深度挖掘數字人場景:通過多個數字人電商項目實戰,完整展示智能系統構建方式,貼近熱門應用場景,增強實戰價值與可落地性。

      (4)內容循序漸進,初學與進階開發者友好:全書由淺入深、結構清晰,從基礎認知到高級實戰,兼顧知識體系構建與動手能力提升,既適合AI開發初學者,也能幫助有經驗的工程師補齊短板。

      (5)作者技術實力深厚,經驗提煉與代碼實操雙助力:作者傾力總結多年AI架構實戰經驗,結合真實項目中的痛點問題,提供一線開發技巧與工程化思維,幫助開發者在實踐中掌握大模型開發的“術”與“道”。

      編輯推薦

      (1)體系完整,循序漸進:從零基礎認知到核心原理,再到開發、部署與運維,全流程掌握智能體的全棧知識體系。

      (2)案例驅動,實操為王:融合GPTs、LangChain、LlamaIndex等熱門技術,配套“即插即用”示例代碼與真實行業案例,快速落地。

      (3)應用廣泛,價值突顯:覆蓋教育、科研、醫療、設計、零售等場景,既能助新手入門,也能為開發者和創業者提供創新思路與商業機會。


      今日互動

      大模型時代,程序員的職業發展面臨哪些轉變?

      在留言區參與互動,我們將選取3名幸運讀者各獲得贈書1本(上面兩本,2選1),截止時間為2025年10月17日。(參與要求:2025年10月14日之前已關注“Ai學習的章北海”公眾號)

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      就讓高市如愿,中方要上大菜!

      就讓高市如愿,中方要上大菜!

      楊風
      2026-02-10 22:12:20
      農村到底蕭條到了啥程度?我在村里住了三個月,說幾句刺耳的話

      農村到底蕭條到了啥程度?我在村里住了三個月,說幾句刺耳的話

      復轉這些年
      2026-02-11 23:59:46
      知恥后勇,中國短道速滑隊捷報頻傳,范可新落淚,林孝俊被犯規

      知恥后勇,中國短道速滑隊捷報頻傳,范可新落淚,林孝俊被犯規

      林子說事
      2026-02-11 11:34:44
      CBA官方罰單:趙睿嚴重不當評論停賽3場罰款5萬 首鋼罰5萬

      CBA官方罰單:趙睿嚴重不當評論停賽3場罰款5萬 首鋼罰5萬

      醉臥浮生
      2026-02-11 20:42:55
      律師:中國最高法院推翻加拿大涉毒男子死刑判決

      律師:中國最高法院推翻加拿大涉毒男子死刑判決

      俄羅斯衛星通訊社
      2026-02-11 19:37:23
      王晶談萬梓良晚年凄涼!稱其不懂江湖規矩,演戲夸張對手很難接

      王晶談萬梓良晚年凄涼!稱其不懂江湖規矩,演戲夸張對手很難接

      小徐講八卦
      2026-02-11 11:40:12
      力壓范戴克,維爾茨當選與桑德蘭一役利物浦隊內最佳球員

      力壓范戴克,維爾茨當選與桑德蘭一役利物浦隊內最佳球員

      懂球帝
      2026-02-12 07:56:08
      Seedance2.0刷爆全網!知名財作家:女主播找工作時間不會很多了

      Seedance2.0刷爆全網!知名財作家:女主播找工作時間不會很多了

      火山詩話
      2026-02-11 06:17:37
      大爆冷!倒數第1擒東部第二送哈登神助攻 布倫森轟40+5+8成背景板

      大爆冷!倒數第1擒東部第二送哈登神助攻 布倫森轟40+5+8成背景板

      鍋子籃球
      2026-02-11 12:29:36
      網友吐槽:“吃相難看!漲價離譜!”

      網友吐槽:“吃相難看!漲價離譜!”

      王二哥老搞笑
      2026-02-12 00:52:08
      湖北女子吃飯閑聊,被母親指責啃老:最錯的事就是生你,網友炸鍋

      湖北女子吃飯閑聊,被母親指責啃老:最錯的事就是生你,網友炸鍋

      離離言幾許
      2026-02-11 22:39:53
      麻六記年會破防!小菲首度狂夸張蘭,三孫將至喜上加喜!

      麻六記年會破防!小菲首度狂夸張蘭,三孫將至喜上加喜!

      鄉野小珥
      2026-02-12 00:36:46
      比賭博還狠的“隱形毒藥”,正慢慢掏空中國家庭,無數人被它拖垮

      比賭博還狠的“隱形毒藥”,正慢慢掏空中國家庭,無數人被它拖垮

      千秋文化
      2026-02-10 20:55:47
      2012年希拉里助手曝出驚天猛料:為報復克林頓出軌,她的私生活竟也亂成一鍋粥,這哪是原諒,分明是頂級復仇

      2012年希拉里助手曝出驚天猛料:為報復克林頓出軌,她的私生活竟也亂成一鍋粥,這哪是原諒,分明是頂級復仇

      歷史回憶室
      2026-01-13 22:46:09
      廣東一高端酒樓,突然宣布結業!早前還在宣傳年夜飯

      廣東一高端酒樓,突然宣布結業!早前還在宣傳年夜飯

      今日搞笑分享
      2026-02-12 00:17:12
      斯瓦泰克披露堅持送蛋不讓球原因,誰是1000賽史上送蛋女王

      斯瓦泰克披露堅持送蛋不讓球原因,誰是1000賽史上送蛋女王

      網球之家
      2026-02-11 22:49:53
      內存現泡沫信號!DDR4價格閃崩近20%已走到盡頭

      內存現泡沫信號!DDR4價格閃崩近20%已走到盡頭

      3DM游戲
      2026-02-11 17:41:04
      夸美國空氣香甜的楊舒平,已被美驅逐出境,如今回國下場怎么樣了

      夸美國空氣香甜的楊舒平,已被美驅逐出境,如今回國下場怎么樣了

      談史論天地
      2026-02-07 13:20:03
      我去!塔圖姆被下放了!!

      我去!塔圖姆被下放了!!

      柚子說球
      2026-02-11 17:20:08
      大風新聞調查:在小紅書注冊未成年人賬號,被推送擦邊內容,改年齡就能打賞直播間

      大風新聞調查:在小紅書注冊未成年人賬號,被推送擦邊內容,改年齡就能打賞直播間

      大風新聞
      2026-02-11 18:53:18
      2026-02-12 08:32:49
      機器學習與Python社區 incentive-icons
      機器學習與Python社區
      機器學習算法與Python
      3247文章數 11085關注度
      往期回顧 全部

      科技要聞

      Meta將斥資超100億美元建設數據中心

      頭條要聞

      環球:高市"豪賭"大勝 軍工業恐成日本經濟"搖錢樹"

      頭條要聞

      環球:高市"豪賭"大勝 軍工業恐成日本經濟"搖錢樹"

      體育要聞

      搞垮一個冬奧選手,只需要一首歌?

      娛樂要聞

      大孤山風波愈演愈烈 超50位明星扎堆

      財經要聞

      廣州前首富被判無期 200億集資窟窿何償

      汽車要聞

      比亞迪最美B級SUV? 宋Ultra這腰線美翻了

      態度原創

      藝術
      時尚
      教育
      本地
      家居

      藝術要聞

      這13個狂草字,您認出幾個?楷書練習多久就可以練行書了?

      其實你不需要這么多褲子,留這3條就夠用!

      教育要聞

      高考地理中的木本植物擴張

      本地新聞

      下一站是嘉禾望崗,請各位乘客做好哭泣準備

      家居要聞

      簡雅閑居 靜享時光柔

      無障礙瀏覽 進入關懷版