Part.1
AI工程師都要會些什么?
大語言模型(Large Language Model,LLM)技術的興起,正在深刻影響軟件的形態,開發者的工作也從實現業務邏輯、構建獨立應用,轉向以LLM為底層引擎快速搭建智能應用的模式。
當下,傳統軟件也許都要基于AI重寫一遍,而這對開發者提出了新的要求:開發者要從單一的代碼編寫者成為駕馭大模型能力的AI工程師。那么,要如何修煉自己的LLM開發技術棧呢?
首先是深入理解當前主流大模型的核心架構——Transformer模型,明晰自注意力機制如何捕捉文本語義、多頭注意力如何并行處理信息,這是自定義大模型結構的基礎。
接著要知曉LLM可能存在的不足之處,通過提示詞工程、微調、檢索增強生成(Retrieval-Augmented Generation,RAG)等技術工具解決知識過時問題。
此外,還要掌握框架工具的使用,例如LlamaIndex、LangChain等,學會編排大模型應用,比如構建“檢索 + 生成”的問答系統。最后是構建智能體驅動LLM自主決策,部署LLM應用并監控其穩定運行。
針對這些知識,小白要學多久才能上手干活?只需讀完《動手構建大模型》這本書即可。全書沒有廢話,講完必要的理論,直接手把手給出實操案例,讀者照著書做便能積累實戰經驗,在工作中邊用邊提升,穩步成長為LLM應用開發實戰高手。
▼點擊下方,即可購書
事不宜遲,這就動手開始學吧。
Part.2
零基礎進階大模型實戰高手
本書為讀者規劃了一條循序漸進的學習路線,零基礎也能輕松上手。書中內容分為三大篇:基礎理論篇解讀LLM的概念、核心架構及其不完美之處;核心技術篇詳解提示詞工程、RAG、LLM框架工具;高階應用篇講透高級RAG、Agent(智能體)、微調、LLM部署與優化。
為獲得更好的學習體驗,讀者需要具備簡單的Python編程知識,并在計算機上搭建一個版本高于3.8.1的Python編程環境,以使用Visual Studio Code工具。在學習過程中一定要積極動手實踐,從而快速吸收所學知識。
![]()
我們現在正式踏上學習之旅。
基礎理論篇
開篇用通俗的語言拆解LLM的組成結構,從Transformer架構的核心邏輯,到分詞、嵌入、上下文窗口這些基礎概念,梳理LLM的發展簡史,并給出用GPT-3.5 API做翻譯、通過小樣本學習控制LLM輸出的實戰小項目。
接著深入講解Transformer架構,闡釋“Attention Is All You Need”論文的核心內容,拆解編碼器 - 解碼器、僅解碼器等設計選擇,對比專有模型與開源模型,還列出了LLM在商業、醫療、教育等9大領域的應用場景。
![]()
最后解釋了LLM產生幻覺(生成錯誤信息)、偏見等問題的根源,并給出應對之道:通過控制輸出格式、調整解碼方法減輕幻覺,用基準測試評估模型性能。
核心技術篇
打好基礎之后,本篇就聚焦LLM應用核心技術,教大家如何與LLM對話,向其輸入特定數據,建立知識庫。
首先,講透提示工程的核心技巧:
零樣本提示:不提供示例,直接讓模型完成任務。
上下文學習和小樣本提示:給出一些示例,提示模型給出符合期望的回答。
思維鏈(CoT)提示:驅使LLM逐步思考,以提供推理能力。
角色提示:給模型設定身份,獲得專業方向的精確回答。
然后,以RAG手段解決LLM知識過時、產生幻覺等問題,詳解從頭構建RAG管道,把文檔轉成嵌入向量、存進向量數據庫、查詢時讓模型結合檢索結果生成答案,從此大模型便能引用專屬數據,生成準確內容。
接著,介紹LangChain和LlamaIndex兩大框架的用法,用兩個項目實戰演示:構建新聞摘要器、使用LangChain構建 LLM驅動的應用。動手跟著做一遍,就能秒懂如何搭建LLM應用的骨架。
![]()
▲新聞文章摘要器的工作流程
將上述工具和框架綜合運用,書中給出了貼近真實場景的項目開發實例:
用LangChain做知識圖譜:從文本中提取關聯關系,讓LLM輸出更加結構化。
搭建客服問答機器人:把專業領域知識投放給模型,用戶提問時自動匹配答案,解放人工。
做YouTube視頻摘要器:用Whisper轉語音為文本,再讓LLM生成摘要,多模態應用輕松實現。
![]()
▲基于文本數據創建知識圖譜的工作流程
這些項目都提供了Google Colab Notebook方式,“開箱即練”,可以直接在云端運行,不用本地配置復雜環境,方便學習并獲得反饋。
高階應用篇
能用工具干活了,接下來學習解決難題、優化性能、部署上線,覆蓋企業級應用的全流程。
首先重點講解基于LlamaIndex的高級RAG技術,包括嵌入模型與LLM微調、RAG監控與評估、混合檢索與嵌入向量檢索。LlamaIndex查詢環節,涵蓋查詢構建、查詢擴展、查詢轉換、重排序、遞歸檢索以及從小到大的檢索邏輯。
還介紹了RAG評估方法,教你如何衡量檢索效果。這些都是企業評估LLM應用的標準流程,掌握后即可與專業工程師對齊。
![]()
▲RAG系統中的檢索評估指標
智能體是大模型的進階形態,能自主調用工具、規劃任務。書中給出多種智能體構建案例:用OpenAI Assistants做分析助手、用 LlamaIndex做數據庫查詢智能體,還講解了AutoGPT、BabyAGI等經典智能體的原理。
如果API調用的通用模型滿足不了需求,就需要使用微調技術,書中講透了LoRA、RLHF等微調技術,并給出詳細的行業案例,包括用醫療數據微調LLM、用金融數據做情感分析。
![]()
▲RLHF過程的可視化示意圖
最后講解模型部署上線步驟,部署優化環節涵蓋使用模型量化、剪枝、蒸餾、投機解碼,還演示了在谷歌云CPU上部署量化模型的具體過程。
至此,讀者完成了AI工程師的能力閉環。
作者團隊介紹
本書作者團隊有著深厚的學術積淀、一線工程實戰經驗與教育傳播能力。他們創作本書,旨在為讀者打開LLM工程應用的大門,讓更多人參與用AI技術改變世界的行動中。
路易斯 - 弗朗索瓦?布沙爾 蒙特利爾學習算法研究所醫學人工智能博士,2020年起擔任初創公司AI部門負責人,組建團隊推進早期計算機視覺研發項目,開設個人YouTube頻道分享AI知識,專注于AI現實應用落地。
路易?彼得斯 擁有帝國理工學院物理學專業背景,曾就職于摩根大通集團從事投資研究。他現任Towards AI首席執行官,密切關注AI帶來的顛覆性社會影響和經濟影響,持續推動AI在更多實際場景中落地的技術突破。
Towards AI 的使命是通過課程、博客、教程、新聞、圖書和Discord社區,讓AI技術觸手可及。自2019年以來,已經幫助超過40萬人了解AI知識。
Part.3
結語
對于技術人來說,要想盡快讓LLM為業務賦能,就一定要動手真刀真槍地干起來。《動手構建大模型》提供了最直接的實操過程,不繞彎子,精準解決各類實際智能化應用需求。
本書最大特點是實戰導向、項目驅動學習,代碼完整可復用,案例豐富多元。每章均配套“小案例 + 大項目”,且項目貼合真實業務場景。
基礎階段:GPT-3.5 API翻譯、小樣本學習控制輸出,助力新手快速上手;
核心階段:新聞摘要器、客服問答機器人、YouTube視頻摘要器,覆蓋文本處理、多模態交互等高頻需求;
高級階段:醫療數據微調 LLM、谷歌云部署量化模型,直接對標企業級任務。
書中語言通俗易懂,方便零基礎學習者快速入門,每章固定設置理論講解、代碼演示、項目實戰模塊,不同層次的讀者可以快速定位自己的核心內容,切實掌握技術并應用落地。
![]()
▲精彩書摘
另外,本書學習體驗優異,提供Google Colab Notebook,所有項目代碼均適配云端環境,讀者無須本地配置復雜依賴,復制鏈接即可運行,大幅降低實踐門檻。
配套資源豐富,在towardsai.net/book提供代碼倉庫、requirements.txt依賴清單、研究論文鏈接,且代碼定期更新以適配LLM生態變化,確保可復現性。
![]()
▲代碼示例
無論是想從傳統程序員轉型AI工程師,還是需要落地大模型應用的企業工程師,又或者是高校相關專業的師生,都能在書中找到對應學習模塊,從理論到實踐全貫通。
吃透理論,熟練應用,《動手構建大模型》助你零基礎進階大模型實戰高手!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.