<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      聽完PromptPilot的發布會,發現他們想Pilot的竟然不止是Prompts

      0
      分享至


      作者 | 郭海惟
      郵箱 | guohaiwei@pingwest.com

      9月13日,火山云的PromptPilot終于“正式”發布了。

      這款產品最早在6月12日的火山引擎 FORCE 原動力大會上亮相,當時火山引擎智能算法負責人吳迪花了十分鐘介紹了PromptPilot的特點和工作流程。

      吳迪當時對PromptPilot推出的戰略背景有三點總結:

      • 模型越強,提出好問題的正向價值越大;

      • 有很多高價值問題,沒有標準答案;

      • 提示詞工程本質是一個搜索問題,一切搜索問題都長期都將由算法來解決。

      這三個論斷,或許可以被理解為當時火山引擎對PromptPilot業務戰略邏輯的核心論述:

      提示詞是值錢的,而PromptPilot的價值,某種程度來自于個性化的場景需求與對prompt需求的個性化理解。正是因為場景是個性化的,所以prompt有被調整的需要;正是因為prompt本質是搜索,所以需要構建對用戶的理解。

      其實很多巨頭都在做類似的事情。

      比如,最近阿里巴巴財報會上,吳永銘將記憶能力稱為整個agent應用突破的重要節點;Notion、飛書、IMA等應用,都在致力于構建一個服務于用戶的知識庫生態。

      Prompt天然有以上的屬性。

      借用最近挺火的“十字路口”的比喻,Prompt既是人與智能的十字路口,也是當下以大模型為主的智能基礎與未來以agent為主的智能生態的十字路口。

      而在9月14日PromptPilot正式發布的溝通會上,面對臺下的開發者和媒體,技術負責人許偉則對PrompPilot的戰略價值給出了更多的論述角度,他在會議上給了幾個很有意思的斷,也是我印象比較深幾點。

      第一,他說,在垂直場景的打造過程中,場景定制化與基礎模型能力的GAP會“永遠存在”。

      如果要解決好垂直場景的落地問題,最好的方式就是“將一些關鍵能力交到廣大客戶和行業專家手中”,從而“共同推動智能的進一步廣泛和深度提升,實現大規模的落地應用”。

      第二,其實也與第一中的解決方案相呼應。許偉稱,如果AI上半場是互聯網數據引領智能增長,那么“下半場的數據則源自行業和專家的腦袋”,而這會是“重要的區別”。

      第三,與大模型訓練類似,大量開發者在開發agent的時候,依然像是在煉金,將數據扔進黑箱里祈求獲得黃金。這已經成為了agent開發中的痛點,同時也造成了一定的算力浪費。許偉認為,工程化的prompt能力,將不同的模塊聯動訓練,可以一定程度上讓agent的訓練“可執行、可驗證”。

      從這個角度來說,PromptPilot對自己角色的定位算是很明確的。它應該就是一個輔助行業從AI上半場走向下半場的工具。

      而作為工具,它自己要迭代、要scaling、要積累數據,同時要考慮一些“代碼素人”的行業專家也可以使用。


      而如果落腳到現實問題上,PromptPilot其實要解決許偉提出的三個“悖論”。

      一個是用戶“如何清楚表達需求”:

      許偉認為,用戶的意圖從人腦,再到具象化的目標、結構化的表達,中間是存在鴻溝的。尤其是當場景越垂直、越專業,那就越難以用自然語言一次性說清楚,也越需要更精細、更結構化的prompt。

      其次是如何摸清楚“模型的能力邊界”:

      而對于agent開發者來說,大模型能力的邊界也是模糊的。(許偉沒有展開講,但我想這個觀點其實也無需多言,因為大模型其實是一個黑箱,所以才會有各種各樣對大模型的能力測評榜單,對榜單的評測結果才會有各種各樣的爭議)。

      許偉說,“大模型應用本質是尋找定制場景的模型能力邊界”。他指出,作為大模型開發者的工作,其實是在表達不清的需求和能力莫測的模型之間,試圖搭建人與模型之間的橋梁。

      第一和第二個“悖論”,其實呼應了之前的觀點,即場景定制化與基礎模型能力的GAP會“永遠存在”。

      而第三個悖論則是長上下文的動態適應過程。

      許偉認為這是目前最難的挑戰。一方面大模型本身是人類高級思考的替代品,本身是很開放式的(硅星人注:注意力不集中且容易有幻覺);另一方面,上下文越來越長,越來越多樣。這導致在開發過程中,很多問題是開發者想象之外的。


      你很難想象PromptPilot能解決以上所有的問題,但他們給出了一個自己的工作流程,我也拍了一張照可以給大家參考——PromptPilot建立了一個與用戶行為流程相匹配的SDK數據閉環回流,來試圖形成一個不斷改進系統能力的飛輪。

      而在整個發布會中,最高頻出現的詞語大概是圖中所示的評估標準和badcase。

      在模型深入場景的過程中,可能最珍貴的就是如何評價的標準。與prompt一樣,標準其實藏在專家的腦子里,它甚至不是一條條理論性的可以清楚描述的語言,而是存在相當程度“灰度”的。而后者則是很難用語言直接描述的。

      許偉舉例說,比如圖片審核中,一些元素以不同的方式不同的程度出現,可能得出的合規與否的判斷會完全不同。而PromptPilot能做的就是讓模型在與用戶不斷交互的過程中個,把評估標準背后的意圖給抽取出來。

      在這個過程中,大量的case就顯得非常重要。


      火山引擎大模型算法工程師王鐵飛,介紹了PromptPilot的四個模塊,分別是:

      數據智擎工坊(Data Engineering)、Prompt 臻化聯動艙(Prompt優化和聯動精調)、Badecase洞察站(Badecase檢測)和 AI方案生成器(Solution)

      這四個模塊可以理解為SDK數據閉環回流圖的細化。

      從實操來看,整體的流程與8月份對外披露的升級版變化不大。整套系統給人的感覺是,在批量測試之前,人基本能改的地方,都開放給了人手動修改和評分;當然,相應的自動化能力也沒落下。

      測試下來的感覺有點像一輛汽車,既有手動擋又有自動擋。

      比如一些媒體老師,拿官方的案例,閉著眼睛一直讓自動化流程走到底,總體也能跑通,拿一個還不錯的測試分數;開發者則喜歡一邊讓自動流程跑,每跑一步,就上手優化一下,再接著跑,編prompt甚至能玩出一點vibe coding的感覺。

      如許偉所說,PrompPilot希望把能力“交給專家”,所以產品方面能明顯看到給用戶留了很多能力植入和交互的地方。

      首先,用戶在一鍵生成Prompt的時候可以提前加入知識庫的文檔。


      用戶可以導入簡單的任務描述,也可以直接把領導給你的任務說明一股腦扔進去。

      因為即便生成效果不佳,也是可以支持劃線局部提修改意見,當然直接上手改也是可以的。


      跳測試。

      這里給數據集輸入一個case(填寫變量)


      變量可以從數據集里隨機抓,也可以AI生成以后自己改。


      模型會跑回答。


      跑完回答后,可以直接在模型回答里改,改到滿意為止。

      如果太復雜的問題,可以在下方添加到評測集里,多輸出幾個標準答案,可以幫助模型表現更好。

      當然也可以批量上傳評測集,評測完成后給所有的結果手動打分和輸入評測標準。同理,評測標準可以自動生成,也可以手動改寫輸入。


      然后AI會自動生成打分的分數,打完分以后可以讓PromptPilot進行自動優化.


      然后這個時候你才進入到PromptPilot核心能力的大門,也就是剛才提到的Prompt臻化聯動倉(Prompt優化和聯動精調)



      如果不滿意的話,可以重新再來一遍,然后模型會不斷微調,把分數拉上去,表現不好的BadCase會被收錄到“錯題本”里,并導出一個智能優化的報告。

      不要小看這個流程,它其實解決了獨立開發者的幾個頭疼的問題:

      上下文能力和模型評估能力。

      案圖示例里只有幾十個case,但如果像agent創業者,動輒數千個case涌入進來,這套流程的威力就會顯現出來了。這不是一個簡單的prompt編寫能力,而是幫助開發者直抵agent的核心。

      我想甚至可以這么說:大模型+PromptPilot,其實就已經可以成為一個簡單版的DIY生產力agent了。

      所以在交流環節,有開發者站起來的第一個問題就是,這玩意兒能不能接到非火山云的場景里,比如他自己玩的端側模型(其實我猜他可能想說阿里云、騰訊云之類的友商,但不太好意思)。

      王鐵飛立刻說是可以的,他們已經開了API接口,能力是完全開放的,開發者直接自己接就可以了。

      PromptPilot 團隊至少在發布會上展現了很包容性的姿態,他們甚至可以支持所謂的“Repurpose”的功能——就是如果你使用了一個較大較強的模型,但因為各種原因需要降級模型能力,PromptPilot可以幫你在執行這個特定的任務能力方面,盡量拉齊到原先的水平上。

      我個人粗淺的理解是:相當于你原本開奔馳大G跑高速,但120邁勻速有很多車,換飛度的性價比其實更高。但在上高速,駕駛員對路況不熟悉,寧愿先用大奔把成功率跑上去,然后慢慢再去探尋成本的邊界,而PromptPilot在這個時候可以成為你換車的工具箱之一。

      所以從這個角度來說,PromptPilot不是一個簡單的prompt工具,而是大模型落地的橋梁。它既能通過對話和評分,把人的需求溝通明白,也能以此為抓手,再對模型能力進行規劃和精調。

      在所有的AI云廠都在布局agent服務能力的今天,PromptPilot未來會長成什么樣,是一件值得期待的事情。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      為了外貿數據排名,南京市江寧經濟開發區公款“購買”異地出口數據,有關部門只考不核

      為了外貿數據排名,南京市江寧經濟開發區公款“購買”異地出口數據,有關部門只考不核

      三言四拍
      2026-04-27 09:06:00
      上海地鐵互毆:知情人曝老太惡心事,臭毛病履不改,女孩恐丟工作

      上海地鐵互毆:知情人曝老太惡心事,臭毛病履不改,女孩恐丟工作

      小怪吃美食
      2026-04-28 00:00:38
      3年朝鮮戰爭,美軍究竟傷亡了多少人?是時候告訴大家真相了!

      3年朝鮮戰爭,美軍究竟傷亡了多少人?是時候告訴大家真相了!

      文史道
      2025-04-05 06:45:06
      山姆29.9元羽衣甘藍盆栽被搶空,多地門店無貨,客服:產品正更新迭代,可關注其他類似商品

      山姆29.9元羽衣甘藍盆栽被搶空,多地門店無貨,客服:產品正更新迭代,可關注其他類似商品

      極目新聞
      2026-04-27 13:20:15
      豆包AI圖片生成對比GPT,被秒渣都不剩,國產AI未來何在?

      豆包AI圖片生成對比GPT,被秒渣都不剩,國產AI未來何在?

      歪歌社團
      2026-04-27 04:12:08
      中方重重制裁下,巴拿馬逢生機,石油船擠爆運河,過路費收到手軟

      中方重重制裁下,巴拿馬逢生機,石油船擠爆運河,過路費收到手軟

      聚焦熱點直擊
      2026-04-27 23:07:50
      我知道那兩名保安為啥不讓退伍老兵上廁所的原因

      我知道那兩名保安為啥不讓退伍老兵上廁所的原因

      筆桿論道
      2026-04-23 01:25:03
      黃楊鈿甜為“耳環風波”出鏡道歉:謠言已澄清,很抱歉掀起這么大風波

      黃楊鈿甜為“耳環風波”出鏡道歉:謠言已澄清,很抱歉掀起這么大風波

      大風新聞
      2026-04-27 14:34:04
      65歲大爺相親57歲大媽,想要夫妻生活,再要個娃,大媽:老不正經

      65歲大爺相親57歲大媽,想要夫妻生活,再要個娃,大媽:老不正經

      風起見你
      2026-04-28 00:39:18
      甘肅天水一佳人好漂亮, 身高168cm,體重48kg 美的讓人移不開眼

      甘肅天水一佳人好漂亮, 身高168cm,體重48kg 美的讓人移不開眼

      鄉野小珥
      2026-04-08 00:48:57
      “這個世界太不公平了”,36E女孩曬考研北大,數學滿分全網羨慕

      “這個世界太不公平了”,36E女孩曬考研北大,數學滿分全網羨慕

      妍妍教育日記
      2026-04-27 11:30:07
      中國第四艘航母官宣:是核動力!舷號19,命名大概率是“江蘇號”

      中國第四艘航母官宣:是核動力!舷號19,命名大概率是“江蘇號”

      福建睿平
      2026-04-26 10:53:36
      53歲顏丙燕:無兒無女,身材發福卻韻味十足,與小20歲男友很恩愛

      53歲顏丙燕:無兒無女,身材發福卻韻味十足,與小20歲男友很恩愛

      草莓解說體育
      2026-04-28 01:31:24
      熱巴和京圈大佬的瓜!

      熱巴和京圈大佬的瓜!

      八卦瘋叔
      2026-04-27 11:01:50
      央國企的內幕被網友們扒得干干凈凈!

      央國企的內幕被網友們扒得干干凈凈!

      燈錦年
      2026-04-28 00:05:06
      大師靠“美國崩潰論”卷走百億,跑路美國后,痛罵中國人

      大師靠“美國崩潰論”卷走百億,跑路美國后,痛罵中國人

      談史論天地
      2026-04-25 11:00:08
      杭州市公共自行車公司:從沒碰到過,已報警!

      杭州市公共自行車公司:從沒碰到過,已報警!

      都市快報橙柿互動
      2026-04-27 22:31:00
      不當總統了?馬克龍將卸任,臨走前通告全球:中美俄都在針對我們

      不當總統了?馬克龍將卸任,臨走前通告全球:中美俄都在針對我們

      共工之錨
      2026-04-28 00:08:09
      民進黨,極有可能在下一屆臺灣地區選舉后,成為長期一家獨大政黨

      民進黨,極有可能在下一屆臺灣地區選舉后,成為長期一家獨大政黨

      李橑在北漂
      2026-04-02 10:22:26
      上海迪士尼一男子勸阻另一男子吸煙,反被連扇巴掌、拳打腳踢!當事人刪帖稱“對方賠了五位數”,警方已介入

      上海迪士尼一男子勸阻另一男子吸煙,反被連扇巴掌、拳打腳踢!當事人刪帖稱“對方賠了五位數”,警方已介入

      都市快報橙柿互動
      2026-04-27 14:53:19
      2026-04-28 02:20:49
      硅星GenAI incentive-icons
      硅星GenAI
      比一部分人更先進入GenAl。
      275文章數 38關注度
      往期回顧 全部

      科技要聞

      DeepSeek V4上線三天,第一批實測出來了

      頭條要聞

      坐在特朗普身邊親歷槍擊案的女記者 身份非常不一般

      頭條要聞

      坐在特朗普身邊親歷槍擊案的女記者 身份非常不一般

      體育要聞

      人類馬拉松"破二"新紀元,一場跑鞋軍備競賽

      娛樂要聞

      黃楊鈿甜為“耳環風波”出鏡道歉:謠言已澄清

      財經要聞

      Meta 140億收購Manus遭中國發改委否決

      汽車要聞

      不那么小眾也可以 smart的路會越走越寬

      態度原創

      家居
      旅游
      健康
      游戲
      藝術

      家居要聞

      江景風格 流動的秩序

      旅游要聞

      不止看花 京津冀春日游花樣翻新

      干細胞如何讓燒燙傷皮膚"再生"?

      LPL又一超級強隊誕生!S賽冠軍復出豪取六連勝,小局12-0一場不敗

      藝術要聞

      他的油畫筆觸粗獷又細膩,透著一種不可言說的美!

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 日本不卡一区二区高清中文| 欧美亚洲h在线一区二区| 中方县| 伊人久久大香线蕉综合影院首页| 国产自在自线午夜精品| 免费在线视频a| 天堂а√在线最新版中文在线| 繁昌县| 爆乳2把你榨干哦ova在线观看| 男人天堂社区| 亚洲日本乱码熟妇色精品| 漂亮人妻被修理工侵犯| 野外做受三级视频| 亚洲日韩av无码一区二区三区人| a片入口| 国产精品成人网址在线观看| 一区二区三区av天堂| 伊人无码一区二区三区| 久久亚洲精品中文字幕| 黑人一级片| 色综合日韩| 中文字幕av无码免费一区| 国产亚洲精品第一综合| 日本在线视频网站www色下载| 国语做受对白XXXXX在线| 性欧美丰满熟妇xxxx性久久久 | 一区二区三区精品| 精品亚洲男人一区二区三区| 91在线免费视频| 在线观看热码亚洲AV每日更新| 国产精品激情| 亚洲午夜福利| 国产婷婷色一区二区三区| 亚洲最大成人综合网| 中文字幕无线码一区二区| 2020久久国产综合精品swag| 免费视频这里是精品视频| 99久无码中文字幕一本久道| 国精产品一区一区三区有限公司杨 | 91丨九色丨人妻丨白浆| 97成人碰碰久久人人超级碰oo|