<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      用AI點外賣,少說倆字或許能省錢?

      0
      分享至

      想象一下,你正在經營一家智能養蝦場(OpenClaw),通過AI系統管理數千畝龍蝦池塘。清晨,你對AI助手說:“幫我訂個披薩?!毕到y迅速響應,后臺計費系統記錄下這簡單的6個字。到了中午,你換了一種說法:“幫我預訂一份意大利薄底薩拉斯米腸披薩?!?strong>同樣的需求,更詳細的描述,但這一次,計費系統記錄的“詞元”數量其實大不相同。


      圖片來源:AI生成

      這不是科幻場景,而是每天都在發生的真實計費邏輯。在AI大模型時代,token是人工智能(尤其是大語言模型)處理中信息的最小單位,也是模型計費和處理的基本單位。2026年3月25日,全國科學技術名詞審定委員會正式發布《關于發布試用人工智能領域名詞token中文名“詞元”的公告》,將這個困擾業界多年的術語統一命名為“詞元”,標志著這一概念正式進入國家規范術語體系。

      詞元(Token)是大模型處理信息的最小信息單元,具有智能時代可計量、可定價、可交易的特征。

      從“字”到“詞元”:計費單位的革命

      傳統認知中,我們按字數計費——寫多少字付多少錢。但在AI世界里,這個邏輯被徹底顛覆。

      大模型廠商的計費公式可以簡化為:

      plain

      費用=(輸入詞元數×輸入單價+輸出詞元數×輸出單價)/1,000,000

      國家數據局最新數據顯示,截至2026年3月,我國日均詞元調用量已突破140萬億,相比2024年初的1000億增長超過1000倍。如此龐大的調用量背后,是一個精密的計費系統。以阿里云百煉平臺為例,Qwen3.6-Plus最低輸入價格2元/每百萬Tokens,最低輸出價格12元/每百萬Tokens。看似微小的差異,在大規模調用場景下,會被顯著放大,從而帶來明顯的成本差異。


      Qwen3.6-Plus推理服務價格

      圖片來源:阿里云官網

      BPE算法:打包常用字,拆分生僻詞

      要理解為什么“幫我訂個披薩”和“幫我預訂一份意大利薄底薩拉斯米腸披薩”會產生不同的詞元數量,需要深入字節對編碼(Byte Pair Encoding,BPE)算法的核心機制。(除了BPE算法外,常見的還有WordPiece、Unigram等算法,本文將以BPE算法為例。)

      BPE算法最早由Philip Gage于1994年提出,用于數據壓縮。2016年,瑞士蘇黎世大學的Rico Sennrich等人將其引入自然語言處理領域,發表了奠基性論文《Neural Machine Translation of Rare Words with Subword Units》,開創了子詞分詞的新紀元。

      BPE算法的運作原理可以概括為:不斷合并訓練語料中出現頻率最高的符號對,直到達到預定詞匯表大小。

      讓我們用一個簡化示例說明,假設訓練語料包含以下詞匯及出現頻率:

      “hug”:10次

      “pug”:5次

      “pun”:12次

      “bun”:4次

      “hugs”:5次

      第一步:將所有詞拆分為字符,添加結束符

      “hug” → “h u g ”

      “pug” → “p u g ”

      “pun” → “p u n ”

      “bun” → “b u n ”

      “hugs” → “h u g s ”

      初始詞匯表僅包含基礎字符:{b, g, h, n, p, s, u, }

      第二步:統計相鄰字符對的出現頻率

      “u g”:15次(來自“hug”的10次 + “hugs”的5次)

      “u n”:16次(來自“pun”的12次 + “bun”的4次)

      “p u”:17次(來自“pug”的5次 + “pun”的12次)

      第三步:合并最高頻字符對

      假設“p u”頻率最高(17次),創建新符號“pu”,

      詞匯表擴展為:{b, g, h, n, p, s, u, , pu}

      第四步:迭代重復

      繼續統計新語料中的字符對頻率,合并下一個最高頻對,直到達到預設的詞匯表大?。ㄈ鏕PT-2為50,257個token)。

      多個常用字被打包成單個詞元

      像“的”“是”“了”“在”等超高頻漢字,在訓練語料中反復出現,BPE算法會將它們與相鄰高頻字組合成固定詞元。例如:

      “的” → 單獨1個token

      “中國” → 1個token(高頻組合)

      “人工智能” → 2個token(“人工”+“智能”)

      單個生僻字和長詞被拆解成多個詞元

      對于低頻字或專業術語,BPE算法缺乏足夠的合并動力,只能拆分為基礎字符甚至UTF-8字節:

      “薹”(生僻字)→ 可能被拆為2-3個token

      “意大利薄底薩拉斯米腸披薩” → 可能被拆為10+個token

      這種差異直接體現在計費上。實測數據顯示,同樣長度的內容,中文消耗的token數約為英文的2-2.7倍。以GPT-4o計費標準計算,處理100萬字符的中文文本比英文貴約50%。

      高計費差異背后的經濟邏輯

      理解BPE算法后,我們就能解釋開頭養蝦場的計費差異:


      圖片來源:作者制作

      這種計費機制有其合理性:低頻詞需要模型進行更多計算來理解和生成,消耗更多算力資源。但從用戶角度看,這意味著表達越精確,成本越高。

      那如何降低詞元成本呢?對于普通用戶和開發者,理解BPE算法可以顯著降低使用成本:

      1. 精簡表達

      避免冗余修飾詞。“訂披薩”比“預定一份意大利薄底薩拉斯米腸披薩”可顯著減少詞元消耗。

      2.使用高頻詞匯

      BPE算法偏愛高頻組合。用“電腦”而非“電子計算機”,用“手機”而非“移動電話”。

      3.善用緩存

      阿里云百煉等平臺支持上下文緩存,命中緩存的輸入token價格通常只有普通輸入的1/10。對于重復性查詢,保持上下文連貫可大幅降低成本。

      4.選擇中文優化模型

      通義千問、DeepSeek等國產模型針對中文優化,同等內容下token消耗比國際模型少30%-50%。

      5.監控token使用

      使用tiktoken等工具預先計算token數量,避免超出預算。OpenAI的tiktoken庫基于Rust實現,可精確統計各模型的token消耗。

      詞元的定名不僅是一個術語的統一,更標志著AI產業進入精細化運營階段。當“幫我訂個披薩”和“幫我預定一份意大利薄底薩拉斯米腸披薩”產生不同的賬單時,我們實際上見證了一種新的語言經濟學誕生——表達的精確度與計算成本直接掛鉤。

      BPE算法通過頻率統計實現的“打包”與“拆分”機制,本質上是用統計學方法模擬人類語言的層級結構。常用字“廉價”,生僻詞更“高價”,這種看似不均衡的分配,實則是大數據時代效率與成本的平衡之道。


      圖片來源:AI生成

      正如全國科技名詞委公告所言,“詞元”一詞“符合單義性、科學性、簡明性、協調性等科技名詞審定原則”。當我們下次與AI對話時,或許可以多想一想:這句話,值多少個詞元?

      參考文獻:

      1.Sennrich, R., Haddow, B., & Birch, A. (2016). Neural Machine Translation of Rare Words with Subword Units. arXiv:1508.07909.

      2.Radford, A., et al. (2019). Language Models are Unsupervised Multitask Learners. OpenAI.

      3.http://www.cnterm.cn/news/mtsm/202603/t20260327_828265.html

      4.http://www.cnterm.cn/news/mtsm/202603/t20260327_828253.html

      5.http://finance.people.com.cn/n1/2026/0330/c1004-40691865.html

      6.https://tech.cnr.cn/gstj/20260327/t20260327_527564025.shtml

      7.http://www.cnterm.cn/news/tzgg/202603/t20260325_827999.html

      來源:蝌蚪五線譜

      編輯:小鹿

      轉載內容僅代表作者觀點

      不代表中科院物理所立場

      如需轉載請聯系原公眾號

      聲明:包含AI生成內容

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      死了這條心!人民日報表態:中國不會救菲律賓,馬科斯投機到頭了

      死了這條心!人民日報表態:中國不會救菲律賓,馬科斯投機到頭了

      風干迷茫人
      2026-04-24 16:01:23
      提前起飛10分鐘,大學生把海航告了

      提前起飛10分鐘,大學生把海航告了

      中國新聞周刊
      2026-04-24 18:21:10
      什么是美?這群北體青年給出了最“不設限”的答案

      什么是美?這群北體青年給出了最“不設限”的答案

      網易新聞出品
      2026-04-24 15:59:19
      微軟推員工“自愿買斷式離職”約8750人符合條件!網友:年齡+工齡≥70,自己算一下

      微軟推員工“自愿買斷式離職”約8750人符合條件!網友:年齡+工齡≥70,自己算一下

      小星球探索
      2026-04-24 20:41:59
      觀察|團結還是分裂?新舊秩序交疊下的伊朗政權謎題

      觀察|團結還是分裂?新舊秩序交疊下的伊朗政權謎題

      澎湃新聞
      2026-04-25 07:16:34
      61歲何智麗現狀:從日本回老家上海,與老友聚餐,面色紅潤沒發福

      61歲何智麗現狀:從日本回老家上海,與老友聚餐,面色紅潤沒發福

      以茶帶書
      2026-04-14 14:09:22
      上海警方:2人在乘坐軌交時大打出手,均被行政拘留

      上海警方:2人在乘坐軌交時大打出手,均被行政拘留

      上觀新聞
      2026-04-25 10:50:10
      5-0!英超保級隊狂飆 6輪不敗+2連勝轟9球 熱刺哭暈:已被甩開8分

      5-0!英超保級隊狂飆 6輪不敗+2連勝轟9球 熱刺哭暈:已被甩開8分

      我愛英超
      2026-04-25 06:22:05
      江蘇一爺爺得知孫女懷孕,一周建成豪華雞窩:已經養了20只小雞

      江蘇一爺爺得知孫女懷孕,一周建成豪華雞窩:已經養了20只小雞

      極目新聞
      2026-04-24 14:04:58
      觸碰紅線,華晨宇撫仙湖演唱會被立刻叫停,原因被扒,令人唏噓

      觸碰紅線,華晨宇撫仙湖演唱會被立刻叫停,原因被扒,令人唏噓

      許三歲
      2026-04-24 22:36:22
      北上廣深樓市暖風勁吹,到底了?摩根大通:中國樓市逼近拐點

      北上廣深樓市暖風勁吹,到底了?摩根大通:中國樓市逼近拐點

      南方都市報
      2026-04-24 20:32:23
      “明天下雨,面試能改天嗎”:角色定位不清,是成年人最大的災難

      “明天下雨,面試能改天嗎”:角色定位不清,是成年人最大的災難

      精讀君
      2026-04-24 09:00:18
      72歲王健林,被逼到崩潰邊緣......

      72歲王健林,被逼到崩潰邊緣......

      酷溫coolwin
      2026-04-24 16:46:47
      開市客北京:兩家COSTCO都是真的;開市客中國:暫不回應

      開市客北京:兩家COSTCO都是真的;開市客中國:暫不回應

      第一財經資訊
      2026-04-24 21:56:13
      在當下歷史的關鍵拐點,選擇中立,就是縱容邪惡

      在當下歷史的關鍵拐點,選擇中立,就是縱容邪惡

      壹家言
      2026-04-24 21:46:00
      皇馬奪冠夢碎!一戰4大爭議判罰,阿韋洛亞開炮,裁判到底在幫誰

      皇馬奪冠夢碎!一戰4大爭議判罰,阿韋洛亞開炮,裁判到底在幫誰

      奧拜爾
      2026-04-25 11:43:52
      好消息!全國免費電視正式落地,不用裝寬帶不交年費5分鐘就能看

      好消息!全國免費電視正式落地,不用裝寬帶不交年費5分鐘就能看

      小柱解說游戲
      2026-04-25 01:26:48
      58歲江珊露面,150斤穿西裝腚大腰圓,但臉顯年輕幾乎沒皺紋

      58歲江珊露面,150斤穿西裝腚大腰圓,但臉顯年輕幾乎沒皺紋

      墨印齋
      2026-04-24 16:43:38
      川崎前鋒官方:原中國籍19歲后衛關德晴已正式取得日本國籍

      川崎前鋒官方:原中國籍19歲后衛關德晴已正式取得日本國籍

      懂球帝
      2026-04-24 18:27:06
      徹底攤牌!首相訪華結束才5天,該國高官:中國投資可以,人別來

      徹底攤牌!首相訪華結束才5天,該國高官:中國投資可以,人別來

      聞識
      2026-04-24 12:23:01
      2026-04-25 12:07:00
      中科院物理所 incentive-icons
      中科院物理所
      愛上物理,改變世界。
      10100文章數 136526關注度
      往期回顧 全部

      科技要聞

      Anthropic剛拿亞馬遜250億美元,又拿谷歌400億

      頭條要聞

      房屋燒毀3年居民安置落空:原地塊已被規劃為商業用地

      頭條要聞

      房屋燒毀3年居民安置落空:原地塊已被規劃為商業用地

      體育要聞

      火箭0-3觸發百分百出局定律:本季加時賽9戰8敗

      娛樂要聞

      鄧超最大的幸運,就是遇見孫儷

      財經要聞

      別高估英偉達,別低估DeepSeek

      汽車要聞

      2026款樂道L90亮相北京車展 樂道L80正式官宣

      態度原創

      家居
      游戲
      教育
      公開課
      軍事航空

      家居要聞

      自然肌理 溫潤美學

      《原神》新區域“凍原”確定8月12日上線 冰封雪原

      教育要聞

      農村學生迎來“好消息”!教育部新規:取消戶籍限制,9月起執行

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      美防長:戰事不會“沒完沒了”

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 亚洲精品成人网| www欧美在线观看| 日日噜噜夜夜狠狠视频| 中文字幕aav| 一本色道久久加勒比精品| 国产熟睡乱子伦午夜视频| 国产精品毛片一区二区| 亚洲色网导航| 人妻久久久| 一级做a爱视频在线播放| 激情一区二区三区成人文| 人妻忍着娇喘被中进中出视频| 狠狠综合久久av一区二区| 潼关县| 91综合色| 中文字幕日日夜夜| 国产精品理论片在线观看 | 亚洲国产一区二区a毛片日本| 无码精油按摩潮喷在线播放| 人妻少妇精品无码专区二区| 国产成人久久婷婷精品流白浆| www插插插无码视频网站 | 国产在线观看香蕉视频| 亚洲无av在线中文字幕| 国产欧美另类久久久精品丝瓜| 熟女蜜臀av麻豆一区二区| 中文字幕无码精品亚洲35| 中文字幕亚洲综合第一页| 午夜性色福利在线视频风险| 国产精品久久午夜夜伦鲁鲁| 拉萨市| 亚洲伊人天天色| 日韩在线一区二区| 国产综合av一区二区三区| 亚洲成人在线电影| 久久夜色精品国产噜噜亚洲sv| 成人乱码一区二区三区av| 久久在线看| 白浆一区二区三区| 亚洲人成亚洲人成在线观看| 国产精品免费视频网站|