<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>

色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3

<cite id="7d2ir"></cite>

<sub id="7d2ir"><s id="7d2ir"><form id="7d2ir"></form></s></sub>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

AI隱私警報已拉響，南大團隊實現AI本地化部署破局，支持國產顯卡

2025-11-26 18:01:15　來源: DeepTech深科技

北京舉報

0

分享至

2023 年，三星公司在接入 ChatGPT 不久之后，接連發生數起內部機密泄露事件。事件起因是三星員工將半導體設備參數、產品源代碼和生產良率等商業機密直接輸入對話系統，導致敏感信息被錄入 ChatGPT 的訓練數據庫。

無論是政務數據、個人隱私還是企業知識產權，一旦上傳至云端都可能面臨泄露風險。當前手機上常見的 AI 應用，其運行模式通常是將用戶的查詢數據上傳到云端服務器進行處理，而非在手機本地運行大模型。這意味著用戶在使用時需要同意服務商的數據使用協議，授權其上傳和處理數據。

這種云端模式存在隱私和安全方面的風險。未來，隨著大模型使用成本的下降，AI 將真正滲透到日常生活的方方面面。屆時，如果未來所有智能交互都依托云端基礎設施，社會各層級的信息將不可避免地向少數平臺集中，無法兼顧數據安全和智能化。

為此，南京大學計算機學院研究員李猛團隊在近期一項研究中，通過使用國產顯卡來推動模型的本地化部署，旨在解決上述隱私與安全問題。與此同時，該研究也旨在利用更少的顯存資源完成更復雜的計算任務，從而緩解高性能顯存供應緊張的問題。

（來源：課題組）

研究中，他和團隊首次發現了混合專家模型中“低分專家可被替換”這一關鍵規律，基于此規律他們首次設計出能將專家緩存命中率提升 2 倍以上、能夠最大化顯存利用效率的系統方法。

在中小企業或家庭等邊緣計算場景中，這項技術能大幅降低硬件成本。例如，原本需要兩張顯卡才能運行的任務，現在一張顯卡即可勝任。未來人們不再需要將模型全部權重加載到顯存中，就能顯著節省推理服務的顯存占用。

另一個極具潛力的方向是移動端。手機內存天然受限，目前大多只能運行高度壓縮的模型，這往往伴隨著計算量增大和性能損失。而本次技術能將更強大的混合專家模型部署到手機上，這意味著用戶無需購買超大內存的手機，就能在現有設備上體驗到更高智能水平的模型。

（來源：https://arxiv.org/pdf/2508.18983）

未來無需為追求更強 AI 購買更高內存手機

李猛團隊之所以致力于將大模型能力部署在手機等邊緣端側設備上，是因為這種方式能讓 AI 計算在本地完成，數據無需離開用戶設備，從而在隱私保護、安全性和服務可靠性方面都更具優勢，為用戶提供一種更穩健、可控的 AI 使用方案。

那么，這會對手機價格帶來影響嗎？手機內存規格是廠商定價的一個因素。但是，本次技術的核心在于更高效地利用手機已有的內存硬件，而不是改變其物理規格或推高價格。

李猛觀察到，隨著大模型能力向端側下沉，未來手機行業的一個趨勢是：為了在本地運行更強的 AI 模型，手機內存規格可能會被動提升，這確實可能導致手機價格上漲，用戶相當于為更強大的端側智能付費。而本次成果恰好提供了一個更優的解決方案：它能讓手機在現有內存容量下，實現原本需要更大內存才能支撐的推理能力。

這意味著用戶可能無需為追求更強 AI 功能而必須購買更高內存版本的手機，從而在獲得先進體驗的同時，緩解了因硬件升級帶來的成本壓力。

對于普通用戶而言，他們可能直觀上會覺得云端大模型能力更強、體驗更好。然而，在必須使用本地模型的合規場景下，本次技術首先解決了“有無”問題，使得在端側部署可用模型成為可能。

其次，對于高度重視個人隱私的用戶來說，這項技術至關重要。如果你很在意數據安全，那么就不希望將個人信息交給那些數據處理政策不明的 App。

目前，一些大模型具備所謂的“讀心術”功能，本質上是通過全面收集和分析用戶的歷史數據（包括使用記錄和對話內容）來推測個人信息。這種深度的數據采集和潛在的信息泄露風險是相當可怕的，而本地化部署則能從根本上避免此類隱私問題。

（來源：https://arxiv.org/pdf/2508.18983）

將模型的內存占用減少一半以上

據介紹，李猛團隊在與業界溝通時發現：當前國內高校采購英偉達顯卡時，面臨價格高昂和受制裁的限制，因此需要尋找國內可替代的顯卡方案。

然而，李猛在嘗試使用國產顯卡進行開發時發現，這些顯卡雖然在算力上能夠滿足需求，但顯存容量普遍不足。例如，在嘗試將一個大模型載入 24GB 顯存時，盡管算力是足夠的，但卻因顯存不足而無法加載完整模型。

目前，各種手機助手在提供本地 AI 功能時，底層實際上都運行著一個大模型（可能是廠商自研的），需要被加載到手機內存中進行本地計算。

眼下，一些廠商已開始嘗試將模型完全部署在本地運行，但這帶來了顯著的內存占用問題。手機內存本身已被各類應用大量占用，再加載一個大模型就如同在擁擠的房間里硬塞進一個沙發，空間會更加捉襟見肘。

因此，李猛團隊開始探索如何在固定規格的顯卡中加載并運行更大的模型。核心思路是充分利用算力資源，通過優化顯存使用來以更經濟、高效的方式運行模型。

由于 Transformer 等架構的模型是分層計算的，所以當前那些沒被使用的層無需一直占用顯存。

基于此，他們將暫時不需要的模型權重存放在外部，待需要時再動態加載至顯存中，從而緩解顯存瓶頸，旨在實現在有限顯存條件下運行更大模型的目標，即讓模型無需完整駐留內存，而是只將當前必需的部分保留在內存中，其余部分暫存于外部，待需要時再動態調入。

這相當于將模型的內存占用減半甚至更多，從而在有限的手機內存資源下，高效地實現強大的本地 AI 功能。

（來源：https://arxiv.org/pdf/2508.18983）

刷新對于國產顯卡的認識

另據悉，這次研究由李猛和業界共同探索完成。最初，李猛團隊期望能在手機上部署該技術，但發現當時模型對內存的需求仍然過大，超出了手機的承載能力，因此手機端合作暫時擱置。

隨后，李猛團隊轉向與國產算力團隊展開合作。后者為其提供了自研的國產計算卡等資源支持，這些卡雖然算力足夠，但顯存容量同樣有限。在這一現實約束下，李猛和學生梳理了已有的相關工作，但無論是預加載方案還是直接丟棄部分專家的方案，都無法在速度和精度上同時令人滿意。

于是，他們轉而開始研究混合專家模型訓練過程中的原理性工作，并注意到了其中可能存在的專家冗余特性。由此，他們提出了“專家替換”的猜想，但初期嘗試表明，直接進行全局替換效果不佳。

此時，他們關注到高通研究院的相關成果，后者發現丟棄低分專家有時對精度影響不大，這讓他們意識到：或許可以專注于對低分專家進行替換。

將“替換”與“聚焦低分”這兩個思路結合后，他們取得了關鍵突破：只需替換低分專家，就能同時實現速度快和精度高。但是，這只優化了單步計算，而一個實用的系統需要達到全局最優。

為此，他們進一步探索了專家選擇在連續幾步中的規律，發現其存在明顯的連續性。基于此，李猛團隊將專家替換策略與多步預測相結合，設計了一套完整的系統，能夠最大化專家復用概率并將顯存命中率提升至最高。

當這套系統在國產算力和英偉達等計算平臺上驗證有效后，他們重新審視了手機端的應用。雖然手機端需要更精細的內存管理，但底層原理是相通的。

（來源：https://arxiv.org/pdf/2508.18983）

據了解，整個研發過程是在“不改動模型架構、不犧牲精度”的嚴格約束下推進的。正是這種約束促使他們必須從系統層面發現新規律，并讓其果真發現了“專家可替換性”的規律，它直接催生了新的系統設計，帶來了整體性能的顯著提升。目前，這一“專家替換”思路及相應的系統設計仍是該團隊的首創，尚未見到類似工作。

這次研究也讓李猛對國產硬件有了全新的認識。在項目啟動前，他尚未實際接觸到國產硬件，對國產算力的性能和生態完善度也曾存有疑慮。而通過這次實踐，他切身感受到國產硬件生態正在快速成長且實力可觀。

盡管在工具鏈等方面可能仍面臨一些挑戰，但他和團隊所需的支持最終都能找到解決方案。“可以說，我親眼見證了國內計算生態與硬件能力建設的顯著進步。雖然與國際頂尖水平仍有差距，但未來的發展前景無疑是值得期待的。”李猛表示。

（來源：https://arxiv.org/pdf/2508.18983）

基于此次研究，他和團隊形成了一個重要認知：即單純聚焦于硬件或軟件算法都遠遠不夠，必須推動軟硬件與算法的協同設計和螺旋式迭代。

這指引他們確立了新的研究方向：持續專注于端側與邊緣側，包括手機、個人電腦及小型服務器等資源受限場景，致力于提升這些設備上的智能計算能力。

李猛告訴 DeepTech，他的愿景是希望智能計算（如 Token 所代表的計算資源）能像水電一樣，成本降至全社會可普遍使用的水平，讓小型或廉價設備也能承載強大的智能。

展望未來，他計劃進一步降低單位智能的計算成本，并推動其在更廣泛場景的落地。未來，也許僅需幾十或幾百元的小型硬件模塊，就能讓普通設備具備顯著的智能化能力。這將從根本上提升社會生產力，將人們從重復、繁重的勞動中解放出來，從事更具創造性的工作。

正如自來水的普及徹底改變了人們取用水的方式，李猛相信通過將智能計算推向邊緣和終端、不斷降低成本，最終將實現智能技術的普惠化。

參考資料：

相關論文 https://arxiv.org/pdf/2508.18983

運營/排版：何晨龍

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

【數智周報】華為任正非：大量建設大模型是正確的探索，未來算力一定過剩；豆包手機助手觸發微信賬號強制下線？豆包、微信雙方回應；亞馬遜推出定制AI芯片Tra

鈦媒體APP 2025-12-07 11:11:13
14 跟貼 14
英霸已老，谷王當立 | 財經峰評

鈦媒體APP 2025-12-07 22:30:21
19 跟貼 19

一次美國自駕，看清中美AI的差異性

鈦媒體APP 2025-08-01 08:20:10
406 跟貼 406

英偉達AI世界模擬器？AI P圖學會「腦補」過程了！

新智元 2025-11-04 19:33:28
0 跟貼 0
字節Seed團隊發布循環語言模型Ouro，在預訓練階段直接「思考」

機器之心Pro 2025-11-04 11:58:36
0 跟貼 0

具身覺醒：AI 從感知到行動的能力躍遷

鈦媒體APP 2025-12-02 18:02:12
0 跟貼 0

大廠禁用Cursor，程序員回歸“手搓時代”？

鈦媒體APP 2025-12-08 09:19:13
2 跟貼 2
靠一臺電腦和3D打印機，80后男子在杭州車庫手搓機器人

環球網資訊 2025-12-07 21:06:10
117 跟貼 117

瘋了！游戲本逆天改裝：一顆電阻4090反殺5090！

雷科技 2025-11-11 18:57:46
129 跟貼 129
外國小哥徒手改裝消費級5090，一舉擊敗巨無霸RTX Pro 6000

機器之心Pro 2025-06-24 15:18:45
28 跟貼 28
PC玩家太難了！OpenAI瘋狂掃貨DDR5：游戲內存也不能幸免

快科技 2025-12-05 17:45:06
17 跟貼 17
男人在外面要面子，本以為手機是假的，沒想到車標也造假！

虎子搞笑菌 2025-12-05 12:36:26
12 跟貼 12
閃存巨頭壯士斷腕！美光放棄消費者市場，國產機會來了？

雷科技 2025-12-06 11:15:37
75 跟貼 75
國產芯片新氣象

經濟觀察報 2025-12-06 22:02:59
0 跟貼 0
天璣 9500：讓“久用不卡”成為旗艦標配

雷科技 2025-12-05 10:16:46
9 跟貼 9
為什么比亞迪車機越來越卡了？真不是車本身的問題，是軟件搞的鬼

大志聊車 2025-12-05 05:54:35
5 跟貼 5
半年被同一人僅退款225次，損失超5萬！平臺漏洞成“提款機”？

丹哥熱評 2025-12-05 12:15:46
8 跟貼 8
確實沒有人什么都懂，但不懂裝懂，發表錯誤言論誤導人就不對了！

老田電腦 2025-12-08 08:49:44
0 跟貼 0
黃仁勛：中國的AI市場無論有沒有英偉達都會進步與華為是競爭對手不是敵人

財聯社 2025-07-21 10:22:14
7 跟貼 7
村委會換屆現場村民拍照遭制止，多人搶奪手機引熱議！

熱點動態1 2025-12-06 16:55:19
4685 跟貼 4685
民間鬼故事

AI鬼知道 2025-12-08 09:16:49
0 跟貼 0
特朗普被下套？涉臺法案強行落地，黃仁勛交底：美對華策略已崩盤

探源歷史 2025-12-08 03:36:39
0 跟貼 0
特朗普簽字！美全票通過涉臺法案，黃仁勛發聲，中美交易或將生變

溫讀史 2025-12-08 02:58:45
0 跟貼 0
人民日報：對最忙五人組不能一笑了之更需一查到底

人民網-人民日報 2025-12-07 16:49:26
5779 跟貼 5779
明朝最基層的治理體系縣衙的架構是怎樣的？

朝話熹史 2025-12-05 06:05:44
0 跟貼 0
劉世錦：有條件有意愿的地方可以在消費、民生、需求等方面步子大一些

證券時報 2025-12-07 13:55:02
5132 跟貼 5132
女孩地鐵手機沒電，下秒操作真開眼了，社牛少有的社恐時刻！

笑場大魔王 2025-12-06 16:25:23
1 跟貼 1
把鈔票放在手機上，真錢還是假錢立馬知道，再也不怕收到假幣了

中書省的世界觀 2025-12-08 03:04:04
0 跟貼 0
爺爺去世后，老叔把手機放進棺材里，半夜竟收到一條信息

追逐者生活 2025-12-06 16:18:08
0 跟貼 0
美國國家安全戰略報告：美國不允許任何國家過于強大

北京日報 2025-12-07 12:38:47
5656 跟貼 5656
小哥僅憑借一個金屬探測儀，在戶外探尋就能實現暴富你敢信嗎？

碳酸熊卡 2025-12-06 10:39:59
1 跟貼 1
要說藏手機這塊，商家簡直無敵了，沒有他做不到的東西

可互時尚 2025-12-07 08:42:51
0 跟貼 0
大媽手機掉到河里老伴立馬跳下去撈大媽找棍子回來卻不見老伴

奶桃影視君 2025-12-07 08:24:22
1 跟貼 1
這是電信詐騙吧，我這兩部手機同時響了，神奇的是同一個來電！

玉皇閣街拍 2025-12-07 09:19:46
0 跟貼 0
男子買了一部蘋果手機，爺爺看后問這得六七百吧，網友：這給爺爺嚇壞了都

青島焦點1 2025-12-07 17:36:10
1 跟貼 1
小伙找回蘋果手機的id，竟然在相冊里，發現了這么多的照片

輕笑語談 2025-12-07 12:00:16
17 跟貼 17
售價3499元豆包手機已售罄，購買者：能完成復雜指令，10分鐘投遞30份求職簡歷

極目新聞 2025-12-05 12:06:58
1215 跟貼 1215
姐姐和妹夫看手機，妹夫竟然這樣做，姐姐動作亮了

趣笑指揮官 2025-12-04 15:39:02
1 跟貼 1
女子的很多照片不舍得刪，于是印刷成書保存起來，網友：再也不怕手機內存不夠了

星沙時報 2025-12-06 11:46:05
0 跟貼 0
手機掉到危險邊緣，大叔死死捍衛住，有一點懈怠就掉下去了

乘風生活說 2025-12-07 09:22:22
0 跟貼 0

新疆網紅wu木三亞去世，人長的帥，朋友曝死因，上個月新店才開業

新疆網紅wu木三亞去世，人長的帥，朋友曝死因，上個月新店才開業

鋭娛之樂

2025-12-07 19:58:59

回鄉探親帶了10個保鏢，進村看到養父被鎖狗籠，村霸：你算老幾！

回鄉探親帶了10個保鏢，進村看到養父被鎖狗籠，村霸：你算老幾！

卡西莫多的故事

2025-12-05 09:26:38

估值4000萬百達翡麗四次流拍，深圳法院再拍為何無人敢買

估值4000萬百達翡麗四次流拍，深圳法院再拍為何無人敢買

瓜哥的動物日記

2025-12-07 02:01:18

約基奇28+9+11超越籃球之神，穆雷34分超新星打鐵，掘金8連斬黃蜂

約基奇28+9+11超越籃球之神，穆雷34分超新星打鐵，掘金8連斬黃蜂

釘釘陌上花開

2025-12-08 09:22:52

張本智和被漏報黑臉！西蒙力挺遭嘲：輸球不總結反操心對手？

張本智和被漏報黑臉！西蒙力挺遭嘲：輸球不總結反操心對手？

阿晞體育

2025-12-08 09:28:06

72歲曾志偉和紅顏知己現身日本大阪逛商場購物，手牽手很親密

72歲曾志偉和紅顏知己現身日本大阪逛商場購物，手牽手很親密

陳意小可愛

2025-12-06 01:59:29

笑麻了！港媒取標題是真不顧明星的死活啊，網友：這幫人才是文人

笑麻了！港媒取標題是真不顧明星的死活啊，網友：這幫人才是文人

夜深愛雜談

2025-11-30 12:30:45

楊千嬅兒子好帥，13歲身高超170、一年長10cm，大鼻子和爸爸一樣

楊千嬅兒子好帥，13歲身高超170、一年長10cm，大鼻子和爸爸一樣

觀察鑒娛

2025-12-08 09:21:57

美媒承認：中國已徹底解決發動機問題！J-20A性能已經超越F-22

美媒承認：中國已徹底解決發動機問題！J-20A性能已經超越F-22

涼羽亭

2025-12-06 18:47:57

東北野雞泛濫成災，為何很少有人吃？當地農民直言

東北野雞泛濫成災，為何很少有人吃？當地農民直言

忠于法紀

2025-11-07 09:25:39

開國大將要被執行槍決，偉人得知后大怒，直言：動他就是動我

開國大將要被執行槍決，偉人得知后大怒，直言：動他就是動我

雍親王府

2025-12-05 13:50:03

先見之明，奇才惠特摩爾如今已被棄用，火箭次輪或收獲大驚喜

先見之明，奇才惠特摩爾如今已被棄用，火箭次輪或收獲大驚喜

拾叁懂球

2025-12-07 11:59:05

教育“斷崖”已至：小學峰值剛過，大學“招生荒”倒計時僅剩7年

教育“斷崖”已至：小學峰值剛過，大學“招生荒”倒計時僅剩7年

笑熬漿糊111

2025-12-08 00:05:18

謙遜!國乒奪冠頒獎孫穎莎主動禮讓C位,讓王曼昱站中間自己去邊上

謙遜!國乒奪冠頒獎孫穎莎主動禮讓C位,讓王曼昱站中間自己去邊上

818體育

2025-12-08 09:08:41

40歲后才懂：這些年瞎花的錢，全是交了智商稅！

40歲后才懂：這些年瞎花的錢，全是交了智商稅！

一桶漿糊要一統江湖

2025-10-27 17:35:07

從AI到可回收火箭，美國剩下的技術神話不多了

從AI到可回收火箭，美國剩下的技術神話不多了

新潮沉思錄

2025-12-07 20:37:23

鴻輝光通被暫停全軍采購資格

齊魯壹點

2025-12-08 06:53:39

邁阿密奪冠之夜，梅西好兄弟被冷落：決賽無緣出場！賽后委屈落淚

邁阿密奪冠之夜，梅西好兄弟被冷落：決賽無緣出場！賽后委屈落淚

球場沒跑道

2025-12-07 09:10:03

陳松伶再瘦一圈變筷子腳臉小重拾下顎線，曾花一年時間激減20kg

陳松伶再瘦一圈變筷子腳臉小重拾下顎線，曾花一年時間激減20kg

粵睇先生

2025-12-07 00:34:34

就在今天！12月8日上午，男籃傳來徐杰、廣東宏遠和國家隊消息

就在今天！12月8日上午，男籃傳來徐杰、廣東宏遠和國家隊消息

桃葉渡春

2025-12-08 09:30:10

DeepTech深科技

麻省理工科技評論獨家合作

15954文章數 514349關注度

往期回顧全部

科技要聞

獨家|李笛再創業，炮轟大模型，再戰AI

頭條要聞

外媒：德外長訪華迎來政治生涯中最艱難一次出國之旅

頭條要聞

外媒：德外長訪華迎來政治生涯中最艱難一次出國之旅

體育要聞

梅開48度！2年半，這是梅西在邁阿密的一人一城

娛樂要聞

林俊杰AAA頒獎禮，韓娛愛豆均站起鞠躬

財經要聞

養牛場未見一頭牛每天開采礦石倒賣

汽車要聞

傳奇超跑電動形態重生雷克薩斯LFA純電概念車

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

健康

房產

家居

時尚

親子

甲狀腺結節"排雷"指南

房產要聞

封關啟幕宜居新時代！觀嵐森嶼定義三亞旅居度假新范本

家居要聞

白味湯館當代宴飲儀式

設計之美花園浪漫餐廳
自然融合溫暖柔和酒吧
電影質感中古風格的家

除了大衣，今年最火的外套一定就是它了！

親子要聞

這五招讓娃主動吃飯

© 1997-2025 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版主站蜘蛛池模板：欧美视频一区| 国产v综合v亚洲欧美大天堂| 无码人妻丰满熟妇区五十路百度| 国产精品青草久久久久福利99| 久久久www免费人成精品| 色欲av在线| 97国产视频| 人妻精品久久久久中文字幕69| 一级7777| www.久草| 亚洲午夜精品久久久久久抢| 亚洲国产精品久久艾草| 亚洲AV成人精品日韩在线播放| 超碰成人电影| 老鸭窝在钱视频| 中文字幕一区二区人妻| 商河县| 精品久久久久久中文字幕无码百度 | 少妇做爱视频| 成年无码av片在线蜜芽| 亚洲精品久久久久久久蜜桃臀| 国产成人综合日韩亚洲| 国产无码VA| 囯产精品久久久久久久久久妞妞 | 永久免费看mv网站入口| 亚洲av影院一区二区三区| 久久久www影院人成_免费 | 长葛市| 人妻无码专区| 久操资源站| 精品亚洲一区二区三区在线观看| 午夜天堂av天堂久久久| 夜夜春视频| 伊人在线视频| 免费av在线| 国产色无码专区在线观看| 88国产精品视频一区二区三区| 射阳县| 男女裸体做爰爽爽全过| 高潮迭起av乳颜射后入| 一起草av|

<pre id="pcug4"><code id="pcug4"></code></pre>

<cite id="pcug4"><track id="pcug4"></track></cite>

<blockquote id="pcug4"></blockquote>