網易首頁 > 網易號 > 正文申請入駐

斯坦福最新研究：睡一覺，AI 就知道你還能活多久

2026-04-06 20:54:34　來源: AppSo

廣東舉報

分享至

z通過一晚上的睡眠，AI 模型就能監控最多 130 種疾病。

老年癡呆、高血壓性心臟病、中風、前列腺癌、乳腺癌、二型糖尿病等等，它都能預測到。

這聽起來就很像多年前，那場硅谷大騙局，一滴血驗證幾百項生化指標。但睡眠聽起來比血液，在不靠譜這方面，有過之無不及。

一般來說，睡眠的監控，頂多就是每天早上醒來，我們可能會習慣性地看一眼連接手表的 App，昨晚深睡了幾小時？評分是多少？

好一點的手表，可能還有睡眠呼吸頻率、HRV 等結合不同算法，來呈現更詳細的睡眠數據。

但如果現在有人說，這一夜看似平靜的睡眠數據里，其實藏著你未來幾年的健康命運，你會不會覺得這是天方夜譚，但又充滿好奇。

就在最近，斯坦福大學團隊在頂級醫學期刊《Nature Medicine》上發表了一項重磅研究，他們開發了一個名為 SleepFM 的 AI 基礎模型，只是通過閱讀我們一個晚上的睡眠數據，就能預測未來患 130 種疾病的風險，甚至包括我們還能活多久。

SleepFM 這個睡眠評估模型，目前已經在 GitHub 上開源。科幻電影里才會上演的體檢情節，AI 把它照進了現實。

具體是怎么一回事，一起來看看這個模型是怎么訓練出來的。

斯坦福的研究團隊給 AI 「喂」了 65000 多名參與者、總計時長超過 585000 小時的睡眠記錄。這個龐大的數據庫讓 SleepFM 學會了人類無法察覺的生理「語言」。

六萬多名參與者的信息主要來自斯坦福大學的睡眠診所，作為主力軍，該研究診所貢獻了約 35000 名參與者。這些數據記錄，也并非一時半會收集的，而是從 1999 年一直覆蓋到了 2024 年，整整跨越了 25 年。

還有來自商業醫療機構 BioSerenity 的數據，數據包含了美國 240 個睡眠中心的近 19000 份記錄，同樣時間涵蓋了 2004 年到 2019 年的長周期數據。

此外還有一些公共數據集，增加模型對不同人群的適應性；以及專門用來評估模型能力的測試集等。

這些長達 25 年的數據積累，讓研究人員有機會做一場時間驗證。他們用 2020 年以前的舊數據訓練 AI，然后讓它預測 2020 年以后患者的情況。如果數據積累不夠久，根本不可能驗證「提前 6 年預警疾病」這種超長周期的預測能力。

有了海量且長周期的數據，這里就得潑一盆冷水了。他們使用的數據，和我們手環上那幾個簡單的數字根本沒法比，他們用的是在睡眠門診里，常用的分析工具——多導睡眠圖（PSG）。

SleepFM 框架描述，圖 A 為多導圖的設置情況，以及來自不同睡眠中心的數據統計。圖 B 和圖 C 是將不同模態的數據，例如心電圖 EKG、腦信號 BAS、肌電圖 EMG 等信號，通過神經網絡編碼，轉成深度學習模型能訓練的特征，并預測最后的結果。圖 D 為臨床應用的評估結果。

在這個龐大的實驗中，SleepFM 學習的是最復雜的生理信號組合，即多導睡眠圖中包含的豐富數據，包括記錄大腦在想什么的腦電圖、記錄心率變化的心電圖、以及捕捉身體肌肉運動的肌電圖、和記錄呼吸信息的氣流信號等。

普通人不可能天天帶著這些線睡覺，這是目前的門檻所在。但另一方面，也正是因為數據如此豐富，SleepFM 才能做到普通設備做不到的事。

基于這些跨越時間的數據，斯坦福團隊通過回顧性實驗，讓 AI 預測患者隨后 6 年的真實電子病歷記錄。

在斯坦福內部測試集上，針對不同疾病大類（如循環系統、神經系統、腫瘤等）的整體預測表現。橫軸列出了循環系統、精神障礙、神經系統甚至腫瘤等十多個大類。圖中每一個黑點代表一種具體的病，位置越高，說明 AI 預測得越準（C-Index 和 AUROC 越高）。可以看到，它在神經系統和循環系統疾病上的表現尤為突出，遠超及格線（虛線表示）。

結果令人非常吃驚。僅憑一個晚上的睡眠數據，SleepFM 成功預測了 130 種疾病風險（準確度指標 C-Index > 0.75），它的準確度遠超預期。在斯坦福睡眠中心的內部測試集上，預測結果準確的均在 75% 以上。

全因死亡率（預測壽命）：準確度 84%。

癡呆癥：準確度 85%。這意味著在記憶開始模糊的幾年前，大腦在睡眠中發出的電信號就已經變了。

心力衰竭與心肌梗死：準確度分別為 80% 和 81%。

慢性腎病：準確度 79%。

其中，評估用的 C-Index 和 AUROC 都是用來給 AI 模型打分的指標，衡量它預測疾病到底準不準。簡單來說，數值越接近 1，說明模型越厲害；接近 0.5 則說明模型在瞎猜。

C-Index (Harrell's Concordance Index)，中文名是一致性指數，它衡量的是模型對病人風險排序的準確性。

AUROC (Area Under the ROC Curve），中文名：受試者工作特征曲線下面積，論文中是衡量，AI 能否準確區分出，哪些人在做完睡眠檢查后的 6 年內會得病，哪些人不會。

模型在外部獨立數據集（SHHS）上的測試結果。結果顯示，在針對中風（Stroke）、心力衰竭（Congestive HF）、心肌梗死以及心血管疾病死亡等 6 項關鍵指標的預測中，AI 依然保持了極高的準確率（大部分 AUROC > 0.8）

從這個角度來看，能證明它確實掌握了「核心醫術」，不是對這 65000 人的電子病歷死記硬背。

但是，既然都要去醫院貼滿電極做 PSG，這個 AI 還有什么用？雖然是一晚上，但是要監控心電圖、腦電圖、肌電圖，這跟我想的「睡一覺」完全不一樣。

睡眠研究常用多導圖設備（PSG）

斯坦福在論文最后給出的結論提到，首先是 SleepFM 這個模型，在同類型的多導圖預測疾病的模型中，目前是做得最好，預測最準確的一個模型。

另一方面，他們提到這也是一種存量價值。意思是，根據他們的統計，目前全球每年有數百萬人因為打呼嚕（睡眠呼吸暫停）去做 PSG 檢查。

但是在過去，這堆復雜的數據醫生看完 PSG 的「呼吸指標」后，這份檢查就沒用了。現在有了 SleepFM，同樣的一次檢查，不需要病人做額外的工作，就能得到一份關于心臟、大腦和壽命的深度風險報告，這是對現有醫療資源的極致利用。

此外，他們也沒有給多導圖之外的監控數據使用，判死刑。具體來說，SleepFM 模型像是一個可穿戴設備的教師，而我們現在的智能手表所采用的分析算法，可以說是一個學生。

在這篇論文中埋下了一個彩蛋，SleepFM 采用了一種通道無關（channel-agnostic）的設計。這意味著，雖然它是被多導圖那全套裝備，訓練出來的，但它被訓練得非常靈活。

即使未來去掉了腦電圖，只剩下智能手表能測到的心電和呼吸信號，這個經過大師級訓練的 AI，依然能利用它學到的通用規律工作。

就像論文作者所展望的，SleepFM 能為未來基于可穿戴設備的無創、實時健康監測，鋪平道路。

這么看下來，基于多導圖的睡眠數據，還是要比那滴血更靠譜一點。論文作者在 X 發文說，多導圖能獲取的數據，比消費級的穿戴設備確實要多，但使用更便攜的穿戴設備，是他們未來工作的方向。

有網友評論說，

這項研究最終將指向這樣一個事實：幾乎所有疾病都與代謝有關，而個體的代謝狀態最能體現在睡眠中。

睡眠數據看起來像一座冰山，漂浮在海面上我們看到的只是非常有限的一部分。SleepFM 也是朝著將我們的睡眠，作為早期健康預警系統，邁出了重要一步。

在消費級穿戴設備的傳感器精度進一步提升，配合這種經過臨床大數據訓練的 AI 算法，我們的智能手表，將來或許真就能成為一個全天候的 AI 醫生。

到那個時候，它不僅能記錄我們的入睡時間，而且能在身體發出細微求救信號的第一時間，發送一條也許能改變命運的提醒，「檢測到早期風險信號，建議及時就醫或改善生活習慣。」

在這個未來到來之前，最好的健康建議依然沒變：今晚，早點睡吧。

歡迎加入 APPSO AI 社群，一起暢聊 AI 產品，獲取，解鎖更多 AI 新知

我們正在招募伙伴

簡歷投遞郵箱hr@ifanr.com

?? 郵件標題「姓名+崗位名稱」（請隨簡歷附上項目/作品或相關鏈接）

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.