![]()
認為通用人工智能能夠靠現有技術架構迅速實現的,可能傾向于認為人類世界是虛擬的,所有人都是假人。
先從馬斯克說起,因為目前很多人認為通用人工智能能夠很快實現,很大程度是受馬斯克影響。
前不久,馬斯克預測2026年是通用人工智能落地的分水嶺,AI開始具備獨立思考和自主決策能力,2030年AI整體智能將超過人類總和。于是很多人都在說馬上就要實現通用人工智能了,人類即將被AI替代。在這一假設基礎上,有智庫還寫了
但,馬斯克不是科學家也不是工程師,他是商人,他最核心也是最擅長的是商業和資本運作,他分析的技術方向需要關注,但技術實現的具體節點,是服務于資本運作,當不得真。
一定注意識別馬斯克那句話是真實的,他為了資本運作,是不在乎夸張的,甚至經常把10年甚至20年才能實現的濃縮為一年,反正實現不了也無所謂,市值和融資拿到手就行了。
馬斯克2011年說最早2020年把人送上火星,隨著時間點臨近,推遲到2022年,然后是一點點推遲到2024年、2026年、2027年、2028年、2029年、2030年以及當前最新的2033年,其實每一次推遲,都有他的資本運作目的,比如2019年炒作,是為了服務星艦項目。
2015年說他的公司距離完全實現自動駕駛還有兩年,到2019年說2020年將有一百萬輛自動駕駛出租車出現在街頭,但時至今日,仍然只在最初試點的少數城市以低數量運行,運行數量也低于中國。
2025年,又說到2030年要年產100萬臺擎天柱機器人,2025年內就要生產5000臺;同樣是2025年,他又說要發射100萬顆星鏈衛星,還要搞太空光伏、太空算力。至于超級跑車、超級高鐵等等零零散散的項目,那就更多了。
馬斯克最常說的目標是“百萬”,也證明馬斯克不過是隨便說一說,因為英文中百萬是一個詞“million”,在傳播上,就像中國人說一個小目標是1億而不是2億、3億、5億一樣,更加朗朗上口。
就拿星鏈衛星來說,地球近地軌道能夠容納的低軌衛星,也就是20多萬顆,怎么可能達到100萬?何況星鏈衛星的壽命最多也就是5年,如果要保持100萬同時在軌,需要每年發射20萬顆,這根本不現實。
除了資本炒作和市值目標,馬斯克從未如期實現任何承諾過的技術或產品目標,唯一例外是上海超級工廠。
所以對馬斯克的話,要關注他說的技術方向,重視他炒作故事要支撐的資本目標,但對具體的時間節點,不宜當真。不過馬斯克仍然值得學習,就在于他雖然夸張、炒作故事,但他確實努力去實現,資本炒作與理想主義,并不矛盾。
更需要國內金融投資行業學習的是,但凡用理性思考甚至回顧下過往,就知道馬斯克是在吹牛,但美國金融和投資機構就是相信,這不得不服。
就比如最近馬斯克說在近地軌道部署100萬顆星鏈衛星,如果從地球發射實在太慢了,傳統火箭發射成本太高,所以提出從月球用電磁彈射向地球發射衛星,就把發射成本降低90%。為此馬斯克設想,在月球建一座衛星組裝廠,把衛星零件從地球運過去,組裝完成后再用電磁彈射發往地球軌道。
這種故事,用正常人的思維應該不難發現荒謬之處,要從月球反過來發射,月球基地的建設需要多少成本和時間呢?干嘛舍近求遠?
但這都不重要,無論再荒謬的事情,只要是馬斯克說的,就有很多人信。
馬斯克還說過一句話,他說“這個世界99%是虛擬的,我們可能并不生活在真實世界中”,言下之意就是認為所有人不過是一串代碼。相信這個判斷馬斯克是真的相信,也只有人類世界是虛擬的,他才敢說以目前的本質是統計學的AI大模型架構,能夠很快通往通用人工智能。
追溯生成式AI大模型的發展歷程,其底層算法架構從最早的支持向量機VSM、邏輯回歸、長短期記憶網絡一路發展到革命性的Transformer架構,伴隨算力提升,模型參數量不斷暴增。
在這個過程中,發現了一個很詭異的事情,那就是只要參數足夠多、算力足夠強,AI就是能更加精確地預測下一個詞應該是什么。
其本質就是統計學,對這一點沒有分歧。
但之后對AI的未來發展就出現了分化,區別在于是否相信統計學能夠實現真正的智能。
有人認為人類的文本語言本質是一種高維信息,大語言模型的海量訓練就是在一個人類尚未感知到的高維空間去總結事物背后的規律,只要AI能做到精準預測下一個詞,就說明AI已經懂了整個世界的運行規律。還認為人類智慧剛開始也可能只是本能,只不過不斷累積參數,然后在隨機中涌現出來了天然智能。
沿著這個思路往下走,自然認為只要繼續堆疊算力、堆疊參數,總有一天能夠對整個世界進行建模,只要AI能夠完美預測到下一個詞,就等同于可以預測世界。
比如斯蒂芬·沃爾弗拉姆所著《這就是ChatGPT》一書,就認為“當你輸入一段提示詞,你其實是在這個高維空間里確定了一個起點和方向。模型預測下一個詞,就是在這個流形上沿著概率密度最高的路徑走一步”。
按照這個思維,認為智能就是預測,人類靠大規模的神經元能夠構建出智能,憑什么AI不行?
以上還是比較講科學的,還有的將智能歸結為神秘學甚至外星人,這就有些不可知論甚至邪教味道了,就不多說了。
對上述觀點,小鎮個人是不信的,小鎮更認可Meta前首席AI科學家、2018年圖靈獎得主楊立昆的觀點。
他提到一個關鍵,他在演講時說,訓練一輛自動駕駛汽車需要數百萬小時的數據,而一個17歲的青少年只需大約10個小時就能學會開車。
他認為根本區別在于,:當前AI模型是自回歸模型,也就是基于統計學的預測模型,不可能對物理世界形成真實的認知,說到底不過是基于既有信息,進行最大概率的預測罷了。正是基于這一認識,楊立昆才選擇去搞世界模型,但相比靠堆參數和算力就能看到進步的生成式AI,世界模型這條路目前看不到實現的可能。
順帶一提,推理和訓練,也是目前AI工程實踐中完全不同的發展方向。所謂訓練就是嘗試讓AI模型學會知識,通過海量帶標簽的樣本數據,通過算法迭代和堆疊萬億級參數,從而求解出機器學習模型最優參數,說得直白點就是對下一個詞的預測變得更加準確。這也是目前生成式AI大模型采取的方式。
而推理則重在運用知識,也就是依托已經訓練完成的模型參數,對新輸入數據進行預測、生成響應,重點是AI技術落地解決實際問題。
目前國產算力芯片重點放在推理上。新增光刻機等基本配屬到推理芯片生產上,這也讓AI大模型公司意見很大,認為訓練芯片的短板導致中美之間AI大模型差距進一步拉開,不過硬件部門也有自己的看法,認為是AI大模型公司算法不行,沒法充分利用現有硬件潛力。這種互相掰扯,就不多討論了,都覺得自己說的有道理。
但這種傾斜本身,已經體現了國家的看法,那就是不相信現行生成式大模型,這種基于統計學的自回歸模型,能夠通往真正的通用人工智能。在國家看來,與其將所有籌碼壓在很可能無法實現的技術方向上,不如務實地先把AI應用于各行各業、推動生產力實質提升,再以更強的生產力去帶動AI技術的發展,自然更支持推理類算力芯片的生產。
對比上述兩種思維,核心區別在于是否認為統計學能夠實現真正的智能。
那么首先需要定義到底什么是通用人工智能,目前有很多不同定義,主要有四類。
一是基于能力:認為AGI應該是一種能與人類綜合認知能力相媲美的人工智能系統,其能力范圍可以覆蓋人類智能的各個方面;
二是基于行為:最典型的就是“圖靈測試”,認為只要AI表現出來的行為與人類無法區分,那就行了,后來還提出了“咖啡測試”,也就是機器人能夠進入普通家庭并獨立制作咖啡,差不多是一個意思,就是不管機器人到底有沒有跟人類一樣的意識和智能,只要表現出的行為一致就行。
三是基于范式:簡單地說就是AI能夠主動發現任務,理解任務背后的價值和意義,并據此做出決策。
四是基于適應性:也就是能夠在有限資源限制下,有效適應環境、解決未曾見過的問題,更強調學習和進化的過程,并不鎖定在實際能力上。
總結上述四種定義,最終殊途同歸,那就是通用人工智能,應該能夠基于已知去探索未知。
認為靠統計學能夠實現通用人工智能,本質就是認為這個世界是虛擬的,因為虛擬所以知識必然是有邊界的,只需要靠堆參數、堆算力,就一定能夠實現。
也就難怪馬斯克會認為人類世界是虛擬的、2030年人工智能可以超越人類。也只有在這種情況下,統計學才能包打天下。
于是,關于AI的發展路線,就變成了唯心和唯物之爭。
所以,相信AI可以很快實現通用人工智能、超越人類,或許更容易相信或者說信仰某種神秘力量,比如神、外星人等等操控人類世界。
自從想明白這一點,小鎮再看到說通用人工智能18個月、兩年、很快就會實現的,小鎮也就不多說啥了,只回復,等你說的這個時間,咱們用實踐來驗證下,記得到時候回來留言,咱們驗證一下。
大家怎么看?
其他文章推薦
(中篇)
(上篇)
如果喜歡,還請點贊、“在看”和關注吧
歡迎分享,讓更多人發現“大樹鄉談”
備用:大樹鄉談2022、大樹鄉談2023
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.