![]()
你有沒有想過,人類記憶的局限性可能徹底被AI改寫?想象一下,如果有一個AI助手能夠24小時不間斷地聆聽你的生活,記住每一次對話、每一個想法,并在你需要時準確地回調(diào)這些信息,那會是什么樣的體驗?三位前Google X科學家正在將這個看似科幻的想法變成現(xiàn)實,他們剛剛為此獲得了570萬美元的種子輪融資。
TwinMind不是又一個聊天機器人,而是一個試圖成為你"第二大腦"的AI應用。它靜靜地在你的手機后臺運行,捕捉你的每一次談話、每一場會議,甚至是你無意中說出的想法,然后將這些碎片化的信息整合成一個個人化的知識圖譜。更令人驚訝的是,這一切都在你的設(shè)備本地完成,不需要將敏感信息上傳到云端。我發(fā)現(xiàn)這種技術(shù)路徑的選擇背后,隱藏著對AI助手未來發(fā)展方向的深度思考。這不僅僅是技術(shù)創(chuàng)新,更是對人機交互范式的全新定義。
從投資方的陣容來看,這個項目已經(jīng)吸引了硅谷頂級投資人的關(guān)注。Streamlined Ventures領(lǐng)投了這輪融資,紅杉資本也參與其中,最值得注意的是,Stephen Wolfram親自為這個項目寫下了人生第一張投資支票。這種投資者的背書讓我相信,TwinMind代表的不僅僅是一個產(chǎn)品,而是整個AI助手行業(yè)即將迎來的重大轉(zhuǎn)折點。
PS:我自己的創(chuàng)業(yè)項目已經(jīng)上線快一個月了,目前驗證反饋非常不錯。產(chǎn)品主打海外垂類細分市場,我們目前正在招一位合伙人級別的技術(shù),希望有全棧能力,熟悉海外技術(shù)棧,如果有海外留學背景就更好了,如果你感興趣,可以直接加我微信MohopeX聊聊。
為什么現(xiàn)在是"第二大腦"的時代
我一直在思考一個問題:為什么ChatGPT、Claude這些強大的AI工具,在日常使用中仍然讓人感覺"不夠智能"?答案其實很簡單,它們?nèi)狈τ洃洝C看螌υ挾枷袷堑谝淮我娒妫阈枰匦陆忉尡尘啊⒅匦绿峁┥舷挛模@種體驗離真正的智能助手還有很大距離。TwinMind的創(chuàng)始人Daniel George在JPMorgan工作時深深體驗了這種痛點,當時他每天要參加無數(shù)個會議,于是他開發(fā)了一個腳本來錄制音頻、轉(zhuǎn)錄文本,并輸入到ChatGPT中。神奇的事情發(fā)生了,隨著時間的推移,ChatGPT開始真正理解他的項目,甚至能生成可用的代碼。
![]()
這個經(jīng)歷讓George意識到,記憶是AI助手的關(guān)鍵缺失環(huán)節(jié)。當前的AI工具就像患有失憶癥的天才,每次交互都從零開始。而人類的智能很大程度上來自于我們能夠積累經(jīng)驗、建立聯(lián)系、形成個人化的知識體系。TwinMind正是要為AI補上這塊拼圖,讓它真正理解你這個人,理解你的生活、工作和思考方式。
但記憶帶來的不僅僅是便利,更是AI助手向真正個人化轉(zhuǎn)變的基礎(chǔ)。想象一下,當AI知道你過去三個月一直在關(guān)注的項目、你的工作風格、你的合作伙伴,它就能提供真正有價值的建議,而不是千篇一律的通用回答。這種個人化程度是目前任何云端AI服務都無法達到的,因為它們?nèi)狈Τ掷m(xù)的、深度的用戶背景理解。
![]()
從技術(shù)發(fā)展的角度看,我們正處在一個關(guān)鍵節(jié)點。移動設(shè)備的AI處理能力已經(jīng)足夠強大,可以在本地運行復雜的語言模型。Apple Silicon的AI核心、高效的本地轉(zhuǎn)錄技術(shù),這些硬件基礎(chǔ)設(shè)施的成熟,為像TwinMind這樣的應用提供了技術(shù)可能性。同時,用戶對隱私的關(guān)注也達到了前所未有的高度,本地處理的優(yōu)勢變得更加明顯。這些因素的匯合,創(chuàng)造了"第二大腦"應用爆發(fā)的完美時機。
TwinMind的技術(shù)創(chuàng)新究竟有多厲害
讓我印象最深刻的是TwinMind在技術(shù)實現(xiàn)上的巧思。大多數(shù)競爭對手,比如Otter、Granola這些會議記錄工具,都是基于React Native構(gòu)建,依賴云端處理。但蘋果的系統(tǒng)限制讓這些應用無法在后臺長時間運行。TwinMind團隊卻選擇了一條更艱難但更有效的路徑:用純Swift構(gòu)建底層服務,直接在iPhone上原生運行。George告訴我們,他們花了六到七個月時間來完善這個音頻捕捉系統(tǒng),"在蘋果的圍墻花園中找到了很多技巧"。
這種技術(shù)選擇帶來的好處是顯而易見的:TwinMind可以連續(xù)錄制16到17個小時而不會耗盡設(shè)備電池。這意味著你可以在一整個工作日中保持應用運行,捕捉所有重要的對話和想法。更重要的是,所有處理都在設(shè)備本地完成,音頻實時轉(zhuǎn)錄為文本,然后音頻文件立即刪除,只保留轉(zhuǎn)錄的文本內(nèi)容。這種"即錄即刪"的設(shè)計不僅保護了隱私,也解決了存儲空間的問題。
![]()
但TwinMind的創(chuàng)新不僅限于移動應用。他們還開發(fā)了一個Chrome擴展,能夠通過視覺AI掃描你打開的瀏覽器標簽頁,理解來自郵件、Slack、Notion等各種平臺的內(nèi)容。這種多模態(tài)的信息收集能力讓我想起了真正的個人助理,他們不僅聽你說什么,還會觀察你在做什么。George甚至用這個擴展來篩選實習生簡歷,"我們打開了854個申請者的LinkedIn檔案和簡歷,然后讓Chrome擴展對最佳候選人進行排名,效果非常好。"
從技術(shù)架構(gòu)上看,TwinMind采用了一種智能的混合模式。大部分處理在設(shè)備本地完成,使用針對不同任務優(yōu)化的本地語言模型。但當遇到復雜查詢時,應用會連接到云端的更強大模型,比如ChatGPT、Gemini或Claude。這種設(shè)計讓成本降低了20倍,因為大部分工作不需要昂貴的云端計算。同時,即使在沒有網(wǎng)絡連接的情況下,TwinMind依然能夠正常工作,這對于經(jīng)常出差或在網(wǎng)絡不穩(wěn)定環(huán)境中工作的用戶來說非常重要。
最讓我驚喜的是TwinMind的語音識別能力。他們最新的Ear-3模型支持超過140種語言,單詞錯誤率僅為5.26%,還能區(qū)分對話中的不同說話者,說話人分離錯誤率只有3.8%。這個模型是在精心策劃的人工標注數(shù)據(jù)集上訓練的,包括播客、視頻和電影內(nèi)容。George發(fā)現(xiàn)了一個有趣的規(guī)律:"支持的語言越多,模型就越擅長理解口音和方言,因為它在更廣泛的說話者范圍內(nèi)進行訓練。"這種技術(shù)洞察說明了TwinMind團隊對語音識別技術(shù)的深度理解。
從Google X到創(chuàng)業(yè):經(jīng)驗的價值
Daniel George的背景讓這個項目更加引人注目。在加入Google X之前,他曾在諾貝爾獎獲獎團隊LIGO中工作,將深度學習應用于引力波天體物理學。24歲時就完成了AI天體物理學博士學位,這樣的學術(shù)背景讓他在2017年加入了Stephen Wolfram的研究實驗室。這段經(jīng)歷最終形成了一個完美的閉環(huán):Wolfram后來成為TwinMind的第一位投資人,這也是這位科學家的首次創(chuàng)業(yè)投資。
![]()
但真正塑造TwinMind的,是George在Google X的經(jīng)歷。他在那里參與了六個不同的項目,包括iyO團隊開發(fā)的AI驅(qū)動耳機項目。George告訴我們:"Google X實際上是創(chuàng)辦自己公司的完美準備地。任何時候都有大約30到40個類似創(chuàng)業(yè)公司的項目在進行。沒有人能在如此短的時間內(nèi)在六個早期創(chuàng)業(yè)公司工作兩三年,然后再推出自己的公司。"這種經(jīng)歷給了團隊從概念到產(chǎn)品快速迭代的能力。
TwinMind的另外兩位聯(lián)合創(chuàng)始人Sunny Tang和Mahi Karim也都來自Google X。Tang是首席技術(shù)官,Karim是首席科學家。這個三人團隊現(xiàn)在住在灣區(qū)的同一所房子里,George說他們"在過去一年半里每周工作100小時"。這種極度專注的工作狀態(tài)讓我想起了早期的科技創(chuàng)業(yè)公司,那種為了改變世界而全身心投入的精神狀態(tài)。
從Google X到TwinMind的轉(zhuǎn)變,體現(xiàn)了一種有趣的創(chuàng)新模式。大公司的研發(fā)實驗室為創(chuàng)新者提供了資源和經(jīng)驗,但真正突破性的產(chǎn)品往往需要創(chuàng)業(yè)公司的靈活性和專注度。George在Google X學到的不僅僅是技術(shù),更重要的是如何管理高風險的創(chuàng)新項目,如何在不確定性中尋找方向。這種經(jīng)驗對于TwinMind這樣需要突破技術(shù)邊界的項目來說是無價的。
![]()
有趣的是,George在JPMorgan的經(jīng)歷也為TwinMind提供了重要啟發(fā)。作為副總裁和應用AI負責人,他每天都要參加無數(shù)會議,這讓他切身體驗了信息過載的痛苦。他開發(fā)的那個簡單腳本,雖然粗糙,但證明了AI記憶的巨大價值。當他把這個想法分享給朋友,并在Blind上發(fā)布時,其他人的興趣讓他意識到這是一個普遍的痛點,而不僅僅是個人需求。
用戶反饋揭示的真實需求
TwinMind目前已經(jīng)有超過30000名用戶,其中15000人是月活躍用戶。這個數(shù)字讓我很好奇用戶究竟如何使用這個應用,以及它是否真的解決了實際問題。從用戶構(gòu)成來看,50%到60%是專業(yè)人士,25%左右是學生,剩下20%到25%是個人用途。這種多樣化的用戶群體說明了"第二大腦"的需求是跨越職業(yè)和年齡界限的。
特別有意思的是,George的父親也在使用TwinMind來寫自傳。這個使用案例讓我意識到,記憶助手的價值不僅僅在于工作效率,更在于幫助人們整理和保存人生經(jīng)歷。對于年長者來說,TwinMind可能成為一種數(shù)字化的記憶保險,幫助他們捕捉和記錄可能被遺忘的珍貴回憶。
![]()
用戶地理分布也很有啟發(fā)性。雖然美國是最大的用戶基礎(chǔ),但TwinMind在印度、巴西、菲律賓、埃塞俄比亞、肯尼亞和歐洲也獲得了顯著增長。這種全球化的接受度說明了記憶增強的需求是普遍的,不受文化和地域限制。同時,TwinMind支持100多種語言的事實,也讓它能夠真正服務全球用戶,而不僅僅是英語用戶。
從產(chǎn)品使用模式來看,20%到30%的TwinMind用戶也在使用Chrome擴展。這個數(shù)字說明了多模態(tài)信息收集的價值。用戶不僅需要記錄口頭交流,也需要記錄他們的數(shù)字活動。這種行為模式驗證了TwinMind的產(chǎn)品方向:真正的個人AI助手需要全方位地理解用戶,而不僅僅是某一個維度。
最讓我印象深刻的是用戶粘性。George預測:"一旦人們使用它,他們就不會停止使用。我離不開它了。"雖然這聽起來像是創(chuàng)始人的偏見,但考慮到TwinMind的增長數(shù)字和用戶反饋,這種說法可能并非夸張。當一個工具真正解決了用戶的核心痛點,并且使用體驗足夠流暢時,它確實會成為用戶生活中不可或缺的一部分。
隱私與安全:本地化的價值
在AI應用普遍依賴云端處理的今天,TwinMind選擇本地化處理的策略顯得格外引人注目。George一再強調(diào),TwinMind不會在用戶數(shù)據(jù)上訓練模型,所有錄音都在本地實時轉(zhuǎn)錄后立即刪除,只有轉(zhuǎn)錄的文本被保存在應用中。這種設(shè)計哲學背后,體現(xiàn)了對用戶隱私的深度思考。
我認為這種本地化處理不僅僅是技術(shù)選擇,更是對AI應用未來發(fā)展方向的重要預判。隨著用戶對隱私保護意識的提高,以及各國對數(shù)據(jù)保護法規(guī)的加強,能夠在本地處理敏感信息的AI應用將具備明顯的競爭優(yōu)勢。TwinMind的這種設(shè)計讓它能夠記錄最私密的對話和想法,而用戶不用擔心這些信息被上傳到某個云端服務器。
![]()
但本地化處理也帶來了技術(shù)挑戰(zhàn)。如何在有限的移動設(shè)備資源上運行復雜的AI模型?如何在保證效果的同時控制電池消耗?TwinMind團隊的解決方案是使用多個針對不同任務優(yōu)化的小型模型,然后在需要時調(diào)用云端的大型模型。這種混合架構(gòu)在效率和效果之間找到了平衡點。
從商業(yè)角度看,本地化處理還帶來了成本優(yōu)勢。George提到,這種架構(gòu)讓成本降低了20倍,因為大部分處理不需要昂貴的云端計算資源。這種成本結(jié)構(gòu)讓TwinMind能夠提供免費版本,同時在付費版本中提供更高級的功能。免費版包含所有基本功能,包括無限時長的轉(zhuǎn)錄和本地語音識別,而15美元/月的Pro版本則提供更大的上下文窗口(高達200萬tokens)和24小時內(nèi)的郵件支持。
我發(fā)現(xiàn)TwinMind在隱私保護上的另一個巧思是,它不讓用戶事后訪問音頻記錄。音頻被實時轉(zhuǎn)錄后立即刪除,只保留文本內(nèi)容。這種設(shè)計既保護了隱私,也避免了存儲大量音頻文件的問題。對于用戶來說,他們得到的是結(jié)構(gòu)化的、可搜索的信息,而不是需要重新聽取的原始錄音。
當然,本地化處理也不是萬能的。對于某些復雜任務,云端的大型模型仍然具有優(yōu)勢。TwinMind的策略是讓用戶選擇:如果你需要更強大的AI能力,可以選擇連接云端模型;如果你更關(guān)注隱私,本地模型已經(jīng)能夠滿足大部分需求。這種靈活性讓不同需求的用戶都能找到適合的使用方式。
市場競爭:為什么TwinMind與眾不同
在AI助手領(lǐng)域,TwinMind面臨著激烈的競爭。從傳統(tǒng)的Siri、Alexa,到新興的ChatGPT、Claude,再到專門的會議記錄工具如Otter、Fireflies,市場上已經(jīng)有很多解決方案。但我認為TwinMind的差異化策略是明智的,它沒有試圖在所有方面都做到最好,而是專注于一個核心優(yōu)勢:記憶。
與傳統(tǒng)AI助手相比,TwinMind的優(yōu)勢在于持續(xù)性。Siri和Alexa雖然能夠回答問題和執(zhí)行任務,但它們無法建立對用戶的深度理解。每次交互都是獨立的,無法形成連續(xù)的對話和關(guān)系。ChatGPT和Claude雖然在對話能力上更強,但它們?nèi)狈τ脩魝€人生活的了解。TwinMind則通過連續(xù)的背景錄制,能夠真正理解用戶的生活、工作和思考模式。
![]()
與專門的會議記錄工具相比,TwinMind的優(yōu)勢在于全面性。Otter、Granola這些工具主要針對特定場景,比如會議或講座。而TwinMind則試圖捕捉用戶生活的方方面面,不僅僅是正式的會議,還包括非正式的對話、個人思考,甚至是偶然聽到的有用信息。這種全面性讓它能夠建立更完整的個人知識圖譜。
我特別注意到TwinMind在技術(shù)實現(xiàn)上的優(yōu)勢。很多競爭對手使用React Native和云端處理,這讓它們無法在iOS后臺長時間運行。TwinMind選擇用純Swift構(gòu)建,并在本地處理大部分任務,這給了它技術(shù)上的護城河。這不是一個容易復制的優(yōu)勢,需要深度的iOS開發(fā)經(jīng)驗和對蘋果系統(tǒng)限制的深入理解。
從產(chǎn)品定位來看,TwinMind也很聰明地避開了一些紅海競爭。它沒有試圖成為通用的搜索工具或問答系統(tǒng),而是專注于個人記憶增強這個細分領(lǐng)域。這個定位讓它能夠在功能上保持專注,在用戶心中建立清晰的品牌認知。
但我也看到了TwinMind面臨的挑戰(zhàn)。蘋果和谷歌這樣的平臺公司,完全有能力在系統(tǒng)層面集成類似的功能。實際上,蘋果的Siri和谷歌的Assistant已經(jīng)在朝這個方向發(fā)展,雖然步伐相對緩慢。TwinMind需要在大公司意識到這個市場機會并大舉進入之前,建立足夠的用戶基礎(chǔ)和技術(shù)壁壘。
![]()
我認為TwinMind的成功很大程度上取決于它能否持續(xù)創(chuàng)新,保持技術(shù)領(lǐng)先。僅僅是"記憶"這一個特性可能不足以長期抵御競爭。但如果它能夠基于記憶能力,開發(fā)出更多獨特的功能和使用場景,就有可能建立起可持續(xù)的競爭優(yōu)勢。
AI助手的未來:從工具到伙伴
通過研究TwinMind,我對AI助手的未來發(fā)展有了更深的思考。目前大多數(shù)AI工具本質(zhì)上仍然是"工具",用戶需要主動調(diào)用它們,告訴它們要做什么。但TwinMind代表了一種新的方向:從被動的工具轉(zhuǎn)向主動的伙伴。它不需要用戶明確的指令,而是通過觀察和學習,主動提供有價值的信息和建議。
這種轉(zhuǎn)變的核心是上下文理解能力。當AI能夠理解用戶的全部背景,包括最近的對話、正在進行的項目、個人偏好和行為模式時,它就能提供更有價值的幫助。比如,當你準備見一個客戶時,AI不需要你明確要求,就能自動提醒你上次與這個客戶討論的關(guān)鍵問題,或者提供相關(guān)的背景信息。
我特別關(guān)注TwinMind的"主動性"特征。George描述它能夠"在你甚至還沒提問之前就主動幫助你"。這種能力需要AI不僅理解用戶說了什么,還要理解用戶的意圖和需求。這是一個巨大的技術(shù)挑戰(zhàn),但也代表了AI助手的未來方向。
從長期來看,我認為個人化AI助手將成為我們數(shù)字生活的中心。就像智能手機改變了我們的生活方式一樣,真正智能的AI助手也將帶來類似的變革。它們不僅能記住我們說過的話,還能理解我們的價值觀、目標和行為模式,成為真正的數(shù)字伙伴。
![]()
但這種發(fā)展也帶來了新的挑戰(zhàn)和問題。當AI助手變得如此了解我們時,數(shù)據(jù)安全和隱私保護變得更加重要。如何確保這些深度個人化的信息不被濫用?如何在便利性和隱私之間找到平衡?TwinMind的本地化處理策略提供了一種解決思路,但這可能不是唯一的答案。
另一個值得思考的問題是依賴性。當我們習慣了AI助手記住一切、提醒一切時,我們自己的記憶能力會不會退化?這就像導航軟件讓很多人失去了認路的能力一樣。如何在利用AI增強能力的同時,保持人類自身的認知能力,這是一個需要深入思考的問題。
我還注意到,個人化AI助手的發(fā)展可能會創(chuàng)造出一種新的數(shù)字不平等。那些能夠負擔得起高質(zhì)量AI助手的人,將在信息處理、決策制定、學習能力等方面獲得巨大優(yōu)勢。這種優(yōu)勢可能會放大現(xiàn)有的社會不平等。如何確保這種技術(shù)的普惠性,也是一個重要的社會問題。
TwinMind的商業(yè)模式與發(fā)展前景
TwinMind的商業(yè)模式設(shè)計得相當聰明。他們提供免費版本來吸引用戶,包含所有核心功能:無限時長的轉(zhuǎn)錄、本地語音識別、基本的AI交互能力。這種策略降低了用戶的試用門檻,讓更多人能夠體驗到"第二大腦"的價值。同時,他們通過Pro版本獲得收入,每月15美元,提供更大的上下文窗口、更強的AI模型訪問權(quán)限和優(yōu)先客戶支持。
從用戶獲取成本的角度看,TwinMind的策略是可持續(xù)的。本地化處理大大降低了運營成本,George提到成本比純云端方案低20倍。這種成本結(jié)構(gòu)讓他們能夠承受免費用戶的負擔,同時通過付費用戶實現(xiàn)盈利。這種模式類似于很多成功的SaaS應用,通過免費版本建立用戶基礎(chǔ),通過高級功能實現(xiàn)商業(yè)化。
我特別關(guān)注TwinMind在API商業(yè)化方面的計劃。他們的Ear-3語音識別模型將通過API提供給開發(fā)者和企業(yè),價格為每小時0.23美元。這種B2B2C的模式可能成為重要的收入來源,特別是考慮到TwinMind在多語言語音識別方面的技術(shù)優(yōu)勢。支持140多種語言、5.26%的詞錯率、3.8%的說話人分離錯誤率,這些技術(shù)指標在行業(yè)中是有競爭力的。
![]()
從融資的角度看,TwinMind的估值增長軌跡也很健康。從最初的3000萬美元估值到最新的6000萬美元后投資估值,這種增長反映了投資者對其技術(shù)和市場前景的認可。特別是Stephen Wolfram的參與,不僅帶來了資金,更重要的是帶來了信譽背書。作為計算科學領(lǐng)域的權(quán)威人物,Wolfram的首次創(chuàng)業(yè)投資選擇了TwinMind,這個信號的價值可能超過了投資金額本身。
但TwinMind也面臨著擴展挑戰(zhàn)。目前他們的團隊只有11人,雖然這種小團隊結(jié)構(gòu)有利于快速決策和產(chǎn)品迭代,但要服務30000用戶并持續(xù)增長,他們需要在合適的時候擴大團隊。特別是在用戶體驗設(shè)計和商務拓展方面,他們已經(jīng)計劃招聘更多人才。
從市場前景來看,我認為個人化AI助手市場剛剛開始。TwinMind目前的用戶規(guī)模相對較小,但增長潛力巨大。如果他們能夠在用戶體驗和技術(shù)能力方面保持領(lǐng)先,有機會在這個新興市場中建立主導地位。關(guān)鍵是要在大公司注意到這個機會并投入資源之前,建立足夠的技術(shù)壁壘和用戶粘性。
我也看到了TwinMind面臨的一些風險。技術(shù)風險方面,AI技術(shù)發(fā)展很快,他們需要持續(xù)創(chuàng)新才能保持競爭優(yōu)勢。市場風險方面,用戶對隱私的擔憂可能會阻礙adoption,特別是在一些隱私敏感的地區(qū)和行業(yè)。監(jiān)管風險方面,各國對AI應用的監(jiān)管政策還在形成中,可能會對產(chǎn)品功能和商業(yè)模式產(chǎn)生影響。
結(jié)尾
也歡迎大家留言討論,分享你的觀點!
覺得內(nèi)容不錯的朋友能夠幫忙右下角點個贊,分享一下。您的每次分享,都是在激勵我不斷產(chǎn)出更好的內(nèi)容。
歡迎關(guān)注深思圈,一起探索更大的世界。
- END -
兩個“特別坑”的AI產(chǎn)品創(chuàng)業(yè)方向,你知道嗎
![]()
速度將成為AI時代唯一的護城河
![]()
a16z重磅預測:Vibe coding贏者通吃?錯了,垂直專業(yè)化才是未來
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.