市場上有無數(shù)的 AI PDF 類產(chǎn)品,但基本上都是 ChatPDF 的模式,也就是解析 PDF 的內(nèi)容后跟它進(jìn)行對話,目前大多數(shù)時候是一個 C 端使用場景。
但作為商業(yè)交流非常重要的一個文檔介質(zhì),PDF 在整個企業(yè)里扮演了非常重要的角色,它的商業(yè)價(jià)值仍然有很多未被開發(fā)。特別是企業(yè)的最關(guān)鍵數(shù)據(jù)往往都在這些最傳統(tǒng)的載體中——PDF 文檔、掃描件和手寫表格里,這些非結(jié)構(gòu)化數(shù)據(jù)就像被鎖在保險(xiǎn)柜里的寶藏,企業(yè)明知價(jià)值巨大卻難以獲取。
于是硅谷的兩位工程師就瞄準(zhǔn)了這塊,做了 Extend AI 這個產(chǎn)品,最近拿了 1700 萬美金的融資,由 Innovation Endeavors 領(lǐng)投,YC、Homebrew、Character VC 以及 Adobe前首席安全官 Scott Belsky、Vercel CEO Guillermo Rauch 和 Stripe產(chǎn)品負(fù)責(zé)人 Jeff Weinstein 跟投。
并且還拿下了 Brex、Square、Checkr、Flatiron Health 以及多家財(cái)富 500 公司的企業(yè)客戶,其收入已經(jīng)做到了數(shù)百萬美金的 ARR。
這個產(chǎn)品讓我覺得有意思的是,它把大家關(guān)注在 PDF 對話這塊移到了有更高要求的企業(yè)級需求場景,特別是手寫內(nèi)容、表格、簽名以及圖像等,也是一個將非結(jié)構(gòu)化數(shù)據(jù)結(jié)構(gòu)化的典型案例,并且不再是一個單純的工具,而是將它打造成為了一個平臺。
![]()
Extend 由 Kushal Byatnal 和 Eli Badgio 聯(lián)合創(chuàng)立,其解決的問題也很常見,在與眾多企業(yè)接觸過程中,創(chuàng)始人發(fā)現(xiàn)傳統(tǒng)的文檔處理方案存在這么幾個問題:
- 傳統(tǒng) OCR 技術(shù)的局限性:無法有效處理手寫筆記、復(fù)雜表格和圖像內(nèi)容;
- 準(zhǔn)確率瓶頸:即使是 99% 的準(zhǔn)確率,在關(guān)鍵業(yè)務(wù)場景中也可能不夠;
- 開發(fā)成本高昂:企業(yè)需要投入"工程師年"級別的努力來構(gòu)建文檔處理系統(tǒng);
- 系統(tǒng)復(fù)雜度:需要整合 VLM 解析引擎、LLM 上下文管理、數(shù)據(jù)標(biāo)注工具等多個組件;
創(chuàng)始人意識到,高質(zhì)量的文檔處理實(shí)際上是一個數(shù)據(jù)和系統(tǒng)工程問題,而不僅僅是 OCR 或基礎(chǔ)模型可以解決的。于是他們希望重新定義文檔處理的方式,通過多模態(tài)大語言模型(VLM)集成,突破傳統(tǒng) OCR 限制,能夠理解手寫內(nèi)容、表格、簽名和圖像。
其次,通過語義分塊技術(shù),將文檔元素語義化組合,創(chuàng)建人類和機(jī)器都易于理解的清潔輸出;第三,內(nèi)置評估工具,為客戶提供分析和評估性能的方法;最后,利用自適應(yīng)學(xué)習(xí),讓客戶參與幫助微調(diào) LLM 能力,更好地理解其特定文檔的復(fù)雜性。提供了一個端到端的解決方案,統(tǒng)一的平臺避免了客戶整合多個工具的復(fù)雜性。
在產(chǎn)品差異化這塊,Extend不僅僅是 API,還提供了完整的基礎(chǔ)設(shè)施和工具集;它不僅面向開發(fā)者也面向操作者;另外還對一些特定行業(yè)進(jìn)行了優(yōu)化,比方說醫(yī)療、金融、物流等高精度要求的行業(yè)。
現(xiàn)在,Extend 能夠在各種文檔類型上實(shí)現(xiàn) 95% 以上的準(zhǔn)確率,無論是清晰的 PDF 還是退化的掃描件。在公司成立一年后,已經(jīng)將收入做到了數(shù)百萬美金 ARR 并且現(xiàn)在為正,其處理的文檔達(dá)到了數(shù)百萬份,得到了像 Brex、Checkr 這種企業(yè)客戶的認(rèn)可。
其長期目標(biāo)是成為"文檔處理云"——就像云平臺為存儲、計(jì)算和協(xié)作提供服務(wù)一樣,Extend 要為文檔處理提供專門構(gòu)建的全棧系統(tǒng)。AI 時代數(shù)據(jù)越來越重要,我覺得 Extend 所處的位置是一個很有價(jià)值的事情。
另外,我之前介紹過智能戒指 Oura,它通過人們攜帶的戒指這個場景持續(xù)跟蹤獲取健康數(shù)據(jù),打造出了一個硬件+軟件+服務(wù)平臺,出售的戒指已經(jīng)突破 250 萬枚,讓自己估值做到了 52 億美金《》。
這個模式后來被用在了寵物狗狗和鳥以及小孩身上,其中有的只是訂閱服務(wù)這塊的 ARR 就已經(jīng)做到了 1 億美金《》。
現(xiàn)在,有人將這個模式應(yīng)用在了奶牛身上打造了一個奶牛版的 Oura,已經(jīng)成為農(nóng)場農(nóng)民離不開的一個產(chǎn)品,其 ARR 同樣增長迅猛,最新……
全 文 共2326 字
后續(xù)內(nèi)容為付費(fèi)會員專屬,會員掃碼登錄直接閱讀
Memo: Signal, not noise!
訂閱 Memo Pro
Memo(vcsmemo.com)是一個基于付費(fèi)訂閱模式的創(chuàng)投內(nèi)容平臺,已得到大量 VC、企業(yè) CEO 以及高管的支持,我們希望幫助你捕捉最具價(jià)值的行業(yè)信號、過濾噪音(Signal,Not Noise)。
訂閱 Memo Pro
你將獲得:
1.解鎖未來一年以及之前的所有會員專屬內(nèi)容
2.郵件訂閱功能:付費(fèi)內(nèi)容+最新行業(yè)快訊+...
3.優(yōu)先體驗(yàn) Memo 新產(chǎn)品和新功能
限時 799 元/年(原價(jià) 999 元/年),掃碼立即訂閱
1.
2.
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.