![]()
這項(xiàng)由阿里巴巴國(guó)際數(shù)字商務(wù)團(tuán)隊(duì)主導(dǎo)的研究發(fā)表于2026年2月,論文編號(hào)為arXiv:2602.06724v1,為長(zhǎng)期復(fù)雜信息搜索任務(wù)提供了一個(gè)全新的解決思路。該研究團(tuán)隊(duì)包括來(lái)自阿里巴巴國(guó)際的多位研究人員,他們提出了一個(gè)名為"Table-as-Search"(TaS)的創(chuàng)新框架,將原本混亂無(wú)序的信息搜索過(guò)程轉(zhuǎn)變?yōu)橄裉顚?xiě)表格一樣條理分明的任務(wù)。
當(dāng)你需要搜索大量復(fù)雜信息時(shí),是否經(jīng)常遇到這樣的困擾:搜索進(jìn)行到一半就迷失了方向,忘記了之前找到了什么,還需要找什么?或者在海量搜索結(jié)果中完全迷失,無(wú)法有效整理和利用獲得的信息?阿里巴巴的研究團(tuán)隊(duì)注意到,現(xiàn)有的AI信息搜索系統(tǒng)在處理復(fù)雜、長(zhǎng)期的搜索任務(wù)時(shí)經(jīng)常"迷路",就像一個(gè)人在大型購(gòu)物中心里轉(zhuǎn)來(lái)轉(zhuǎn)去,最終忘記了自己要買(mǎi)什么。
傳統(tǒng)的信息搜索系統(tǒng)采用類(lèi)似"思考-行動(dòng)"的方式工作,就像一個(gè)人邊走邊想,把所有的搜索歷史和結(jié)果都記在腦子里。當(dāng)搜索任務(wù)簡(jiǎn)單時(shí),這種方式還算有效。但是當(dāng)面臨復(fù)雜的多步驟搜索任務(wù)時(shí),系統(tǒng)就會(huì)因?yàn)樾畔⑦^(guò)載而出現(xiàn)問(wèn)題,經(jīng)常出現(xiàn)"丟三落四"的情況,這在學(xué)術(shù)界被稱為"迷失在中間"現(xiàn)象。
研究團(tuán)隊(duì)提出的TaS框架就像是給搜索過(guò)程提供了一個(gè)清晰的表格模板。每當(dāng)用戶提出復(fù)雜的搜索需求時(shí),系統(tǒng)首先會(huì)創(chuàng)建一個(gè)結(jié)構(gòu)化的表格,其中行代表需要找到的候選對(duì)象,列代表需要驗(yàn)證的條件或需要收集的信息。這樣,搜索過(guò)程就變成了填寫(xiě)表格的過(guò)程:已經(jīng)找到的信息填入相應(yīng)的格子,空著的格子就代表還需要繼續(xù)搜索的內(nèi)容。
這種方法的巧妙之處在于它將復(fù)雜的搜索狀態(tài)管理問(wèn)題轉(zhuǎn)化為直觀的表格操作。就像你在整理購(gòu)物清單時(shí),會(huì)在買(mǎi)到的物品后面打勾,還沒(méi)買(mǎi)到的保持空白。通過(guò)這種方式,系統(tǒng)始終清楚地知道當(dāng)前的進(jìn)展?fàn)顩r,不會(huì)因?yàn)樾畔⑦^(guò)多而混亂。
TaS框架能夠統(tǒng)一處理三種不同類(lèi)型的信息搜索任務(wù)。第一種是深度搜索,就像尋找一個(gè)符合多個(gè)嚴(yán)格條件的特定目標(biāo),比如找到一個(gè)既在出生省份上大學(xué),又在20歲左右為電視劇唱主題歌,還在22歲左右發(fā)行首張專輯的歌手。第二種是廣度搜索,需要收集大量對(duì)象的基本信息,比如搜集2005年到2015年所有TED獎(jiǎng)獲得者的詳細(xì)資料。第三種是深廣結(jié)合搜索,這是最具挑戰(zhàn)性的任務(wù),既需要大范圍尋找符合條件的目標(biāo),又需要深入挖掘每個(gè)目標(biāo)的詳細(xì)信息,比如找到30家在西班牙市場(chǎng)銷(xiāo)售阿迪達(dá)斯運(yùn)動(dòng)鞋、價(jià)格有競(jìng)爭(zhēng)力且有成熟B2C運(yùn)營(yíng)經(jīng)驗(yàn)的商家,并獲取他們的聯(lián)系方式。
在技術(shù)實(shí)現(xiàn)上,TaS采用多智能體協(xié)作的方式工作。系統(tǒng)中有一個(gè)主要規(guī)劃者負(fù)責(zé)整體協(xié)調(diào),就像項(xiàng)目經(jīng)理一樣制定搜索策略和分配任務(wù)。還有多個(gè)執(zhí)行智能體負(fù)責(zé)具體的搜索操作,就像不同的專員分別負(fù)責(zé)不同方面的信息收集。所有搜索到的信息都存儲(chǔ)在一個(gè)外部數(shù)據(jù)庫(kù)中,這樣可以避免系統(tǒng)因?yàn)樾畔⑦^(guò)多而"撐爆"。
研究團(tuán)隊(duì)設(shè)計(jì)了一個(gè)三階段的工作流程。首先是表格初始化階段,系統(tǒng)根據(jù)用戶查詢創(chuàng)建合適的表格結(jié)構(gòu)。然后是動(dòng)態(tài)協(xié)調(diào)階段,系統(tǒng)會(huì)在兩種模式之間切換:當(dāng)需要尋找更多候選對(duì)象時(shí),啟動(dòng)"行擴(kuò)展"模式,派遣多個(gè)搜索智能體并行尋找新的候選者;當(dāng)候選對(duì)象足夠但信息不完整時(shí),啟動(dòng)"單元格填充"模式,針對(duì)每個(gè)候選對(duì)象補(bǔ)充缺失的信息。最后是答案綜合階段,系統(tǒng)整理表格中的信息生成最終回答。
為了驗(yàn)證TaS框架的有效性,研究團(tuán)隊(duì)進(jìn)行了大規(guī)模實(shí)驗(yàn)測(cè)試。他們使用了多個(gè)不同類(lèi)型的測(cè)試基準(zhǔn),包括需要多步推理的深度搜索任務(wù)、需要大規(guī)模信息聚合的廣度搜索任務(wù),以及他們專門(mén)構(gòu)建的復(fù)合型深廣搜索任務(wù)。特別值得一提的是,由于目前缺乏高質(zhì)量的深廣結(jié)合搜索測(cè)試集,研究團(tuán)隊(duì)專門(mén)創(chuàng)建了一個(gè)包含20個(gè)復(fù)雜商務(wù)開(kāi)發(fā)場(chǎng)景的測(cè)試基準(zhǔn),這些場(chǎng)景都來(lái)自真實(shí)的商業(yè)需求。
實(shí)驗(yàn)結(jié)果顯示,TaS框架在各種測(cè)試中都表現(xiàn)出了顯著的優(yōu)勢(shì)。在深度搜索任務(wù)中,使用成本較低的Gemini-2.5-Flash模型的TaS系統(tǒng),竟然超越了使用更強(qiáng)大模型的傳統(tǒng)多智能體系統(tǒng),準(zhǔn)確率從38.4%提升到52.4%。這說(shuō)明問(wèn)題的關(guān)鍵不在于模型的推理能力,而在于如何有效管理復(fù)雜的搜索狀態(tài)。
在廣度搜索任務(wù)中,TaS系統(tǒng)同樣表現(xiàn)出色。使用Claude-Sonnet-4模型時(shí),TaS的成功率達(dá)到3.5%,與使用更強(qiáng)"思考"版本模型的傳統(tǒng)系統(tǒng)相當(dāng)。更重要的是,TaS在提高搜索覆蓋率的同時(shí)還保持了較高的精確度,打破了傳統(tǒng)系統(tǒng)中精確度和覆蓋率相互制約的困境。
在最具挑戰(zhàn)性的深廣結(jié)合搜索任務(wù)中,TaS系統(tǒng)更是展現(xiàn)出了決定性的優(yōu)勢(shì)。與商用系統(tǒng)Gemini DeepResearch相比,TaS在候選對(duì)象發(fā)現(xiàn)準(zhǔn)確率上提升了4.7%,在信息收集精確度上提升了5.1%。這證明了結(jié)構(gòu)化規(guī)劃相比專有黑盒系統(tǒng)的明顯優(yōu)勢(shì)。
研究團(tuán)隊(duì)還深入分析了TaS框架的多個(gè)優(yōu)勢(shì)特性。在魯棒性方面,隨著搜索任務(wù)復(fù)雜度的增加,TaS相對(duì)于傳統(tǒng)方法的優(yōu)勢(shì)越來(lái)越明顯。在簡(jiǎn)單任務(wù)中,TaS的優(yōu)勢(shì)可能只有14.3%,但在最復(fù)雜的任務(wù)中,優(yōu)勢(shì)可以擴(kuò)大到17.9%。這說(shuō)明TaS特別適合處理高復(fù)雜度的搜索任務(wù)。
在效率方面,TaS的優(yōu)勢(shì)并不來(lái)自于簡(jiǎn)單的增加搜索量,而是來(lái)自于更精確有效的搜索策略。實(shí)驗(yàn)顯示,TaS系統(tǒng)在使用相同甚至更少搜索次數(shù)的情況下,能夠獲得比傳統(tǒng)系統(tǒng)更好的結(jié)果。這就像一個(gè)有經(jīng)驗(yàn)的購(gòu)物者能夠用更少的時(shí)間買(mǎi)到更多需要的東西。
TaS框架還表現(xiàn)出了優(yōu)秀的可擴(kuò)展性。研究發(fā)現(xiàn),給TaS分配更多計(jì)算資源時(shí),它能夠更有效地利用這些資源獲得性能提升。在測(cè)試時(shí)擴(kuò)展實(shí)驗(yàn)中,TaS的性能提升幅度比傳統(tǒng)方法更大。
框架的靈活性也是一個(gè)重要優(yōu)勢(shì)。研究團(tuán)隊(duì)發(fā)現(xiàn),TaS的執(zhí)行層(子智能體)可以很容易地被更小、更專業(yè)的模型替代,而不會(huì)損失太多性能。這意味著在實(shí)際應(yīng)用中可以大大降低計(jì)算成本。同時(shí),TaS可以無(wú)縫集成現(xiàn)有的專業(yè)搜索智能體,讓它們發(fā)揮更大的作用。
通過(guò)具體案例分析,研究團(tuán)隊(duì)展示了TaS如何解決傳統(tǒng)方法的兩個(gè)主要問(wèn)題。第一個(gè)是過(guò)早收斂問(wèn)題,傳統(tǒng)系統(tǒng)經(jīng)常找到部分匹配的結(jié)果后就停止搜索,而TaS通過(guò)表格結(jié)構(gòu)強(qiáng)制系統(tǒng)驗(yàn)證所有條件。第二個(gè)是搜索不充分問(wèn)題,在需要大量信息收集的任務(wù)中,傳統(tǒng)系統(tǒng)經(jīng)常遺漏信息或留下空白,而TaS通過(guò)明確的表格結(jié)構(gòu)確保信息收集的完整性。
研究團(tuán)隊(duì)也誠(chéng)實(shí)地指出了TaS框架的一些局限性。首先,這個(gè)框架主要針對(duì)信息搜索任務(wù)優(yōu)化,對(duì)于不需要搜索的一般性任務(wù)可能會(huì)增加不必要的復(fù)雜性。其次,TaS的性能在很大程度上依賴于主規(guī)劃智能體的能力,如果規(guī)劃智能體的能力不足,整個(gè)系統(tǒng)的性能就會(huì)受到影響。此外,目前的深廣結(jié)合搜索評(píng)估還需要人工驗(yàn)證,這在一定程度上限制了大規(guī)模測(cè)試的可行性。
盡管存在這些限制,TaS框架仍然為復(fù)雜信息搜索任務(wù)提供了一個(gè)突破性的解決方案。它不僅解決了傳統(tǒng)方法在處理復(fù)雜長(zhǎng)期搜索任務(wù)時(shí)的根本性問(wèn)題,還展現(xiàn)了在多種應(yīng)用場(chǎng)景中的廣泛潛力。對(duì)于需要進(jìn)行復(fù)雜信息收集和分析的商業(yè)應(yīng)用、學(xué)術(shù)研究和日常信息搜索,TaS都提供了一個(gè)更可靠、更高效的解決方案。
這項(xiàng)研究的意義遠(yuǎn)不止于技術(shù)創(chuàng)新本身。它重新定義了我們對(duì)復(fù)雜信息搜索任務(wù)的理解方式,從混亂的文本生成轉(zhuǎn)向結(jié)構(gòu)化的信息管理。這種思維方式的轉(zhuǎn)變可能會(huì)影響未來(lái)搜索系統(tǒng)的設(shè)計(jì)理念,讓人工智能在處理復(fù)雜任務(wù)時(shí)變得更加可靠和高效。隨著信息量的爆炸式增長(zhǎng),像TaS這樣能夠有效管理復(fù)雜搜索狀態(tài)的框架將變得越來(lái)越重要,為構(gòu)建更智能、更實(shí)用的信息搜索系統(tǒng)鋪平道路。
Q&A
Q1:Table-as-Search框架是什么?
A:Table-as-Search是阿里巴巴國(guó)際團(tuán)隊(duì)開(kāi)發(fā)的信息搜索框架,它將復(fù)雜的搜索任務(wù)轉(zhuǎn)化為填寫(xiě)表格的過(guò)程。系統(tǒng)創(chuàng)建結(jié)構(gòu)化表格,行代表候選對(duì)象,列代表需要驗(yàn)證的條件或收集的信息,通過(guò)填寫(xiě)表格來(lái)管理搜索進(jìn)度,避免傳統(tǒng)方法容易迷失方向的問(wèn)題。
Q2:TaS框架比傳統(tǒng)搜索方法好在哪里?
A:TaS的主要優(yōu)勢(shì)在于結(jié)構(gòu)化的狀態(tài)管理。傳統(tǒng)方法容易在復(fù)雜搜索中"迷路",而TaS通過(guò)表格清晰追蹤搜索進(jìn)度。實(shí)驗(yàn)顯示,TaS能讓成本較低的模型超越更強(qiáng)大的傳統(tǒng)系統(tǒng),在復(fù)雜任務(wù)中優(yōu)勢(shì)更加明顯,同時(shí)在提高覆蓋率的同時(shí)保持高精確度。
Q3:TaS框架能處理哪些類(lèi)型的搜索任務(wù)?
A:TaS可以統(tǒng)一處理三種搜索任務(wù):深度搜索(尋找符合多個(gè)嚴(yán)格條件的特定目標(biāo))、廣度搜索(收集大量對(duì)象的基本信息)、深廣結(jié)合搜索(既要大范圍尋找又要深入收集詳細(xì)信息)。特別擅長(zhǎng)處理復(fù)雜的商務(wù)開(kāi)發(fā)、學(xué)術(shù)研究等需要多步驟信息收集的場(chǎng)景。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.