上周我寫過(guò)一篇AI產(chǎn)品自用分享,當(dāng)時(shí)我說(shuō),AI知識(shí)問(wèn)答方面,我會(huì)選擇openai o3和豆包。
PC場(chǎng)景下,o3比較多,而手機(jī)場(chǎng)景下,我用的比較多的還是豆包。
雖然ChatGPT也有app,但一旦手機(jī)開了魔法,微信啥的還有一些其他的應(yīng)用,就很容易卡,非常的不方便。
所以我前兩天在上海逛ChinaJoy的時(shí)候,看到一些忘了的圖,或者是我不懂的梗,我都是隨時(shí)隨地問(wèn)豆包。
![]()
比如這個(gè)暴雪展上巨大的泰瑞爾,當(dāng)時(shí)跟朋友大眼瞪小眼,忘了是個(gè)啥,然后掏起了豆包就開始問(wèn)。
然后我就發(fā)現(xiàn),這個(gè)豆包,又雙叒叕更新了。
更新了圖片的視覺推理。
不愧是我群的高頻討論對(duì)象。。。
![]()
就是當(dāng)你開著這個(gè)深度思考模式,再上傳圖片的時(shí)候,豆包就能對(duì)這個(gè)圖片展開思維鏈推理了。
![]()
我給你們直接放個(gè)實(shí)例看看。
比如我刷ChinaJoy視頻,看到了一個(gè)特別抽象的黑人哥們兒,念哪吒的打油詩(shī)念的頭頭是道的。
![]()
我想知道他是誰(shuí),就在豆包的深度思考模式下上傳了一張他的視頻截圖,然后問(wèn)豆包。
![]()
然后豆包就開始刷刷刷分步思考。
![]()
先是找了參考圖片,然后又根據(jù)返回的結(jié)果搜索關(guān)鍵詞和參考資料。
![]()
最后,給了我一個(gè)準(zhǔn)確的結(jié)果。
![]()
如果ChatGPT玩的比較多的,應(yīng)該就能非常熟悉了。
這不是o3最獨(dú)特的那個(gè)視覺推理。
![]()
豆包,也終于上線了這個(gè)視覺推理功能,牛逼。
而且,o3要錢的,而豆包,免費(fèi)。
豆包還是牛逼。
也用這個(gè)功能,給大家測(cè)一些好玩的。
我想到的第一個(gè)case,就是德爺。
與貝爺齊名的荒野求生硬漢,最近來(lái)中國(guó)了,這陣子在深圳。
![]()
熱情好客的中國(guó)朋友,本著來(lái)都來(lái)了大過(guò)年的都是孩子都不容易的原則,生生把德爺?shù)幕囊扒笊兂闪藵M漢全席。
視頻里他們吃的那家飯店,我還挺想吃的,但點(diǎn)進(jìn)評(píng)論區(qū),居然沒人說(shuō)是哪家。
這屆網(wǎng)友不行。。。
所以我就去問(wèn)豆包了。
(是為了測(cè)試,并不是因?yàn)槲茵挕#?/p>
我扔給豆包幾張截圖,然后問(wèn)它,這是哪家店。
![]()
它就開始思考了。
先確定這里是深圳。
盤子上有漢字,可能是店名。
視頻發(fā)布者是德爺。
![]()
然后按照自己的推測(cè),開始放大盤子,查看漢字。
給我看懵了,這么小的字,它居然都給認(rèn)全了。
![]()
給我的結(jié)果,就是旺吉利海鮮大排檔。
![]()
上大眾點(diǎn)評(píng)一搜,真是這家店,往下一翻,臥槽,德爺跟店家的合照就明晃晃在店家動(dòng)態(tài)里掛著。
![]()
單說(shuō)豆包,可能還感受不到差距。
但我放個(gè)失敗的案例你們就明白了。
![]()
把地址認(rèn)成了北京,還說(shuō)了一堆片兒湯話,最后也沒給答案。
差距是拉開了的。
我們?cè)賮?lái)看一個(gè)德爺?shù)陌咐?/p>
最近他在深圳刷了一天盤子。
因?yàn)榘壮粤巳思业呐ks,被抓去做勞力。
![]()
我就把德爺刷盤子這個(gè)圖片發(fā)給豆包,問(wèn)它這是哪家店。
它開始放大圖片看細(xì)節(jié)。
![]()
文字信息不全,它也會(huì)自己腦補(bǔ),最終得出了準(zhǔn)確的答案。
![]()
還有更好玩的,我把一張表情包發(fā)給它,問(wèn)它出處是什么,它也是張口就來(lái)。
比如這兩個(gè)表情包,一只騷氣的雞和一只尷尬但不失禮貌的豬。
![]()
豆包給我的回答,是這樣的。
![]()
然后我才知道,這個(gè)雞和這個(gè)豬,分別來(lái)自于太太樂雞精和雙匯火腿腸。
論當(dāng)代網(wǎng)友的精神狀態(tài)。。。
豆包甚至認(rèn)識(shí)所有的奧特曼。
這是愛迪。
![]()
這是蓋亞。
![]()
對(duì)于甄嬛傳也是爛熟于心,給它看一張圖,它就知道是哪個(gè)名場(chǎng)面,還能精確到集。
![]()
這在某種程度上,其實(shí)已經(jīng)有點(diǎn)超越人類了。。。
除了搞抽象,干正事兒也不耽誤。
這是考公都要面對(duì)的行測(cè)題。
![]()
豆包思維鏈那一欄刷刷刷跑了巨長(zhǎng),最后得出結(jié)論,這是一個(gè)關(guān)于對(duì)稱的問(wèn)題,然后選了B。
它答對(duì)了。
這道更復(fù)雜一點(diǎn)的題,也答對(duì)了。
![]()
還有這種考眼力的題目,我一看頭都暈,但豆包飛快地把F給找了出來(lái)。
![]()
我還考了它一個(gè)高難度問(wèn)題,就是把宗慶后的全家福發(fā)出來(lái),讓它認(rèn)。
一頓截圖推理之后,結(jié)果是這樣的:比較重要的人物,宗慶后,妻子施幼珍,女兒宗馥莉,爺爺宗啟騄,奶奶王樹珍,都對(duì)上號(hào)了。
![]()
不過(guò),豆包的深度視覺推理當(dāng)然也有軟肋。
遇到這種六個(gè)手指的問(wèn)題,它還是會(huì)信誓旦旦地說(shuō)出五個(gè)手指。
![]()
還有,把我的照片給它讓它識(shí)別,它一次把我識(shí)別成了電競(jìng)選手,還有一次說(shuō)我是電視劇三體的總導(dǎo)演。
到處碰瓷,把我給嚇得。。。
![]()
不過(guò)這倆其實(shí)都還好,畢竟六根手指是現(xiàn)在所有大模型都繞不過(guò)的幻覺。
而我的形象也并沒有在網(wǎng)上大范圍流傳,它不知道也正常。
總的來(lái)說(shuō),我覺得豆包這個(gè)功能,還是挺實(shí)用的。
把o3的視覺推理直接免費(fèi)平權(quán),用著也很方便。
還有我一個(gè),我覺得非常酷的事。
就是,我在忙到爆炸的間隙出去看了一部一直都很想看的電影,《浪浪山小妖怪》。
我真的非常非常非常喜歡這部電影。
講的是一群被上司壓榨多年無(wú)法晉升的小妖怪,決定搏一把大的,冒充唐僧師徒去西天取經(jīng)。
一路上這支散裝隊(duì)伍吵吵鬧鬧的路過(guò)了很多風(fēng)景。
那些風(fēng)景,在熹微的晨光或是朦朧的夜晚,靜默地注視著這群心懷熱血的小妖怪,看他們到底能不能把這個(gè)充滿規(guī)則和潛規(guī)則的世界,攪得天翻地覆。
答案當(dāng)然是不能。
故事中的一段,他們來(lái)到了這個(gè)場(chǎng)景。
![]()
我一看,好眼熟啊,好像在黑神話里見過(guò),但我忘了是哪了。
然后一出影院我就問(wèn)豆包,這個(gè)場(chǎng)景是哪,它很快的給了我回答: 佛光寺。
![]()
我就說(shuō)嘛,這是大圣去過(guò)的地方。
在電影里,幾個(gè)小妖怪真在這個(gè)地方,見到了大圣。
小妖怪冒充唐僧師徒,但大圣沒有殺小妖怪,而是給了他們,四根保命毫毛。
所以搜出來(lái)答案的那一刻,我感覺黑神話和浪浪山真的夢(mèng)幻聯(lián)動(dòng)了,不只是場(chǎng)景。
還有內(nèi)核,那種屬于中國(guó)人骨子里的俠義情結(jié),對(duì)命運(yùn)的抗?fàn)帲瑢?duì)蒼生的悲憫。
然后我就覺得,這種快速把知識(shí)、線索串起來(lái),然后電光火石間有所領(lǐng)悟的感覺太爽了。
這種知識(shí)絲滑進(jìn)入腦海的方式。
可能就是我們未來(lái)與AI溝通的常態(tài)了。
當(dāng)你有所想。
AI,便有所應(yīng)。
以上,既然看到這里了,如果覺得不錯(cuò),隨手點(diǎn)個(gè)贊、在看、轉(zhuǎn)發(fā)三連吧,如果想第一時(shí)間收到推送,也可以給我個(gè)星標(biāo)?~謝謝你看我的文章,我們,下次再見。
>/ 作者:卡茲克、水杉
>/ 投稿或爆料,請(qǐng)聯(lián)系郵箱:wzglyay@virxact.com
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.