看到有個(gè)搞工業(yè)視覺(jué)大模型的程序員在那吹,說(shuō)自己公司所使用的工業(yè)視覺(jué)大模型都是經(jīng)過(guò)百萬(wàn)、千萬(wàn)甚至是上億數(shù)據(jù)訓(xùn)練的,識(shí)別準(zhǔn)確率超過(guò)99.3%,我看了笑了笑,別說(shuō)99.3%了,就算是99.8%,在我們公司都是不合格的!
![]()
而他另一套純技術(shù)思維的說(shuō)法就更讓我無(wú)語(yǔ)了,說(shuō)什么:“準(zhǔn)確率高的,大概率都是小模型!”
咱拋開(kāi)使用場(chǎng)景,只看訓(xùn)練的數(shù)據(jù)集,不看準(zhǔn)確率,這不是妥妥得耍流氓嘛!況且,工業(yè)視覺(jué)基本上都是非標(biāo)視覺(jué),恰恰是很看使用場(chǎng)景的東西,所以,為什么很多大的工業(yè)視覺(jué)項(xiàng)目都看不到通用工業(yè)視覺(jué)大模型的身影?是我們做不出來(lái)嗎?是那套通用視覺(jué)大模型沒(méi)用,或者準(zhǔn)確率不高,好吧!
的確,現(xiàn)在工業(yè)視覺(jué)行業(yè)內(nèi)有很多通用型產(chǎn)品,比如說(shuō)檢個(gè)小螺絲,貼個(gè)標(biāo)簽什么的,這都是簡(jiǎn)單的工業(yè)視覺(jué)場(chǎng)景,遇到復(fù)雜的檢測(cè)場(chǎng)景,即使是上億數(shù)據(jù)集的工業(yè)視覺(jué)大模型,它也得針對(duì)單個(gè)場(chǎng)景單獨(dú)訓(xùn)練,該花多長(zhǎng)時(shí)間就得花多長(zhǎng)時(shí)間,本來(lái)應(yīng)該訓(xùn)練多少數(shù)據(jù)集,它就應(yīng)該訓(xùn)練多少數(shù)據(jù)集!
比如說(shuō),你是上億級(jí)工業(yè)視覺(jué)大模型,我是從0開(kāi)始訓(xùn)練的工業(yè)視覺(jué)大模型,甲方生產(chǎn)時(shí)需要檢測(cè)一個(gè)叫作“螺母”的東西,那大概率是上億級(jí)的工業(yè)視覺(jué)大模型省時(shí)間,前提是它訓(xùn)練過(guò)“螺母”這個(gè)東西,如果沒(méi)有,那其實(shí)它和我這個(gè)從0開(kāi)始訓(xùn)練的大模型其實(shí)是一樣的!我需要訓(xùn)練幾十萬(wàn)次,那它同樣也得訓(xùn)練幾十萬(wàn)次,沒(méi)有什么捷徑可走。
這時(shí)候,如果我訓(xùn)練后的準(zhǔn)確率控制在99.8%以上,而這個(gè)號(hào)稱(chēng)用了上億數(shù)據(jù)集訓(xùn)練的工業(yè)大模型的識(shí)別準(zhǔn)確率最高只有99.3%,您認(rèn)為客戶(hù)會(huì)使用哪個(gè)?您跟他吹自己上億數(shù)據(jù)集,他不需要又有什么用?
對(duì)于客戶(hù)來(lái)說(shuō),拋開(kāi)“螺母”這個(gè)東西,其他的訓(xùn)練對(duì)他都沒(méi)用,在代碼的世界里,我們管這個(gè)叫作“冗余”!
換個(gè)角度說(shuō),別說(shuō)99.3%了,哪怕是99.9%,工業(yè)視覺(jué)項(xiàng)目能順利通過(guò)驗(yàn)收都是很難的,因?yàn)榭蛻?hù)要的,其實(shí)是100%!但是,大家都知道,只要是視覺(jué),不管是工業(yè)視覺(jué)還是消費(fèi)市場(chǎng)的視覺(jué),沒(méi)有誰(shuí)能夠保證檢測(cè)100%的準(zhǔn)確率。
我做過(guò)的幾乎所有工業(yè)視覺(jué)項(xiàng)目,基本上合同上寫(xiě)的識(shí)別準(zhǔn)確率就沒(méi)有低于千分之一的即99.9%,最夸張的一次,客戶(hù)直接要求識(shí)別準(zhǔn)確率要在萬(wàn)分之一即99.99%,這個(gè)項(xiàng)目四年了,還沒(méi)有通過(guò)驗(yàn)收!我想未來(lái)只要客戶(hù)堅(jiān)持這個(gè)數(shù)字,估計(jì)大概率也是驗(yàn)收不掉了!
所以,工業(yè)視覺(jué)模型數(shù)據(jù)集大小其實(shí)并不重要,客戶(hù)看的,只是能給他節(jié)省多少事,客戶(hù)的要求其實(shí)就是替代人工或者極少數(shù)的人工干預(yù)。
假設(shè)甲方是一個(gè)生產(chǎn)螺絲的工廠,引進(jìn)了一臺(tái)視覺(jué)設(shè)備,檢測(cè)準(zhǔn)確率這里假設(shè)是90%,要求很低,對(duì)于生產(chǎn)的螺絲,只要檢測(cè)不合格,直接吹走或者推到瑕疵品區(qū)域即可,只要瑕疵品區(qū)域足夠大,即使是識(shí)別準(zhǔn)確率不高,那么產(chǎn)線(xiàn)在完全沒(méi)有人工干預(yù)的情況下,跑個(gè)個(gè)把小時(shí)甚至是一天都沒(méi)有問(wèn)題。
但是,如果甲方是一個(gè)生產(chǎn)輪胎的工廠呢?同樣是90%的話(huà),意味著每生產(chǎn)10個(gè)輪胎就有一個(gè)輪胎檢測(cè)不到,那視覺(jué)設(shè)備基本上就離不開(kāi)人工了!
那假設(shè)如果我們的視覺(jué)設(shè)備能夠把識(shí)別準(zhǔn)確率提高到99.9%呢?對(duì)于生產(chǎn)螺絲的企業(yè)來(lái)說(shuō),其實(shí)影響不大,因?yàn)榧词故?0%,人工干預(yù)的情況也很少,但是,對(duì)于生產(chǎn)輪胎的企業(yè)來(lái)說(shuō),作用就大了,假設(shè)3分鐘檢測(cè)一個(gè)輪胎,那么原來(lái)90%的識(shí)別率,每30分鐘就得人工干預(yù)一下,現(xiàn)在變成了2天!
所以,拋開(kāi)使用場(chǎng)景光談模型數(shù)據(jù)集大小那就是本末倒置!工業(yè)視覺(jué)的本其實(shí)就是準(zhǔn)確率,而不是所謂的通用性!
結(jié)語(yǔ)
為什么現(xiàn)在很多通用型的工業(yè)視覺(jué)軟件產(chǎn)品價(jià)格卷到了幾乎沒(méi)利潤(rùn),很多價(jià)格都卷到了千元以?xún)?nèi),原因也是在這,過(guò)分講究模型的多樣性,實(shí)際上看似訓(xùn)練的數(shù)據(jù)集很大,但是解決不了客戶(hù)的實(shí)際問(wèn)題,自然賣(mài)不動(dòng)!不管工業(yè)視覺(jué)產(chǎn)品怎么吹上天,終究還是以解決客戶(hù)問(wèn)題為主,你解決不了客戶(hù)的問(wèn)題或者解決的不夠徹底,自然不會(huì)被市場(chǎng)所接受!
包括我在內(nèi)的很多程序員,其實(shí)都有一個(gè)通病,那就是很喜歡搞通用的東西,這個(gè)本身沒(méi)錯(cuò),通用,意味著低耦合,拿來(lái)即用,不用即拋,這在代碼的世界里面其實(shí)是個(gè)好東西,但是,拋開(kāi)業(yè)務(wù)只看代碼,難怪你做不好!
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.