在計(jì)算機(jī)視覺領(lǐng)域中,商湯、曠視、云從、依圖可以說是當(dāng)之無愧的頭部企業(yè),更是被業(yè)內(nèi)稱為CV(ComputerVision)四小龍。值得關(guān)注的是,商湯和云從兩家上市公司都經(jīng)歷了上市即巔峰,隨即股價(jià)下跌的劇情。資本市場(chǎng)表現(xiàn)不佳,深陷裁員等傳聞,不禁讓人好奇:當(dāng)風(fēng)口退去,他們準(zhǔn)備好面對(duì)資本市場(chǎng)最嚴(yán)格的審視了嗎?
研發(fā)成本高、盈利難:
目前業(yè)內(nèi)將虧損的主要原因歸咎于研發(fā),從招股書顯示,商湯科技2018-2021年上半年,累計(jì)虧損242.72億元,調(diào)整后累計(jì)虧損為28.6億元。商湯科技在研發(fā)上十分大手筆。2018-2021年上半年,商湯科技三年半合計(jì)研發(fā)支出達(dá)69.91億元。
云從科技的招股書中也可以看到,2019年-2021年,云從科技三年累計(jì)虧損高達(dá)23.21億元。造成虧損的一大原因是高額的研發(fā)投入占了營(yíng)收大半,2019年至2021年,云從三年累計(jì)研發(fā)投入占營(yíng)收的占比為59.39%。
AI的應(yīng)用場(chǎng)景中非常分散和碎片化,客戶的每一個(gè)新場(chǎng)景都需要企業(yè)長(zhǎng)期堆人頭、消耗大量的研發(fā)與交付資源。無論是云從還是商湯,持續(xù)增加的研發(fā)投入,卻換來長(zhǎng)期虧損,這成為籠罩在AI企業(yè)頭頂之上的烏云。
商業(yè)化落地難:
翻閱商湯科技公布的2022年上半年財(cái)報(bào)顯示,公司新增2136項(xiàng)專利,專利資產(chǎn)總數(shù)達(dá)12502個(gè),在全球頂級(jí)計(jì)算機(jī)視覺會(huì)議上發(fā)表了71篇論文。可商業(yè)并非學(xué)術(shù)。如何將技術(shù)規(guī)?;涞氐綀?chǎng)景中去,并實(shí)現(xiàn)商業(yè)化變現(xiàn),對(duì)于不少計(jì)算機(jī)視覺企業(yè)來說也是一個(gè)難點(diǎn)。
無論是盈利模式還是應(yīng)用落地,在CV領(lǐng)域外,四小龍的AI之路仍充滿著艱難。
計(jì)算機(jī)視覺與工業(yè)界GAP有多大?
從人臉識(shí)別到工業(yè)智造,計(jì)算機(jī)視覺目前已跨越了安防、金融、零售、互聯(lián)網(wǎng)、半導(dǎo)體、汽車等不同垂直行業(yè)。
隨著數(shù)字化轉(zhuǎn)型需求的提升,越來越多的工業(yè)企業(yè)開始應(yīng)用視覺技術(shù)替代人工進(jìn)行工況檢測(cè)、成品檢驗(yàn)、質(zhì)量控制。“四小龍”在應(yīng)用場(chǎng)景的落地上雖然都以比較成熟的安防和金融為主,但查看幾家企業(yè)的網(wǎng)站發(fā)現(xiàn),已有一些企業(yè)開始在工業(yè)領(lǐng)域涉足。
例如,曠視推出的河圖就是面向供應(yīng)鏈物聯(lián)網(wǎng)打造的“機(jī)器人物聯(lián)網(wǎng)操作系統(tǒng)”,重點(diǎn)關(guān)注“倉(cāng)儲(chǔ)、物流、制造和供應(yīng)鏈”等行業(yè)場(chǎng)景。商湯科技在工業(yè)質(zhì)量控制方面更是已有案例,提供了基于SenseCore 商湯AI大裝置打造的光機(jī)電軟算一體化的深泉工業(yè)質(zhì)檢推訓(xùn)平臺(tái)解決方案。
碎片化場(chǎng)景難以深入
新市場(chǎng)、新賽道的拓展并不容易。對(duì)于計(jì)算機(jī)視覺企業(yè)來說,想要進(jìn)入工業(yè)市場(chǎng),質(zhì)檢、巡檢是主要應(yīng)用場(chǎng)景,但對(duì)于工業(yè)企業(yè)來說,計(jì)算機(jī)視覺只是繁雜工藝中的一環(huán),要嵌入完整的生產(chǎn)線上,必然會(huì)遇到與其他環(huán)節(jié)合作的挑戰(zhàn),甚至與工業(yè)本身的相互磨合。
一個(gè)個(gè)“大而全”的解決方案,看似可以破解一切難題,但往往會(huì)被現(xiàn)實(shí)場(chǎng)景進(jìn)一步削弱。因此,機(jī)器視覺在工業(yè)領(lǐng)域的應(yīng)用需要找到非常有吸引力的差異化場(chǎng)景。
在我們與工業(yè)用戶的接觸中,很多用于都有意愿嘗試通過AI機(jī)器視覺來解決工業(yè)檢測(cè)中的問題,但是客戶對(duì)技術(shù)的成熟度并無概念。視覺算法企業(yè)在面對(duì)千奇百怪的工業(yè)應(yīng)用場(chǎng)景時(shí),也很難保證用戶可以在一定成本內(nèi)達(dá)到預(yù)期效果。
比如在汽車、3C、制藥等行業(yè),他們的共同特點(diǎn)都連續(xù)大批量生產(chǎn)、對(duì)外觀質(zhì)量的要求非常高,但三個(gè)行業(yè)的被測(cè)物一致性、對(duì)視覺系統(tǒng)的分辨率、對(duì)檢測(cè)速度的要求來講,都是不盡相同的。
細(xì)分到不同的工藝環(huán)節(jié),都會(huì)造成機(jī)器視覺系統(tǒng)所需的機(jī)理模型不同。以冶金鋼卷生產(chǎn)缺陷檢測(cè)為例,鋼卷分為冷軋、熱軋,都可以采用機(jī)器視覺技術(shù)進(jìn)行質(zhì)檢,但算法要解決的機(jī)理問題卻又是完全不一樣。一個(gè)企業(yè)、一個(gè)場(chǎng)景,尚無法做到模型的通用化,而一對(duì)一模型的定制開發(fā),又會(huì)導(dǎo)致落地成本和實(shí)施周期的增加。
從若干客戶的各種具體應(yīng)用場(chǎng)景中對(duì)解決方案進(jìn)行總結(jié)研發(fā),提煉出在一定應(yīng)用場(chǎng)景下相對(duì)普適性的解決方案,并設(shè)計(jì)有效的機(jī)器視覺解決方案,需要大量的行業(yè)應(yīng)用經(jīng)驗(yàn)積累。
因此,想在工業(yè)場(chǎng)景中拓展智能化應(yīng)用,光有算法實(shí)力是不行的,還必須具備相當(dāng)深刻的行業(yè)知識(shí)。對(duì)于工業(yè)領(lǐng)域來說,不一定需要多復(fù)雜的算法,而是更多地受到其他現(xiàn)實(shí)因素的影響。他們更注重豐富的行業(yè)應(yīng)用經(jīng)驗(yàn),算法應(yīng)力求簡(jiǎn)單實(shí)用,穩(wěn)定性強(qiáng)。
成熟算法已有
一般來說,掌握底層軟件算法的公司更容易形成自身優(yōu)勢(shì)。但在工業(yè)領(lǐng)域,成熟的視覺算法軟件已經(jīng)有很多,包括vision pro、halcon、opevCV、mil、hexsight、evision、avl等。例如,非常成熟的檢測(cè)算法Halcon,經(jīng)過長(zhǎng)期的積累和迭代,不僅非常穩(wěn)定而且計(jì)算量小,還不用標(biāo)注數(shù)據(jù)和調(diào)參。
在算法側(cè)重上,工業(yè)視覺的算法往往側(cè)重于精確度的提高;而計(jì)算機(jī)視覺的算法難度相對(duì)較高,側(cè)重于或采用數(shù)學(xué)邏輯或采用深度學(xué)習(xí)方法進(jìn)行物體的標(biāo)定與識(shí)別。
有系統(tǒng)服務(wù)商曾表示,在開發(fā)解決方案的時(shí)候選擇了某品牌的相機(jī),相機(jī)設(shè)備自帶一個(gè)面向工業(yè)視覺的算法庫(kù),買回去之后可以直接開發(fā)出更具針對(duì)性的產(chǎn)品,部署的時(shí)候再買一個(gè)品牌的加密狗就可以了,完全沒有必要再去單獨(dú)購(gòu)買一套純算法。既然已經(jīng)有了這么多可供選擇的算法,工業(yè)企業(yè)也就完全沒有必要再去選擇純算法公司的產(chǎn)品。
缺乏樣本數(shù)據(jù)
軟件是機(jī)器視覺產(chǎn)業(yè)的核心中樞,其背后的本質(zhì)是數(shù)據(jù)的積累和算法的迭代。在視覺算法層面,一個(gè)最簡(jiǎn)單的思路是針對(duì)特殊場(chǎng)景收集大量數(shù)據(jù)去訓(xùn)練模型。
在工業(yè)場(chǎng)景中,數(shù)據(jù)的收集存在一定問題,樣本數(shù)據(jù)量往往不足以支持基于深度學(xué)習(xí)的計(jì)算機(jī)視覺檢測(cè)任務(wù)。一般來說,不合格缺陷產(chǎn)品的數(shù)量遠(yuǎn)遠(yuǎn)少于合格品,隨機(jī)獲取的數(shù)據(jù)將存在樣本分布不平衡的問題。而且,工業(yè)現(xiàn)場(chǎng)的拍攝環(huán)境復(fù)雜無法保證,容易造成樣本圖像的質(zhì)量不一,從而影響后續(xù)檢測(cè)效果。
機(jī)器視覺領(lǐng)域看似繁榮,但是真正落地仍然面臨很多問題。除了軟件算法層面的問題,光源的穩(wěn)定性、工件位置的穩(wěn)定性、工件表面質(zhì)量的穩(wěn)定性、工件本身的一致性、工件材質(zhì)、物體的運(yùn)動(dòng)速度、光學(xué)系統(tǒng)的精度等都是影響視覺技術(shù)在工業(yè)領(lǐng)域落地的難點(diǎn)。這需要光學(xué),深度學(xué)習(xí)、傳統(tǒng)圖像算法、機(jī)械設(shè)備、傳感器等多方面融合。
對(duì)于工業(yè)用戶來說,合適的硬件及易用的軟件算法固然十分重要,但更重要的是提供軟硬件方案的機(jī)器視覺廠商可以根據(jù)他們的應(yīng)用需要和使用場(chǎng)景進(jìn)行可行性分析,并給出真正適合的解決方案。