2021年12月上旬,商湯科技首次公開募股定價本該正常進行,然而,美國財政部一紙政令給商湯的IPO進程帶來新的波折。商湯被列入“軍事工業(yè)復合體公司”黑名單,要求“美國相關”投資者一律不許參與商湯募資。但商湯上市后的表現(xiàn)似乎讓美國失望了……
事實上,在AI領域,CV四小龍商湯、曠視、云從和依圖作為AI行業(yè)的代表企業(yè),一直以來備受各界關注,背后有龐大融資規(guī)模的因素,也有長期巨額虧損的因素,不同的人有著不同的關注角度,而美國虎視眈眈的則是這些企業(yè)代表的研究方向與已經展現(xiàn)出來的實力,會給其帶來巨大的威脅。
當然,除了CV賽道,讓美國不適的是整個中國的AI產業(yè),除了CV四小龍,科大訊飛、海康威視等都在制裁的清單上。背后的原因顯而易見,AI作為下一個20年全球化競爭的核心賽道之一,也是中美科創(chuàng)競爭的關鍵核心戰(zhàn)場之一。而中國AI產業(yè)的先發(fā)優(yōu)勢與全面、深層次的布局已經形成了極強的競爭優(yōu)勢,并在各方面領跑全球。
但很顯然,中國AI產業(yè)取得的成就并非是單個企業(yè),而是體系化、系統(tǒng)化的領先,美國試圖通過“制裁”、“拉黑”企業(yè)阻礙中國AI產業(yè)的持續(xù)性領先,這個算盤是敲不響的,以AI第一股科大訊飛為例,目前科大訊飛已經通過在智能語音、計算機機器視覺等感知智能領域的突破,以及深度學習、自然語言處理等認知智能層面的單點技術的突破,實現(xiàn)了系統(tǒng)性創(chuàng)新。
美國在怕什么?
數(shù)據(jù)顯示,早在2019年,我國人工智能專利申請數(shù)量超過11萬項,超過美國的8萬項,穩(wěn)居世界第一,計算機視覺作為全球布局最集中的領域,國內企業(yè)數(shù)量在全球占比也已超過40%。最新數(shù)據(jù)顯示,2018年-2021年全球共新增申請了65萬件人工智能相關專利,中國、美國和日本申請量分列前三,其中中國為44.5萬件,占比68.5%。
專利數(shù)量的豐富度背后,則是中國市場應用場景的豐富度,無論是在布局廣度還是深度方面,均已經形成了明顯的競爭優(yōu)勢。同時,中國AI行業(yè)的創(chuàng)新普遍有著明顯的原創(chuàng)性,占據(jù)著大部分創(chuàng)新應用的主導權,疊加場景應用的加速落地,后續(xù)發(fā)展勢頭依然強勁。
在過去科技領域,美國長期處于優(yōu)勢地位,也讓美國在上一輪的競爭中有了躺著賺錢的實力,作為下一個二十年國際化競爭的核心賽道,AI代表的不僅是下一代的效率革命,也是國家實力的體現(xiàn)?;久媸?,中國AI產業(yè)的強勢崛起,無疑讓美國感受到了威脅。
從這個角度來看,美國頻繁拉黑中國AI企業(yè)的目的無非就是希望借此阻礙中國AI企業(yè)的發(fā)展,防止中國成為全球AI產業(yè)的領跑者,從而維護自身的技術優(yōu)勢去搶占下半場競爭的主導權。
事實上,美國在AI領域對中國的防備不是沒有的。早在2019年初,特朗普政府就簽署了“美國AI倡議”:為確保美國繼續(xù)保持 AI 創(chuàng)新的領導地位, AI 倡議要求聯(lián)邦機構根據(jù)各自機構的任務,在其研發(fā)投資中優(yōu)先考慮 AI 研發(fā)。2020年初,美國為了緩解“領先地位”焦慮,推出“AI十原則”,其中強調“AI增長創(chuàng)新是美國政府高級優(yōu)先項。”
然而,作為一個關鍵的賽道,這種“你追我趕”的競爭方式根本上無法緩解美國的焦慮,因為對AI的投入,中國從未放慢腳步,也因此“拉黑”成為美國新的競爭手段。
美國之所以覺得這種方式有用,也是抓住了目前AI企業(yè)持續(xù)高投入、虧損的痛點,通過阻礙AI企業(yè)上市融資的方式來釜底抽薪。但這一計劃大概率落空,一來,像科大訊飛這樣已經上市的企業(yè),業(yè)務多元化布局,已經實現(xiàn)了規(guī)模化盈利,資金充足;二來,未上市的獨角獸企業(yè),本身具備技術創(chuàng)新實力,少了美國相關投資者,也不見得就徹底融不到錢了,以商湯為例,重啟上市計劃,在融資規(guī)模沒有變化的情況下,基石投資規(guī)模反倒從原來的4.5億美元,提升至5.1億美元,可見市場對中國AI企業(yè)的看好。
NLP與CV雙賽道演進,中國企業(yè)已搶先一步
從創(chuàng)新邏輯來看,及中美投資者偏好來看,美國AI領域主要偏重于底層基礎創(chuàng)新,而中國AI企業(yè)則更加強調應用創(chuàng)新,這依托于過去中國互聯(lián)網(wǎng)在各行業(yè)商業(yè)模式創(chuàng)新的優(yōu)勢,也意味著中國AI創(chuàng)新邏輯是場景與需求驅動的反向創(chuàng)新,有著更高的落地效率。
結果也是顯而易見的,無論是計算機視覺技術、學習算法、還是自然語言處理,已經深度融合到了各行各業(yè),從To B到To C全面覆蓋,大到無人駕駛,小到文字識別。
回到本質來看,AI是什么?也即我們追求的AI的能力到底是什么?事實上,即是構造一個可以用于理解世界的結構,簡單來理解的話,就是再造一個“人腦系統(tǒng)”,通過這個系統(tǒng)去理解世界的結構,然后去通過各種技能解放人類雙手。從這個邏輯來看,AI未來的能力一定是集成式的,因為只有集成才會擁有更加豐富的智慧。其中,NLP(自然語言處理)與CV(計算機視覺技術)則是最為關鍵的兩個環(huán)節(jié),也即交流與觀察。
這也是AI行業(yè)在單點技能實現(xiàn)突破后,下一個階段的重要發(fā)展趨勢,而這樣的集成與融合在中國AI行業(yè)已經悄然展開。
早在2016年,基于強大的NLP技術沉淀,科大訊飛研發(fā)出一套深度全序列卷積神經網(wǎng)絡的語音識別框架(DFCNN),該技術解決方案可以直接將一句語音轉化成一張圖像作為輸入。簡單來說,DFCNN技術方案可以通過“觀看”語譜圖即可理解語音中表達的內容。據(jù)了解,科大訊飛將這一計數(shù)法方案與諸多現(xiàn)有的技術點結合后,DFCNN的語音識別框架在內部數(shù)千小時的中文語音短信聽寫任務上,相比目前業(yè)界最好的語音識別框架雙向RNN-CTC系統(tǒng)獲得了15%的性能提升。
(DFCNN示意圖)
一個技術方案背后,是科大訊飛早在2016年就已經展開了AI集成式能力的布局,從行業(yè)的角度來看,這是對下半場的提前布局,帶領中國AI產業(yè)再一次實現(xiàn)搶先一步的跨越。
在業(yè)界的普遍認知里,科大訊飛是一家很強的語音公司。但實際上,除了語音的強之外,其在CV領域的布局幾乎是與CV行業(yè)的快速發(fā)展幾乎同步。早在2008年,科大訊飛就已經展開了在CV領域的探索,并且基于自然語言處理技術的深厚積淀,科大訊飛在CV賽道的邏輯也走出了差異化,比如在文本識別范疇,科大訊飛的解決方案來自于語音識別對連續(xù)波形轉換的技術邏輯,在這一解決方案中,科大訊飛將語音識別中的HMM模型框架引入到文本行識別,大幅提升了精度。
2013年,科大訊飛的文本識別技術就已經應用于其主營業(yè)務之一智慧教育,并逐漸成為智能閱卷、評分測評甚至現(xiàn)在“因材施教”的個性化教育等應用的入口。
在文本識別生根發(fā)芽之際,科大訊飛又開啟了計算機視覺領域其他技術方向探索的征程,從人臉識別、醫(yī)學影像到輔助駕駛、虛擬形象等。
換個角度來看,科大訊飛在CV及NLP領域互相借鑒、融合底層的技術邏輯,這也為集成化的AI能力落地奠定了堅實的基礎。在科大訊飛AI研究院,計算機視覺、認知、語音三大方向一盤棋,也形成了科大訊飛跨領域、融合式的創(chuàng)新的能力。
可以預見的是,在新的階段,多種技術與場景需求的系統(tǒng)性創(chuàng)新是AI能力實現(xiàn)廣泛落地的先決條件,同時,行業(yè)對集成化能力需求的進一步提升,也將進一步提升中國AI產業(yè)的競爭能力。
下半場將啟,科大訊飛陽謀浮出水面
多項能力的集成是AI行業(yè)下半場開啟的重要信號,這也是AI邁向新階段的關鍵體現(xiàn)點??v觀CV和NLP兩大核心能力的現(xiàn)狀,在技術方面都實現(xiàn)了深度的突破,并且目前均已經實現(xiàn)廣泛的落地與應用。
在語音市場,根據(jù)中國語音產業(yè)聯(lián)盟發(fā)布的《2020~2021中國語音產業(yè)發(fā)展白皮書》,我國智能語音市場規(guī)模持續(xù)穩(wěn)定增長,其中科大訊飛以60%市場份額穩(wěn)居第一;根據(jù)艾媒咨詢發(fā)布的《2020年中國人工智能產業(yè)專題研究報告》科大訊飛的綜合實力和成長能力遠超同行業(yè)競爭者,獨占第一梯隊。
無論是從市占率,還是技術實力等方面來看,科大訊飛在語音領域都處于寡頭地位。在語音之外,事實上,CV領域科大訊飛也有著領先優(yōu)勢,取得了非凡的成就,如科大訊飛在計算機視覺頂級會議CVPR 2019和文檔分析與識別頂級會議ICDAR 2019的多項評測任務中獲得冠軍;在ICPR MTWI圖文識別挑戰(zhàn)賽中包攬了全部三項任務的冠軍等等;在2021年輕量級文字識別技術創(chuàng)新大賽中,科大訊飛以復雜自然場景83.29%的正確率,取得第一名。
我們也不難看出,科大訊飛除了NLP強,CV也同樣很強,但相比于NLP,其在CV領域一直比較低調。一方面,在語音市場市占率超過60%的市場地位讓業(yè)界對科大訊飛形成了固有的認知,疊加消費業(yè)務重點布局語音市場,也潛移默化的削弱了其在CV領域的聲量。除了這一客觀因素之外,也有科大訊飛的主觀因素。
作為深耕AI行業(yè)20余年的龍頭企業(yè),對于AI本質的理解肯定是更加深刻與完善的,自然也有更加超前的戰(zhàn)略眼光,從其在2008年就展開了在計算機視覺領域的布局也不看看出這一點,即科大訊飛長遠的布局邏輯是多元布局、單點突破,再實現(xiàn)系統(tǒng)性的創(chuàng)新能力,從而實現(xiàn)自身的跨越式發(fā)展,帶領行業(yè)提前進入下半場。
至此,我們也可以明顯看出背后的邏輯,從行業(yè)角度來看,行業(yè)對AI能力的需求逐漸進入集成化時代,且無論是CV賽道,還是NLP賽道在技術上都已實現(xiàn)了重大突破,大規(guī)模落地應用,下一階段的重點多項技術的集成化;對于科大訊飛來說,雙賽道布局,且底層技術邏輯相互借鑒共用的思路,能更加快速地實現(xiàn)集成化發(fā)展。
不可忽視的是,新階段,必然是新領域、新的解決方案,所以AI行業(yè)持續(xù)的投入還在繼續(xù),縱觀全球范圍,目前的AI企業(yè)大都以單點突破為主,在后續(xù)的發(fā)展中缺錢依然是常態(tài),而科大訊飛除了先發(fā)優(yōu)勢,也是最不缺錢的那一個。搶占先機、掌控主導權,似乎科大訊飛已經勝券在握。
也同樣,在下半場的國際競爭中,也為中國AI市場贏得了新的提前進場的入場券,而美國以“拉黑”企業(yè)阻礙中國AI持續(xù)領先的計劃,怕是又要落空了……
請登錄以參與評論
現(xiàn)在登錄