5月9日,依圖重磅推出了擁有世界級算法優(yōu)勢的云端AI芯片——求索(questcore?)。這是依圖推出的第一款云端深度學習推理定制化SoC芯片,專為計算機視覺領域分析任務打造。性能秒殺英偉達!算法即芯片的時代來了。在今天的年度發(fā)布會上,擁有世界級算法優(yōu)勢的依圖科技重磅推出云端AI芯片——求索(questcore?)!為AI芯片開辟了一條新道路。選擇在擅長的領域繼續(xù)發(fā)揮優(yōu)勢?!扒笏鳌笔且缊D推出的第一款云端深度學習推理定制化SoC芯片,為計算機視覺領域分析任務打造,針對視覺領域的不同運算進行加速,適用于人臉識別、車輛檢測等多個應用場景。加入“造芯”陣營后,依圖科技瞄準其擅長的計算機視覺領域,再度打出重拳,這一拳打破了算法公司與芯片硬件公司的“次元壁”。
人工智能公司依圖科技發(fā)布云端視覺推理AI芯片questcore(求索),由依圖科技和兩年前投資的AI芯片初創(chuàng)團隊ThinkForce聯(lián)合開發(fā)。questcore基于擁有自主知識產(chǎn)權(quán)的ManyCore架構(gòu),采用16nm工藝,適用于人臉識別、視頻結(jié)構(gòu)化分析、行人再識別等多種圖像和視頻實時智能分析任務。
依圖科技聯(lián)合創(chuàng)始人兼CEO朱瓏介紹,在實際的云端應用場景,questcore最高能提供每秒15TOPS的視覺推理性能,最大功耗僅20W,比一個普通的電燈泡還小。在同等功耗下,questcore的視覺推理性能是市面現(xiàn)有主流同類產(chǎn)品的2——5倍。
發(fā)布會現(xiàn)場,依圖科技首席創(chuàng)新官呂昊手拿一臺體積大小和15英寸蘋果MacBookPro筆記本相當?shù)囊缊D原子服務器,帶動現(xiàn)場200個攝像完成實時智能視頻分析,對嘉賓進行人臉對比。呂昊介紹,依圖原子服務器基于questcore打造,一臺服務器提供的算力與8張英偉達P4卡服務器相當,而體積僅為后者的一半,功耗不到20%。對于芯片的落地情況,呂昊說,目前questcore先搭載在依圖原有的產(chǎn)品上,面向市場銷售解決方案和硬件等,未來會尋求更多的客戶。
“求索”已來:云端AI芯片市場再添新玩家
在發(fā)布會現(xiàn)場,依圖聯(lián)合創(chuàng)始人兼CEO朱瓏談到了AI芯片為何難做,用了三個“沒有”作為排比句:
沒有典型場景應用就沒有意義;
沒有超越NVIDIA的芯片就沒有意義;
沒有世界級的算法就沒有意義。
如果一款AI芯片沒有定制方向、沒有超過業(yè)內(nèi)最大咖的玩家、沒有頂級算法作為支撐,那么這款芯片就不能稱為是成功的,這也是依圖所面臨的挑戰(zhàn)。
依圖科技的確擁有世界級的算法優(yōu)勢,但它并非芯片創(chuàng)業(yè)公司,在投入大、門檻高的芯片行業(yè),一開始就選擇了高端玩家頗多的領域進軍——自研云端AISoC,頗有要挑硬骨頭下手的意思。
先來看下規(guī)格:
類型:系統(tǒng)級芯片(SoC);
架構(gòu):ARM+ManyCore?;
制程:16nm
工作記憶內(nèi)存:LPDDR4X;
解碼:64路全高清實時。
發(fā)布會現(xiàn)場,依圖科技首席創(chuàng)意官呂昊為大家進行了芯片演示——他手持一臺體積與15英寸蘋果MacBookPro筆記本相當?shù)囊缊D原子服務器,成功帶動200路攝像頭同時完成實時智能視頻分析任務。
剛開始大屏幕只顯示了服務器處理的27個攝像頭畫面——一個NVIDIAP4顯卡大概只能處理27個攝像頭。緊接著,大屏幕畫面突然顯示了原子服務器同時帶動200個攝像頭的畫面:
一場直觀的新品考驗。
依圖原子服務器基于questcore?打造,一臺服務器提供的算力與8張英偉達P4卡服務器相當,而體積僅為后者的一半,功耗不到20%。在進行視頻解析時,1臺依圖原子服務器(搭載4核questcore?芯片,除此之外無需其他配置),與8卡英偉達T4服務器(含雙核英特爾x86CPU)對比,單路視頻解析功耗僅為后者的20%,與8卡英偉達P4服務器(同樣含雙核英特爾x86CPU)相比,功耗約為后者的10%。
questcore?可獨立運行,自研架構(gòu),實現(xiàn)高性價比
這款芯片作為服務器芯片可以獨立運行,不依賴Intelx86CPU,并且采用依圖自研的ManyCore?架構(gòu),具有靈活可拓展的特質(zhì),適配各類深度學習算法。
從這些特性來看,這款云端芯片更看重“實用”二字——如何滿足更多的需求、如何將本有的算法優(yōu)勢在芯片上發(fā)揮更大的作用、如何適應現(xiàn)有的生態(tài)。
簡單來講,它致力于解決一個實在的問題——如何實現(xiàn)高性價比。
“利用算法優(yōu)勢”成為全場發(fā)布會的一大關(guān)鍵詞。依圖認為,好的算法才能更高效地利用芯片架構(gòu),才能指導芯片架構(gòu)設計,把算力更高效地轉(zhuǎn)化為智能。這款芯片基于領域?qū)S眉軜?gòu)(DomainSpecificArchitecture,DSA)理念,專為計算機視覺應用而生。
questcore?是款“自立自強”的芯片:它作為服務器芯片可以獨立運行,不依賴Intelx86CPU。這也是依圖芯片與NVIDIAGPU、GoogleTPU和其他AI芯片公司研發(fā)的AI加速器產(chǎn)品一個很大的不同。
另外,這款芯片采用依圖自研的ManyCore?架構(gòu),據(jù)介紹,同等功耗下,這款芯片能提供市面現(xiàn)有同類主流產(chǎn)品2——5倍的視覺分析性能。
如果一款芯片想要實用性強,就必須擁有強大的可拓展性,以便應用于更多的場景。ManyCore?架構(gòu)能夠適配各類深度學習算法,支持TensorFlow、PyTorch、Caffe等各類深度學習框架,便于無縫接入現(xiàn)有生態(tài)。在此架構(gòu)下,questcore?構(gòu)建的產(chǎn)品和解決方案可以兼顧云端和邊緣計算的需求。
據(jù)依圖科技向新智元介紹,這款芯片能實現(xiàn)性能和功耗比呈量級提升的根本原因之一是:ManyCore?架構(gòu)針對INT8數(shù)據(jù)(8位整數(shù)數(shù)據(jù)類型)進行加速。
事實上,對于云端AI推理或者說視覺推理計算而言,并不需要高精度的計算,低精度的INT8數(shù)據(jù)類型已經(jīng)足夠滿足需求。采用16nm制程也是考慮現(xiàn)在業(yè)界對視覺分析應用的需求。
在投入極高的芯片行業(yè),如何實現(xiàn)高性價比是眾多玩家要實際面對的終極問題,算力的提升正是為了解決AI場景中的經(jīng)濟學難題——用更少的成本解決更多的問題。
投資AI芯片初創(chuàng)團隊ThinkForce,依圖邁向算法芯片一體化
在發(fā)布會上,依圖表示未來立足“算法+芯片+數(shù)據(jù)智能”的極智戰(zhàn)略,深入行業(yè),降低人工智能應用落地和推廣成本,賦能行業(yè)。
據(jù)介紹,questcore?芯片的設計和研發(fā)正是依圖算法團隊和ThinkForce團隊緊密合作的成果。
事實上,依圖科技在AI芯片領域內(nèi)早有布局。2017年底,依圖正式對外宣布戰(zhàn)略投資AI芯片初創(chuàng)團隊ThinkForce。ThinkForce是中國少有的擁有芯片研發(fā)全鏈路能力的團隊,核心成員來自IBM、AMD、Intel、ZTE等芯片業(yè)界龍頭企業(yè),全都擁有十年以上專業(yè)芯片研發(fā)設計經(jīng)歷,經(jīng)手過40余款不同芯片的量產(chǎn)。
有了如此高配的芯片研究團隊,打破算法與芯片的“次元壁”不再是難事,軟硬件一體化的產(chǎn)品也因此誕生。
事實上,次元壁本就不應該存在。市場上并不存在單獨能夠使用的軟件或硬件,整個行業(yè)、整個生態(tài)一定是緊密結(jié)合在一起的。
這款芯片將于與依圖智能軟件結(jié)合在一起,構(gòu)成軟硬件一體化的產(chǎn)品或解決方案對外銷售,未來將應用于交通運輸、公共安全、智慧醫(yī)療和智慧零售等行業(yè)。TOB服務崛起之下,軟硬件一體化正成為一家AI企業(yè)的商業(yè)優(yōu)勢,可以為客戶提供針對特定場景優(yōu)化的性價比最高的解決方案。
AI芯片市場逐漸擁擠:“造芯”路上,定制化是未來方向
與依圖科技相似的是,Google、微軟、阿里等科技巨頭也在自研芯片:同樣也是通過利用自身特有優(yōu)勢,從而為客戶提供更好的軟硬件一體化解決方案。越來越多企業(yè)加入了轟轟烈烈的“造芯”大軍。
AI芯片是個全新戰(zhàn)場。
押寶AI芯片可以說是大勢所趨,據(jù)研究報告顯示,目前AI芯片行業(yè)生命周期正處于幼稚期,市場增長快,2022年將從2018年的42.7億美元,成長至343億美元。
與其他戰(zhàn)場相比,這個新戰(zhàn)場充滿了不確定性,以及更多的機會——一個沒有先例可循的智能時代。中國AI創(chuàng)企與世界科技巨頭站在同一起跑線上,完全有可能成為新巨頭,同時加速數(shù)據(jù)中心服務器芯片自主可控進程。
美國杜克大學電子計算機工程系教授陳怡然、美國紐約州立大學教授陳逸中曾在文章《中國AI芯片有可能彎道超車》提到:人工智能應用場景千變?nèi)f化,其中應用的算法之間的差異更是巨大,可以預期未來各項應用將有不同的定制化芯片,出現(xiàn)人工智能芯片百家爭鳴的盛況。AI芯片的另一大特點在于它所面對的是一個全新的、還未被大公司充分定義的新的業(yè)務場景。即使是NVIDIA,也只是在云計算這一領域有一定的壟斷地位。
定制化芯片必然是未來方向。
世界級的創(chuàng)新需要世界級的命題,如今AI普及也成為世界級命題。依圖聯(lián)合創(chuàng)始人兼CEO朱瓏認為AI普及的關(guān)鍵是智能密度,而這里“智能密度”指單位面積硅芯片提供的算力轉(zhuǎn)化的智能。
然而,在半導體的摩爾定律已經(jīng)臨近終結(jié),智能密度繼續(xù)翻倍不能再只寄希望于摩爾定律。雖然半導體的摩爾定律逼近終結(jié),但算法性能卻仍在萬倍增長,過去4年依圖的人臉識別算法精度提升了10萬倍。
同時,通用芯片已無法解決所有需求,定制化芯片與依圖questcore?一樣,GoogleTPU也是一種DSA,針對深度神經(jīng)網(wǎng)絡(DNN)進行加速,GoogleTPU充分證明了DSA的優(yōu)勢。而對于DSA芯片而言,領域知識是最重要的,需要對機器視覺技術(shù)和行業(yè)有著深刻理解,這是需要人工智能公司在研發(fā)和商用落地中不斷積累的。
一家算法公司造芯,需要下多大決心?
2017年就有傳言說依圖開始進軍AI芯片領域,并在開發(fā)AI芯片,對標另一家AI芯片初創(chuàng)公司地平線。對于這一說法,依圖首席創(chuàng)新官呂昊在采訪中對DeepTech澄清,從未在公司內(nèi)部聽聞依圖做芯片對標的是地平線。
他表示,與谷歌、微軟、阿里等公司自研芯片一樣,依圖自己做芯片也是為了更好地發(fā)揮依圖算法和軟件的性能,為客戶提供更好的軟硬件一體化解決方案。
朱瓏則在發(fā)布會上表示,依圖開發(fā)這款芯片,不在于追求匹及英偉達上則幾百T的算力,而在于高計算密度。
圖丨questcore?與英偉達產(chǎn)品的單位面積算力比較
圖丨依圖科技首席創(chuàng)新官呂昊在現(xiàn)場演示已經(jīng)配備questcore?的服務器機柜,并現(xiàn)場演示了4顆芯片如何支撐200路實時視屏解析,并具備人臉識別和比對的能力,目前產(chǎn)品已經(jīng)商用
據(jù)依圖提供的信息,questcore?是全球首款深度學習云端定制SoC芯片,定位服務器芯片/云端AI芯,可獨立使用,將與依圖的智能視覺分析軟件結(jié)合,作為軟硬件一體化的解決方案對外銷售,適用于加速各類視覺推理任務,比如交通運輸、公共安全、智慧醫(yī)療和智慧零售等行業(yè),尤其是對云端智能視頻實時分析等應用具有強需求的企業(yè)環(huán)境。搭載questcore?的依圖原子服務器,將為今年11月在上海舉行的第二屆世界進口博覽會提供安保服務。
在能效上,questcore?峰值性能達到11.2T(深度學習推理運算),功耗20W,攝像頭單路功耗僅為英偉達GPUP4的30%,同等功耗下,深度學習推理運算性能是市面同類產(chǎn)品的2——5倍。這款產(chǎn)品也支持TensorFlow、PyTorch等各類深度學習框架,適用于加速各類視覺推理任務,最高50路FHD視頻流硬件解碼,另外還支持虛擬化、容器化,可將AI云的彈性計算和調(diào)度提升一個量級。依圖也為questcore?配備了基于其自研ManyCore?架構(gòu)的深度學習推理模塊,ManyCore?架構(gòu)同樣適配各類深度學習算法。
圖丨questcore?支持的視覺推理場景
呂昊對DeepTech表示,questcore?由依圖和ThinkForce團隊共同打造,依圖在2017年2月時有了自研芯片的想法,大約2年時間順利完成一款量產(chǎn)AI芯片的研發(fā),從設計到制造實現(xiàn)全面國產(chǎn)化,背后是依圖和ThinkForce之間的深度合作。
后者成立于2017年,同樣是近年來中國AI芯片初創(chuàng)公司中最值得關(guān)注的新星之一,曾提出過“算法即芯片”的論斷(這一論斷也在今天的發(fā)布會上由朱瓏屢次提及,顯然,這位算法出身的創(chuàng)始人非常認可這一論斷)。
據(jù)了解,ThinkForce團隊核心成員來自IBM、AMD、INTEL、LSI、Broadcom、Cadence、ZTE等業(yè)界龍頭芯片企業(yè),負責過IBMPowerPC、AMDAPU的北橋、SonyPS3Cell處理器、MicrosoftXBOX游戲機主芯片、以及全球最高速的56GSerdes等,團隊成員手里曾量產(chǎn)過40款以上各類芯片,總銷售額數(shù)十億美元。2018年,ThinkForce完成4.5億元A輪融資,依圖正是投資方之一。
(來源:ThinkForce)
對于依圖推出這款云端AI芯片的原因,呂昊概括為三點:對行業(yè)的理解、產(chǎn)品體量已經(jīng)達到一定程度(未透露具體量級)、依圖算法精度的提升。
第一款AI芯片之所以選擇了用在云端推理上,也是因為依圖各主要業(yè)務尤其在安防上的需求。questcore?主打視頻推理,主要關(guān)注分析處理視頻的數(shù)量,專用于加速視覺推理運算,比如人臉識別、視頻結(jié)構(gòu)化分析、行人再識別等等,其和一些終端視頻推理芯片的區(qū)別在于,終端芯片只需要分析處理一路視頻,云端芯片則關(guān)心的是可以處理多少路視頻。呂昊表示,questcore?是目前更智能、性價比更高的視覺推理AI芯片。
“questcore?將整合在我們的產(chǎn)品中對外售賣。依圖的體量相對較大,最深耕的行業(yè)就是安防,因此不需要擔心由于市場體量較小而產(chǎn)生的成本問題……我們對于市場的需求、對于AI領域有自己的理解。2017年,公司對于AI算力需求增長以及產(chǎn)品競爭性有了一定的預判,因此有了自研AI芯片的決定”,他說。
不難看出,在這幾大動機中,現(xiàn)階段的業(yè)務需求是依圖第一次“造芯”的最直接原因。
圖丨2017年中國計算機視覺應用市場份額(來源:IDC)
依圖創(chuàng)立于2012年9月,自成立以來,其AI算法在人臉識別領域?qū)矣型黄?,且現(xiàn)已不再局限于視覺識別方向,在業(yè)內(nèi)也被認為是一家很明確的AI+垂直行業(yè)、應用層技術(shù)落地的AI算法公司,涉及安防、醫(yī)療、AI制藥、金融領域等。其中,依圖在安防和醫(yī)療領域布局較早,現(xiàn)已形成一定的先發(fā)優(yōu)勢,例如依圖醫(yī)療智能輔助診斷系統(tǒng)已經(jīng)在上海、浙江等近百家三甲醫(yī)院臨床應用,在安防上則搭建了全球首個十億級人像比對系統(tǒng),算法已突破億級靜態(tài)比對。
圖丨依圖已有的算法突破
但顯然,現(xiàn)在,和業(yè)內(nèi)很多公司一樣,依圖不單單只想追求極致的算法,也將目光投向了追求配合算法的極致算力上?!皼]有典型場景應用沒有意義,沒有超越英偉達的芯片沒有意義,沒有世界級的算法沒有意義”,朱瓏說。
發(fā)布會上,依圖也第一次對外談及其對智能算力發(fā)展的理解和使命:提升智能密度,即從單位智能走向群體智能,單位面積智能算力更高。這一使命顯然已經(jīng)從算法、數(shù)據(jù)跨越到了算力領域。
盡管采訪中依圖多次表示自身并非為了開發(fā)芯片而開發(fā)芯片、不為芯片商業(yè)化,但隨著這款云端AI芯片的推出,其定位將不再是一家純粹的AI算法公司。
圖丨含有4顆questcore?芯片的板卡
呂昊透露,公司既然決定自研AI芯片就不會只有一款產(chǎn)品,目前依圖已經(jīng)開始著手第二款產(chǎn)品的研發(fā),新芯片的算力還在優(yōu)化,希望能達到同等產(chǎn)品2到5倍的提升。依圖表示,首先發(fā)揮自己最擅長和積累最多的機器視覺領域?qū)I(yè)知識,今后將逐漸拓展到其他領域的芯片研發(fā)。
(來源:DeepTech)
算法紅利時代已過,垂直整合重回“C位”
依圖此次推出的芯片產(chǎn)品,能幫助依圖帶來怎樣的業(yè)務增長,仍有待時間和市場驗證,但我們相信,視覺算法公司進軍產(chǎn)業(yè)上游,開始自研芯片,現(xiàn)在還只是剛剛吹響前奏。去年就有業(yè)內(nèi)人士對DeepTech表示,中國的計算機視覺產(chǎn)業(yè)一定會走出一家或者幾家自研CV芯片的公司。
把時間倒回到大概兩三年前,也就是在2015年——2017年,無論是在視覺還是語音方向,算法公司都是產(chǎn)業(yè)圈和創(chuàng)投圈最熱捧的對象。當時,在AI的三大支柱“算法、數(shù)據(jù)、芯片”中,AI公司的核心競爭力主要體現(xiàn)在前兩者。
但從去年開始,整體的情況又有了細微的變化:無論是語音識別、自然語言處理還是人臉識別算法,各家在幾個最主要指標上的表現(xiàn)或許仍有先后之分,但算法上彼此已經(jīng)越來越難拉開距離。算法紅利逐漸吃緊,數(shù)據(jù)資源更是愈發(fā)掌握在極個別頭部公司手中,拼算力硬件也就成了一個水到渠成的階段。
這背后一個更重要的趨勢是,行業(yè)垂直整合的卷土重來。例如,過去1年,DeepTech接觸過的眾多涉及AI業(yè)務的公司,都在愈發(fā)頻繁地使用這個詞語——“全棧(fullstack)”。它意味著完整一套、端到端產(chǎn)品或服務體系的能力,正在成為描述一家AI公司競爭力的關(guān)鍵詞。
比如特斯拉,這家汽車公司最近推出了自己的芯片F(xiàn)SD,本質(zhì)上已經(jīng)拼上了最后一塊關(guān)鍵的版圖。放在過去,誰能想象一家汽車廠居然會自研自動駕駛芯片?
圖丨發(fā)布會上,依圖同樣對比了其與特斯拉FSD的性能功效,questcore?最大的不同在于兼顧云端和邊緣端
之所以說垂直整合是卷土重來,也是因為分工外包合作是主流,絕大多數(shù)企業(yè)傾向于專注核心業(yè)務,非核心業(yè)務與產(chǎn)業(yè)鏈上的供應商進行合作,打包捆綁式的合作模式讓出了舞臺中心。現(xiàn)在,垂直整合正在回歸,尤其是在電子信息密切相關(guān)的領域。
而特斯拉以外,蘋果更早嘗到了垂直整合的甜頭:不但寫軟件開發(fā)算法,還自研芯片,自運營零售商店。兩家公司分別在消費電子和汽車領域體現(xiàn)了高度垂直整合的價值,在用戶體驗、企業(yè)效率、建立壁壘上有顯著優(yōu)勢。
圖丨特斯拉自動駕駛芯片F(xiàn)SD(來源:特斯拉)
“特斯拉就是非常明顯的信號,這不是熱度問題,這是行業(yè)落地的必然結(jié)果”,呂昊說,“今年是AI芯片產(chǎn)品出現(xiàn)比較多的一年,很多公司都會嘗試垂直整合”。
目前,在云端AI芯片市場上,我們已經(jīng)看英偉達(T4)、谷歌(TPUv3)、亞馬遜(Inferentia)、華為(昇騰910)、百度(昆侖)這樣的中外科技巨頭,也有寒武紀(MLU100)、Graphcore(IPU)、比特大陸(BM1680、BM1682)等明星AI初創(chuàng)公司,可謂“巨頭盤踞、群雄爭霸”,尤其是在推理市場上更是百家爭鳴,但可以預見這片藍海還會有更多的玩家入局。算法背景團隊、芯片背景團隊、互聯(lián)網(wǎng)巨頭、傳統(tǒng)AI芯片大廠各有優(yōu)勢此起彼伏之間,云端AI芯片將迎來“物種大爆發(fā)”。
值得一提的是,在算法紅利的階段,國內(nèi)的不少AI方案廠商更多只是針對場景開發(fā)和優(yōu)化算法,所以很多時候都直接購買國外大廠的芯片,某種程度上來看,倒更像是為國外廠商創(chuàng)造更多產(chǎn)品的出海口,并不能直接推動中國芯片產(chǎn)業(yè)的發(fā)展,而現(xiàn)在,算法公司也在嘗試自研芯片,如果有越來越多中國公司在其中“怒刷存在感”,芯片持續(xù)高速地試錯、更新、升級,對中國芯片產(chǎn)業(yè)來說,也是在創(chuàng)造新的機會。
了解自身優(yōu)勢、了解市場真正需求,提供定制化芯片成為了依圖“高性價比”的解決方案,這也為那些想要加入芯片市場的玩家們提供了一個可高度參考的路線。正如陳怡然教授和陳逸中教授所說的那樣,一個成功的芯片項目所帶來的不僅僅是銷售芯片本身的利潤,還有伴隨芯片設計、制造以及銷售整套流程中產(chǎn)生的支撐產(chǎn)業(yè)與生態(tài)系統(tǒng),從而帶動軟硬件發(fā)展、行業(yè)標準制定、知識產(chǎn)權(quán)銷售等產(chǎn)業(yè)發(fā)展。算法即芯片,這條新路還會帶給AI公司更多的可能性。