智能時(shí)代,AI芯片革命已悄然到來(lái)


還記得年初小米澎湃芯片發(fā)布會(huì)嗎,一時(shí)間“中國(guó)芯”情愫讓大眾大大感動(dòng)了一把。

當(dāng)人們還在陶醉移動(dòng)芯片技術(shù)的國(guó)產(chǎn)化突飛猛進(jìn)的時(shí),新一代AI芯片已經(jīng)開(kāi)始來(lái)勢(shì)洶洶。而這浪聲勢(shì),早已有中國(guó)公司的身影。

9月2號(hào),華為在2017年德國(guó)柏林國(guó)際消費(fèi)電子產(chǎn)品展覽會(huì)上發(fā)布麒麟970芯片,定位為華為首款人工智能AI移動(dòng)計(jì)算平臺(tái)。這款芯片將在華為手機(jī)Mate 10上啟用。


一晚上的時(shí)間,這條消息爆燃網(wǎng)絡(luò)。大眾對(duì)芯片的認(rèn)識(shí),開(kāi)始準(zhǔn)備接受一個(gè)新概念:人工智能(AI)芯片。

上一篇文章《從機(jī)器人悠悠,來(lái)扒一扒人工智能的歷史》扒過(guò)人工智能的發(fā)展歷史,可知這一輪人工智能的革命是深度學(xué)習(xí)系統(tǒng)派。那么當(dāng)前誕生的AI芯片,顧名思義就是能滿足深度學(xué)習(xí)計(jì)算能力的電子集成處理器。

那么這個(gè)AI芯片到底有什么革命性呢?先來(lái)搞明白深度學(xué)習(xí)的需求點(diǎn)。

深度學(xué)習(xí)作為新一代計(jì)算模式,本質(zhì)上是多層次的人工神經(jīng)網(wǎng)絡(luò)算法,即模仿人腦的神經(jīng)網(wǎng)絡(luò),從最基本的單元上模擬了人類大腦的運(yùn)行機(jī)制。由于人類大腦的運(yùn)行機(jī)制與計(jì)算機(jī)有著鮮明的不同,深度學(xué)習(xí)與傳統(tǒng)計(jì)算模式有非常大的差別。

深度學(xué)習(xí)的人工神經(jīng)網(wǎng)絡(luò)算法與傳統(tǒng)計(jì)算模式不同,它能夠從輸入的大量數(shù)據(jù)中自發(fā)的總結(jié)出規(guī)律,從而舉一反三,泛化至從未見(jiàn)過(guò)的案例中。因此,它不需要人為的提取所需解決問(wèn)題的特征或者總結(jié)規(guī)律來(lái)進(jìn)行編程。人工神經(jīng)網(wǎng)絡(luò)算法實(shí)際上是通過(guò)大量樣本數(shù)據(jù)訓(xùn)練建立了輸入數(shù)據(jù)和輸出數(shù)據(jù)之間的映射關(guān)系,其最直接的應(yīng)用是在分類識(shí)別方面。例如訓(xùn)練樣本的輸入是語(yǔ)音數(shù)據(jù),訓(xùn)練后的神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)的功能就是語(yǔ)音識(shí)別,如果訓(xùn)練樣本輸入是人臉圖像數(shù)據(jù),訓(xùn)練后實(shí)現(xiàn)的功能就是人臉識(shí)別。

深度學(xué)習(xí)與傳統(tǒng)計(jì)算模式最大的區(qū)別就是不需要編程,但需要海量數(shù)據(jù)并行運(yùn)算。

傳統(tǒng)處理器架構(gòu)(包括x86 和ARM 等),一般由中央運(yùn)算器(執(zhí)行指令計(jì)算)、中央控制器(讓指令有序執(zhí)行)、內(nèi)存 (存儲(chǔ)指令)、輸入(輸入編程指令)和輸出(輸出結(jié)果)五個(gè)部分構(gòu)成,其中中央運(yùn)算器和中央控制器集成一塊芯片上構(gòu)成了我們今天通常所講的 CPU。這個(gè)架構(gòu)往往需要數(shù)百甚至上千條指令才能完成一個(gè)神經(jīng)元的處理,因此無(wú)法支撐深度學(xué)習(xí)的大規(guī)模并行計(jì)算需求。

那么現(xiàn)在有什么硬件可以滿足深度學(xué)習(xí)的并行運(yùn)算呢?

GPU和FPGA

GPU作為應(yīng)對(duì)圖像處理需求而出現(xiàn)的芯片,其海量數(shù)據(jù)并行運(yùn)算的能力與深度學(xué)習(xí)需求不謀而合。因此,它被最先引入深度學(xué)習(xí)。2011 年斯坦福大學(xué)教授吳恩達(dá)率先將其應(yīng)用于谷歌大腦中便取得驚人效果,結(jié)果表明12 顆NVIDIAD 的GPU 可以提供相當(dāng)于2000 顆CPU 的深度學(xué)習(xí)性能,之后紐約大學(xué)、多倫多大學(xué)以及瑞士人工智能實(shí)驗(yàn)室的研究人員紛紛在GPU 上加速其深度神經(jīng)網(wǎng)絡(luò)。

FPGA全稱現(xiàn)場(chǎng)可編程門陣列(Field-Programmable Gate Array),最初作為專用集成電路領(lǐng)域中的一種半定制電路而出現(xiàn)的,具有一定的可編程性,可同時(shí)進(jìn)行數(shù)據(jù)并行和任務(wù)并行計(jì)算,在處理特定應(yīng)用時(shí)有更加明顯的效率。FPGA的應(yīng)用領(lǐng)域主要是深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)算法,因?yàn)槠淇删幊绦?,這讓FPGA在深度學(xué)習(xí)領(lǐng)域擁有了得天獨(dú)厚的優(yōu)勢(shì)。

然而,目前GPU和FPGA各自都有其局限性和優(yōu)劣,比如GPU硬件結(jié)構(gòu)固定不具備可編程性,無(wú)法像FPGA 一樣可以靈活的配置硬件結(jié)構(gòu)。 運(yùn)行深度學(xué)習(xí)算法能效遠(yuǎn)低于FPGA。而FPGA基本單元的計(jì)算能力有限,但是每個(gè)單元的計(jì)算能力都遠(yuǎn)遠(yuǎn)低于CPU 和GPU。另外FPGA價(jià)格較為昂貴,在規(guī)模放量的情況下單塊FPGA 的成本要遠(yuǎn)高于專用定制芯片。

以深度學(xué)習(xí)為代表的人工智能計(jì)算需求,發(fā)展早期,主要采用GPU、FPGA 等已有適合并行計(jì)算的通用芯片來(lái)實(shí)現(xiàn)加速。由于這類通用芯片設(shè)計(jì)初衷并非專門針對(duì)深度學(xué)習(xí),因而,天然存在性能、功耗等方面的瓶頸。

而進(jìn)入人工智能(AI)芯片發(fā)展階段,就是專門滿足深度學(xué)習(xí)并行運(yùn)算能力的定制化芯片。其底層系統(tǒng)平臺(tái)架構(gòu)是從GPU或者FPGA發(fā)展而來(lái),對(duì)其重新設(shè)計(jì)。

設(shè)計(jì)芯片的目的是從加速深度學(xué)習(xí)算法到希望從底層結(jié)構(gòu)模擬人腦來(lái)更好實(shí)現(xiàn)智能。

目前人工智能芯片涵蓋了基于FPGA 的半定制、針對(duì)深度學(xué)習(xí)算法的全定制、類腦計(jì)算芯片三個(gè)階段。
  

1、基于FPGA 的半定制人工智能芯片,如國(guó)內(nèi)初創(chuàng)公司深鑒科技,該公司設(shè)計(jì)了“深度學(xué)習(xí)處理單元”(Deep Processing Unit,DPU)的芯片,希望以ASIC 級(jí)別的功耗來(lái)達(dá)到優(yōu)于GPU 的性能。

2、針對(duì)深度學(xué)習(xí)算法的全定制,就是完全采用ASIC 設(shè)計(jì)方法全定制,性能、功耗和面積等指標(biāo)面向深度學(xué)習(xí)算法都做到最優(yōu)。谷歌的TPU 芯片、我國(guó)中科院計(jì)算所的寒武紀(jì)深度學(xué)習(xí)處理器芯片就是這類芯片的典型代表。華為麒麟970的技術(shù)授權(quán)就是來(lái)自寒武紀(jì)。

谷歌的TPU 芯片

3、類腦計(jì)算芯片,這是人工智能芯片的未來(lái)發(fā)展階段,其設(shè)計(jì)目的不再局限于僅僅加速深度學(xué)習(xí)算法,而是在芯片基本結(jié)構(gòu)甚至器件層面上希望能夠開(kāi)發(fā)出新的類腦計(jì)算機(jī)體系結(jié)構(gòu),比如會(huì)采用憶阻器和 ReRAM 等新器件來(lái)提高存儲(chǔ)密度。這類芯片的研究離成為市場(chǎng)上可以大規(guī)模廣泛使用的成熟技術(shù)還有很大的差距,甚至有很大的風(fēng)險(xiǎn),但是長(zhǎng)期來(lái)看類腦芯片有可能會(huì)帶來(lái)計(jì)算體系的革命。這類芯片的典型代表是IBM 的TrueNorth 芯片。

類腦計(jì)算芯片市場(chǎng)空間巨大。據(jù)預(yù)測(cè),包含消費(fèi)終端的類腦計(jì)算芯片市場(chǎng)將在2022 年以前達(dá)到千億美元的規(guī)模,其中消費(fèi)終端是最大市場(chǎng),占整體98.17%,其它需求包括工業(yè)檢測(cè)、航空、軍事與國(guó)防等領(lǐng)域。

上面談到華為剛發(fā)布的人工智能移動(dòng)芯片麒麟970, AI 技術(shù)授權(quán)來(lái)源寒武紀(jì)(中科寒武紀(jì)科技有限公司)。公司由計(jì)算機(jī)體系結(jié)構(gòu)國(guó)家重點(diǎn)實(shí)驗(yàn)室(依靠中國(guó)科學(xué)院計(jì)算技術(shù)所)孵化出的全球首個(gè) AI 領(lǐng)域的獨(dú)角獸。這是一個(gè)國(guó)人將會(huì)引以為傲的偉大公司。8月18日,寒武紀(jì)科技完成1億美元A輪融資,寒武紀(jì)科技已經(jīng)成為全球AI芯片領(lǐng)域第一家獨(dú)角獸。

我們的目標(biāo)是通過(guò)這個(gè)全新的完全自主的指令集,構(gòu)建未來(lái)智能時(shí)代的 x86 生態(tài)?!浼o(jì)CEO 陳天石

2016 年 3 月份,寒武紀(jì)-1A(Cambricon-1A)問(wèn)世,這也是全球首個(gè)商用深度神經(jīng)網(wǎng)絡(luò)處理器 IP(Intellectual Property)。寒武紀(jì)通過(guò)授權(quán)的方式推廣 AI 指令集,來(lái)快速推動(dòng)市場(chǎng)發(fā)展。寒武紀(jì)作為AI基礎(chǔ)層廠商將IP授權(quán)給應(yīng)用層企業(yè),華為等IT企業(yè)作為基礎(chǔ)層廠商的技術(shù)優(yōu)勢(shì),利用這些技術(shù),快速在手機(jī)AI芯片等前沿領(lǐng)域?qū)崿F(xiàn)應(yīng)用量產(chǎn)。其首款集成寒武紀(jì)芯片的商用產(chǎn)品就是麒麟 970。

麒麟970的發(fā)布,代表在手機(jī)移動(dòng)市場(chǎng),AI芯片的將會(huì)迎來(lái)大規(guī)模商業(yè)化應(yīng)用。

而事實(shí)上,人工智能的市場(chǎng)空間將不僅僅局限于計(jì)算機(jī)、手機(jī)等傳統(tǒng)計(jì)算平臺(tái)。從無(wú)人駕駛汽車、無(wú)人機(jī)再到智能家居的各類家電,至少數(shù)十倍于智能手機(jī)體量的設(shè)備需要引入感知交互能力。而出于對(duì)實(shí)時(shí)性的要求以及訓(xùn)練數(shù)據(jù)隱私等考慮,這些能力不可能完全依賴云端,必須要有本地的軟硬件基礎(chǔ)平臺(tái)支撐。人工智能定制芯片需求量就將數(shù)十倍于智能手機(jī)。

在智能時(shí)代,人工智能將推動(dòng)這一輪計(jì)算革命。而芯片也將是人工智能時(shí)代的開(kāi)路先鋒。正如英特爾X86 處理器芯片壟斷所的PC時(shí)代,ARM 移動(dòng)處理器芯片所壟斷的移動(dòng)互聯(lián)時(shí)代,下一個(gè)智能時(shí)代,也將是AI芯片的天下。

未來(lái)代表AI芯片技術(shù)壟斷地位的公司會(huì)不會(huì)屬于中國(guó),我們不妨期待!

-end-


作者:曹濤CT,產(chǎn)品經(jīng)理,互聯(lián)網(wǎng)追風(fēng)人。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容