姓名:于川皓 學(xué)號:16140210089
轉(zhuǎn)載自:https://www.zhihu.com/question/20102212
【嵌牛導(dǎo)讀】:隨著深度學(xué)習(xí)技術(shù)的成熟,AI人工智能正在逐步從尖端技術(shù)慢慢變得普及。AlphaGo和人類的對弈,并不是我們以往所理解的電子游戲,電子游戲的水平永遠(yuǎn)不會提升,而AlphaGo則具備了人工智能最關(guān)鍵的“深度學(xué)習(xí)”功能。
【嵌牛鼻子】:人工智能
【嵌牛提問】:人工智能的發(fā)展前景如何?
【嵌牛正文】:
作者:Chen Zhang
鏈接:https://www.zhihu.com/question/20102212/answer/126994210
來源:
隨著深度學(xué)習(xí)技術(shù)的成熟,AI人工智能正在逐步從尖端技術(shù)慢慢變得普及。AlphaGo和人類的對弈,并不是我們以往所理解的電子游戲,電子游戲的水平永遠(yuǎn)不會提升,而AlphaGo則具備了人工智能最關(guān)鍵的“深度學(xué)習(xí)”功能。AlphaGo中有兩個深度神經(jīng)網(wǎng)絡(luò),Value Networks(價值網(wǎng)絡(luò))和 Policy Networks(策略網(wǎng)絡(luò))。其中Value Networks評估棋盤選點位置,Policy Networks選擇落子。這些神經(jīng)網(wǎng)絡(luò)模型通過一種新的方法訓(xùn)練,結(jié)合人類專家比賽中學(xué)到的棋譜,以及在自己和自己下棋(Self-Play)中進(jìn)行強化學(xué)習(xí)。也就是說,人工智能的存在,能夠讓AlphaGo的圍棋水平在學(xué)習(xí)中不斷上升。
人工智能的技術(shù)應(yīng)用主要是在以下幾個方面:
自然語言處理(包括語音和語義識別、自動翻譯)、計算機(jī)視覺(圖像識別)、知識表示、自動推理(包括規(guī)劃和決策)、機(jī)器學(xué)習(xí)和機(jī)器人學(xué)。按照技術(shù)類別來分,可以分成感知輸入和學(xué)習(xí)與訓(xùn)練兩種。計算機(jī)通過語音識別、圖像識別、讀取知識庫、人機(jī)交互、物理傳感等方式,獲得音視頻的感知輸入,然后從大數(shù)據(jù)中進(jìn)行學(xué)習(xí),得到一個有決策和創(chuàng)造能力的大腦。
從上世紀(jì)八九十年代的PC時代,進(jìn)入到互聯(lián)網(wǎng)時代后,給我們帶來的是信息的爆炸和信息載體的去中心化。而網(wǎng)絡(luò)信息獲取渠道從PC轉(zhuǎn)移到移動端后,萬物互聯(lián)成為趨勢,但技術(shù)的限制導(dǎo)致移動互聯(lián)網(wǎng)難以催生出更多的新應(yīng)用和商業(yè)模式。而如今,人工智能已經(jīng)成為這個時代最激動人心、最值得期待的技術(shù),將成為未來10年乃至更長時間內(nèi)IT產(chǎn)業(yè)發(fā)展的焦點。
人工智能概念其實在上世紀(jì)80年代就已經(jīng)炒得火熱,但是軟硬件兩方面的技術(shù)局限使其沉迷了很長一段時間。而現(xiàn)在,大規(guī)模并行計算、大數(shù)據(jù)、深度學(xué)習(xí)算法和人腦芯片這四大催化劑的發(fā)展,以及計算成本的降低,使得人工智能技術(shù)突飛猛進(jìn)。
一、驅(qū)動人工智能發(fā)展的先決條件
物聯(lián)網(wǎng)——物聯(lián)網(wǎng)提供了計算機(jī)感知和控制物理世界的接口和手段,它們負(fù)責(zé)采集數(shù)據(jù)、記憶、分析、傳送數(shù)據(jù)、交互、控制等等。攝像頭和相機(jī)記錄了關(guān)于世界的大量的圖像和視頻,麥克風(fēng)記錄語音和聲音,各種傳感器將它們感受到的世界數(shù)字化等等。這些傳感器,就如同人類的五官,是智能系統(tǒng)的數(shù)據(jù)輸入,感知世界的方式。而大量智能設(shè)備的出現(xiàn)則進(jìn)一步加速了傳感器領(lǐng)域的繁榮,這些延伸向真實世界各個領(lǐng)域的觸角是機(jī)器感知世界的基礎(chǔ),而感知則是智能實現(xiàn)的前提之一。
大規(guī)模并行計算——人腦中有數(shù)百至上千億個神經(jīng)元,每個神經(jīng)元都通過成千上萬個突觸與其他神經(jīng)元相連,形成了非常復(fù)雜和龐大的神經(jīng)網(wǎng)絡(luò),以分布和并發(fā)的方式傳遞信號。這種超大規(guī)模的并行計算結(jié)構(gòu)使得人腦遠(yuǎn)超計算機(jī),成為世界上最強大的信息處理系統(tǒng)。近年來,基于GPU(圖形處理器)的大規(guī)模并行計算異軍突起,擁有遠(yuǎn)超CPU的并行計算能力。
從處理器的計算方式來看,CPU計算使用基于x86指令集的串行架構(gòu),適合盡可能快的完成一個計算任務(wù)。而GPU從誕生之初是為了處理3D圖像中的上百萬個像素圖像,擁有更多的內(nèi)核去處理更多的計算任務(wù)。因此GPU天然具備了執(zhí)行大規(guī)模并行計算的能力。云計算的出現(xiàn)、GPU的大規(guī)模應(yīng)用使得集中化的數(shù)據(jù)計算處理能力變得前所未有的強大。
大數(shù)據(jù)——根據(jù)統(tǒng)計,2015年全球產(chǎn)生的數(shù)據(jù)總量達(dá)到了十年前的20多倍,海量的數(shù)據(jù)為人工智能的學(xué)習(xí)和發(fā)展提供了非常好的基礎(chǔ)。機(jī)器學(xué)習(xí)是人工智能的基礎(chǔ),而數(shù)據(jù)和以往的經(jīng)驗,就是人工智能學(xué)習(xí)的書本,以此優(yōu)化計算機(jī)的處理性能。
深度學(xué)習(xí)算法——最后,這是人工智能進(jìn)步最重要的條件,也是當(dāng)前人工智能最先進(jìn)、應(yīng)用最廣泛的核心技術(shù),深度神經(jīng)網(wǎng)絡(luò)(深度學(xué)習(xí)算法)。2006年,Geoffrey Hinton教授發(fā)表的論文《A fast learning algorithm for deep belief nets》。他在此文中提出的深層神經(jīng)網(wǎng)絡(luò)逐層訓(xùn)練的高效算法,讓當(dāng)時計算條件下的神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練成為了可能,同時通過深度神經(jīng)網(wǎng)絡(luò)模型得到的優(yōu)異的實驗結(jié)果讓人們開始重新關(guān)注人工智能。之后,深度神經(jīng)網(wǎng)絡(luò)模型成為了人工智能領(lǐng)域的重要前沿陣地,深度學(xué)習(xí)算法模型也經(jīng)歷了一個快速迭代的周期,Deep Belief Network、Sparse Coding、Recursive Neural Network, Convolutional Neural Network等各種新的算法模型被不斷提出,而其中卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)更是成為圖像識別最炙手可熱的算法模型。
二、IT巨頭在人工智能上的投入
技術(shù)的進(jìn)步使得人工智能的發(fā)展在近幾年顯著加速,IT巨頭在人工智能上的投入明顯增大,一方面網(wǎng)羅頂尖人工智能的人才,另一方面加大投資力度頻頻并購,昭示著人工智能的春天已經(jīng)到來。
<img src="https://pic4.zhimg.com/50/v2-aa97001218f562983ff1e7eecc2e356f_hd.png" data-rawwidth="1279" data-rawheight="720" class="origin_image zh-lightbox-thumb" width="1279" data-original="https://pic4.zhimg.com/v2-aa97001218f562983ff1e7eecc2e356f_r.png">科技企業(yè)巨頭近幾年在人工智能領(lǐng)域密集布局,巨頭們通過巨額的研發(fā)投入、組織架構(gòu)的調(diào)整、持續(xù)的并購和大量的開源項目,正在打造各自的人工智能生態(tài)圈。在未來,人工智能將不再是尖端技術(shù),而會成為隨處可見的基礎(chǔ)設(shè)施。對于人工智能初創(chuàng)企業(yè)而言,既要尋找與巨頭的合作契合點,又要避開正面沖突。
科技企業(yè)巨頭近幾年在人工智能領(lǐng)域密集布局,巨頭們通過巨額的研發(fā)投入、組織架構(gòu)的調(diào)整、持續(xù)的并購和大量的開源項目,正在打造各自的人工智能生態(tài)圈。在未來,人工智能將不再是尖端技術(shù),而會成為隨處可見的基礎(chǔ)設(shè)施。對于人工智能初創(chuàng)企業(yè)而言,既要尋找與巨頭的合作契合點,又要避開正面沖突。

IBM
IBM Watson由90臺IBM服務(wù)器、360個計算機(jī)芯片組成,是一個有10臺普通冰箱那么大的計算機(jī)系統(tǒng)。它擁有15TB內(nèi)存、2880個處理器、每秒可進(jìn)行80萬億次運算?,F(xiàn)在已經(jīng)逐步進(jìn)化到四個批薩盒大小,性能也提升了240%。Watson存儲了大量圖書、新聞和電影劇本資料、辭海、文選和《世界圖書百科全書》等數(shù)百萬份資料。Watson是基于IBM“DeepQA”(深度開放域問答系統(tǒng)工程)技術(shù)開發(fā)的。DeepQA技術(shù)可以讀取數(shù)百萬頁文本數(shù)據(jù),利用深度自然語言處理技術(shù)產(chǎn)生候選答案,根據(jù)諸多不同尺度評估那些問題。IBM研發(fā)團(tuán)隊為Watson開發(fā)的100多套算法可以在3秒內(nèi)解析問題,檢索數(shù)百萬條信息然后再篩選還原成“答案”輸出成人類語言。
產(chǎn)業(yè)布局:IBM公司自2006年開始研發(fā)Watson,并在2011年2月的《危險地帶》(Jeopardy!)智力搶答游戲中一戰(zhàn)成名。一開始IBM想把Watson打造為超級Siri,主要還是賣硬件。但是后來轉(zhuǎn)型為認(rèn)知商業(yè)計算平臺,2011年8月開始應(yīng)用于醫(yī)療領(lǐng)域。例如在腫瘤治療方面,Watson已收錄了腫瘤學(xué)研究領(lǐng)域的42種醫(yī)學(xué)期刊、臨床試驗的60多萬條醫(yī)療證據(jù)和200萬頁文本資料。Watson能夠在幾秒之內(nèi)篩選數(shù)十年癌癥治療歷史中的150萬份患者記錄,包括病歷和患者治療結(jié)果,并為醫(yī)生提供可供選擇的循證治療方案。目前癌癥治療領(lǐng)域排名前三的醫(yī)院都在運行Watson,并在今年8月正式進(jìn)入中國。
2012年3月,Watson則首次應(yīng)用于金融領(lǐng)域,花旗集團(tuán)成為了首位金融客戶。Watson幫助花旗分析用戶的需求,處理金融、經(jīng)濟(jì)和用戶數(shù)據(jù)以及實現(xiàn)數(shù)字銀行的個性化,并幫助金融機(jī)構(gòu)找出行業(yè)專家可能忽略的風(fēng)險、收益以及客戶需求。
硬件:人腦模擬芯片SyNAPSE
SyNAPSE(Systems of Neuromorphic Adaptive Plastic Scalable Electronics,即“自適應(yīng)塑料可伸縮電子神經(jīng)形態(tài)系統(tǒng)”)芯片,含有100萬個可編程神經(jīng)元、2.56億個可編程突觸,每消耗一焦耳的能量,可進(jìn)行460億突觸運算。在進(jìn)行生物實時運算時,這款芯片的功耗低至70毫瓦(mW),比現(xiàn)代微處理器功耗低數(shù)個數(shù)量級。
谷歌在一系列人工智能相關(guān)的收購中獲益。2013年3月,谷歌以重金收購DNNresearch的方式請到了深度學(xué)習(xí)技術(shù)的發(fā)明者Geoffrey Hinton教授。2014年年初,谷歌以4億美元的架構(gòu)收購了深度學(xué)習(xí)算法公司——DeepMind,也就是推出AlphaGo項目的公司。該公司創(chuàng)始人哈薩比斯是一位橫跨游戲開發(fā)、神經(jīng)科學(xué)和人工智能等多領(lǐng)域的天才人物。
云平臺:TensorFlow數(shù)據(jù)庫,機(jī)器學(xué)習(xí)的核心是讓機(jī)器讀懂?dāng)?shù)據(jù)并基于數(shù)據(jù)做出決策。當(dāng)數(shù)據(jù)規(guī)模龐大而又非常復(fù)雜時,機(jī)器學(xué)習(xí)可以讓機(jī)器變得更聰明。TensorFlow在數(shù)據(jù)輸入和輸出方面都有驚人的精度和速度,它被確切地定義為人工智能工具。
產(chǎn)業(yè)布局:谷歌無人駕駛汽車、基于Android智能手機(jī)的各種app應(yīng)用與插件、智能家居(以收購的NEST為基礎(chǔ))、VR生態(tài)、圖像識別(以收購的Jetpac為基礎(chǔ))。
2013年12月,F(xiàn)acebook成立了人工智能實驗室,聘請了卷積神經(jīng)網(wǎng)絡(luò)最負(fù)盛名的研究者、紐約大學(xué)終身教授Yann LeCun為負(fù)責(zé)人。Yann LeCun是紐約大學(xué)終身教授,是卷積神經(jīng)網(wǎng)絡(luò)領(lǐng)域的重要推動者,而該技術(shù)的最主要應(yīng)用就是圖像識別的自然語言處理,這與Facebook的需求和已經(jīng)積累的數(shù)據(jù)類型非常匹配。在Yann LeCun的幫助下,2014年Facebook的DeepFace技術(shù)在同行評審報告中被高度肯定,其臉部識別率的準(zhǔn)確度達(dá)到97%。而他領(lǐng)導(dǎo)的Facebook人工實驗室研發(fā)的算法已經(jīng)可以分析用戶在Facebook的全部行為,從而為用戶挑選出其感興趣的內(nèi)容。
AI技術(shù):視覺DeepFace技術(shù)(收購http://face.com)、語音識別(收購Mobile technologies)、自然語義(收購Wit.AI)、神經(jīng)網(wǎng)絡(luò)訓(xùn)練+機(jī)器學(xué)習(xí)
云平臺:開發(fā)者平臺Parse、Torch開源深度學(xué)習(xí)模塊
硬件: Big Sur(基于GPU的用于訓(xùn)練神經(jīng)網(wǎng)絡(luò)的硬件系統(tǒng),開源)
產(chǎn)業(yè)布局:語音助手Moneypenny、VR生態(tài)(收購Oculus Rift、Sourroud360全景攝像機(jī)促進(jìn)內(nèi)容發(fā)展)
百度
2014年5月,被稱為“谷歌大腦之父”的AndrewNG(吳恩達(dá))加盟百度,擔(dān)任首席科學(xué)家,負(fù)責(zé)百度“百度大腦”計劃。大數(shù)據(jù)是人工智能的基礎(chǔ),而作為天然的大數(shù)據(jù)企業(yè),百度擁有強大的數(shù)據(jù)獲取能力和數(shù)據(jù)挖掘能力。2014年7月14日,百度憑借自身的大數(shù)據(jù)技術(shù)14場世界杯比賽的結(jié)果預(yù)測中取得全中的成績,擊敗了微軟和高盛。2014年9月,百度正式發(fā)布整合了大數(shù)據(jù)、百度地圖LBS的智慧商業(yè)平臺,旨在更好在移動互聯(lián)網(wǎng)時代為各行業(yè)提供大數(shù)據(jù)解決方案。
AI技術(shù):語音識別Deep Speech、視覺識別“智能讀圖”、自然語言與智能語義、自動駕駛、深度學(xué)習(xí)
解決方案:基于智能手機(jī)的語音服務(wù)系統(tǒng)(度秘)
開發(fā)者云平臺: 百度云
產(chǎn)業(yè)布局:汽車領(lǐng)域無人駕駛、基于智能手機(jī)的各種app應(yīng)用與插件。
Microsoft
AI技術(shù):語音、視覺、自然語言、分布式機(jī)器學(xué)習(xí)
云平臺:Microsoft Azure(存儲、計算、數(shù)據(jù)庫、live、媒體功能)、分布式機(jī)器學(xué)習(xí)工具包DMTK(自然語言處理,推薦引擎,模式識別,計算機(jī)視覺以及預(yù)測建模等)、人工智能平臺Project Malmo
產(chǎn)業(yè)布局:語言助手(微軟小冰、Cortana小娜、Tay)、VR(Hololens全息眼鏡)
Apple
AI技術(shù):自然語言(收購Vocal IQ)、收購可視化地圖MapsenseGPS公司 Coherent Navigation
產(chǎn)業(yè)布局:汽車領(lǐng)域無人駕駛、SIRI語音助手
Amazon
云平臺:Amazon Web Services(存儲、計算、模式識別和預(yù)測,其中視頻識別API 收購Orbeus)
阿里
云平臺(阿里云IaaS,可視化人工智能平臺DTPAI)
產(chǎn)業(yè)布局 :智能家具、物聯(lián)網(wǎng)
騰訊
AI技術(shù):視覺、智能計算與搜索實驗室
產(chǎn)業(yè)布局:智能硬件
三、人工智能的生態(tài)
<img src="https://pic2.zhimg.com/50/v2-3e400f0328b14659a68f4ed4f90b1265_hd.png" data-rawwidth="1279" data-rawheight="720" class="origin_image zh-lightbox-thumb" width="1279" data-original="https://pic2.zhimg.com/v2-3e400f0328b14659a68f4ed4f90b1265_r.png">科技巨頭圍繞人工智能產(chǎn)業(yè),開展了大量的收購;標(biāo)的包括人工智能初創(chuàng)企業(yè)(算法)、大數(shù)據(jù)公司(算法或數(shù)據(jù))和芯片研發(fā)公司(計算能力)。截至至2016年7月底,谷歌在其中的收購次數(shù)最多達(dá)到了13次。巨頭們在人工智能領(lǐng)域的并購呈現(xiàn)兩個特點:一是連續(xù)多次買入,二是標(biāo)的規(guī)模較小。
科技巨頭圍繞人工智能產(chǎn)業(yè),開展了大量的收購;標(biāo)的包括人工智能初創(chuàng)企業(yè)(算法)、大數(shù)據(jù)公司(算法或數(shù)據(jù))和芯片研發(fā)公司(計算能力)。截至至2016年7月底,谷歌在其中的收購次數(shù)最多達(dá)到了13次。巨頭們在人工智能領(lǐng)域的并購呈現(xiàn)兩個特點:一是連續(xù)多次買入,二是標(biāo)的規(guī)模較小。

<img src="https://pic1.zhimg.com/50/v2-1745baa5e65373864829f51a036e03f4_hd.png" data-rawwidth="1279" data-rawheight="720" class="origin_image zh-lightbox-thumb" width="1279" data-original="https://pic1.zhimg.com/v2-1745baa5e65373864829f51a036e03f4_r.png">從2013年開始,科技巨頭大多加大了對人工智能的自主研發(fā),同時通過不斷開源,試圖建立自己的人工智能生態(tài)系統(tǒng),開源力度不斷增加。比如Google 開源TensorFlow 后,F(xiàn)acebook、百度和微軟等都加快了開源腳步。最早走向人工智能工具開源的是社交巨頭Facebook,于去年1月宣布開源多款深度學(xué)習(xí)人工智能工具。而谷歌、IBM和微軟幾乎于去年11通同時宣布開源。谷歌發(fā)布了新的機(jī)器學(xué)習(xí)平臺TensorFlow,所有用戶都能夠利用這一強大的機(jī)器學(xué)習(xí)平臺進(jìn)行研究,被稱為人工智能界的Android。IBM則宣布通過Apache軟件基金會免費為外部程序員提供System ML人工智能工具的源代碼。微軟則開源了分布式機(jī)器學(xué)習(xí)工具包DMTK,能夠在較小的集群上以較高的效率完成大規(guī)模數(shù)據(jù)模型的訓(xùn)練,在今年7月微軟又推出了開源的Project Malmo項目,用于人工智能的訓(xùn)練。
從2013年開始,科技巨頭大多加大了對人工智能的自主研發(fā),同時通過不斷開源,試圖建立自己的人工智能生態(tài)系統(tǒng),開源力度不斷增加。比如Google 開源TensorFlow 后,F(xiàn)acebook、百度和微軟等都加快了開源腳步。最早走向人工智能工具開源的是社交巨頭Facebook,于去年1月宣布開源多款深度學(xué)習(xí)人工智能工具。而谷歌、IBM和微軟幾乎于去年11通同時宣布開源。谷歌發(fā)布了新的機(jī)器學(xué)習(xí)平臺TensorFlow,所有用戶都能夠利用這一強大的機(jī)器學(xué)習(xí)平臺進(jìn)行研究,被稱為人工智能界的Android。IBM則宣布通過Apache軟件基金會免費為外部程序員提供System ML人工智能工具的源代碼。微軟則開源了分布式機(jī)器學(xué)習(xí)工具包DMTK,能夠在較小的集群上以較高的效率完成大規(guī)模數(shù)據(jù)模型的訓(xùn)練,在今年7月微軟又推出了開源的Project Malmo項目,用于人工智能的訓(xùn)練。

<img src="https://pic2.zhimg.com/50/v2-57532267ccda6eb41a5076a68c24240d_hd.png" data-rawwidth="1279" data-rawheight="720" class="origin_image zh-lightbox-thumb" width="1279" data-original="https://pic2.zhimg.com/v2-57532267ccda6eb41a5076a68c24240d_r.png">

人工智能已經(jīng)逐漸建立起自己的生態(tài)格局,由于科技巨頭的一系列布局和各種平臺的開源,人工智能的準(zhǔn)入門檻逐漸降低。未來幾年之內(nèi),專業(yè)領(lǐng)域的智能化應(yīng)用將是人工智能主要的發(fā)展方向。無論是在專業(yè)還是通用領(lǐng)域,人工智能的企業(yè)布局都將圍繞著基礎(chǔ)層、技術(shù)層和應(yīng)用層三個層次的基本架構(gòu)。
基礎(chǔ)層就如同大樹的根基,提供基礎(chǔ)資源支持,由運算平臺和數(shù)據(jù)工廠組成。中間層為技術(shù)層,通過不同類型的算法建立模型,形成有效的可供應(yīng)用的技術(shù),如同樹干連接底層的數(shù)據(jù)層和頂層的應(yīng)用層。應(yīng)用層利用輸出的人工智能技術(shù)為用戶提供具體的服務(wù)和產(chǎn)品。
<img src="https://pic1.zhimg.com/50/v2-c9e10b53adb07251de6870a3157ac9b4_hd.png" data-rawwidth="1279" data-rawheight="720" class="origin_image zh-lightbox-thumb" width="1279" data-original="https://pic1.zhimg.com/v2-c9e10b53adb07251de6870a3157ac9b4_r.png">

位于基礎(chǔ)層的企業(yè)一般是典型的IT巨頭,擁有芯片級的計算能力,通過部署大規(guī)模GPU和CPU并行計算構(gòu)成云計算平臺,解決人工智能所需要的超強運算能力和存儲需求,初創(chuàng)公司無法進(jìn)入。技術(shù)層的算法可以拉開人工智能公司和非人工智能公司的差距,但是巨頭的逐步開源使算法的重要程度不斷降低。應(yīng)用層是人工智能初創(chuàng)企業(yè)最好的機(jī)遇,可以選擇合理的商業(yè)模式,避開巨頭的航路,更容易實現(xiàn)成功。
45?4 條評論
?分享
?收藏?感謝收起

神經(jīng)學(xué)、人工智能、生物學(xué)話題的優(yōu)秀回答者
114 人贊同了該回答
這個問題太大了,分成兩段討論吧。事先聲明,由于問題太大太大,我寫的這份總結(jié)既不保證完整,也不保證客觀。
1. ===功能===
人工智能現(xiàn)在已經(jīng)能實現(xiàn)很多功能了,比如
語音識別——李開復(fù)博士當(dāng)年做的工作奠定了很多當(dāng)今識別系統(tǒng)的基礎(chǔ)。這里忍不住說一下,Siri本身的技術(shù)并沒有特別大的亮點,真正nb的是它的模式(語音識別直接與搜索引擎結(jié)合在一起,產(chǎn)品體驗做得好。而且關(guān)鍵是這樣的模式能采集到更多數(shù)據(jù),使得系統(tǒng)的精度越來越高)
自然語言理解——目前看到的最強的結(jié)果應(yīng)該是IBM Watson。但其實我們現(xiàn)在用的搜索引擎、中文輸入法、機(jī)器翻譯(雖然其實還不怎么work)都和自然語言理解相關(guān)。這塊兒不是我的專業(yè),請 @段維斯 同學(xué)補充。
數(shù)據(jù)挖掘——隨著近年數(shù)據(jù)量的瘋狂增長,數(shù)據(jù)挖掘也有了長足進(jìn)步。最具有代表性的是前幾年著名的Netflix challenge(Netflix公司公開了自己的用戶評分?jǐn)?shù)據(jù),讓研究者根據(jù)這些數(shù)據(jù)對用戶沒看過的電影預(yù)測評分,誰先比現(xiàn)有系統(tǒng)好10%,誰就能贏100萬美元)最后這一比賽成績較好的隊伍,并非是單一的某個特別nb的算法能給出精確的結(jié)果,而是把大量刻畫了不同方面的模型混合在一起,進(jìn)行最終的預(yù)測。
計算機(jī)視覺——目前越來越多的領(lǐng)域跟視覺有關(guān)。大家可能一開始想到的都是自動駕駛。雖然大家都在說googleX的無人車, 但實際上現(xiàn)在無論是商業(yè)上,還是技術(shù)整合上最成功的算法是Mobile Eye的輔助駕駛系統(tǒng)。這個公司也是目前computer vision領(lǐng)域最掙錢的公司。
從實現(xiàn)新功能方面說,視覺的發(fā)展的趨勢主要有兩方面,A) 集成更多的模塊,從問題的各種不同方面,解決同一個問題(比如Mobile Eye,就同時使用了數(shù)十種方法,放到一起最終作出決策)? B) 使用新的信息,解決一個原來很難的問題。這方面最好的例子是M$的Kinect,這個產(chǎn)品最讓人拍案叫絕的就是那個紅外pattern投影儀。
2. ===理論基礎(chǔ)===
這里說的是數(shù)學(xué)理論,是為實現(xiàn)功能解決問題而存在的。與人類的智能的聯(lián)系在下一節(jié)說。從這個角度,我們已經(jīng)有了很多強有力的數(shù)學(xué)工具,從高斯時代的最小二乘法,到現(xiàn)在比較火的凸優(yōu)化,其實我們解決絕大多數(shù)智能問題的套路,都可以從某種意義上轉(zhuǎn)換成一個優(yōu)化問題。
真正限制我們解這個優(yōu)化問題的困難有以下三個:
計算復(fù)雜度——能保證完美解的算法大都是NP-hard的。如何能讓一個系統(tǒng)在當(dāng)前的硬件下“跑起來”,就需要在很多細(xì)節(jié)取巧,這是很多l(xiāng)earning paper的核心沖突。
模型假設(shè)——所有模型都要基于一些假設(shè),比如說,無人車會假設(shè)周圍的汽車加速度有一個上限(至少不會瞬間移動吧,否則怎么閃避)絕大多數(shù)假設(shè)都不能保證絕對正確,我們只是制定那些在大多數(shù)時候合理的假設(shè),然后基于這些假設(shè)建模(比如,在語音識別里,我們是否要假設(shè)存在背景噪聲呢?如果有背景噪聲,這個噪聲應(yīng)該符合什么特點呢?這時候無論你怎么定標(biāo)準(zhǔn),總能找出“反例”)
數(shù)據(jù)基礎(chǔ)——任何學(xué)習(xí)過程都需要數(shù)據(jù)的支持,無論是人類學(xué)說話學(xué)寫字,還是計算機(jī)學(xué)習(xí)汽車駕駛。但是就數(shù)據(jù)采集本身來說,成功的案例并不多。大概這個世界上最強的數(shù)據(jù)采集就是google了吧。每次你搜索一個關(guān)鍵詞,然后點進(jìn)去,google就自動記錄了你的行為,然后以此數(shù)據(jù)來訓(xùn)練自己的算法。
114?4 條評論
?分享
?收藏?感謝收起

知乎用戶
12 人贊同了該回答
所謂前景,我理解有兩個含義。一是有沒有商業(yè)價值,畢業(yè)以后有沒有公司愿意要你。二是能不能實現(xiàn)較強的功能,包括能不能達(dá)到人類的智能水平。
我相信商業(yè)價值是很大的。計算機(jī)的計算性能發(fā)展到今天,常規(guī)的商業(yè)應(yīng)用,比如財務(wù)報表,字處理,網(wǎng)頁服務(wù)等已經(jīng)完全夠用了。那么必然需要新的增長點。說的直白一點就是舊的程序已經(jīng)足夠快了。如果沒有新程序和新功能,就沒有人愿意升級軟件和硬件系統(tǒng)了。那么下一步的新功能只能往智能化的方向發(fā)展。IBM花了很多錢,開發(fā)了一個電視節(jié)目里玩游戲的Watson。當(dāng)然不是因為IBM老板特別愛看這個節(jié)目。主要原因是展示他們的技術(shù),從而推動新一代智能產(chǎn)品的銷售。這一系列的產(chǎn)品主要面向大醫(yī)院,相當(dāng)于一套自動回答問題的醫(yī)學(xué)百科全書。Google花大力氣開發(fā)了自動駕駛汽車。Apple推出了一個相當(dāng)不完善的Siri。他們都看到了智能機(jī)器蘊含的巨大商業(yè)潛力,而此類機(jī)器的大規(guī)模應(yīng)用將會帶來革命性的效果。
第二個問題是多久才能實現(xiàn)類似于人類的功能。目前能夠達(dá)到甚至超越人類的人工智能,都是專門設(shè)計來解決一個特定問題的。Deep Blue是專門下棋的。Watson和Google專門做信息檢索。這都是人考慮到這些問題的特點從而專門設(shè)計的程序。而人類可以自我學(xué)習(xí)而解決各種不同的問題。如果把人類作為一個標(biāo)桿,人工智能的研究還只是剛剛起步而已。要達(dá)到人類的能力,至少需要幾十年甚至上百年的時間。當(dāng)然,預(yù)測未來從來都是一件很不靠譜的事情。