從《西部世界》聊到人工智能

最近幾個(gè)星期,有一部美劇可謂是火到不行,那就是HBO最新制作的《西部世界》,這部美劇的基礎(chǔ)是上世紀(jì)80年代的同名美國(guó)科幻片(又譯作《血洗樂(lè)園》)。

美劇《西部世界》劇照

在這部美劇中,人類創(chuàng)造了一個(gè)“樂(lè)園”,樂(lè)園被設(shè)計(jì)成西部電影中的場(chǎng)景:沙漠、酒吧、木制教堂、牛仔和治安官。但特別的是,這個(gè)樂(lè)園中的人們實(shí)際上都是游戲中的“NPC”一樣的存在,他們實(shí)際上是人類制造的具有人工智能的機(jī)器人(因?yàn)椴⑽纯吹絺鹘y(tǒng)的機(jī)械結(jié)構(gòu),他們的內(nèi)部也有類似肌肉、骨骼一類的組織,所以或許稱為“仿生人”更加恰當(dāng))而已?!翱腿恕眰兛梢杂袃?shù)貋?lái)到樂(lè)園中,對(duì)機(jī)器人為所欲為。

野風(fēng)君今天的文章不是來(lái)劇透的,也不是單純地向大家來(lái)推薦這部美劇,而是想和大家聊聊和這部美劇緊密相連的“人工智能”這個(gè)話題。

“人工智能”這個(gè)概念在近幾年可謂是如雨后春筍,在和我們?nèi)粘I罹o密聯(lián)系的各個(gè)領(lǐng)域被一提再提乃至大肆炒作:“人工智能的語(yǔ)音助手”、“人工智能的地圖導(dǎo)航”、“人工智能的安保系統(tǒng)”,等等的宣傳語(yǔ)不勝枚舉??戳恕段鞑渴澜纭分?,關(guān)于人工智能的討論又火熱了起來(lái)。很多人都很想知道影視作品中的那種難辨真假的人工智能產(chǎn)物究竟離我們還有多遠(yuǎn)。

首先,野風(fēng)君認(rèn)為,和影視劇中一樣“難辨真假”的“人造人”或許給我們帶來(lái)的并不一定是更加美好的生活。著名的“恐怖谷理論”也認(rèn)為:和我們?nèi)祟愄^(guò)相似的機(jī)器人很可能會(huì)給我們帶來(lái)天然的恐懼感,令我們對(duì)其感到反感。前不久,野風(fēng)君聽取的著名計(jì)算機(jī)科學(xué)家李開復(fù)的演講中,他也堅(jiān)定地認(rèn)為:“可以成功的機(jī)器人產(chǎn)品一定是和真人不過(guò)分相似的?!北M管,李開復(fù)博士論述的角度有所不同,但是野風(fēng)君也認(rèn)為:和真人過(guò)分相似的“非人物體”不但是挑戰(zhàn)科學(xué)倫理的,而且是可能帶來(lái)很大災(zāi)難的。

施瓦辛格飾演的“終結(jié)者”

在我們的現(xiàn)實(shí)生活中,“人工智能”是正在高速發(fā)展的,他如今不僅成為了學(xué)界關(guān)注的熱點(diǎn),而且也得到了資本的青睞。但除了它所要達(dá)到的“智能”或許和很多朋友臆想的“極致擬人”不同之外,實(shí)現(xiàn)它的方式或許也并不和我們認(rèn)為的一致。

“人工智能”需要教會(huì)機(jī)器“如何思考”,但實(shí)際上機(jī)器的“思考方式”卻和人的有很大不同,當(dāng)一個(gè)語(yǔ)音助手可以準(zhǔn)確錄入我們說(shuō)的話,并且恰當(dāng)斷句時(shí),很多人認(rèn)為,這個(gè)“人工智能”已經(jīng)明白了這句話的意思,所以才可以達(dá)到這樣的效果。但實(shí)際上,如今盛行的“人工智能”是并沒有這樣的能力的。所以,讓我們聊聊現(xiàn)今實(shí)現(xiàn)人工智能的核心技術(shù)——“機(jī)器學(xué)習(xí)”(Machine Learing)。

“機(jī)器學(xué)習(xí)”是什么

“機(jī)器學(xué)習(xí)”一詞由計(jì)算機(jī)科學(xué)家阿瑟·薩繆爾(Arthur Samuel)提出,他將其定義為“不顯式編程地給予計(jì)算機(jī)一定的功能”。這個(gè)定義或許有點(diǎn)晦澀,但有點(diǎn)編程經(jīng)歷的朋友都知道,計(jì)算機(jī)實(shí)際上是很笨的,你在程序中寫入了“1+1”,計(jì)算機(jī)才知道計(jì)算出“2”這個(gè)結(jié)果,也就是說(shuō),我們想讓計(jì)算機(jī)去做一件事,都得在程序代碼中明明白白地(即“顯式地”)寫出來(lái)讓他做的事情以及步驟和方法,然后才能讓計(jì)算機(jī)去進(jìn)行基礎(chǔ)的、大量的和枯燥的計(jì)算,計(jì)算機(jī)才算是具有了一定的“功能”。

但通過(guò)機(jī)器學(xué)習(xí),計(jì)算機(jī)解決問(wèn)題的過(guò)程卻越來(lái)越像是一個(gè)“黑箱”,也就是說(shuō)它逐漸地不再需要我們?nèi)ヒ徊揭徊降叵轮噶睿憧梢匀プ鲆恍┦虑榱?,而我們的代碼對(duì)計(jì)算機(jī)的行為的規(guī)劃也不再那么的“明確”,所以說(shuō),某種程度上,計(jì)算機(jī)仿佛是有了自己思想的能力(因?yàn)橐粋€(gè)人可以給你他思考的結(jié)果,但你同樣無(wú)法得知他思考的過(guò)程)。

計(jì)算機(jī)成為“棋王”之路

阿瑟·薩繆爾利用“機(jī)器學(xué)習(xí)”寫出了一個(gè)西洋跳棋程序,這個(gè)程序可以通過(guò)對(duì)大量棋局的分析逐漸辨認(rèn)出當(dāng)前是一步“好棋”,還是“壞棋”。在后來(lái),薩繆爾還用這個(gè)程序挑戰(zhàn)了康涅狄格州的跳棋冠軍,并且取得了勝利。也是從這之后,從IBM的“深藍(lán)”戰(zhàn)勝世界西洋棋棋王卡斯帕羅夫,一直到前不久google的AlphaGo戰(zhàn)勝圍棋高手李世石,人工智能的發(fā)展常常是踩著無(wú)數(shù)“棋王”的尸體走來(lái)的。從小愛下圍棋的野風(fēng)君每每想到這里,都覺得好氣呀。

阿瑟·薩繆爾和他的西洋棋程序

“人工智能”在不同領(lǐng)域的具體實(shí)現(xiàn)方式都有所不同,但機(jī)器學(xué)習(xí)的大致模式都是:通過(guò)對(duì)大量的數(shù)據(jù)的訓(xùn)練,增強(qiáng)自己的“思考能力”。說(shuō)的通俗一點(diǎn),就是計(jì)算機(jī)在看了很多的資料之后,可以依據(jù)概率和統(tǒng)計(jì)的原理來(lái)做出一個(gè)“是或否”的判斷,從而為之后的局面做出一個(gè)“更好”的選擇。比如,AlphaGo在看了無(wú)數(shù)盤大師們的棋局之后,知道了在遇到某個(gè)場(chǎng)面時(shí),怎樣落子可以增大自己贏的概率,同時(shí),它還可以自己“左右互搏”,自己和自己下棋,從而積累更多的棋局?jǐn)?shù)據(jù)。

大家都知道,一盤圍棋從落第一枚棋子開始,一直到棋局結(jié)束,期間可能出現(xiàn)的每一步棋的不同組合的數(shù)量是有限的,所以理論上,如果計(jì)算機(jī)已經(jīng)對(duì)所有的情況進(jìn)行過(guò)“訓(xùn)練”,就可以對(duì)任意的棋局做出最優(yōu)化的反應(yīng),人類棋手自然是不能取勝的。但實(shí)際上,受計(jì)算機(jī)性能和資源的制約,這種“窮舉”的方法在圍棋上還難以實(shí)現(xiàn),但是我們可以認(rèn)為,計(jì)算機(jī)看過(guò)越多的棋局,進(jìn)行過(guò)越多的“訓(xùn)練”之后,它下棋的能力也會(huì)不斷地提升,而這過(guò)程中,人類是不可能去顯式編程對(duì)他進(jìn)行一步一步的指導(dǎo)的(大家設(shè)想一下,如果AlphaGo的程序中有類似“如果第1步下在A點(diǎn),第2步下在B點(diǎn)......第88步下在¥點(diǎn),那么你的第89步應(yīng)該下在@點(diǎn)”的指令,這會(huì)產(chǎn)生多么恐怖的代碼量,這個(gè)程序的字符數(shù)可能比宇宙中的原子數(shù)目還多)

所以,一臺(tái)計(jì)算機(jī)變成“棋王”的過(guò)程中,就是經(jīng)歷了這樣一種“不斷訓(xùn)練、吸取經(jīng)驗(yàn)、自我優(yōu)化”的過(guò)程的。雖然實(shí)際的棋類機(jī)器人,特別是AlphaGo的“邁向棋王之路”上還有著很多其他的內(nèi)容,但主體的道路都只是“Practice makes perfect”(這句話應(yīng)該直譯為“練得越多,越厲害”)而已。而且,即使人工智能做出了很好的判斷和選擇,但它的邏輯和人類的“思考”依舊是大不相同的,它做出的只是基于數(shù)據(jù)和統(tǒng)計(jì)學(xué)的判斷而已。

“自然語(yǔ)言處理”中的“機(jī)器學(xué)習(xí)”

關(guān)于“機(jī)器學(xué)習(xí)”,野風(fēng)君再舉一個(gè)例子。

在昨天,野風(fēng)君看了一年一度的“科技節(jié)春晚”——錘子科技的新品發(fā)布會(huì)。整個(gè)發(fā)布會(huì)中,最引人注目的部分大概就是:羅永浩對(duì)著手機(jī)說(shuō)出一串話,然后手機(jī)準(zhǔn)確迅速地將這段語(yǔ)音信息處理成文字信息顯示在手機(jī)上。顯然,這是基于“人工智能”的,而這背后就牽扯到了“機(jī)器學(xué)習(xí)”應(yīng)用的一大領(lǐng)域——“自然語(yǔ)言處理”(NLP)。

手機(jī)智能地判斷出了語(yǔ)段的斷句方式

“自然語(yǔ)言”就是指我們?nèi)祟惾粘Uf(shuō)的語(yǔ)言,是相對(duì)于計(jì)算機(jī)的“機(jī)器語(yǔ)言”而存在的。關(guān)于這部分,野風(fēng)君自知能力有限,只能聊聊最淺顯的知識(shí)。

我們可以想想,如果我們有了大量的“語(yǔ)料”(此處指自然語(yǔ)言的材料,比如大量的語(yǔ)音記錄等),那么通過(guò)上文提到的機(jī)器學(xué)習(xí)的訓(xùn)練方式,我們可以對(duì)這些語(yǔ)料進(jìn)行訓(xùn)練,計(jì)算機(jī)便可以學(xué)習(xí)到不同斷句方式正確的概率,比如在訓(xùn)練的語(yǔ)料中有十次出現(xiàn)“我回家吃飯”,而且計(jì)算機(jī)得知其中有九次都應(yīng)該斷句為“我/回家/吃飯”,僅有一次是“我回/家/吃飯”,那么在應(yīng)用過(guò)程中,再遇到這句話,訓(xùn)練出來(lái)的這個(gè)人工智能就會(huì)選擇前者的斷句方式。而這背后,實(shí)際上是對(duì)“出現(xiàn)概率”和“正確幾率”做出一種鏈接。

當(dāng)然了,這只是給出了一種最簡(jiǎn)單,最理想的情況,真正的NLP中,會(huì)涉及到更多,更復(fù)雜的問(wèn)題,比如對(duì)詞語(yǔ)的劃分,對(duì)不恰當(dāng)語(yǔ)料的識(shí)別,對(duì)不同來(lái)源語(yǔ)料的區(qū)別對(duì)待(比如來(lái)自報(bào)紙的語(yǔ)料就來(lái)自口語(yǔ)的更加可信)等等。但是毫無(wú)疑問(wèn),只要是基于“機(jī)器學(xué)習(xí)”和統(tǒng)計(jì)學(xué)的自然語(yǔ)言處理,在擁有更多語(yǔ)料、經(jīng)過(guò)更久訓(xùn)練之后,計(jì)算機(jī)就更可能擁有更高的準(zhǔn)確率。比如,如今科大訊飛的語(yǔ)音識(shí)別引擎就已經(jīng)比四年前野風(fēng)君去訊飛總部時(shí)體驗(yàn)的“先進(jìn)語(yǔ)音識(shí)別引擎”要強(qiáng)的太多了。

“人工智能”≠“人智”

說(shuō)了這么多,礙于能力限制,野風(fēng)君也覺得自己講的不夠易懂,但希望能給大家?guī)?lái)一個(gè)印象,那就是:“人工智能”實(shí)際上并不是嚴(yán)格仿生學(xué)上的“模仿人的智力”(盡管如今人工智能領(lǐng)域的“人工神經(jīng)網(wǎng)絡(luò)”等詞語(yǔ)仿佛和仿生學(xué)有很大關(guān)系,但實(shí)際上并沒有太大關(guān)聯(lián)),而且很大程度上,“人工智能”并不具有嚴(yán)格意義上的“思維”,它的功能的基礎(chǔ)只是對(duì)已有數(shù)據(jù)的統(tǒng)計(jì)學(xué)處理和“經(jīng)驗(yàn)歸納”而已?!段鞑渴澜纭分?,那種工程師修改一下程序,人造人的個(gè)性就發(fā)生很大改變,但又和真人難以分辨并且可以自主思考的“人工智能”離我們還是很遠(yuǎn)的。

最后,還是希望大家有空可以去看看《西部世界》這部美劇,盡管作為HBO制作的作品,它一如既往的有很多“少兒不宜”的畫面,而且野風(fēng)君也不認(rèn)為這部美劇和很多人吹捧的一樣“神”,但的確是值得一看的,特別是在如今這個(gè)“人工智能”快速走進(jìn)我們生活的時(shí)代。

最后,大家也都別覺得“人工智能”是個(gè)多么高大上和復(fù)雜的東西,每個(gè)人都是可以不太困難地了解它的基本原理的。就像野風(fēng)君的學(xué)長(zhǎng)、人工智能科學(xué)家戴文淵說(shuō)的:“AI(人工智能)這個(gè)如今看來(lái)高大上的東西,就和20年前制作網(wǎng)站一樣,在20年后,也就是一件很平常的東西而已”

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容