前言:
我們無法想象,一個快馬加鞭傳遞三百里加急的信件的信使看到我們今天拿起智能手機(jī)一秒之內(nèi)傳遞訊息的震驚。我們也曾對著智能機(jī)器人像個孩童一樣問東問西——雖然它懂得比你想象的多得多。當(dāng)我們看到鋪天蓋地的新聞?wù)f阿爾法狗打敗了李世石,人工智能要改造這個世界。

一、 電腦一思考,人類就尖叫——一臺用來計算的計算機(jī),為什么突然學(xué)會了思考?
我們把計算機(jī)叫做電腦,既然稱之為“腦”就說明在人們眼里,計算機(jī)像大腦一樣在思考。哪怕是簡單的1+1=2的計算。當(dāng)然,計算機(jī)思考的背后還是人類的思考。但是,就像我們坐過山車一樣,除了最初的推動力,其他時間,過山車靠的都是地球引力在運(yùn)動,電腦在最初的步驟里,是需要人類設(shè)定程序來計算,但是,當(dāng)它進(jìn)入一個更高深的層次,發(fā)現(xiàn)規(guī)律并且自我運(yùn)算的時候,計算機(jī)就開始自我賦能了。

當(dāng)我們教別人如何做事的時候,首先會在腦子里將事情的步驟想一想,然后用“編碼”——語言一二三地總結(jié)出來傳授,最后讓他做一遍驗證一下學(xué)會了沒有。人類要如何“教會”計算機(jī)做事呢?
教會計算機(jī)按照人類思維模式做事,是不是可以將此理解為智能的開端?智能換個詞就是智慧,智慧的意思是辨析判斷、發(fā)明創(chuàng)造的能力。書中講到智慧行為一般包括兩個部分:搜索+評估。
任何生物要想生存,一定要有對生存環(huán)境的判斷。哪里有危險,哪里能吃到東西。這種判斷換句話說就是“多看一步”——預(yù)測未來。這種預(yù)測最行之有效的,就是拋棄一切主觀意識和價值判斷,對事物的發(fā)展進(jìn)行推測——有一個詞概括了這種判斷和推測:仿真,就是基于現(xiàn)有狀況機(jī)械地推測今后的變化。
搜索是進(jìn)行仿真的前提。計算機(jī)的搜索功能會用讓它搜索到正確的選項,在下棋的時候,搜索就意味著,找到一個正確的落子點(diǎn)。

當(dāng)我們到喧鬧嘈雜的菜市場,如何才能快速確定誰家的菜新鮮便宜呢?初入菜市場的你,評估的結(jié)果一定是:顧客最多的那家。電腦對下棋也需要評估。電腦將整個資源進(jìn)行切割,在切割后的各個部分里,再進(jìn)行搜索并且對評價較高的部分進(jìn)行進(jìn)一步的搜索。這就像我們分解目標(biāo)各個擊破一樣。
二、 了解人工智能之前,必須要了解的深度學(xué)習(xí)。
如何讓計算機(jī)知道這張圖片狗是狗而不是貓?就像媽媽對你說的,要學(xué)習(xí)才能知道更多,把學(xué)習(xí)的任務(wù)交給電腦,這種方式叫機(jī)器學(xué)習(xí)。在創(chuàng)新工場CEO李開復(fù)著的《人工智能》一書中,對機(jī)器學(xué)習(xí)有一個定義:機(jī)器學(xué)習(xí)……是一種用數(shù)學(xué)模型對真實世界中的特定問題進(jìn)行建模,以解決該領(lǐng)域內(nèi)相似問題的過程。
仔細(xì)看一遍這個概念,不要被里面的專業(yè)名詞嚇跑。通俗一點(diǎn)理解,就是像我們?nèi)祟悓W(xué)習(xí)漢字一樣,從天地人日月星開始,從不會到記住,一次一次地記憶,當(dāng)我們看的次數(shù)足夠多時,這個字就印在腦海里了,下次,不管這個字是楷體還是宋體,不管是毛筆寫的還是鋼筆寫的,我們不會認(rèn)錯。計算機(jī)也是用這個規(guī)律來記憶的。

到今天,機(jī)器學(xué)習(xí)在畫像識別領(lǐng)域技術(shù)已經(jīng)比較成熟了。比如人臉識別技術(shù),或者你打開某一個軟件掃一掃,就能知道任何一朵花兒的名字,或者你在淘寶上用圖片搜索賣價更低的商品。在這里,我們要說的是機(jī)器學(xué)習(xí)中的深度學(xué)習(xí)。
三、 什么是強(qiáng)化學(xué)習(xí)?
有兩種學(xué)習(xí)方式:監(jiān)督式學(xué)習(xí)和強(qiáng)化學(xué)習(xí)。顧名思義,監(jiān)督式學(xué)習(xí)就是有老師看著學(xué),而強(qiáng)化學(xué)習(xí)不需要老師,計算機(jī)會對未知的環(huán)境進(jìn)行隨機(jī)搜索并反饋其結(jié)果。在反饋結(jié)果的過程中,“評估”被不斷強(qiáng)化,所以這個方法就被叫做,強(qiáng)化學(xué)習(xí)。
當(dāng)這種強(qiáng)化學(xué)習(xí)技術(shù)運(yùn)用到將棋領(lǐng)域的時候,將棋出現(xiàn)了人類可以永遠(yuǎn)都想不出來的“棋路”——計算機(jī)自我發(fā)明了新的棋路。事實上,這些結(jié)果是建立在最初大數(shù)據(jù)輸入的前提下的,監(jiān)督式學(xué)習(xí)讓電腦學(xué)到了最前沿的技術(shù),然后才能強(qiáng)化學(xué)習(xí)。其實簡單點(diǎn)說就是,人類教會了計算機(jī)之后,計算機(jī)逐漸超過了師傅,開始自學(xué)成才了。當(dāng)徒弟開始領(lǐng)悟規(guī)律,老師恐怕就真的追不上了。
阿爾法狗就是很好的例證。圍棋在進(jìn)入電腦評估的時候,因為其棋面的復(fù)雜多樣性,每一步是很難用分值來計量。這時候,一種叫做蒙特卡洛法的運(yùn)用隨機(jī)效果來進(jìn)行推算的方法出現(xiàn)了。

其實從概念可以看出,這是一種看起來麻煩但是能夠在不確定性中找出答案的方法,對于圍棋這樣很難找到規(guī)律和計算方法的棋藝來說,這種方法是非常恰當(dāng)?shù)摹0柗ü芬彩峭ㄟ^蒙特卡洛法,深度計算的結(jié)合,掌握了圍棋的方法戰(zhàn)勝人類的。
最后:
當(dāng)人工智能一步一步走進(jìn)我們的生活,變得比人類更聰明的時候,人類難免會產(chǎn)生擔(dān)心,從普通人擔(dān)心的工作被槍占,到人工智能專家擔(dān)心人工智能缺乏倫理觀,做出無法被人類控制的事。這也的確為人工智能的發(fā)展敲響了警鐘,人類為了便利而將人工智能推向了今天,但是說到底,人才是一切的根本,對此,我們要永遠(yuǎn)記住并且遵循。
