
? 作者:[美] 吳軍
? 出版年份:2016-8
??出版社:中信出版集團(tuán)
? 前言
2016年是機(jī)器智能歷史上一個(gè)具有幾年意義的年份,他是一個(gè)時(shí)代的結(jié)束,也是新時(shí)代的開(kāi)始。1956年提出人工智能的概念,60年后Google的圍棋計(jì)算機(jī)AlphaGo打敗了李世石,這一勝利,宣告了機(jī)器智能時(shí)代的到來(lái)。
? 第一章 數(shù)據(jù)---人類建造文明的基石
從古至今,人類在農(nóng)作生活、認(rèn)識(shí)自然規(guī)律、認(rèn)識(shí)天文學(xué)、推動(dòng)社會(huì)經(jīng)濟(jì)發(fā)展,都伴隨著數(shù)據(jù)的產(chǎn)生和使用,對(duì)數(shù)據(jù)和信息進(jìn)行處理后,人類就可以獲得知識(shí)。進(jìn)入信息時(shí)代,電子計(jì)算機(jī)的使用產(chǎn)生了大量的數(shù)據(jù),數(shù)據(jù)的使用推動(dòng)社會(huì)發(fā)展,慢慢進(jìn)入下一個(gè)技術(shù)革命時(shí)代---智能時(shí)代。
數(shù)據(jù)是文明的基石:以天文學(xué)發(fā)展歷程為例
修建金字塔的幾千年前,古埃及人在尼羅河附近 觀天象,辯農(nóng)時(shí),開(kāi)創(chuàng)了天文學(xué);
公元前4000~3000年前,美索不達(dá)米亞平原的蘇美爾人計(jì)算出月亮和五大行星的運(yùn)行周期,并且能預(yù)測(cè)日食和月食。
公元前551年,古希臘人將美索不達(dá)米亞平原的數(shù)學(xué)和天文成就帶回古希臘,古希臘成為了全世界數(shù)學(xué)和天文學(xué)的中心。代表:柏拉圖的學(xué)生歐克多索建立地心說(shuō)早期模型,阿基米德建立日心說(shuō)早起模型等。
公元130年,托勒密以觀測(cè)數(shù)據(jù)為基礎(chǔ),用40~60個(gè)小圓套大圓的方法,精確計(jì)算出行星運(yùn)動(dòng)軌跡。
1600年左右,開(kāi)普勒從師父第谷繼承大量的、精確的數(shù)據(jù),用一個(gè)橢圓模型清楚地描述了星體運(yùn)動(dòng)規(guī)律,提出了開(kāi)普勒三定律。
1700年左右,牛頓提出萬(wàn)有引力定律,徹底解釋天體運(yùn)動(dòng)是橢圓的原因,并且修正了開(kāi)普勒的橢圓模型,將橢圓的焦點(diǎn)從太陽(yáng)移到太陽(yáng)系的中心。
人類社會(huì)發(fā)展產(chǎn)生了大量的數(shù)據(jù),反之可以利用數(shù)據(jù)的相關(guān)性解決很多難題。日本人使用鐵人王進(jìn)喜的照片,分析出很多大慶油田的詳細(xì)信息,最終中標(biāo)政府的保密項(xiàng)目;Google根據(jù)用戶搜索流感的相關(guān)信息,預(yù)測(cè)流感傳播在全世界的趨勢(shì)變化。

人類掌握足夠的數(shù)據(jù)量,如何使用也是需要面對(duì)的難題。Google給了一個(gè)很好的答案,AlphaGo分析總結(jié)了幾十萬(wàn)盤圍棋數(shù)據(jù)后,得到一個(gè)統(tǒng)計(jì)模型,對(duì)于不同的局勢(shì)下可以比人類更加有效的行棋。這種方法叫做數(shù)據(jù)驅(qū)動(dòng)方法,即在數(shù)據(jù)量足夠的前提下,使用若干個(gè)簡(jiǎn)單的模型代替一個(gè)復(fù)雜的模型。
? 第二章? 大數(shù)據(jù)和機(jī)器智能
現(xiàn)在人人都知道人工智能,哪如何才能判定是否機(jī)器智能呢?有什么辦法可以進(jìn)行這方面測(cè)試呢? 當(dāng)然有,就是圖靈測(cè)試,即讓一臺(tái)機(jī)器和一個(gè)人坐在幕后,讓一個(gè)裁判同時(shí)與幕后的任何機(jī)器進(jìn)行交流,如果這個(gè)裁判無(wú)法判斷自己交流的對(duì)象是人還是機(jī)器,就說(shuō)明這臺(tái)機(jī)器有了和人同等的智能。
從1956年提出人工智能后,科學(xué)家一直研究如何讓機(jī)器變得智能,主要在語(yǔ)音識(shí)別、機(jī)器翻譯、戰(zhàn)勝人類象棋冠軍、自動(dòng)回答問(wèn)題等方面,最初想讓機(jī)器像人類一樣思考,但是十幾年來(lái)并無(wú)實(shí)質(zhì)性進(jìn)展。直到1972年,賈里尼克到IBM做學(xué)術(shù)休假,使用大量數(shù)據(jù),基于統(tǒng)計(jì)方法研究出一款語(yǔ)音識(shí)別系統(tǒng),識(shí)別率從70%提升到90%以上,同時(shí)語(yǔ)音識(shí)別規(guī)模從幾百詞增加到兩萬(wàn)多,有了質(zhì)的飛躍,這種方法被稱為數(shù)據(jù)驅(qū)動(dòng)方法。
2005年,在機(jī)器翻譯領(lǐng)域并無(wú)積累的Google團(tuán)隊(duì)參加NIST交流和測(cè)評(píng),并以巨大優(yōu)勢(shì)打敗全世界的機(jī)器翻譯團(tuán)隊(duì),揭開(kāi)神秘面紗后,使用的方法還是兩年前的方法,但是使用了成千上萬(wàn)倍的數(shù)據(jù),量變完成到質(zhì)變的飛躍。在大數(shù)據(jù)的基礎(chǔ)上,使用數(shù)據(jù)驅(qū)動(dòng)方法催熟了機(jī)器智能。

大數(shù)據(jù)對(duì)于機(jī)器智能的意義已經(jīng)非常明確,但并不是數(shù)量大就將機(jī)器變得智能。大數(shù)據(jù)除了數(shù)據(jù)量大外還有兩個(gè)重要特征,多維度和完備性。舉個(gè)簡(jiǎn)單的例子,使用百度或者Google進(jìn)行搜索時(shí),輸入幾個(gè)字就可以聯(lián)想出想要搜尋的信息。依靠數(shù)據(jù)量大,輸入前幾個(gè)關(guān)鍵字聯(lián)想出想要搜尋的信息,有時(shí)候并不是我們想要的,當(dāng)輸入所有字后,百度會(huì)自行保存這部分關(guān)鍵詞,而且保存相關(guān)搜尋結(jié)果,下一次搜索此信息時(shí)就可以準(zhǔn)確提示整個(gè)信息;而且針對(duì)相同的關(guān)鍵字,不同人可能獲得不同的搜索結(jié)果。這就需要多維度的數(shù)據(jù),且具完備性,根據(jù)不同人的搜索習(xí)慣,可以有不同的信息。

未完,待續(xù)...