它100:0大勝阿法狗的學(xué)習(xí)法寶,你用不用?

2017年10月19日,《自然》雜志刊登了谷歌DeepMind團(tuán)隊(duì)的新成果——

AlphaZero大勝AlphaGo

名為AlphaZero(暫譯:阿法元)的機(jī)器系統(tǒng)僅訓(xùn)練3天就戰(zhàn)勝了AlphaGo Lee,比分100:0,后者就是戰(zhàn)敗李世石的那套。

經(jīng)過(guò)40天訓(xùn)練后,Alpha Zero又以89:11戰(zhàn)勝了Alpha Master,即橫掃柯潔的那套。

輕松一刻的漫畫(huà)

那么,我們可以從阿法元的勝利中獲得哪些顛覆性的學(xué)習(xí)奧秘呢?

1、經(jīng)驗(yàn)可能反而是束縛你的絆腳石!創(chuàng)造力來(lái)自于一張“白紙”!

阿法元完全從零開(kāi)始,不需要任何歷史棋譜的指引,更不需要參考人類(lèi)任何的先驗(yàn)知識(shí),完全靠自己一個(gè)人強(qiáng)化學(xué)習(xí)(reinforcement learning)和參悟。

這是最具顛覆性的一點(diǎn):以前我們常常強(qiáng)調(diào)經(jīng)驗(yàn)學(xué)習(xí)的重要性,所以必須從小學(xué)開(kāi)始通識(shí)教育。

阿法元的探索或許能產(chǎn)生這點(diǎn)啟示:

摒棄所有經(jīng)驗(yàn),人類(lèi)或許天生就有超強(qiáng)的學(xué)習(xí)力和創(chuàng)造力!我們認(rèn)為的通識(shí)教育,不是助力它們,反而是在扼殺它們!

由此,人類(lèi)以前的學(xué)習(xí)常識(shí)或?qū)⒈活嵏?/b>!

2、左右手相搏,意味著左右腦同時(shí)開(kāi)發(fā)。全腦開(kāi)發(fā)促進(jìn)學(xué)習(xí)可能是正確的!

阿法元只需要在4個(gè)TPU上,花三天時(shí)間,自己左右互搏490萬(wàn)棋局。

以前我看過(guò)不少文章說(shuō)全腦開(kāi)發(fā)是假的,如根本沒(méi)有左右腦之分,右腦根本不需要開(kāi)發(fā)之類(lèi)的說(shuō)法。

如今阿法元的訓(xùn)練方法,或許能證明全腦開(kāi)發(fā)的正確性。

說(shuō)起左右相搏,我一下子就想到了金庸《射雕英雄傳》里的周伯通,他不正是左右互搏術(shù)的行家嗎?原來(lái)今天的學(xué)習(xí)方法早就被金庸看透了,所以他能那么高產(chǎn)。

好像跑題遠(yuǎn)了點(diǎn),拉回來(lái)!我其實(shí)就想告訴你,全腦開(kāi)發(fā)可能是正確的。

3、掌握并訓(xùn)練科學(xué)的策略和價(jià)值流程同樣重要!

阿法元將“策略網(wǎng)絡(luò)”和“價(jià)值網(wǎng)絡(luò)”的神經(jīng)網(wǎng)絡(luò)合二為一,從而讓它能得到更高效的訓(xùn)練和評(píng)估。

其實(shí),我們學(xué)了那么多的通識(shí)教育,卻從未系統(tǒng)和科學(xué)的學(xué)習(xí)過(guò)策略和價(jià)值流程理論。

如果人類(lèi)不學(xué)習(xí)那些遠(yuǎn)古傳來(lái)的歷史經(jīng)驗(yàn),而是一開(kāi)始就學(xué)習(xí)科學(xué)的策略和價(jià)值流程,并且不斷訓(xùn)練它,會(huì)不會(huì)也能變成阿法元一樣的“神”呢?

我覺(jué)得這會(huì)是一個(gè)很有意思的學(xué)習(xí)探索。

讓我感覺(jué)最要命的是:通過(guò)相關(guān)的文章介紹,我發(fā)現(xiàn):阿法元(AlphaGo Zero)的計(jì)算過(guò)程更趨近于人類(lèi)的思考過(guò)程!

我只能淚躺了

難怪,柯潔稱(chēng):“一個(gè)純凈、純粹自我學(xué)習(xí)的alphago是最強(qiáng)的...對(duì)于alphago的自我進(jìn)步來(lái)講...人類(lèi)太多余了。”

古力慨嘆“20年不抵3天,我們的傷感,人類(lèi)的進(jìn)步”。

如果,有一天人工智能比人類(lèi)更先進(jìn),根本不需要人類(lèi),你還能做什么?

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀(guān)點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容