人機(jī)圍棋大戰(zhàn):人類的錯(cuò)誤可以避免嗎?

輸不要緊,重要的是,我們還有機(jī)會(huì)猜測(cè)AlphaGo的獨(dú)特思維。

為什么某一階段的最優(yōu)策略,有時(shí)恰恰是全局最劣策略?

“破壞性創(chuàng)新”的經(jīng)典案例:鋼鐵巨人是如何倒下的。


1、致兩千年后的你

那一天,人類終于回想起,曾經(jīng)一度被AlphaGo支配的恐怖,還有被囚禁于棋局中的那份恥辱。

李世石能贏一局,水平更高的柯潔卻一局都贏不了,因?yàn)槿祟愡M(jìn)步靠經(jīng)驗(yàn),經(jīng)驗(yàn)積累靠感覺(jué),而AlphaGo進(jìn)步的方向只有一個(gè):不斷積累“勝率”更高的走法。

AlphaGo 開發(fā)團(tuán)隊(duì)主管使用 Elo 算法評(píng)估AlphaGo對(duì)陣柯潔,每局的勝率為99.37% 。

劍未出手,勝負(fù)已分,這不是古龍小說(shuō),這是AI時(shí)代的游戲規(guī)則。

AlphaGo的開發(fā)團(tuán)隊(duì)沒(méi)有圍棋高手,只負(fù)責(zé)算法和喂“棋局”(據(jù)說(shuō)現(xiàn)在連棋局都不“喂”了),AlphaGo可算是不折不扣的“自學(xué)成才”。

所以,輸不要緊,重要的是,我們還有機(jī)會(huì)猜測(cè)AlphaGo的獨(dú)特思維。

2、AlphaGo為什么常下“臭棋”?

圍棋大師能夠記憶實(shí)戰(zhàn)棋局,卻記不住棋盤上隨意擺放的棋子。因?yàn)槿祟愊缕宓姆椒?,是把棋局分為幾塊,左下角、右下角、邊路、中腹……,再去評(píng)估每一塊的得失。

人類這么做也是沒(méi)辦法,因?yàn)槲覀兛梢栽u(píng)估每一步棋對(duì)某一塊的形勢(shì)影響,卻無(wú)法計(jì)算這一步棋對(duì)整個(gè)棋局的影響。人類也有“內(nèi)勢(shì)”和“外勢(shì)”概念,只不過(guò),所有不基于概率的思考,都是“人類一思考,AlphaGo就發(fā)笑”。

AlphaGo不是一塊一塊地思考。每手棋,它都要重新評(píng)估整個(gè)棋盤,這個(gè)能力,既來(lái)自它強(qiáng)大的計(jì)算能力,也在于它看過(guò)棋局,是對(duì)手的幾十上百倍。

去年的時(shí)候,人類還嘲笑AlphaGo經(jīng)常下“臭棋”。后來(lái)人類明白了,對(duì)某一塊棋是“臭棋”的,恰恰提升了全局的勝率。

總結(jié)成一句話:“某一階段的最優(yōu)策略,有時(shí)恰恰是全局的最劣策略?!?/b>

這個(gè)說(shuō)法,讓我想起了美國(guó)管理學(xué)家克萊頓·克里斯坦森(Clayton Christensen)提出的“破壞性創(chuàng)新”理論(Disruptive Innovation)。

3、鋼鐵巨人是如何被打敗的?

讓我們重溫作者的一個(gè)鋼鐵行業(yè)的經(jīng)典案例吧。這樣的事情,在每個(gè)行業(yè)都發(fā)生過(guò),尤其在中國(guó)。

假設(shè)有一家行業(yè)NO.1的巨型鋼鐵企業(yè),我們暫時(shí)叫它“宇宙鋼鐵”,技術(shù)牛,產(chǎn)品線豐富,資本雄厚。

看上去,“宇宙鋼鐵”沒(méi)有競(jìng)爭(zhēng)對(duì)手了?當(dāng)然不會(huì),一定會(huì)有一些“小不點(diǎn)兒”鋼廠,質(zhì)量雖然不行,但成本更低,它們的下游客戶也是利潤(rùn)微薄的小企業(yè),買不起也不需要好鋼材。

“宇宙鋼鐵”一開始沒(méi)把這些“小不點(diǎn)兒”當(dāng)回事,直到經(jīng)濟(jì)繁榮忽然停止,“宇宙鋼鐵”發(fā)現(xiàn),自己的大客戶因?yàn)槔麧?rùn)下降,用不起自己的產(chǎn)品,紛紛改買“小不點(diǎn)兒”們的產(chǎn)品。

怎么辦呢?董事會(huì)找來(lái)了咨詢公司,請(qǐng)專家分析鋼鐵行業(yè)。他們分析了“宇宙鋼鐵”的產(chǎn)品結(jié)構(gòu),發(fā)現(xiàn)其中最基礎(chǔ)的鋼筋產(chǎn)品,技術(shù)難度低,客戶對(duì)成本更敏感,而鋼板產(chǎn)品,工藝最復(fù)雜,客戶對(duì)品質(zhì)更敏感。

“磚家叫獸”們給出了一個(gè)理所當(dāng)然的“聰明”建議:避免劣勢(shì),退出低利潤(rùn)的鋼筋市場(chǎng);發(fā)揮優(yōu)勢(shì),大力拓展高利潤(rùn)的鋼板市場(chǎng)。

這個(gè)策略看上去一點(diǎn)問(wèn)題都沒(méi)有,我們常常在上市公司年報(bào)中看到“產(chǎn)品升級(jí),進(jìn)入利潤(rùn)率更高的XX市場(chǎng)”這樣的字眼,再被證券研究機(jī)構(gòu)一忽悠,股價(jià)立刻來(lái)個(gè)漲停板。

接下來(lái)會(huì)發(fā)生什么呢?花開兩朵,各表一枝,我們先講“宇宙鋼鐵”。由于放棄了低毛利產(chǎn)品,高利潤(rùn)帶動(dòng)資本收益率大幅上升,投資人紛紛看好,股價(jià)一路上揚(yáng)。但其中的危機(jī),卻沒(méi)有人看出來(lái)。

花的另一枝就是行業(yè)本身的巨變,由于“宇宙鋼鐵”撤出低利潤(rùn)的鋼筋市場(chǎng),這個(gè)市場(chǎng)被大量“小不點(diǎn)兒”企業(yè)占據(jù),它們之間發(fā)生了慘烈的價(jià)格戰(zhàn),被分析師判定為最危險(xiǎn)的行業(yè)。

所有殺不死你的,都會(huì)讓你更強(qiáng)大。那些最后活下來(lái)的企業(yè),要么是經(jīng)過(guò)收購(gòu)兼并重組,要么是保持低成本的同時(shí)升級(jí)了技術(shù)。而價(jià)格戰(zhàn)的噩夢(mèng),也讓他們把眼光投向更高利潤(rùn)的鋼板市場(chǎng)。

這個(gè)策略的問(wèn)題就開始暴露了,“宇宙鋼鐵”再次成為靶子,只是對(duì)手比當(dāng)初更強(qiáng)大。當(dāng)你放棄了一個(gè)細(xì)分市場(chǎng)的時(shí)候,只要市場(chǎng)需求還在,你其實(shí)是在為自己培養(yǎng)競(jìng)爭(zhēng)對(duì)手。

“宇宙鋼鐵”的好日子到頭了嗎?還沒(méi)有,董事會(huì)又作出了“英明”的最優(yōu)決策:進(jìn)入利潤(rùn)更高的鋼架市場(chǎng)——只是這一次,它已經(jīng)無(wú)法再用高利潤(rùn)來(lái)掩飾市場(chǎng)份額的下降了。

新一輪循環(huán)開始了,但巨人的命運(yùn)早已注定。可我們還是要繼續(xù)追問(wèn)開始的那個(gè)問(wèn)題:我們能否避免“現(xiàn)在的優(yōu)勢(shì)導(dǎo)致未來(lái)的敗局”呢?

4、“贏多少”重要,還是“贏面多大”重要?

讓我們?cè)倩氐健叭藱C(jī)大戰(zhàn)”,看看人類和AlphaGo的決策方法有什么不同。

前面說(shuō)了,人類下圍棋是一塊棋一塊棋的累積優(yōu)勢(shì)。所以,人類的最佳策略是把握好每一塊棋,打得過(guò)的地方盡量多贏幾目,打不過(guò)的地方盡量少丟幾目,能夠斬對(duì)方大龍的機(jī)會(huì),絕不放過(guò),用每一塊的優(yōu)勢(shì),爭(zhēng)取全局的勝利。

一句話概括:人類直接計(jì)算的是“勝幅”——這一手棋下去,能賺幾目。

而AlphaGo不同,前面說(shuō)它是全局思考的,所以它直接計(jì)算的是“勝率”——這一手棋下去后,最終的贏面概率是多少。只要它覺(jué)得這么下可以提高未來(lái)的“勝率”,哪怕眼前讓對(duì)方賺上幾目,也就是人類眼里的“臭棋”,也可以接受。

換一種說(shuō)法:在98%概率贏5萬(wàn),和99%的概率贏1萬(wàn)元之間,人類選前者,AlphaGo選后者。

我們能否從“勝幅”和“勝率”的不同思維出發(fā),再反思一下“宇宙鋼鐵”的案例呢?

5、100年之后的企業(yè)生存概率

“宇宙鋼鐵”在第一次危機(jī)中,有兩個(gè)選擇:一是保利潤(rùn),保住自己現(xiàn)在的優(yōu)勢(shì)(勝幅策略),二是保市場(chǎng),加入兩敗俱傷的價(jià)格戰(zhàn),遏制競(jìng)爭(zhēng)對(duì)手,爭(zhēng)取未來(lái)活下來(lái)的概率(勝率策略)。

現(xiàn)在我們知道了,選擇一是錯(cuò)誤的。但當(dāng)初,“宇宙鋼鐵”能夠避免這個(gè)錯(cuò)誤嗎?

如果CEO不是一個(gè)披著人類外皮的機(jī)器人,基本上,這個(gè),很難。

選擇一注重現(xiàn)在的優(yōu)勢(shì),我們稱之為“百?gòu)?qiáng)企業(yè)戰(zhàn)略”,它有一套財(cái)務(wù)指標(biāo)體系,利潤(rùn)率、銷售額、凈資產(chǎn)收益率……

選擇二注重長(zhǎng)遠(yuǎn)的生存,我們稱之為“百年企業(yè)戰(zhàn)略”,但它無(wú)法被評(píng)估。如果一定要有一個(gè)指標(biāo)的話,那我們就開個(gè)腦洞,叫它“存活指數(shù)”——100年之后的生存概率。

如果企業(yè)以后能發(fā)展出自己的“人工智能”,它恐怕最關(guān)心的就是這一條指標(biāo),就像人人都怕死一樣。

遺憾的是,人類不擅長(zhǎng)概率計(jì)算,這個(gè)指標(biāo),恐怕只有AlphaGo這樣的人工智能才有可能學(xué)會(huì)計(jì)算。

人類只能看到眼前的利益?!坝钪驿撹F”的選擇,我們完全可以理解,一個(gè)守著低毛利產(chǎn)品不放還打價(jià)格戰(zhàn)CEO,財(cái)務(wù)數(shù)據(jù)一定很難看,一定會(huì)被股東掃地出門。

但希望未必沒(méi)有,人類直覺(jué)學(xué)習(xí)的能力,從未被真正開發(fā)過(guò)。在AlphaGo打敗李世石之后,圍棋界出現(xiàn)了“AlphaGo流”,模仿它一些獨(dú)特的下法,反思被過(guò)去奉為圣經(jīng)的定式。

因?yàn)檫@些,都可能是人類思維的盲區(qū)。

6、致兩千年后的你

記得《棋魂》中有一段對(duì)話:

“圍棋的樂(lè)趣在于有對(duì)手的存在。”

“那棋神不是很寂寞了嗎?”

“因?yàn)檫@樣,所以神教會(huì)人類下棋,希望人類能理解他的世界。”


近期熱文

邏輯性差怎么辦?4個(gè)“蘇格拉底式提問(wèn)”一定有幫助

節(jié)日怎樣安排加班,才能人人滿意又公平?

碎片化學(xué)習(xí)是如何把林則徐帶到“坑”里去的?

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容