輸不要緊,重要的是,我們還有機(jī)會(huì)猜測(cè)AlphaGo的獨(dú)特思維。
為什么某一階段的最優(yōu)策略,有時(shí)恰恰是全局最劣策略?
“破壞性創(chuàng)新”的經(jīng)典案例:鋼鐵巨人是如何倒下的。
1、致兩千年后的你
那一天,人類終于回想起,曾經(jīng)一度被AlphaGo支配的恐怖,還有被囚禁于棋局中的那份恥辱。
李世石能贏一局,水平更高的柯潔卻一局都贏不了,因?yàn)槿祟愡M(jìn)步靠經(jīng)驗(yàn),經(jīng)驗(yàn)積累靠感覺(jué),而AlphaGo進(jìn)步的方向只有一個(gè):不斷積累“勝率”更高的走法。
AlphaGo 開發(fā)團(tuán)隊(duì)主管使用 Elo 算法評(píng)估AlphaGo對(duì)陣柯潔,每局的勝率為99.37% 。
劍未出手,勝負(fù)已分,這不是古龍小說(shuō),這是AI時(shí)代的游戲規(guī)則。
AlphaGo的開發(fā)團(tuán)隊(duì)沒(méi)有圍棋高手,只負(fù)責(zé)算法和喂“棋局”(據(jù)說(shuō)現(xiàn)在連棋局都不“喂”了),AlphaGo可算是不折不扣的“自學(xué)成才”。
所以,輸不要緊,重要的是,我們還有機(jī)會(huì)猜測(cè)AlphaGo的獨(dú)特思維。
2、AlphaGo為什么常下“臭棋”?
圍棋大師能夠記憶實(shí)戰(zhàn)棋局,卻記不住棋盤上隨意擺放的棋子。因?yàn)槿祟愊缕宓姆椒?,是把棋局分為幾塊,左下角、右下角、邊路、中腹……,再去評(píng)估每一塊的得失。
人類這么做也是沒(méi)辦法,因?yàn)槲覀兛梢栽u(píng)估每一步棋對(duì)某一塊的形勢(shì)影響,卻無(wú)法計(jì)算這一步棋對(duì)整個(gè)棋局的影響。人類也有“內(nèi)勢(shì)”和“外勢(shì)”概念,只不過(guò),所有不基于概率的思考,都是“人類一思考,AlphaGo就發(fā)笑”。
AlphaGo不是一塊一塊地思考。每手棋,它都要重新評(píng)估整個(gè)棋盤,這個(gè)能力,既來(lái)自它強(qiáng)大的計(jì)算能力,也在于它看過(guò)棋局,是對(duì)手的幾十上百倍。
去年的時(shí)候,人類還嘲笑AlphaGo經(jīng)常下“臭棋”。后來(lái)人類明白了,對(duì)某一塊棋是“臭棋”的,恰恰提升了全局的勝率。
總結(jié)成一句話:“某一階段的最優(yōu)策略,有時(shí)恰恰是全局的最劣策略?!?/b>
這個(gè)說(shuō)法,讓我想起了美國(guó)管理學(xué)家克萊頓·克里斯坦森(Clayton Christensen)提出的“破壞性創(chuàng)新”理論(Disruptive Innovation)。
3、鋼鐵巨人是如何被打敗的?
讓我們重溫作者的一個(gè)鋼鐵行業(yè)的經(jīng)典案例吧。這樣的事情,在每個(gè)行業(yè)都發(fā)生過(guò),尤其在中國(guó)。
假設(shè)有一家行業(yè)NO.1的巨型鋼鐵企業(yè),我們暫時(shí)叫它“宇宙鋼鐵”,技術(shù)牛,產(chǎn)品線豐富,資本雄厚。
看上去,“宇宙鋼鐵”沒(méi)有競(jìng)爭(zhēng)對(duì)手了?當(dāng)然不會(huì),一定會(huì)有一些“小不點(diǎn)兒”鋼廠,質(zhì)量雖然不行,但成本更低,它們的下游客戶也是利潤(rùn)微薄的小企業(yè),買不起也不需要好鋼材。
“宇宙鋼鐵”一開始沒(méi)把這些“小不點(diǎn)兒”當(dāng)回事,直到經(jīng)濟(jì)繁榮忽然停止,“宇宙鋼鐵”發(fā)現(xiàn),自己的大客戶因?yàn)槔麧?rùn)下降,用不起自己的產(chǎn)品,紛紛改買“小不點(diǎn)兒”們的產(chǎn)品。
怎么辦呢?董事會(huì)找來(lái)了咨詢公司,請(qǐng)專家分析鋼鐵行業(yè)。他們分析了“宇宙鋼鐵”的產(chǎn)品結(jié)構(gòu),發(fā)現(xiàn)其中最基礎(chǔ)的鋼筋產(chǎn)品,技術(shù)難度低,客戶對(duì)成本更敏感,而鋼板產(chǎn)品,工藝最復(fù)雜,客戶對(duì)品質(zhì)更敏感。
“磚家叫獸”們給出了一個(gè)理所當(dāng)然的“聰明”建議:避免劣勢(shì),退出低利潤(rùn)的鋼筋市場(chǎng);發(fā)揮優(yōu)勢(shì),大力拓展高利潤(rùn)的鋼板市場(chǎng)。
這個(gè)策略看上去一點(diǎn)問(wèn)題都沒(méi)有,我們常常在上市公司年報(bào)中看到“產(chǎn)品升級(jí),進(jìn)入利潤(rùn)率更高的XX市場(chǎng)”這樣的字眼,再被證券研究機(jī)構(gòu)一忽悠,股價(jià)立刻來(lái)個(gè)漲停板。
接下來(lái)會(huì)發(fā)生什么呢?花開兩朵,各表一枝,我們先講“宇宙鋼鐵”。由于放棄了低毛利產(chǎn)品,高利潤(rùn)帶動(dòng)資本收益率大幅上升,投資人紛紛看好,股價(jià)一路上揚(yáng)。但其中的危機(jī),卻沒(méi)有人看出來(lái)。
花的另一枝就是行業(yè)本身的巨變,由于“宇宙鋼鐵”撤出低利潤(rùn)的鋼筋市場(chǎng),這個(gè)市場(chǎng)被大量“小不點(diǎn)兒”企業(yè)占據(jù),它們之間發(fā)生了慘烈的價(jià)格戰(zhàn),被分析師判定為最危險(xiǎn)的行業(yè)。
所有殺不死你的,都會(huì)讓你更強(qiáng)大。那些最后活下來(lái)的企業(yè),要么是經(jīng)過(guò)收購(gòu)兼并重組,要么是保持低成本的同時(shí)升級(jí)了技術(shù)。而價(jià)格戰(zhàn)的噩夢(mèng),也讓他們把眼光投向更高利潤(rùn)的鋼板市場(chǎng)。
這個(gè)策略的問(wèn)題就開始暴露了,“宇宙鋼鐵”再次成為靶子,只是對(duì)手比當(dāng)初更強(qiáng)大。當(dāng)你放棄了一個(gè)細(xì)分市場(chǎng)的時(shí)候,只要市場(chǎng)需求還在,你其實(shí)是在為自己培養(yǎng)競(jìng)爭(zhēng)對(duì)手。
“宇宙鋼鐵”的好日子到頭了嗎?還沒(méi)有,董事會(huì)又作出了“英明”的最優(yōu)決策:進(jìn)入利潤(rùn)更高的鋼架市場(chǎng)——只是這一次,它已經(jīng)無(wú)法再用高利潤(rùn)來(lái)掩飾市場(chǎng)份額的下降了。
新一輪循環(huán)開始了,但巨人的命運(yùn)早已注定。可我們還是要繼續(xù)追問(wèn)開始的那個(gè)問(wèn)題:我們能否避免“現(xiàn)在的優(yōu)勢(shì)導(dǎo)致未來(lái)的敗局”呢?
4、“贏多少”重要,還是“贏面多大”重要?
讓我們?cè)倩氐健叭藱C(jī)大戰(zhàn)”,看看人類和AlphaGo的決策方法有什么不同。
前面說(shuō)了,人類下圍棋是一塊棋一塊棋的累積優(yōu)勢(shì)。所以,人類的最佳策略是把握好每一塊棋,打得過(guò)的地方盡量多贏幾目,打不過(guò)的地方盡量少丟幾目,能夠斬對(duì)方大龍的機(jī)會(huì),絕不放過(guò),用每一塊的優(yōu)勢(shì),爭(zhēng)取全局的勝利。
一句話概括:人類直接計(jì)算的是“勝幅”——這一手棋下去,能賺幾目。
而AlphaGo不同,前面說(shuō)它是全局思考的,所以它直接計(jì)算的是“勝率”——這一手棋下去后,最終的贏面概率是多少。只要它覺(jué)得這么下可以提高未來(lái)的“勝率”,哪怕眼前讓對(duì)方賺上幾目,也就是人類眼里的“臭棋”,也可以接受。
換一種說(shuō)法:在98%概率贏5萬(wàn),和99%的概率贏1萬(wàn)元之間,人類選前者,AlphaGo選后者。
我們能否從“勝幅”和“勝率”的不同思維出發(fā),再反思一下“宇宙鋼鐵”的案例呢?
5、100年之后的企業(yè)生存概率
“宇宙鋼鐵”在第一次危機(jī)中,有兩個(gè)選擇:一是保利潤(rùn),保住自己現(xiàn)在的優(yōu)勢(shì)(勝幅策略),二是保市場(chǎng),加入兩敗俱傷的價(jià)格戰(zhàn),遏制競(jìng)爭(zhēng)對(duì)手,爭(zhēng)取未來(lái)活下來(lái)的概率(勝率策略)。
現(xiàn)在我們知道了,選擇一是錯(cuò)誤的。但當(dāng)初,“宇宙鋼鐵”能夠避免這個(gè)錯(cuò)誤嗎?
如果CEO不是一個(gè)披著人類外皮的機(jī)器人,基本上,這個(gè),很難。
選擇一注重現(xiàn)在的優(yōu)勢(shì),我們稱之為“百?gòu)?qiáng)企業(yè)戰(zhàn)略”,它有一套財(cái)務(wù)指標(biāo)體系,利潤(rùn)率、銷售額、凈資產(chǎn)收益率……
選擇二注重長(zhǎng)遠(yuǎn)的生存,我們稱之為“百年企業(yè)戰(zhàn)略”,但它無(wú)法被評(píng)估。如果一定要有一個(gè)指標(biāo)的話,那我們就開個(gè)腦洞,叫它“存活指數(shù)”——100年之后的生存概率。
如果企業(yè)以后能發(fā)展出自己的“人工智能”,它恐怕最關(guān)心的就是這一條指標(biāo),就像人人都怕死一樣。
遺憾的是,人類不擅長(zhǎng)概率計(jì)算,這個(gè)指標(biāo),恐怕只有AlphaGo這樣的人工智能才有可能學(xué)會(huì)計(jì)算。
人類只能看到眼前的利益?!坝钪驿撹F”的選擇,我們完全可以理解,一個(gè)守著低毛利產(chǎn)品不放還打價(jià)格戰(zhàn)CEO,財(cái)務(wù)數(shù)據(jù)一定很難看,一定會(huì)被股東掃地出門。
但希望未必沒(méi)有,人類直覺(jué)學(xué)習(xí)的能力,從未被真正開發(fā)過(guò)。在AlphaGo打敗李世石之后,圍棋界出現(xiàn)了“AlphaGo流”,模仿它一些獨(dú)特的下法,反思被過(guò)去奉為圣經(jīng)的定式。
因?yàn)檫@些,都可能是人類思維的盲區(qū)。
6、致兩千年后的你
記得《棋魂》中有一段對(duì)話:
“圍棋的樂(lè)趣在于有對(duì)手的存在。”
“那棋神不是很寂寞了嗎?”
“因?yàn)檫@樣,所以神教會(huì)人類下棋,希望人類能理解他的世界。”
近期熱文
邏輯性差怎么辦?4個(gè)“蘇格拉底式提問(wèn)”一定有幫助
節(jié)日怎樣安排加班,才能人人滿意又公平?
碎片化學(xué)習(xí)是如何把林則徐帶到“坑”里去的?