4.23世界讀書日:如何像訓(xùn)練AI一樣訓(xùn)練自己?

4.23世界讀書日

4.23,世界讀書日,用一本書,紀(jì)念這個(gè)美好的日子,也致敬這個(gè)美好的時(shí)代。

不知道大家近期會(huì)不會(huì)有這樣一種感受:在“百模大戰(zhàn)”的背景下,日常生活中好像不會(huì)用點(diǎn)AI大模型就感覺與世界脫軌了。

在聽萬維鋼老師新書《拐點(diǎn)》的時(shí)候,讓我對(duì)大模型時(shí)代的發(fā)展又有了一些新的認(rèn)識(shí),想要訓(xùn)練一個(gè)語言大模型,有個(gè)關(guān)鍵步驟是非常值得注意的,就是“強(qiáng)化學(xué)習(xí)”。現(xiàn)在AI技術(shù)進(jìn)展之所以如此之快,很大程度上得益于這個(gè)強(qiáng)化學(xué)習(xí)。

對(duì)于我而言,對(duì)于任何新技術(shù)都是滿懷敬畏,但卻從不因?yàn)樾录夹g(shù)而迷失自我,關(guān)注新技術(shù)發(fā)展的同時(shí),我更希望關(guān)注的是“個(gè)體”本身,任何新工具的出現(xiàn),都是為了解決一些社會(huì)發(fā)展中本身存在的矛盾,而非是為了替代某些東西。

我不是新技術(shù)的發(fā)明者,我沒法跟大家探討大模型應(yīng)該怎樣,我還是喜歡回歸到人本身上來,如何像訓(xùn)練AI一樣訓(xùn)練自己,讓自己在新技術(shù)包圍下同樣具有競(jìng)爭(zhēng)力,這才應(yīng)該是我們個(gè)體應(yīng)該花更多精力去關(guān)注的事情。

今天就跟大家來聊一聊這個(gè)“強(qiáng)化學(xué)習(xí)”。

強(qiáng)化學(xué)習(xí)是一門關(guān)于反饋、學(xué)習(xí)和迭代的技術(shù)。你會(huì)發(fā)現(xiàn):學(xué)習(xí)、反饋、迭代,這不正是我們每個(gè)人都一直在經(jīng)歷的過程嗎。從這個(gè)角度來看,AI迭代的方法,有沒有可能被咱們?nèi)祟悂斫梃b一下呢?我認(rèn)為,這應(yīng)該是可以的。

從社會(huì)發(fā)展的角度來看,這些年一直存在一種客觀現(xiàn)象:

腦科學(xué)給AI研究提供了靈感,AI研究也反過來給腦科學(xué)提供了思路。和AI一樣,人的大腦和身體本質(zhì)上也是由若干個(gè)神經(jīng)網(wǎng)絡(luò)組成的。我發(fā)現(xiàn):神經(jīng)網(wǎng)絡(luò)的訓(xùn)練和控制,這個(gè)視角對(duì)人的成長(zhǎng)特別有啟發(fā)。

可以試著把【仿生學(xué)】反過來用,嘗試用【仿AI學(xué)】,看看我們自身能從神經(jīng)網(wǎng)絡(luò)的訓(xùn)練和控制中學(xué)到什么。

如果你曾經(jīng)也過關(guān)注有關(guān)社會(huì)學(xué)的研究就會(huì)發(fā)現(xiàn),人的行為習(xí)慣、性格特征、情緒表現(xiàn)等一系列的稟賦特征都有神經(jīng)網(wǎng)絡(luò)的性質(zhì)。甚至在萬維鋼老師看來,佛學(xué)中的【業(yè)力】也可以理解為神經(jīng)網(wǎng)絡(luò)。

有一個(gè)企業(yè)家,也是一個(gè)洞見輸出者,叫肖恩.帕里什,他寫了一本《清晰思考》,總結(jié)了一些科學(xué)決策與行動(dòng)的方法,我們可以借鑒他的結(jié)論,結(jié)合神經(jīng)網(wǎng)絡(luò)的思路,關(guān)注我們生活日常中的一些小事,在一些微不足道的小事細(xì)節(jié)上,清晰思考,做出正確的選擇,從而日積月累,擺脫平庸陷阱。

感性大于理性,這是人之所以為人的最基本特質(zhì),在我們自己的事情上尤為明顯,神經(jīng)網(wǎng)絡(luò)構(gòu)建了我們的本能反應(yīng),我們本身就是感性的動(dòng)物,不管你如何標(biāo)榜理性,我們總會(huì)在本能地、自動(dòng)地做很多事情,而其中很多選擇,本身就是不理性的,是錯(cuò)誤的。

想要少犯錯(cuò)、不平庸,非常困難,因?yàn)槟闶窃诟约旱母行员灸茏鲗?duì),你需要比你的一些神經(jīng)網(wǎng)絡(luò)更兇。

一個(gè)常用的策略就是暫停本能反應(yīng),最好的方式就是嵌入某種儀式。

比如我們看籃球運(yùn)動(dòng)員罰籃。他們從來都不是拿過球來站好就投,而是一定要先把球在原地不緊不慢拍幾下,找找感覺,完了再投。這就是暫停。場(chǎng)上所有隊(duì)員、場(chǎng)邊那么多觀眾都得等著,因?yàn)檫\(yùn)動(dòng)員必須要把心緒從剛才的激烈爭(zhēng)奪中切換到眼前這個(gè)靜止罰球的狀態(tài)上來,要確保清晰思考。

這個(gè)動(dòng)作說起來簡(jiǎn)單,實(shí)際做起來很難,在你情緒高漲的時(shí)候,突然中止,暫停一會(huì),在繼續(xù)下一個(gè)動(dòng)作。如果你也能做到,你就會(huì)發(fā)現(xiàn),生活中的很多錯(cuò)誤,可能都可以避免了。

可能在一些傳統(tǒng)的觀念里,很多人總是喜歡抱有一種僥幸心理:覺得越不認(rèn)真,越不寫意、越放縱就能打贏越厲害的人,認(rèn)為贏還不行,還得贏得不費(fèi)力才能體現(xiàn)美感,最好是昨天通宵刷視頻,今天早上還能生龍活虎……這本身就是非常愚蠢的文藝妄想。

不費(fèi)力的贏只能贏普通人,說明你愛打平庸的賽,你贏不了高手。能豁得出去自己,舍得投入比別人更高的能量,才是真正的強(qiáng)勢(shì)。

姚明每次罰球之前都運(yùn)球5下,你為什么不能在回應(yīng)別人的爭(zhēng)議之前深呼吸3次呢?停頓會(huì)讓你的形象更有力量。

比停頓更難的是知道什么時(shí)候停頓。我們太容易按照某種默認(rèn)模式自動(dòng)行動(dòng)。莫里什認(rèn)為,改善行動(dòng)的方法不是用意志力戰(zhàn)勝默認(rèn)模式,而是用好的默認(rèn)模式取代壞的默認(rèn)模式。

我們應(yīng)該在每次發(fā)言之前,自動(dòng)深呼吸,調(diào)整慣性,讓身心保持放松回歸理性。我們不是取消慣性,而是要用好的慣性。

如果我們把自己想象成一個(gè)由若干個(gè)神經(jīng)網(wǎng)絡(luò)組成的AI,那么本質(zhì)上就是神經(jīng)網(wǎng)絡(luò)訓(xùn)練的問題。

主要策略有兩個(gè),即控制和改寫:一個(gè)是想辦法控制我們與生俱來的不好的神經(jīng)網(wǎng)絡(luò),也就是我們的弱點(diǎn)。另一個(gè)就是主動(dòng)訓(xùn)練幾個(gè)好的神經(jīng)網(wǎng)絡(luò),以至于遇到相關(guān)的情況能夠自動(dòng)的做出正確的反應(yīng)。

先說后者,有點(diǎn)逆天改命的意思,如果考慮到人本身就是臺(tái)生物機(jī)器,我們要做的就是從硬件層面進(jìn)行升級(jí),升級(jí)出一套強(qiáng)勢(shì)的人格來。強(qiáng)勢(shì),其實(shí)就是高標(biāo)準(zhǔn)。

一般人理解標(biāo)準(zhǔn)是一種管理規(guī)則,是做給別人看的,是一個(gè)量化的考核結(jié)果。既然是規(guī)則就會(huì)有意外,而意外的發(fā)生,就會(huì)容易衍生出人本能反應(yīng),從而被感性控制。

所以,在帕里什眼中,標(biāo)準(zhǔn)并不是管理規(guī)則,標(biāo)準(zhǔn)是訓(xùn)練神經(jīng)網(wǎng)絡(luò)的素材庫(kù)。垃圾進(jìn)就會(huì)出垃圾,你想要訓(xùn)練一個(gè)高水平的神經(jīng)網(wǎng)絡(luò),就得確保只使用高水平的素材。至于現(xiàn)實(shí)情境公不公平并不重要,重要的是不要污染我的素材庫(kù),總結(jié)一句話就是:標(biāo)準(zhǔn)會(huì)變成習(xí)慣,習(xí)慣會(huì)變成結(jié)果。

如果你做的和別人一樣,你只能期待和別人一樣的結(jié)果,如果想要不同的結(jié)果,就必須提高標(biāo)準(zhǔn)。

平庸的人會(huì)因?yàn)楦鞣N原因減低標(biāo)準(zhǔn),環(huán)境有力就全力以赴,環(huán)境不友好就松懈下來,覺得盡力就好,這樣久而久之,你的神經(jīng)網(wǎng)絡(luò)就會(huì)被污染。

你必須確保自己交付的每一個(gè)作品,都是你所能做到最好的。

要實(shí)行高標(biāo)準(zhǔn),那就要明白最好的是什么才行,一個(gè)好辦法就是借用榜樣的力量。榜樣的作用就是逼你實(shí)行高標(biāo)準(zhǔn)。

程序大師不接受難看的代碼,溝通大師不接受未經(jīng)深思熟慮的電子郵件,榜樣不是讓你追星用的,他們讓你不舒服、如芒在背才好,被大師罵是最幸運(yùn)的學(xué)習(xí)經(jīng)歷。

如果你沒有榜樣,沒有大師給你反饋,那么不好意思,你的神經(jīng)網(wǎng)絡(luò)還沒搭建,等你先搭建起來再往后看吧。

4.23世界讀書日

往往我們需要訓(xùn)練4個(gè)神經(jīng)網(wǎng)絡(luò)。

自我認(rèn)識(shí)(self-knowledge):你得知道你自己會(huì)做什么、不會(huì)做什么,你的長(zhǎng)處和短處,你知道的以及所不知道的,總結(jié)來說,就是你得知道你的能力邊界在哪里,你不能什么都想做,也不要跟別人玩別人擅長(zhǎng)而你不擅長(zhǎng)的游戲。

自控(self-control):駕馭自己的情緒和弱點(diǎn)。一個(gè)好的思路就是把情緒與自己拉開距離,就好像觀察外在的事物一樣對(duì)待它們。

自信:(self-confidence):相信自己有能力,相信自己有價(jià)值。真正的自信一定是從做成一件件小事中得來的,如果你曾經(jīng)做成了很多事情,不管別人怎么輕視你,你都可以無所畏懼,大可用一句:不知者不畏,打發(fā)了他。

自信的人會(huì)樂于改變自己的觀點(diǎn),會(huì)靈活根據(jù)實(shí)際情況做出調(diào)整和改變,不會(huì)拘泥于某些細(xì)枝末節(jié),自信總是能夠給我們帶來不可名狀的能量和勇氣。

自信能讓你專注做正確的事,而不是做正確的人,自信是面對(duì)現(xiàn)實(shí)的勇氣,也是成就自己的基石。

自我問責(zé)(self-accountability):這個(gè)神經(jīng)網(wǎng)絡(luò)非常強(qiáng)勢(shì),如果處理事件我們都能理性站在這個(gè)高度的話,沒有什么問題是解決不了的。

凱文凱利講過一句話:成熟的基礎(chǔ)是,即使事情不是你的錯(cuò),也不意味著不是你的責(zé)任。

在現(xiàn)實(shí)工作中,每個(gè)人完成工作的路徑是多樣的,但是沒有人會(huì)關(guān)注你的過程,你所付出的努力是否有價(jià)值取決于事情最終的結(jié)果,如果結(jié)果不是正向的,你得所有努力都會(huì)顯得蒼白無力。

領(lǐng)導(dǎo)在意的事結(jié)果,哪怕事情不是你的錯(cuò),但也一定有你的責(zé)任,所有的解釋都毫無意義,而抱怨只是在對(duì)世界應(yīng)該如何運(yùn)轉(zhuǎn)討價(jià)還價(jià)而已。

而對(duì)于強(qiáng)人,如果我們是強(qiáng)人的話,我們應(yīng)該專注于下一步的行動(dòng),看看做什么對(duì)未來更有利,過去已經(jīng)過去了。

從神經(jīng)網(wǎng)絡(luò)的概念去思考自己人生該如何自處,這應(yīng)該是一個(gè)非常有趣的例子。當(dāng)然AI不會(huì)抱怨,但抱怨是人的一種本能。

但你要明白:當(dāng)你抱怨的時(shí)候,你就是一個(gè)受害者。

不管你處于何種原因抱怨,哪怕家人朋友都理解你的抱怨,但你依然是受害者。重點(diǎn)來了,我們最需要關(guān)注的是,避免自己把自己訓(xùn)練成長(zhǎng)期受害者,你會(huì)有無助感和無力感,乃至絕望。

沒有成功人士愿意和一個(gè)長(zhǎng)期受害者共事,強(qiáng)人不做受害者,不管是誰的錯(cuò),這就是我的責(zé)任,我接受現(xiàn)實(shí),我只關(guān)注下一步該怎么辦。

而你要做的,就是確保你做的每一件事,都是在訓(xùn)練自己的神經(jīng)網(wǎng)絡(luò),好好去選擇你做的事。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容