【白話數(shù)據(jù)分析】聊聊“幸存者偏差”與“隨機對照實驗”

01 舉個栗子

場景1:小時候更優(yōu)秀,成年后越來越平庸?

你是否覺得小時候的自己更優(yōu)秀,而成年后的自己正在變得越來越平庸?你也許只是被隨機性欺騙了。想一想吧,每一次升學(xué)和就業(yè),你身邊的人都換了一茬兒。如果你曾經(jīng)是某一個團(tuán)體里的佼佼者,那么你就會跟其他群體里的佼佼者被分到一塊兒。在新的團(tuán)體里,大家都同樣優(yōu)秀,你也就更容易顯得普通,但這不過是假象罷了。只需要看一看頂級名校學(xué)生的自我評價,你就會發(fā)現(xiàn)人類是多么容易被隨機性蒙蔽雙眼,這些經(jīng)過激烈競爭而突圍的年輕竟然經(jīng)常覺得自己智力欠缺,他們要做的只不過是多接觸其他學(xué)校的人。

場景2:上了大學(xué)又怎樣?還沒打工掙得多?

過年回家會不會被其他人說,上了大學(xué)又怎樣?還沒有我打工掙得多?

如今很多人在說,誰誰誰當(dāng)初沒好好上學(xué)如今照樣掙大錢,而好多用功讀書的人,畢業(yè)后反而不如那些沒好好學(xué)習(xí)的人混得好。并且因為這樣的例子有很多,所以很多人得出“上學(xué)沒有用處”,“讀書無用”的結(jié)論。

這些其實只是個例,因為基數(shù)太大,所以看起來有很多。2010年第六次全國人口普查的官方口徑,可以算出來大專以上文化程度的人口僅占總?cè)丝诘?.7%左右??梢钥闯鰧W(xué)歷低的人數(shù)遠(yuǎn)高于學(xué)歷高的人數(shù),所以即便低學(xué)歷者成功率遠(yuǎn)低于高學(xué)歷者,也照樣會導(dǎo)致低學(xué)歷者出現(xiàn)大批成功人士。

對于高學(xué)歷者,普通人既會關(guān)注成功的人,也會關(guān)注那些沒成功的人,并且高學(xué)歷卻落魄的人尤其受關(guān)注,容易被當(dāng)作新聞報道;而對于低學(xué)歷者,普通人往往只關(guān)注成功者,忽視了廣大學(xué)歷低又沒成功的人。正是因為忽視了這些“沉默的數(shù)據(jù)”,才產(chǎn)生「讀書無用」這種錯誤結(jié)論。

貌似“卑之無甚高論”,但是你真的看懂了嗎,其核心問題是“我們需要重點研究那些非幸存者”,因為無法生存下去是系統(tǒng)性風(fēng)險,我們需要先保證生存下來才能談發(fā)展,而過多關(guān)注“幸存者”只不過是錦上添花而已。


02 什么是“幸存者偏差”?

幸存者偏差是指:當(dāng)研究一種事件或現(xiàn)象時,只對幸存者進(jìn)行研究而忽略那些未幸存下來的人或事物,可能會導(dǎo)致對結(jié)果的偏差。當(dāng)我們評估一個系統(tǒng)、產(chǎn)品、組織或者行業(yè)時,僅考慮它們現(xiàn)存的元素,忽略了曾經(jīng)存在但已經(jīng)失敗的元素。這種情況導(dǎo)致我們誤以為現(xiàn)存元素比實際上更具代表性,因此偏向于低估系統(tǒng)的失敗率。

幸存者偏差產(chǎn)生的原因:

數(shù)據(jù)丟失:在這種情況下,未幸存下來的人或事物的數(shù)據(jù)可能不存在,因此無法對其進(jìn)行研究。

選擇偏差:在這種情況下,研究者可能會主觀地選擇對幸存者進(jìn)行研究,而忽略未幸存者。

幸存者偏差的影響:

對結(jié)論的偏差:因為只研究幸存者,可能得出錯誤的結(jié)論,因此忽略了關(guān)鍵信息。

對決策的影響:幸存者偏差也可能影響決策,因為決策者可能根據(jù)錯誤的結(jié)論做出錯誤的決策。


03 如何避免“幸存者偏差”?

如何避免幸存者偏差?有以下一些建議:

獲取全面的數(shù)據(jù):研究者應(yīng)該對所有可用的數(shù)據(jù)進(jìn)行研究,以避免偏差。

避免選擇偏差:研究者應(yīng)該避免主觀地選擇對幸存者進(jìn)行研究,而應(yīng)該以客觀的方式對所有數(shù)據(jù)進(jìn)行研究。

正確評估風(fēng)險:研究者應(yīng)該正確評估風(fēng)險,以避免對結(jié)果產(chǎn)生偏差。

關(guān)注未幸存者:研究者應(yīng)該關(guān)注未幸存者,以避免偏差。

總體而言,避免幸存者偏差需要研究者具有全面的數(shù)據(jù),客觀的分析方法和正確評估風(fēng)險的能力。只有在所有這些方面都得到考慮時,才能得出準(zhǔn)確的結(jié)論和做出正確的決策。


04如 何設(shè)計隨機對照實驗?

要設(shè)計科學(xué)有效的隨機對照實驗,請遵循以下步驟:

定義研究問題:正在測試什么,假設(shè)是什么?

確定研究人群:正在研究誰或什么?

將參與者隨機分配到治療組和對照組:這有助于確保各組之間的任何差異都是由于治療而不是其他因素造成的。

對治療組進(jìn)行治療并觀察:這可能涉及給藥、使用特定療法或?qū)⑴c者暴露于特定環(huán)境因素。

比較治療組和對照組之間的結(jié)果:這樣做是為了確定治療是否有效以及假設(shè)是否得到支持。

例子

一位研究人員想要確定一種新的降壓藥是否有效。

1. 研究問題:與安慰劑相比,新藥是否能有效降低血壓?

2. 研究人群:高血壓成人

3. 隨機分配:參與者被隨機分配接受新藥或安慰劑。

4.給藥:治療組的參與者服用新藥,而對照組的參與者服用安慰劑。

5. 結(jié)果比較:研究人員在一段時間后測量兩組的血壓,并比較結(jié)果以確定新藥與安慰劑相比是否能有效降低血壓。


05 總結(jié)

研究成功者往往比較簡單,因為大家都在研究,很容易就產(chǎn)生了共識,但不是那么成功或者失敗者則鮮有人關(guān)注,或者泛泛而談,因為多數(shù)人認(rèn)為沒成功有什么好學(xué)的。這個觀點自然有它的道理,但是從博弈論的角度而言,研究大家都在研究的東西收益較低。

信息的價值在于你比別人多知道一些或者比別人先知道。著重研究別人沒注意到的信息,收益更大,宏觀上講,這叫逆向思維。我們砥礪前行,我們試圖去看清事物真相,但我們往往會停留在事物的表面現(xiàn)象,停留在解決表面問題或者容易解決的問題,對未知的事物充滿恐懼和困惑。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容