赤裸裸的統計學

一、統計學是大數據時代最炙手可熱的學問

舉例了基尼系數:衡量一個國家的財富分配的公平程度,范圍在0-1,越小越平均
對描述性數據過度依賴會帶來誤導性的結果和判斷,抽樣來解決大問題

二、描述統計學

平均數
中位數
絕對數相對數
標準差:表示數據離散程度,反映了分散在平均值周圍數據的聚合程度
正態(tài)分布:

三、統計數字會撒謊

1、統計數據的單位站的角度不同可能就是另一個角度解讀數據
2、你無法管理你無法衡量的事物,需要找到有效的評價指標

四、相關性和相關系數

1、關系系數在區(qū)間【-1 1】,不受變量單位的限制
2、求和公式=∑ Xi = X1+ X2+ X3+ X4+......Xi (i=n時)
平均數=∑( Xi )/n(i=n時)


1.jpg
五、概率和期望值

1、概率學是研究不確定時間和結果的學問

六-七:兩個故事

1、蒙提.霍爾悖論
2、黑天鵝事件

八、數據與偏見

1、健康用戶偏見、幸存者偏見、記憶性偏見、發(fā)表性偏見、選擇性偏見
九、中心極限定理
1、中心極限定理的核心就是,一個大型樣本的正確抽樣與其所代表的群體存在相似關系
2、標準差是衡量群體中所有個體的離散性,標準誤差是僅僅衡量樣本平均值的離散性
3、通過中心極限定理,我們便可知道樣本平均值和整體平均值之間的距離和概率
4、任意一個群體的樣本平均值在群體平均值周圍呈正態(tài)分布
十-十四
1、回歸分析能夠控制其他因素不變的前提下,對某個具體變量與某個特定結果之間的關系進行量化

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
【社區(qū)內容提示】社區(qū)部分內容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發(fā)布,文章內容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

友情鏈接更多精彩內容