做數(shù)據(jù)分析許久了, 簡單寫寫比賽的數(shù)據(jù)分析項目思路一 使用邏輯回歸/隨機森林等對kaggle比賽項目 "給出泰坦尼克號上的乘客的信息, 預測乘客是否幸存"進行簡單的數(shù)據(jù)分析...
說實話,不喜歡用博客園的編輯器,是在是太low了。雖然博客園的文章一旦寫出來,還是好看,至少在技術博客方面是這樣。但我還是決定來簡書寫技術博客,雖然簡書上可能閱讀量會比較小,...
相關性是變量之間的數(shù)學關系,但不意味著因果性線性回歸法是計算最佳擬合線的一種方法兩變量之間可能不是線性的在樣本數(shù)據(jù)區(qū)間內,最佳擬合線能做出估計,但超出范圍的毫無把握 如何判斷...
樣本均值、比例等于總體均值、比例的點估計量,這是無偏樣本最可能的情況。但是這一情況仍有可能是錯誤的,因為畢竟是一個樣本的結果。置信區(qū)間:總體統(tǒng)計量在某一區(qū)間內的可信程度,這一...
卡方分布也是假設檢驗的一種方法,利用卡方分布來檢驗觀察頻數(shù)與期望頻數(shù)之間的差異大小是否顯著主要用途有:1.檢驗觀察頻數(shù)與某一概率分布的擬合優(yōu)度2.檢驗兩個事件是否獨立 一:檢...
一句話描述假設檢驗的原理為:假定原假設成立,計算檢驗結果及更差情況的概率,若這一概率很小(小于顯著性水平),則認為原假設為假。 一:假設檢驗基本步驟: 1.確定原假設,備擇假...
我來答下磊叔【數(shù)據(jù)分析面試30題】專欄的小作業(yè)。 題目:微信日某一日的用戶上億,你如何算出這一日的男女比例?解題思路:上億的數(shù)據(jù)量,硬件人力軟件時間都配齊肯定能算出來,但這明...
知乎上學了磊叔【知乎作者:徐小磊】的數(shù)據(jù)分析方法論,我來交作業(yè)了本文目標:練習數(shù)據(jù)分析的七劍法 有這樣一份數(shù)據(jù),數(shù)值代表日活躍用戶: 15個連續(xù)時間的數(shù)據(jù),日活用戶時高時低,...
【寫在開頭】自從開始數(shù)據(jù)分析的學習,看了很多莎爺[簡書作者:鄧莎]的文章,深受啟發(fā),非常感謝。我也堅信寫作是為了更好地總結與分享。 從Kesci上下載了一份數(shù)據(jù)集——五大城市...