寫在前面的話
? ? ? ?平靜心湖起漣漪,開始新的挑戰(zhàn)。我會根據(jù)每周工作繁忙程度來完成作業(yè),時間充裕的時候盡量高質(zhì)量完成,忙的時候采用懶人模式。作業(yè)的日期、質(zhì)量等無法固定,可能會遲到,但不會缺席。
數(shù)據(jù)的集中趨勢
眾數(shù) :統(tǒng)計學(xué)術(shù)語,在統(tǒng)計分布上具有明顯集中趨勢點的數(shù)值,代表數(shù)據(jù)的一般水平(眾數(shù)可以不存在或多于一個)。 修正定義:是一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù)值,叫眾數(shù),有時眾數(shù)在一組數(shù)中有好幾個。用M表示。 理性理解:簡單的說,就是一組數(shù)據(jù)中占比例最多的那個數(shù)。
中位數(shù) :又稱中點數(shù),中值。中位數(shù)是按順序排列的一組數(shù)據(jù)中居于中間位置的數(shù),即在這組數(shù)據(jù)中,有一半的數(shù)據(jù)比他大,有一半的數(shù)據(jù)比他小,這里用m0.5來表示中位數(shù)。(注意:中位數(shù)和眾數(shù)不同,眾數(shù)指最多的數(shù),眾數(shù)有時不止一個,而中位數(shù)只能有一個。)
平均數(shù) :統(tǒng)計學(xué)術(shù)語,是表示一組數(shù)據(jù)集中趨勢的量數(shù),是指在一組數(shù)據(jù)中所有數(shù)據(jù)之和再除以這組數(shù)據(jù)的個數(shù)。它是反映數(shù)據(jù)集中趨勢的一項指標(biāo)。解答平均數(shù)應(yīng)用題的關(guān)鍵在于確定“總數(shù)量”以及和總數(shù)量對應(yīng)的總份數(shù)。

分位數(shù) :亦稱分位點,是指將一個隨機變量的概率分布范圍分為幾個等份的數(shù)值點,常用的有中位數(shù)即二分位數(shù)、四分位數(shù)、百分位數(shù)等。
極差 :又稱范圍誤差或全距(Range),以R表示,是用來表示統(tǒng)計資料中的變異量數(shù)(measures of variation),其最大值與最小值之間的差距,即最大值減最小值后所得之?dāng)?shù)據(jù)。它是標(biāo)志值變動的最大范圍,它是測定標(biāo)志變動的最簡單的指標(biāo)。移動極差(Moving Range)是其中的一種。極差不能用作比較,單位不同 ,方差能用作比較, 因為都是個比率。
數(shù)據(jù)的離中趨勢
數(shù)值型數(shù)據(jù)
- 方差 :方差是在概率論和統(tǒng)計方差衡量隨機變量或一組數(shù)據(jù)時離散程度的度量。概率論中方差用來度量隨機變量和其數(shù)學(xué)期望(即均值)之間的偏離程度。統(tǒng)計中的方差(樣本方差)是每個樣本值與全體樣本值的平均數(shù)之差的平方值的平均數(shù)。方差是衡量源數(shù)據(jù)和期望值相差的度量值。
? ? ? ?其中:為總體方差,
為變量,
為總體平均值,
為樣本個數(shù)。
-
標(biāo)準(zhǔn)差 :又常稱均方差,是離均差平方的算術(shù)平均數(shù)的平方根,用
表示。標(biāo)準(zhǔn)差是方差的算術(shù)平方根。標(biāo)準(zhǔn)差能反映一個數(shù)據(jù)集的離散程度。
? ? ? ?其中:為實數(shù),
為
到
的算術(shù)平均值,
為變量個數(shù)。
- 極差 :又稱范圍誤差或全距(Range),以R表示,是用來表示統(tǒng)計資料中的變異量數(shù)(measures of variation),其最大值與最小值之間的差距,即最大值減最小值后所得之?dāng)?shù)據(jù)。
- 平均差 :表示各個變量值之間差異程度的數(shù)值之一。指各個變量值同平均數(shù)的離差絕對值的算術(shù)平均數(shù)。
? ? ? ?其中:為實數(shù),
為
到
的算術(shù)平均值,
為變量個數(shù)。
順序數(shù)據(jù):四分位差
? ? ? ?四分位差(quartile deviation),它是上四分位數(shù)(Q3,即位于75%)與下四分位數(shù)(Q1,即位于25%)的差。
? ? ? ?四分位差反映了中間50%數(shù)據(jù)的離散程度,其數(shù)值越小,說明中間的數(shù)據(jù)越集中;其數(shù)值越大,說明中間的數(shù)據(jù)越分散。四分位差不受極值的影響。
分類數(shù)據(jù):異眾比率
? ? ? ?異眾比率指的是總體中非眾數(shù)次數(shù)與總體全部次數(shù)之比。換句話說,異眾比率指非眾數(shù)組的頻數(shù)占總頻數(shù)的比例。
其中:表示異眾比率,
表示眾數(shù)次數(shù),
表示總體次數(shù)。
相對離散程度——離散系數(shù)
? ? ? ?離散系數(shù)是測度數(shù)據(jù)離散程度的相對統(tǒng)計 量,主要是用于比較不同樣本數(shù)據(jù)的離散程度。離散系數(shù)大,說明數(shù)據(jù)的離散程度也大;離散系數(shù)小,說明數(shù)據(jù)的離散程度也小。在概率論和統(tǒng)計學(xué)中,離散系數(shù)(coefficient of variation),是概率分布離散程度的一個歸一化量度,其定義為標(biāo)準(zhǔn)差與平均值之比。
? ? ? ?其中,為標(biāo)準(zhǔn)差,
為樣本算術(shù)平均值
分布的形態(tài)
- 偏態(tài)系數(shù)
偏態(tài):統(tǒng)計數(shù)據(jù)峰值與平均值不相等的頻率分布。根據(jù)峰值小于或大于平均值可分為正偏函數(shù)和負偏函數(shù),其偏離的程度可用偏態(tài)系數(shù)刻畫。如平均數(shù)大于眾數(shù),稱為正偏態(tài)(positiveskewness);相反,則稱為負偏態(tài)(negativeskewness)。
偏態(tài)系數(shù):偏態(tài)系數(shù)以平均值與中位數(shù)之差對標(biāo)準(zhǔn)差之比率來衡量偏斜的程度,用SK表示偏斜系數(shù):偏態(tài)系數(shù)小于0,因為平均數(shù)在眾數(shù)之左,是一種左偏的分布,又稱為負偏。偏態(tài)系數(shù)大于0,因為均值在眾數(shù)之右,是一種右偏的分布,又稱為正偏。
? ? ? ?其中:為實數(shù),
為樣本的算術(shù)平均值,
為標(biāo)準(zhǔn)差,
為樣本個數(shù)。

- 峰度系數(shù)
? ? ? ?統(tǒng)計上是用四階中心矩來測定峰度的。因為實驗研究表明,偶階中心矩的大小與圖形分布的峰度有關(guān)。其中的二階中心矩就是數(shù)據(jù)的方差,它在一定程度上可以反映分布的峰度,但有時方差相同的數(shù)據(jù)卻有不同的峰度,因此就利用四階中心矩來反映分布的尖峭程度。為了消除變量值水平和計量單位不同的影響,實際工作中是利用四階中心矩與σ4的比值作為衡量峰度的指標(biāo),稱為峰度系數(shù)。但是在SPSS中的計算公式是四階中心矩與σ4的比值減去3后的值,這個值與0相比,如果為0,說明其峰度與正態(tài)分布相同。大于0,說明它是比正態(tài)分布要陡峭。
? ? ? ?其中:為實數(shù),
為樣本的算術(shù)平均值,
為標(biāo)準(zhǔn)差,
為樣本個數(shù)。
疑問
? ? ? ?網(wǎng)上搜到的另一個峰度系數(shù)公式里,,不確定以哪個為準(zhǔn),待以后認真學(xué)習(xí)后解決。
本周總結(jié)
? ? ? ?開始學(xué)習(xí)的第一周,從松兄推薦開始,看了第一周學(xué)習(xí)目錄。本周學(xué)習(xí)內(nèi)容主要是看書和搜集材料,一周看一本書肯定是看不完的,決定采用最省力、最簡單的辦法——各處copy知識點。隨后看到作業(yè)提交方式,又花了一點時間研究簡書和MD語法。本周剛開始,匆忙之中有很多東西都沒理順,接下來的學(xué)習(xí)和作業(yè)質(zhì)量應(yīng)該會慢慢提高。
? ? ? ?水平有限,不對之處請多多指正。