Percentile
計(jì)算百分位數(shù)。PDF P438的例子。
當(dāng)y=(n+1)*p/100 不是整數(shù)時(shí),比如12.5, 那么取第12個(gè)和第13個(gè)數(shù),然后用(v13-v12)(12.5-12)+v12 這樣算。即在兩個(gè)數(shù)之間,又按比例取了一個(gè)數(shù)
注意quitile,quartile這些,不一定是和換算為20,25百分位的數(shù)值完全相等。因?yàn)榘俜治豢赡懿徽?,?分,5分位整除。
Coefficient of variation: 注意這個(gè)是變異系數(shù),不是協(xié)方差。定義是標(biāo)準(zhǔn)差/平均值。比如一組數(shù)較小,一組數(shù)較大,但標(biāo)準(zhǔn)差相同。這兩個(gè)
標(biāo)準(zhǔn)差就無法說明哪組數(shù)的波動(dòng)性更大。但除以平均值后就可以說明了。
切比雪夫不等式:從平均值出發(fā),偏離正負(fù)K個(gè)標(biāo)準(zhǔn)差(K>1)之內(nèi)包含的數(shù)據(jù)點(diǎn)占整個(gè)集合的百分比,不低于1-1/k^2
夏普比率:? (組合收益-無風(fēng)險(xiǎn)收益)/組合收益的標(biāo)準(zhǔn)差。? ?衡量的是每一點(diǎn)風(fēng)險(xiǎn)帶來的超額收益(相對(duì)于無風(fēng)險(xiǎn)收益)
如果沒有無風(fēng)險(xiǎn)收益做參照物,那么就不可比。例如我把標(biāo)準(zhǔn)差弄的很小,但收益也較低,比率仍然可以比較大。有了無風(fēng)險(xiǎn)收益做對(duì)比,大家就被拉到了一個(gè)起跑線上
注意如果夏普比率為負(fù),那么有可能標(biāo)準(zhǔn)差越大,夏普比率越大(往0的方向靠近)。這種情況就不能說夏普比率越大越好。
夏普比率的另一個(gè)應(yīng)用是,他是用標(biāo)準(zhǔn)差衡量風(fēng)險(xiǎn)的。如果有些模型天然就是高頻交易,每次盈利一點(diǎn)點(diǎn),但有可能頻率較低的有大額虧損,可能就不適合
偏度skewness :
sk=(各個(gè)值與均值之差的立方/標(biāo)準(zhǔn)差的立方)/n? (n較大,如>100時(shí).n小時(shí)公式為n/((n-1)(n-2))? )
偏度衡量整個(gè)分布是往左偏還是往右偏。
豐度kurtosis :
kt=(各個(gè)值與均值之差的立方/標(biāo)準(zhǔn)差的立方)/n? (n較大,如>100時(shí).n小時(shí)公式為n(n+1)/((n-1)(n-2)(n-3))? )
相對(duì)豐度:
kt' = kt-3? 3是正態(tài)分布的豐度。這個(gè)值衡量的是相對(duì)于正態(tài)分布的豐度。
豐度較大,意味著fatter tail,表示偏離度可能比較大。一般來說豐度>1就算是比較大了。
有了豐度、偏度基本可以衡量一個(gè)歷史數(shù)據(jù)的偏離度和大部分值落在哪里。

偏度形容了整個(gè)數(shù)據(jù)集往左偏還是往右偏。
錯(cuò)題的經(jīng)驗(yàn):
1. 讀題不仔細(xì)??辞宄莔ean,median。 看清楚起止日期。
2. 調(diào)和平均數(shù)計(jì)算平均價(jià)格。調(diào)和平均數(shù)
條件概率的理解:


條件概率的定義這樣理解比較好:A和B的概率各是一個(gè)圈。A,B同時(shí)發(fā)生的概率是兩個(gè)圈的交集。要求兩個(gè)圈的交集部分占B圈的面積,就是P(AB)/P(B).? 但這種理解并不好解釋在A和B獨(dú)立的情況
注意如果A和B獨(dú)立,則從上述兩個(gè)公式中可以推出P(A|B)=P(A).? 所以大部分的場(chǎng)景下,考慮條件概率一般是A和B不相互獨(dú)立。
還有一個(gè)公式是:
P(AB) = P(A | B)P(B) ? 是第一個(gè)公式的簡(jiǎn)單變形。
書中P492的例子(A是收益大于無風(fēng)險(xiǎn)收益的概率,0.7, B是收益大于0的概率,0.8)是一種特殊情況。收益大于無風(fēng)險(xiǎn)收益,那么收益肯定是大于0的,所以0.7是一個(gè)P(A&B),符合上述公式。
進(jìn)入數(shù)學(xué)期望部分
前面所討論的是基于樣本的統(tǒng)計(jì),描述了一組數(shù)據(jù)的集中程度、偏離集中點(diǎn)的程度。
數(shù)學(xué)期望則是一種預(yù)期,是一種預(yù)測(cè),不是對(duì)已有數(shù)據(jù)的描述。但做出預(yù)測(cè)的基礎(chǔ)還是已有的一些信息。期望還有另外一種解釋,即樣本在無窮大時(shí)的均值。
已經(jīng)知道了隨機(jī)變量的一些分布信息,比如有p1的概率取值為v1, 有p2的概率取值為v2 ,等等。然后需要給一個(gè)隨機(jī)變量預(yù)測(cè)一個(gè)期望值,就是數(shù)學(xué)期望。
在前面做樣本統(tǒng)計(jì)的時(shí)候,方差被用來描述樣本偏離均值的程度。一個(gè)隨機(jī)變量的方差用下面公式定義:
? ??

隨機(jī)變量的方差,被定義為(隨機(jī)變量與數(shù)學(xué)期望的差的平方)的數(shù)學(xué)期望。
(X-E(X))^2? 這個(gè)東西沒有辦法計(jì)算出來。因?yàn)閄是一個(gè)隨機(jī)變量。但這個(gè)東西的數(shù)學(xué)期望卻是可以計(jì)算的,基于已有的信息。如下公式,X1,X2到Xn都代表一個(gè)樣本點(diǎn)(或者說我們估計(jì)的以某個(gè)概率發(fā)生的事件)。P(Xn)代表了樣本點(diǎn)發(fā)生的概率。
所以,上述方差公式展開后就變?yōu)椋?/p>

這個(gè)公式比較重要。

數(shù)學(xué)期望樹
這個(gè)樹比較重要。劃清楚這個(gè)樹對(duì)于整理思路很有幫助。
如果一個(gè)隨機(jī)變量是由幾個(gè)隨機(jī)變量構(gòu)成的,每個(gè)隨機(jī)變量有一定的權(quán)重,這就是投資組合的數(shù)學(xué)模型。
要求組合的數(shù)學(xué)期望,將各組成部分的數(shù)學(xué)期望求出來,然后乘以權(quán)重,再相加就可以了。
對(duì)于一個(gè)組合的方差,是如下公式:Rp代表Return of Portfolio 。
其中w1代表組合中第一個(gè)隨機(jī)變量的權(quán)重,R1代表第一個(gè)隨機(jī)變量。 ??

從而最終推導(dǎo)出:

這是一個(gè)比較漂亮的N*N矩陣。對(duì)角線為每個(gè)隨機(jī)變量的方差。其中cov協(xié)方差的定義:

i==j的時(shí)候,協(xié)方差就是方差。
一般來說,乘積的期望不等于期望的乘積,除非變量相互獨(dú)立。所以協(xié)方差不能理解為E(Ri-ERi) * E(Rj-ERj)
(R-ER) ,有可能是負(fù)的,也有可能是正的,代表了獨(dú)立變量在多大程度上,哪個(gè)方向上對(duì)期望的偏離。
兩個(gè)獨(dú)立變量距離各自期望的偏離之積。而這個(gè)積的期望反應(yīng)的是這個(gè)積在樣本無窮大時(shí),這個(gè)積的值。當(dāng)樣本空間非常大時(shí),這個(gè)積有如下趨勢(shì):
1,如果兩個(gè)獨(dú)立變量不相關(guān)(這里的不相關(guān)指不線性相關(guān))或者獨(dú)立,那么這個(gè)積趨向于0. 因?yàn)闃颖径嗔酥笳?fù)最終要相抵。
2,如果兩個(gè)變量的變化方向相同,那么樣本超多之后,這個(gè)積一定是正的或負(fù)的
協(xié)方差的符號(hào)說明了兩個(gè)變量在變化上的相關(guān)性。其值的大小在一般的數(shù)學(xué)問題上沒有意義,因?yàn)閮蓚€(gè)變量的量綱可能差距較遠(yuǎn)。但在計(jì)算投資回報(bào)時(shí),因?yàn)橥顿Y回報(bào)率都是在-100%到100%波動(dòng),所以其值也衡量了波動(dòng)的大小。
對(duì)于一般的數(shù)學(xué)問題,需要消除掉量綱的影響。消除量綱的方法是協(xié)方差除以每個(gè)變量的標(biāo)準(zhǔn)差,得到一個(gè)東西,這個(gè)東西就是相關(guān)系數(shù):
相關(guān)系數(shù) correlation= Cov(a,b)/(std(a)*std(b))
仍然注意這里的相關(guān)指的是線性相關(guān)。相關(guān)系數(shù)為1代表完全正相關(guān),0代表完全不相關(guān),-1代表完全負(fù)相關(guān)。
兩個(gè)隨機(jī)變量獨(dú)立的定義:P(AB)=P(A)*P(B) 這和前面條件概率的討論是一致的
兩個(gè)隨機(jī)變量不相關(guān)的定義:E(AB)=E(A)E(B) ?
貝葉斯公式:
公式比較簡(jiǎn)單,從條件概率的變形即可得到:
因?yàn)?P(A|B)*P(B)=P(B|A)*P(A)=P(AB)
所以P(A|B)=P(B|A)*P(A)/P(B)
關(guān)鍵是此公式代表的現(xiàn)實(shí)意義和如何使用。當(dāng)A是一個(gè)已知信息,B是新發(fā)生的信息,那么當(dāng)B發(fā)生時(shí),我如何更新A發(fā)生的概率?