R數(shù)據(jù)分析:工具變量回歸與孟德爾隨機(jī)化,實(shí)例解析

原諒我又拖更好久,沒辦法,欸,就是懶,但是所有的單子都是保質(zhì)保量完成的哈。,今天給大家寫工具變量和孟德爾隨機(jī)化,文章略微有些長(zhǎng),請(qǐng)大家準(zhǔn)備好清醒的頭腦,和半個(gè)小時(shí)的閱讀時(shí)間哈。

啥是工具變量回歸

Instrumental variable procedures are needed when some regressors are endogenous (correlated with the error term). The procedure for correcting this endogeneity problem involves finding instruments that are correlated with the endogenous regressors but uncorrelated with the error term. Then the two stage least squares procedure can be applied.

在你的研究中有內(nèi)生性問題時(shí)(就是你的自變量和殘差有關(guān)系了,這個(gè)時(shí)候就有內(nèi)生性問題了),這個(gè)時(shí)候就可以用得到工具變量回歸,或者說你的混雜很多控制不完,這個(gè)時(shí)候就可以用工具變量回歸。

工具變量回歸是在觀察性研究中控制混雜的利器!

舉例說明工具變量

我現(xiàn)在想探討兩個(gè)有相關(guān)的變量之間的因果關(guān)系,比如X和Y吧,我想知道XY是如何相互影響的,現(xiàn)在聰明的我又去找了一個(gè)變量Z,我現(xiàn)在肯定地知道Z和Y是沒有直接的關(guān)系的,但是Z會(huì)影響X,且只會(huì)影響X。

然后我做數(shù)據(jù)分析,如果我的數(shù)據(jù)告訴我本來不可能影響Y的Z竟然對(duì)Y有作用,那么這個(gè)作用只能是通過X實(shí)現(xiàn)的。

大概思想就是這樣的,好簡(jiǎn)單吧。繼續(xù)看:

把上面的話放在一個(gè)實(shí)際的情形下:我現(xiàn)在想研究抑郁depression (X)和?smoking (Y)的關(guān)系,此時(shí)我手上恰好還有一個(gè)變量:工作機(jī)會(huì)缺乏Lack of job opportunities (Z),正常人都知道工作機(jī)會(huì)缺乏是絕對(duì)不可能對(duì)吸煙有影響的,對(duì)吧,因?yàn)楣ぷ鳈C(jī)會(huì)是別人或者外部環(huán)境決定的,吸煙是你自己干的,所以Z對(duì)Y是絕對(duì)不會(huì)有影響的,但是我收集到了好多數(shù)據(jù),一分析,發(fā)現(xiàn)工作機(jī)會(huì)越缺乏的人們吸煙情況越嚴(yán)重,這內(nèi)在的原因有可能就是X(僅在XYZ3個(gè)變量的系統(tǒng)中看)。

這個(gè)時(shí)候Z就可以在研究XY之間關(guān)系的時(shí)候作為一個(gè)工具變量!

什么是工具變量回歸

工具變量回歸就是把上面的思想用數(shù)據(jù)實(shí)現(xiàn),具體的方法就是把你的有內(nèi)生性問題的自變量拆開,一部分和殘差有關(guān),一部分無關(guān),無關(guān)的部分就是工具變量:

Instrumental Variables regression (IV) basically splits your explanatory variable into two parts: one part that could be correlated with ε and one part that probably isn’t

有點(diǎn)不好理解,繼續(xù)看:

還記得我們的一般的回歸模型不?如下圖:

注意模型后面都有一個(gè)誤差項(xiàng)e,這個(gè)e就代表這除了x之外的那些沒能測(cè)著的可能影響y的因素,而工具變量回歸就相當(dāng)于將我們?cè)瓉淼腦分解成了兩部分,一部分和誤差項(xiàng)相關(guān),一部分不相關(guān),不相關(guān)的部分的系數(shù)不久是干干凈凈的系數(shù)嘛。所以說一個(gè)完美的工具變量就可以將混雜控制的干干凈凈明明白白的。

如何找工具變量

In real life, instrumental variables can be difficult to find and in fact, may not exist at all

很遺憾,現(xiàn)實(shí)世界真正的工具變量有可能根本就不存在,最完美工具變量就要求這個(gè)工具變量Z和X相關(guān),和Y不相關(guān)。

就是這個(gè)“只”,太難了。

回到我們的第一個(gè)例子:你說工作機(jī)會(huì)缺乏本身是不可能和吸煙有影響的,我同意,但是它影響抑郁嗎?不是。

工作機(jī)會(huì)缺乏有可能還會(huì)影響焦慮吧,還會(huì)影響幸福感吧,這些說不定都和吸煙有可能有關(guān)吧,所以我們把工作機(jī)會(huì)缺乏做工具變量回歸,得到的抑郁對(duì)吸煙的影響肯定也是不準(zhǔn)的。

我們找工具變量一定是基于理論的,不是說我做個(gè)相關(guān)分析就說某某變量滿足工作變量的條件,合格工具變量從理論上考慮要滿足如下兩個(gè)條件:

Exogenous?—not affected by other variables in the system (i.e. Cov(z,ε) = 0). This can’t be directly tested; you have to use your knowledge of the system to determine if your system has exogenous variables or not.

Correlated with X, an endogenous explanatory variable (i.e. Cov(Z,X) ≠ 0). A very significant correlation is called a?strong first stage. Weak correlations can lead to misleading estimates for parameters and standard errors.

一是外生性Exogenous,就是說你找的這個(gè)工具變量是絕對(duì)不應(yīng)該受到你研究的這個(gè)系統(tǒng)中的其余變量影響的。

二是一定要和X相關(guān)Correlated with X,最好是強(qiáng)相關(guān)(弱相關(guān)會(huì)導(dǎo)致X的系數(shù)估計(jì)不準(zhǔn))

比如,我想看接受咨詢對(duì)抑郁的效果如何,因?yàn)橛绊懸钟舻囊蛩貙?shí)在太多了,你想一個(gè)一個(gè)都收集后在模型中控制掉顯然是不現(xiàn)實(shí)的,但是我發(fā)現(xiàn)了一個(gè)我研究的這個(gè)系統(tǒng)中的一個(gè)外生變量:離咨詢中心的距離,我們認(rèn)為離咨詢中心的距離和接受咨詢是有相關(guān)的,有可能還比較強(qiáng),此時(shí)距離就可以在我們的研究中作為一個(gè)工具變量。

這個(gè)距離變量在理論上是絕對(duì)不會(huì)影響抑郁的,如果在模型中發(fā)現(xiàn)距離有作用,我們就可以認(rèn)為其是通過影響咨詢從而影響的抑郁,它的系數(shù)就可以近似認(rèn)為是咨詢的系數(shù)。

就像上圖表達(dá)的一樣,我們現(xiàn)在理解為距離只有通過影響咨詢才能影響抑郁,所以其系數(shù)可以認(rèn)為是咨詢的系數(shù),但是這個(gè)說法成立的前提就是只,就是距離和咨詢之間的相關(guān)性是完美的。

但是實(shí)際上是不可能的。

比如,有可能咨詢中心是在社區(qū)服務(wù)中心里面的,那么此時(shí)距離其實(shí)和人們?cè)谏鐓^(qū)服務(wù)中心待的時(shí)間有相關(guān)性了,就是離咨詢中心近就越可能在社區(qū)服務(wù)中心待的時(shí)間久,從而受到同伴或者別的影響就不容易抑郁,但這并不是咨詢的作用。

所以從這個(gè)角度考慮距離作為工具變量也是不完美的,但是科研哪有完美的事呢,發(fā)表的文獻(xiàn)中用距離作為工具變量的文章很多的。大家理解這其中的內(nèi)在邏輯就好。

就是說下圖中紅色的路徑的存在是影響了例子中工具變量的可接受性的。

橫斷面數(shù)據(jù)的因果推斷理論

要推斷因果很多時(shí)候是要通過設(shè)計(jì)良好的隨機(jī)對(duì)照試驗(yàn)進(jìn)行的,當(dāng)實(shí)驗(yàn)設(shè)計(jì)行不通的時(shí)候,學(xué)者就會(huì)追求通過橫斷面數(shù)據(jù)探討因果,通常我們會(huì)將實(shí)驗(yàn)組和對(duì)照組的差值直接看作是試驗(yàn)因素導(dǎo)致的果,但是這樣的做法缺點(diǎn)是顯而易見的:

In most observational studies, inferring effects is problematic, because those choosing different treatments may be different and their responses to the actually received treatments may also be different

于是聰明的學(xué)者們進(jìn)行了很多的努力,比如說通過給實(shí)驗(yàn)組匹配一些特征一致的對(duì)照組(就是在一堆橫斷面觀察數(shù)據(jù)中挑選),最終使得兩組除了實(shí)驗(yàn)因素其余的特征均達(dá)到可比,這樣就能解釋因果了。

但是這么樣匹配也是存在問題的:你只能匹配那些你自己知道的變量,有可能好多特征你根本就沒有考慮到或者根本就考慮不到,所以又怎么說明兩組是可比的呢?

還有一種常用的方法是反事實(shí)推斷方法,感興趣的可以閱讀下面的文獻(xiàn):

Rosenbaum, P., Rubin, D: The central role of the propensity score in observational studies for causal effects.?Biometrika,?70, 41–55 (1983)

這兒只給大家簡(jiǎn)要介紹,我們已經(jīng)知道用觀察數(shù)據(jù)的實(shí)驗(yàn)組和對(duì)照組之間的差異并不能說明是實(shí)驗(yàn)因素導(dǎo)致了這種差異,是因?yàn)閮山M的某些特征有可能是不同的,有可能正是實(shí)驗(yàn)組具備某些特征所以它更容易成為實(shí)驗(yàn)組,咱們不知道。

those who chose a particular treatment may have had good reasons to choose that treatment (perhaps including a particular response to the treatment), and therefore their responses to different treatments cannot be compared

但是有沒有可能在對(duì)照組中真的找出來一個(gè)亞組,這個(gè)亞組的總的特征和實(shí)驗(yàn)組完全一樣,從而它們接受試驗(yàn)的可能性也應(yīng)是一樣的,這樣的亞組理論上是可以的!

就是說我們要做的在對(duì)照組中找到那些本來應(yīng)該和實(shí)驗(yàn)組一樣可能性接受試驗(yàn)因素的個(gè)體,那么這些個(gè)體就是那種本來憑著它自己的特征應(yīng)該會(huì)被分到實(shí)驗(yàn)組但卻到了對(duì)照組的個(gè)體,這些個(gè)體除了沒有接受實(shí)驗(yàn)因素,其它的特征我們認(rèn)為都和實(shí)驗(yàn)組是可比的!

那么怎么樣評(píng)價(jià)這個(gè)接受試驗(yàn)的可能性呢?就用傾向分propensity score

大家把上面的中文和下面的英文多讀幾遍,體會(huì)一番這種反事實(shí)思想的高明之處:

the effect size may be estimated by comparing those who have and those who have not received the treatment from among those who would have received the treatment with equal probability. This probability is called the propensity score.

本來兩個(gè)人被分到實(shí)驗(yàn)組的可能性都一樣,但現(xiàn)實(shí)中一部分卻分到了對(duì)照組,那么這些人之間的效果差不就是實(shí)驗(yàn)因素造成的嘛。

以上就是反事實(shí)推斷因果的思想。很棒的思想!

再給大家介紹另外一種因果推斷的思想:工具變量,感興趣的同學(xué)可以閱讀下面的文獻(xiàn):Spirtes, P., Glymour, C, Scheines, R.:?Causation, Prediction and Search. Springer, New York (1993)

這兒依然是給大家簡(jiǎn)要說明,因?yàn)殚_篇就講過:

想象一下我們有XYZ3個(gè)變量,我們想看看這3個(gè)變量之間的關(guān)系和關(guān)系的方向,首先我們考慮XY之間是獨(dú)立的,此時(shí)存在兩種情況,一是XY沒有任何聯(lián)系,二是雖然XY在表面上有聯(lián)系,但是實(shí)際上其實(shí)沒聯(lián)系(表面上的聯(lián)系也是因?yàn)橥瑫r(shí)受到Z的影響造成的)。

為了更好地說明3個(gè)變量間關(guān)系的各種情況,我們借助有向無環(huán)圖DAGs看看:

上面的這個(gè)圖顯示了XYZ之間關(guān)系的所有可能性,看到這個(gè)圖我們?cè)賮砘匚兑幌聝蓚€(gè)變量獨(dú)立的情況,如果XY是獨(dú)立的,那么上圖中的[a], [b], [g], [h], [i], [j], [o], [p], [q], [r], [t], [u], [v], [x], [y], and [z]都會(huì)沒有啦,因?yàn)檫@些子圖中都有都有XY之間的指向箭頭。我們看[I]這個(gè)圖就表達(dá)了完全中介效應(yīng),就是XY是沒有直接因果的,之所以有表面的因果也是因?yàn)閆存在,如果Z不在了,XY依然獨(dú)立。同理圖[m]也是一個(gè)意思。

上面介紹了兩個(gè)變量獨(dú)立,還有一個(gè)概念叫做條件獨(dú)立,條件獨(dú)立也會(huì)牽涉到第三個(gè)變量Z,就是說在Z的特定水平下XY是獨(dú)立的,只要Z不變,XY就一直獨(dú)立,此時(shí)所有XY的虛假關(guān)系都是Z導(dǎo)致的:

Conditional independence is linked to the causal structures depicted in these graph by saying that if some intervention kept Z constant, X and Y would be independent, just like as if conditioned on a particular category of Z

上面的子圖[n]就表示一種條件獨(dú)立關(guān)系,其實(shí)[l],[m]也可以看作是XY條件獨(dú)立。

應(yīng)用條件獨(dú)立的思想就引申出了工具變量instrumental variable這個(gè)概念,如果我們要回答:“對(duì)于存在相關(guān)關(guān)系的XZ,到底是X對(duì)Z有作用還是Z對(duì)X有作用這一科學(xué)問題”,我們找到工具變量Y,這個(gè)Y只會(huì)對(duì)Z產(chǎn)生影響,但是不會(huì)影響X且不會(huì)被X影響,這樣就保證了在有向無環(huán)圖中XY之間是絕不會(huì)有箭頭存在的(圖[K]),但是Y一定有箭頭指向Z,此時(shí)就形成了XY的條件獨(dú)立性,這個(gè)條件就是Z。

看到這兒估計(jì)好多人已經(jīng)暈了,沒辦法呀,寫作水平有限,得給大家放個(gè)圖。

讀到這的同學(xué)先回頭把圖[k]和圖[m]好好地瞅兩眼,繼續(xù)往下看,把圖k和圖m印在你的腦海里,如果此時(shí)XY是真實(shí)是獨(dú)立的,那我們的可以得出來X是因Z是果(圖[k]);如果此時(shí)XY是條件獨(dú)立的,我們就可以得出來Z是因X是果(圖[m])。

以上就是用工具變量推斷因果方向的思想。

孟德爾隨機(jī)化

上面寫了很多的橫斷面觀察數(shù)據(jù)推斷因果的思想,目的之一就是要給大家引出來孟德爾隨機(jī)化Mendelian Randomization(寫個(gè)文章真的是煞費(fèi)苦心啊,趕緊先點(diǎn)個(gè)贊再繼續(xù)往下看)。孟德爾隨機(jī)化其實(shí)就是找到了一個(gè)近乎完美的工具變量,建議大家閱讀下面這篇文獻(xiàn):

Mendelian Randomization: Genetic Variants as Instruments for Strengthening Causal Inference in Observational Studies

這篇文獻(xiàn)就講了,通過孟德爾隨機(jī)化來實(shí)現(xiàn)在觀察數(shù)據(jù)實(shí)現(xiàn)因果推斷,這兒依然是粗淺地給大家進(jìn)行介紹。

The basic principle utilized in Mendelian randomization is that genetic variants that either alter the level of, or mirror the biological effects of, a modifiable environmental exposure that itself alters disease risk should be related to disease risk to the extent predicted by their influence on exposure to the environmental risk factor.Common genetic polymorphisms that have a well-characterized biological function (or are markers for such variants) can therefore be utilized to study the effect of a suspected environmental exposure on disease risk.

孟德爾隨機(jī)化的基本原理就是基因變量和疾病的關(guān)系程度是可以被基因所造成環(huán)境因子的暴露所預(yù)測(cè)的?;虻淖兓梢杂脕硌芯凯h(huán)境暴露對(duì)疾病的影響。

這里面重要需要理解的就是使用基因的變異替代環(huán)境的變異。

有人問,為啥我不直接測(cè)暴露呢?是因?yàn)榛蚴艿降纳鐣?huì)心理行為因素更少,或者說沒有。

舉個(gè)例子,我在研究維生素C和冠心病的因果關(guān)系的時(shí)候,如果我除了直接來收集了維C使用和冠心病發(fā)病率的數(shù)據(jù),我還得收集各種心理,社會(huì),行為因素作為協(xié)變量吧,此時(shí)我問你,你能保證都收集的面面俱到嘛?

不能,絕對(duì)做不到,因?yàn)橛泻芏嗫赡苤两裎幢蝗藗兝斫獾淖兞繒?huì)影響冠心病。

但是如果我用基因來作為可修飾環(huán)境因素的替代,是不是這個(gè)關(guān)系就清晰多了,因?yàn)榛蚴遣粫?huì)那么容易被外界因素影響的,另外因?yàn)闇p數(shù)分裂過程是隨機(jī)的,所以基因之間也沒有聯(lián)系--------孟德爾第二定律------孟德爾隨機(jī)化的由來。

舉個(gè)例子,下表可以看得到很多心理行為因素都和CRP水平有關(guān)系:

但是,你卻可以發(fā)現(xiàn)同樣的這些心理行為因素都和1050G/C基因型是沒關(guān)系的(除了CRP)。這個(gè)基因就可以作為CRP的marker,就是一個(gè)很好的工具變量。

在觀察性研究中還有一個(gè)顧慮是反向因果,但是使用基因型作為工具變量也很好地排除了反向因果;還可以避免測(cè)量誤差和選擇偏倚,具體解釋請(qǐng)查閱原文獻(xiàn)哈。

孟德爾隨機(jī)化和隨機(jī)對(duì)照試驗(yàn)思想對(duì)比

孟德爾隨機(jī)化和隨機(jī)對(duì)照實(shí)驗(yàn)是有邏輯上的一致性的。如下圖:

在隨機(jī)對(duì)照實(shí)驗(yàn)中我們有專門的隨機(jī)分配過程來保證組間的可比性,在孟德爾隨機(jī)化中我們有一個(gè)樣本的挑選過程,這個(gè)挑選是通過等位基因?qū)崿F(xiàn)的,把等位基因作為了暴露的代替,從而也可以實(shí)現(xiàn)組間可比性:

我們考慮一個(gè)研究降壓藥效果的隨機(jī)對(duì)照試驗(yàn),影響血壓的變量是很多的,通過試驗(yàn)分配的隨機(jī)化,我們樸素地認(rèn)為所有的可能或不可能影響血壓的因素都在兩組中可比了。【有文章會(huì)在隨機(jī)化后比較基線特征,這個(gè)操作是完全沒有必要的】

在孟德爾隨機(jī)化中我們認(rèn)為等位基因的分配就是一個(gè)天然的隨機(jī)過程,所以如果我們找到了影響暴露的等位基因,此時(shí)我們選擇不同基因型的個(gè)體進(jìn)行比較就可以直接得到暴露所造成的效果。

舉例子:我要研究酒精消耗和心血管疾病的關(guān)系,有可能不飲酒的人其實(shí)是自身身體本來就差,所以他不飲酒所以有可能你發(fā)現(xiàn)不飲酒的人心血管病發(fā)病情況更加高,還有情況是因?yàn)樗难芗膊×怂运伙嬀屏?,這個(gè)是反向因果,諸如此類,你做個(gè)橫斷面調(diào)查是說不清楚的。

但是我找到了一個(gè)影響飲酒的基因ALDH2 genotype,這個(gè)基因是隨機(jī)的呀,是不會(huì)受到其余因素影響的,也不會(huì)有反向因果的。

你只要這個(gè)基因陽性,我就樸素地認(rèn)為你就是飲酒的,即使你沒有飲酒也是因?yàn)槟惴聪蛞蚬?,或者是被環(huán)境影響了;只要你這個(gè)基因陰性,你就是不飲酒,即使你飲酒也是因?yàn)楸画h(huán)境影響了。有人估計(jì)要罵我在亂說,其實(shí)是的,這個(gè)孟德爾隨機(jī)化一定要是大樣本才行的,一定注意。反正思想就是這樣。

The analogy with randomized controlled trials is also useful in understanding why an objection to Mendelian randomization—that the environmentally modifiable exposure proxied for by the genetic variants (such as alcohol intake or circulating CRP levels) are influenced by many other factors in addition to the genetic variants (Jousilahti and Salomaa, 2004)—while true, is of no consequence.

所以說你只要找一批ALDH2 genotype陽性的人和ALDH2 genotype陰性的人,直接調(diào)查它們的心血管病發(fā)病,你就可以得到飲酒對(duì)心血管病的影響了,注意一定是大樣本情形哈。

有些同學(xué)還是不信,在寫個(gè)例子:很多研究都說CRP和hypertension, insulin resistance, and coronary heart disease有關(guān)系,所以很多學(xué)者都說CRP造成了這些病,有一天,有人做了孟德爾隨機(jī)化研究了這個(gè)問題,他就發(fā)現(xiàn)雖然CRP和這些病相關(guān),但是CRP基因和這些病都沒關(guān),這就矛盾了吧,其中一個(gè)解釋就是混雜太多了,還有一個(gè)解釋就是反向因果,就是說橫斷面數(shù)據(jù)不準(zhǔn)的,你得信孟德爾隨機(jī)化。文獻(xiàn)給大家貼上,有興趣自己去看:

Davey Smith G, Lawlor D, Harbord R, Timpson N, Rumley A, Lowe G, Day I, Ebrahim S. Association of C-reactive protein with blood pressure and hypertension: Lifecourse confounding and Mendelian randomization tests of causality. Arteriosclerosis, Thrombosis, and Vascular Biology. 2005;25:1051–1056.

這一部分是對(duì)比隨機(jī)對(duì)照試驗(yàn)嘛,就再給大家寫個(gè)例子:比如我研究降壓藥的效果,我會(huì)設(shè)計(jì)一個(gè)隨機(jī)對(duì)照試驗(yàn),把所有影響血壓的因素都通過隨機(jī)分配到兩組中,一組給藥,一組不給,挺好的設(shè)計(jì),精髓就在于混雜隨機(jī)分配的過程。轉(zhuǎn)到孟德爾隨機(jī)化,相關(guān)基因的顯性和隱性也是隨機(jī)分的,天然隨機(jī)的,而這個(gè)隨機(jī)就保證了你暴露還是不暴露,所以在邏輯上孟德爾隨機(jī)和隨機(jī)對(duì)照試驗(yàn)是一樣一樣的:

Thus the fact that many other factors are related to the modifiable exposure does not vitiate the power of randomized controlled trials; neither does it vitiate the strength of Mendelian randomization designs.

所以如果你信隨機(jī)對(duì)照試驗(yàn),你就應(yīng)該理解并相信孟德爾隨機(jī)化。以上從類比隨機(jī)對(duì)照研究的角度給大家寫了孟德爾隨機(jī)化,希望給大家以啟發(fā)。

孟德爾隨機(jī)化和工具變量思想

本文開篇就講了,一個(gè)完美的工具變量必須有外生性和與X強(qiáng)相關(guān),基因型是有天然的外生性的,所以第一個(gè)條件完美滿足,因?yàn)槲覀冋业幕虮緛砭褪菍?duì)我們的研究的暴露有影響的基因(比如引起維生素D缺乏的基因)所以第二個(gè)條件也幾乎完美滿足。還有這個(gè)工具變量也是肯定和其它可能影響結(jié)局的混雜無關(guān)的。

反正就是:用適合的基因作為工具變量太完美啦,記住下圖!

這個(gè)基因不會(huì)影響結(jié)局,因?yàn)樗莾H引起暴露的基因,這個(gè)基因和你能想象到的任何混雜(各種心理行為社會(huì)因素)都不可能有關(guān)系,所以如果在數(shù)據(jù)分析中我們發(fā)現(xiàn)這個(gè)基因的表達(dá)和結(jié)局竟然出現(xiàn)了關(guān)系,那么一定是通過影響暴露X從而影響了結(jié)局Y,而且這個(gè)因果一定是從X到Y(jié)而不會(huì)反過來,這一切的推斷都是從橫斷面觀察性研究中得出的,多么精妙啊。

以上給大家寫了從工具變量角度理解孟德爾隨機(jī)化。希望能給大家以啟發(fā)。

實(shí)例操練

希望看了上面的比較詳細(xì)的解釋,大家應(yīng)該理解了孟德爾隨機(jī)化的原理,接下來再帶著大家用實(shí)際例子進(jìn)行實(shí)操

這篇文章太長(zhǎng)了實(shí)在放不下了,先點(diǎn)關(guān)注,看下篇吧。略略略.....。

小結(jié)

今天給大家寫了孟德爾隨機(jī)化的原理,感謝大家耐心看完,自己的文章都寫的很細(xì),代碼都在原文中,希望大家都可以自己做一做,請(qǐng)關(guān)注后私信回復(fù)“數(shù)據(jù)鏈接”獲取所有數(shù)據(jù)和本人收集的學(xué)習(xí)資料。如果對(duì)您有用請(qǐng)先收藏,再點(diǎn)贊轉(zhuǎn)發(fā)。

也歡迎大家的意見和建議,大家想了解什么統(tǒng)計(jì)方法都可以在文章下留言,說不定我看見了就會(huì)給你寫教程哦,另有任何問題都可以私信我哈。

往期精彩

R數(shù)據(jù)分析:如何給數(shù)據(jù)框的列改名

R數(shù)據(jù)分析:相關(guān)性分析

R數(shù)據(jù)分析:有調(diào)節(jié)的中介

R數(shù)據(jù)分析:如何用R做數(shù)據(jù)模擬

R數(shù)據(jù)分析:用R語言做meta分析

R數(shù)據(jù)分析:用R語言做潛類別分析LCA

R數(shù)據(jù)分析:多分類邏輯回歸

R數(shù)據(jù)分析:如何做聚類分析,實(shí)操解析

R數(shù)據(jù)分析:主成分分析及可視化

R數(shù)據(jù)分析:一些數(shù)據(jù)可視化的基本原則

R數(shù)據(jù)分析:生存分析的做法和結(jié)果解釋

R數(shù)據(jù)分析:潛在剖面分析LPA的做法與解釋

R數(shù)據(jù)分析:鳶尾花數(shù)據(jù)集的聚類分析實(shí)操

R數(shù)據(jù)分析:潛變量與降維方法(主成分分析與因子分析)

R數(shù)據(jù)分析:逐步回歸的做法和原理,案例剖析

R數(shù)據(jù)分析:如何在R中使用mutate

R數(shù)據(jù)分析:著名的“三門問題”的R語言模擬

R數(shù)據(jù)分析:貝葉斯定理的R語言模擬

R數(shù)據(jù)分析:層次聚類實(shí)操和解析,一看就會(huì)哦

R數(shù)據(jù)分析:R Markdown:數(shù)據(jù)分析過程報(bào)告利器,你必須得學(xué)呀

R數(shù)據(jù)分析:傾向性評(píng)分匹配實(shí)例操作

R數(shù)據(jù)分析:ROC曲線與模型評(píng)價(jià)實(shí)例

R數(shù)據(jù)分析:雙分類變量的交互作用作圖

R數(shù)據(jù)分析:如何用R語言做meta分析,寫給小白

R數(shù)據(jù)分析:非專業(yè)解說潛變量增長(zhǎng)模型

R數(shù)據(jù)分析:競(jìng)爭(zhēng)風(fēng)險(xiǎn)模型的做法和解釋

R數(shù)據(jù)分析:競(jìng)爭(zhēng)風(fēng)險(xiǎn)模型的做法和解釋二

R數(shù)據(jù)分析:資料缺失值的常見處理方法

R數(shù)據(jù)分析:多水平模型詳細(xì)說明

R數(shù)據(jù)分析:邏輯斯蒂回歸與泊松回歸

R數(shù)據(jù)分析:結(jié)構(gòu)方程模型(SEM)介紹

R數(shù)據(jù)分析:一般線性回歸的做法和解釋

R數(shù)據(jù)分析:雙因素方差分析與交互作用檢驗(yàn)

R數(shù)據(jù)分析:再寫潛在類別分析LCA的做法與解釋

R數(shù)據(jù)分析:如何繪制回歸分析結(jié)果的森林圖

R數(shù)據(jù)分析:嵌套數(shù)據(jù)分析為什么要用加隨機(jī)效應(yīng)?終于解釋清楚了

R數(shù)據(jù)分析:自我報(bào)告的身高數(shù)據(jù)的離群值探索

R數(shù)據(jù)分析:傾向性評(píng)分匹配完整實(shí)例(R實(shí)現(xiàn))

R數(shù)據(jù)分析:如何用lavaan包做結(jié)構(gòu)方程模型,實(shí)例解析

R數(shù)據(jù)分析:再寫stargazer包,如何輸出漂亮的表格

R數(shù)據(jù)分析:如何用R做多重插補(bǔ),實(shí)例操練

R數(shù)據(jù)分析:如何用mice做多重插補(bǔ),實(shí)例解析

R數(shù)據(jù)分析:廣義估計(jì)方程式GEE的做法和解釋

R數(shù)據(jù)分析:交互作用的簡(jiǎn)單斜率圖做法及解釋

R數(shù)據(jù)分析:何為Tidy data,它又有什么好處

R數(shù)據(jù)分析:如何理解模型中的“控制”,圖例展示

R數(shù)據(jù)分析:如何計(jì)算問卷的聚合效度,實(shí)例操練

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容