讀李霞老師《生物信息學(xué)》教材

第一次知道李霞老師是在2019年“數(shù)學(xué)、計(jì)算機(jī)與生命科學(xué)交叉科學(xué)青年學(xué)者論壇”上,詳見(jiàn):2019||數(shù)學(xué)、計(jì)算機(jī)與生命科學(xué)交叉科學(xué)青年學(xué)者論壇。在論壇上她的演講是《數(shù)學(xué)在生物醫(yī)學(xué)中的作用》,生動(dòng)有趣,主要是能夠恰如其分地overlap到數(shù)學(xué)和生物醫(yī)學(xué)的點(diǎn)。后來(lái)就開(kāi)始在網(wǎng)上搜關(guān)于她的資料:

了解到李老師是數(shù)學(xué)出身轉(zhuǎn)到生物信息,也是國(guó)內(nèi)早期從事和教授生物信息的老師之一。雖然到其門(mén)下讀書(shū)幾乎不可能了,但是總是在關(guān)注著生物信息第一梯隊(duì)的老師的動(dòng)態(tài)。前幾天,在國(guó)內(nèi)某知名生信大廠的二手群里,看到有前同事在出手一本生物信息教材——2010年出版的《生物信息學(xué)》。要知道那時(shí)候,該大廠也是本書(shū)出版后一年(2011)才成立的。10年來(lái),該廠為我國(guó)培養(yǎng)了成百上千的高通量測(cè)序(生信,產(chǎn)品,運(yùn)營(yíng),銷(xiāo)售)人才??吹竭@個(gè)時(shí)間,看到李老師的教材,我覺(jué)得自己責(zé)無(wú)旁貸要收下本書(shū)了,在之前屯過(guò):

剛好,也借此機(jī)會(huì),一窺十年前生物信息的狀態(tài)。在此,我們不禁要問(wèn),那時(shí)候?qū)W習(xí)生物信息的同學(xué),現(xiàn)在都在哪呢?

如今(指2012年),李霞教授已是名符其實(shí)的桃李滿天下。從2001年招收第一屆研究生,到今天李霞教授已經(jīng)招收了11屆學(xué)生,培養(yǎng)碩士生54人、博士生35人,已畢業(yè)的45名學(xué)生絕大多數(shù)分配到中國(guó)科學(xué)院、清華大學(xué)、香港科技大學(xué)、同濟(jì)大學(xué)等科研院所或重點(diǎn)高校工作。李霞教授一直堅(jiān)持碩士研究生發(fā)表SCI收錄影響因子2.0、博士研究生發(fā)表SCI收錄影響因子5.0(或累計(jì))的論文才能畢業(yè),就是在這近乎苛刻的培養(yǎng)要求下,哈醫(yī)大生物信息學(xué)院培養(yǎng)的學(xué)生個(gè)個(gè)功夫過(guò)硬,實(shí)力不凡。

目前國(guó)內(nèi)越來(lái)越多的高校開(kāi)始開(kāi)設(shè)《生物信息》這門(mén)課了,坊間也有很多培訓(xùn)機(jī)構(gòu)在做培訓(xùn),據(jù)某大廠統(tǒng)計(jì),2019年較2018年變化-30%。2020年新冠影響,又多了許多序列數(shù)據(jù)需要生物信息人員來(lái)分析。十年前,生物信息還只是一個(gè)科研院所的研究項(xiàng)目,十年后,生物信息已經(jīng)是一個(gè)常見(jiàn)的工種:

所以能在一門(mén)學(xué)科的早期就開(kāi)始教育和普及工作是很需要魄力的。

好了,讓我們回到課本上來(lái)。

緒論
    生物信息學(xué)的興起
    生物信息學(xué)在生命科學(xué)中的地位

這部分作者講述了人類(lèi)基因組計(jì)劃的劃時(shí)代作用:改變生物科學(xué)的研究范式。同時(shí):

全書(shū)的重點(diǎn)也落腳在生物信息在人類(lèi)復(fù)雜疾病中的應(yīng)用上。這又回到我們之前的追問(wèn):NGS數(shù)據(jù)那么多,什么時(shí)候才能改善人類(lèi)健康?2020的新冠,讓我們看到了希望,NGS技術(shù)在早期的病毒序列解讀,后期的防控篩查都起到了舉足輕重的作用。

緒論是用來(lái)召喚夢(mèng)想的。

生物信息學(xué)基礎(chǔ)
    DNA、RNA和蛋白質(zhì)序列信息資源
        核酸序列
        蛋白質(zhì)序列數(shù)據(jù)庫(kù)
        NCBI與EMBL-EBI
    雙序列比對(duì)
        替換計(jì)分矩陣
        雙序列比對(duì)算法
        數(shù)據(jù)庫(kù)搜索
        比對(duì)的統(tǒng)計(jì)學(xué)顯著性
        參數(shù)的選擇
    多序列比對(duì)
        相似性與距離、計(jì)分與罰分、替換矩陣
        主要比對(duì)方法與軟件
        局部比對(duì)、glocal比對(duì)、synthenic比對(duì)
        全基因組比對(duì)
        軟件,參數(shù),比對(duì)質(zhì)量
    序列特征分析
        DNA序列特征分析
        蛋白質(zhì)序列特征分析
        序列綜合分析
    分子進(jìn)化分析
        系統(tǒng)發(fā)生分析與重建
        核酸和蛋白質(zhì)的適應(yīng)進(jìn)化
        分子進(jìn)化與生物信息
    表達(dá)序列分析
        EST數(shù)據(jù)分析
        基因表達(dá)系列分析
    基因芯片數(shù)據(jù)分析
        常見(jiàn)的芯片平臺(tái)與數(shù)據(jù)庫(kù)
        基因芯片數(shù)據(jù)的處理
        差異表達(dá)分析
        基因芯片數(shù)據(jù)的聚類(lèi)分析
        基因芯片數(shù)據(jù)的分類(lèi)分析
        基因芯片數(shù)據(jù)其他分析
        常用表達(dá)譜分析軟件

第二部分的生物信息基礎(chǔ),主要介紹了序列比對(duì)和表達(dá)數(shù)據(jù)分析模式。其實(shí)這個(gè)是永遠(yuǎn)不會(huì)過(guò)時(shí)的知識(shí)點(diǎn),在
讀后|| Encyclopedia of Bioinformatics and Computational Biology ABC of Bioinformatics
NGS通識(shí)第零講||NGS通識(shí)
文章中,我們都提到過(guò),生物信息處理的數(shù)據(jù)類(lèi)型就那么幾種:序列,矩陣,圖像,文本,空間。所以序列的基本處理這個(gè)還是要懂的,如何評(píng)價(jià)兩個(gè)序列的相似性?在算法上如何實(shí)現(xiàn)?這是生物信息的基本功,生物信息不是只會(huì)畫(huà)個(gè)圖,也不是只會(huì)安裝軟件,它不是。所以,關(guān)于生物信息我們還要學(xué)習(xí)很多數(shù)學(xué)和計(jì)算機(jī)的知識(shí)。

在看這一章的時(shí)候,恰巧也在極客時(shí)間上重溫《數(shù)據(jù)結(jié)構(gòu)與算法之美》,深感自己的底子之薄,生信的坑子之深:

在這里我們不去講編輯距離,不去畫(huà)動(dòng)態(tài)規(guī)劃的表,關(guān)于生信的算法我第一次接觸的是
用隱馬爾可夫模型做基因預(yù)測(cè)

功能基因組信息學(xué)
    基因注釋與功能分類(lèi)
        基因注釋數(shù)據(jù)庫(kù)
        基因集功能富集分析
        基因功能預(yù)測(cè)
    蛋白質(zhì)分析與蛋白質(zhì)組學(xué)
        蛋白質(zhì)分析方法
        蛋白質(zhì)組學(xué)數(shù)據(jù)的獲取與分析
    蛋白質(zhì)結(jié)構(gòu)分析
        蛋白質(zhì)的高級(jí)結(jié)構(gòu)
        蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫(kù)
        蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)
        基于結(jié)構(gòu)預(yù)測(cè)蛋白質(zhì)功能
        蛋白質(zhì)結(jié)構(gòu)異常與疾病
    轉(zhuǎn)錄調(diào)控信息學(xué)
        轉(zhuǎn)錄調(diào)控的高通量實(shí)現(xiàn)
        轉(zhuǎn)錄因子結(jié)合位點(diǎn)的信息學(xué)預(yù)測(cè)方法
        轉(zhuǎn)錄調(diào)控?cái)?shù)據(jù)庫(kù)
    生物分子網(wǎng)絡(luò)
        生物分子網(wǎng)絡(luò)概述
        生物分子網(wǎng)絡(luò)分析
        生物分子網(wǎng)絡(luò)的重構(gòu)和應(yīng)用
            基因表達(dá)網(wǎng)絡(luò)
            基因調(diào)控網(wǎng)絡(luò)
            蛋白質(zhì)互作網(wǎng)絡(luò)
            代謝網(wǎng)絡(luò)
    計(jì)算表觀遺傳學(xué)
        基因組的DNA甲基化
        組蛋白修飾的表觀基因組
        基因組印記
        表觀遺傳學(xué)數(shù)據(jù)庫(kù)及軟件

如果不是看過(guò)本書(shū)的出版時(shí)間,你完全看不出這是十年前的教材。因?yàn)橛懻摰闹黝}就算放到今天依然是很新穎的,這就是聞道有先后吧。比如最近 比較火的冷凍電鏡(Cryoelectron Microscopy),在本書(shū)中也有提到。就方法論來(lái)說(shuō),我覺(jué)得這部分的生物分子網(wǎng)絡(luò)很有啟發(fā)意義,目前的生物信息一般是分析序列結(jié)構(gòu)和基因表達(dá),但是生物過(guò)程往往是比較復(fù)雜的,所以網(wǎng)絡(luò)的應(yīng)用似乎是顯而易見(jiàn)。

目前生物分子網(wǎng)路正應(yīng)用在生物系統(tǒng)的許多方面,也在和新的算法一起給我們帶來(lái)新的見(jiàn)解。

生物信息學(xué)與人類(lèi)復(fù)雜疾病
    人類(lèi)復(fù)雜疾病與計(jì)算系統(tǒng)生物學(xué)
        復(fù)雜疾病概述
        復(fù)雜疾病數(shù)據(jù)庫(kù)
        疾病網(wǎng)絡(luò)重構(gòu)和計(jì)算系統(tǒng)生物學(xué)方法
    單核苷酸多態(tài)與人類(lèi)疾病
        SNP分型技術(shù)與數(shù)據(jù)庫(kù)資源
        基于SNP的復(fù)雜疾病遺傳定位
        數(shù)量性狀研究與SNP的系統(tǒng)遺傳學(xué)分析
        SNP相關(guān)的集成軟件工具
    miRNA與復(fù)雜疾病
        miRNA 與靶基因
        miRNA多態(tài)和復(fù)雜疾病
        miRNA 表達(dá)譜與復(fù)雜疾病
        miRNA 調(diào)控分子網(wǎng)絡(luò)

這部分是本教材的落腳點(diǎn),就像為之前的所有知識(shí)點(diǎn)找到了歸屬。所謂打鐵還需自身硬,要把生物信息(數(shù)學(xué)與計(jì)算機(jī)和生命科學(xué)的結(jié)合)應(yīng)用到揭示解決人類(lèi)的健康上去,我們還有一段路要走,目前我們至少可以確定,這條路的基本方向是對(duì)的。

十年前我們分析基因芯片表達(dá)數(shù)據(jù),十年后我們分析單細(xì)胞轉(zhuǎn)錄組表達(dá)譜;十年前我們分析SNP和MiRNA,十年后我們分析ecDNA;十年前我們摸索著前進(jìn),十年后我們滿懷憧憬。

十年間,我們看到生物信息在測(cè)序方法,數(shù)據(jù)庫(kù)建設(shè),數(shù)據(jù)挖掘算法與軟件等方面都有新的發(fā)展。2010-2020這十年依然是后基因組時(shí)代,后功能基因組時(shí)代。如今,我們可以在單個(gè)細(xì)胞水平上來(lái)分析DNA(基因組),RNA(轉(zhuǎn)錄組),蛋白質(zhì)(組)及其互作。如果說(shuō)十九世紀(jì)末二十世紀(jì)初,以細(xì)胞病理學(xué)為基礎(chǔ)的醫(yī)學(xué)模式,開(kāi)始向分子醫(yī)學(xué)轉(zhuǎn)變。那么,隨著單細(xì)胞技術(shù)的成熟,在生命科學(xué)的信息流中,分子醫(yī)學(xué)(DNA,RNA,蛋白)將被單細(xì)胞統(tǒng)一起來(lái),走向組織,器官(圖譜),個(gè)體(精準(zhǔn)醫(yī)療),群體(免疫)。

生物信息正在慢慢成為人類(lèi)健康管理的技術(shù)基礎(chǔ)。


本文參考了以下鏈接:
生物信息學(xué)國(guó)內(nèi)學(xué)者TOPs【歡迎交流】
走在時(shí)代前沿的女科學(xué)家 ——記我國(guó)著名生物信息學(xué)家李霞教授
生物信息學(xué)專(zhuān)業(yè)就業(yè)方向
http://snap.stanford.edu/deepnetbio-ismb/ipynb/Human+Disease+Network.html
http://www.biols.cas.cn/xwdt/gsdt/201904/t20190419_5277844.html

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

友情鏈接更多精彩內(nèi)容