總結(jié)能力不太強,改了一遍又一遍最后決定按照題目一個個來:
1. 生物信息一般做哪些事情
答案是我百度來的:測序與序列對比,蛋白質(zhì)結(jié)構(gòu)對比與預(yù)測,基因識別。對于這些術(shù)語
我理解表面意思,但是具體如何操作還不清楚
2. 從業(yè)者要掌握哪些技能
首先,數(shù)據(jù)分析是很重要的,如果不會數(shù)據(jù)分析就算得到了結(jié)果也沒用。
然后應(yīng)該是基本的程序語言,比如R,petrl,python等等,然后開始學(xué)習(xí)lunix的操作
最后我認(rèn)為比較重要的一點是可以靜下心來仔仔細(xì)細(xì)的分析程序運行中出現(xiàn)的error,我
一向看見error就放棄,換個包來試試或者晾幾天再說。
3. 電腦的配置要求
電腦的配置不是很懂,只要安裝ubuntu的時候可以有至少10G的內(nèi)存留給ubuntu和conda
就可以了。
4. 如何部署工作環(huán)境
對于系統(tǒng)的安裝我想我沒有發(fā)言權(quán)因為全程都是學(xué)長幫我裝的。不過我在安裝的時候遇到
一個問題,我的電腦是64位的,但是在裝好virtual box再裝操作系統(tǒng)的時候只有32位的
可以選。最后學(xué)長關(guān)機再開機,在開機過程中按了F幾個鍵,然后就有32位和64位一起選了。
開始的時候我們沒有注意磁盤大小,然后再下載fastq數(shù)據(jù)的時候發(fā)現(xiàn)系統(tǒng)沒有位置存放
數(shù)據(jù)了,所以就重新安裝在內(nèi)存最大的磁盤了,我裝在了D盤。其他的安裝conda沒有什么
問題,比較順利。
5. 如何保證分析結(jié)果可重復(fù)
第三章的數(shù)據(jù)重復(fù)我沒有得到什么重要的信息,從群里的討論來看,寫一下我的見解。
就以最近學(xué)的R為例,每一個R包的使用都有相關(guān)文獻(xiàn)來展示代碼和數(shù)據(jù),好的文獻(xiàn)就是
直接copy你的代碼和數(shù)據(jù)可以得到一模一樣的結(jié)果,我認(rèn)為結(jié)果有一點差異都不算好的文獻(xiàn)。
第二個,根據(jù)代碼帶入任何數(shù)據(jù)都可以運行并得到結(jié)果。我有很多次直接搬文獻(xiàn)的方法來
卻得不到任何結(jié)果還百思不得其解,總以為我自己出了什么問題。
6. 如何解決遇到的問題
Doctor看起來是個不錯的幫手。畢竟書上說 If any one of our
instructions causes an error, your first choice will be to see what the
doctor says.
But 我在安裝Doctor的時候就這個的時候就出現(xiàn)問題了。
mkdir -p ~/bin
curl http://data.biostarhandbook.com/install/doctor.py > ~/bin/doctor.py
chmod +x ~/bin/doctor.py
代碼很簡單,但是第二步就運行不了了。
第一個提示:/home/yxf/bin/doctor.py: No such files
但是我明明mkdir了啊,再運行一遍,
第二個提示:bash: /bin/doctor.py: Permission denied
算了,不裝了。遇到問題去google