在linux下先放gz文件,用perl腳本,注意輸入示例為3B.clonotypes.TRB.txt,表頭是:count freq cdr3nt cdr3aa v d j VEnd DStart DEnd JStart。
用7-zip壓縮成gzip,不是zip:

cd /mnt/Ocean/Shared/VDJ_pair
用vdjtools格式的txt作為輸入文件:
perl 1.pl 運(yùn)行
perl 1.pl ./ results生成結(jié)果
會(huì)生成6個(gè)文件

新冠的數(shù)據(jù)生成是空的,做如下處理:
原始文件導(dǎo)入r包immunarch中導(dǎo)出成vdjtools格式,再做處理:
J.start后邊4列刪除
表頭改成count freq cdr3nt cdr3aa v d j VEnd DStart DEnd JStart
H-K列中有NA的替換成-1
E-G列中unknown替換成.
cdr3.aa里na改.
添加到壓縮包的時(shí)候把文件的WPS關(guān)掉
之前txt壓縮成gzip,結(jié)果是0 。tsv壓縮后perl就有結(jié)果了。
如果產(chǎn)生的結(jié)果里面都是0的話,說明txt的編碼方式是UTF-16,要改成UTF-8

這樣是錯(cuò)的