根據(jù)geneID合并數(shù)據(jù)(相當于merge)

由于WT樣品有幾個重復(fù),而每個重復(fù)都單獨算出基因的TPM值,現(xiàn)在需要將幾個重復(fù)根據(jù)geneID進行合并,以便后續(xù)求每個基因TPM的平均值。
具體perl代碼如下:

open FA,"$ARGV[0]";
while(<FA>){
    chomp;
    @temp=split /\t/,$_;
    $hash{$temp[0]}=[$temp[3]];
}

open FA,"$ARGV[1]";

while(<FA>){
    chomp;
    @temp=split /\t/,$_;
    if(exists $hash{$temp[0]}){
        push @{$hash{$temp[0]}},$temp[3];
        $hash{$temp[0]}=$hash{$temp[0]};
    
    }
    
}


open FA,"$ARGV[2]";

while(<FA>){
    chomp;
    @temp=split /\t/,$_;
    if(exists $hash{$temp[0]}){
        push @{$hash{$temp[0]}},$temp[3];
        $hash{$temp[0]}=$hash{$temp[0]};
    
    }
    
}

open FA,"$ARGV[3]";

while(<FA>){
    chomp;
    @temp=split /\t/,$_;
    if(exists $hash{$temp[0]}){
        push @{$hash{$temp[0]}},$temp[3];
        $hash{$temp[0]}=$hash{$temp[0]};
    
    }
    
}

open FA,"$ARGV[4]";

while(<FA>){
    chomp;
    @temp=split /\t/,$_;
    if(exists $hash{$temp[0]}){
        push @{$hash{$temp[0]}},$temp[3];
        $hash{$temp[0]}=$hash{$temp[0]};
    
    }
    
}

open FA,"$ARGV[5]";

while(<FA>){
    chomp;
    @temp=split /\t/,$_;
    if(exists $hash{$temp[0]}){
        push @{$hash{$temp[0]}},$temp[3];
        $hash{$temp[0]}=$hash{$temp[0]};
    
    }
    
}


foreach(sort keys %hash){
print"$_\t@{$hash{$_}}\n";
    
    
    
}

運行代碼:

perl perl_merge.pl  WT_rep1.tpm.count  WT_rep2.tpm.count WT_rep3.tpm.count  WT_rep4.tpm.count WT_rep5.tpm.count WT_rep6.tpm.count|head -20

初步結(jié)果如下:


image.png
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容