ChIP-Seq數(shù)據(jù)挖掘系列-5.2: ngs.plot 畫圖工具ngs.plot.r 和 replot.r 參數(shù)詳解

ngs.plot

必需參數(shù)

參數(shù) 參數(shù)釋義 參數(shù)示例
-G 基因組名 hg18,hg19,mm9,mm10; 詳情參見: SupportedGenomes
-R 需要展示的基因組區(qū)域 tss, tes, genebody, exon, cgi, enhancer, dhs or bed(custom regions)
-C Bam 文件或配置文件 配置文件詳情參見:: HowToUseConfiguration
-O 輸出結(jié)果名 輸出文件前綴

可選參數(shù):

參數(shù) 參數(shù)釋義 參數(shù)示例
-E 基因列表或bed文件自定義作圖區(qū)域 如果不提供列表,那么整個基因組都會被繪圖;transcript ID,gene ID 和symbol都適用,可以混著用,一行一個;使用bed文件時,與-R bed連用。
-T 圖標題 圖的標題

覆蓋度生成

Argument Explanation Accepted value and notes
-F 為數(shù)據(jù)庫表或畫圖類型的選擇提供的進一步信息 protein_coding,K562,rnaseq (順序不重要) 表示 coding genes in K562 cell line drawn in rnaseq mode. 更多信息見: UseFurtherInfo;-F [gene_type][,sub_region][,cell_line or tissue][,exon_type][,rnaseq or chipseq]
-D 基因數(shù)據(jù)庫 默認使用 ensembl, refseq.
-L 兩側(cè)區(qū)域大小 以bp為單位. 默認情況: -R=tss, tes, genebody, -L=2000; -R=exon, cgi, -L=500; when -R=*.bed, -L=1000.
-N 側(cè)翼區(qū)域因子 當使用時,兩側(cè)區(qū)域大小等于interval 乘以側(cè)翼區(qū)域因子。這樣做的好處就是允許側(cè)翼區(qū)域大小可以動態(tài)變化,使得做出來的圖更加自然。
-RB 粗暴統(tǒng)計過濾 設(shè)定極值占總體的比例,將會從數(shù)據(jù)的兩端刪除. 默認設(shè)置為 0 (0%). 設(shè)置為 0.05 表示從總體中移除 5% 極值.
-S 隨機抽樣率 (0, 1]. 從全基因組或者gene list 中抽取一定比例的樣本;對于想快速查看結(jié)果有很大的幫助。
-P 調(diào)用CPU數(shù)量 設(shè)置0調(diào)用本地所有CPU
-AL 標準化覆蓋度向量的算法 覆蓋度向量可以時任意長度.但是必須歸一化為等長,以便取平均值和作圖。.
spline(default) 先進行曲線擬合,然后以相等的間距取值。
bin 整個向量被分割成固定數(shù)量的大小相等的bin,并計算每個bin的平均值。
-CS 一次加載基因的塊多少。 在計算覆蓋度時,控制一次加載的基因數(shù)目,加載的少消耗內(nèi)存小花費時間多。
-MQ 設(shè)置比對質(zhì)量閾值過濾reads 默認 20. 20 意味著錯配率為 1%.
-FL 建庫插入片段大小用于計算物理覆蓋度 默認150. ngs.plot 使用物理覆蓋度代替reads豐度. 插入片段大小因該是建庫插入片段的平均長度
-SS 特定鏈的覆蓋度計算 both(default), same, opposite.
-IN 是否是大間隔 0 或1. 默認情況下, exon 和 cgi 是小 interval; genebody 和*.bed 是大 interval. X軸一般分成5部分;對于小的interval,中間一部分作為interval 區(qū)域,兩側(cè)各2個側(cè)翼區(qū)域;對于大的interval,中間三部分作為interval 區(qū)域,兩側(cè)各1個側(cè)翼區(qū)域。
-FI 是否輸出圖 0 或1. 設(shè)置1表示不輸出圖,;后續(xù)可以利用replot.r處理輸出數(shù)據(jù)生成圖。

ngs.plot.r 和 replot.r 共有的參數(shù)

通用參數(shù)

Argument Explanation Accepted value and notes
-FS 字體大小 默認為 12 pt.

富集輪廓圖參數(shù)

Argument Explanation Accepted value and notes
-WD 圖的寬度 Default is 8 in.
-HG 圖的高度 Default is 7 in.
-SE 布爾值,是否展示標準誤差 0 或1. 默認情況下,標準誤差將呈現(xiàn)為每個曲線周圍的陰影區(qū)域。
-MW 移動窗口寬度以平滑輪廓圖 默認1沒有移動. window 大小的單位就是一個數(shù)據(jù)點. ngs.plot圖中,x軸為100各數(shù)據(jù)點.
-H 陰影區(qū)不透明度 建議值:[0,0.5]。將在每個曲線下添加半透明陰影。
-YAS Y軸大小 默認自動調(diào)整(auto),也可以通過min_val,max_val設(shè)定
-LEG 是否畫圖列 默認為1,展示圖列, 0 不展示圖列.
-BOX 是否給圖畫上邊框 默認為1,畫出邊框, 0 不畫邊框.
-VLN 是否畫豎線 是否畫垂直線在位點(e.g., TSS 和 TES);默認為1,畫線, 0 不畫線.
-XYL 是否繪制X軸和y軸標簽? 默認為1,畫出X軸和y軸, 0 不畫X軸和y軸.
-LWD 線寬度 默認3 pt.

熱圖參數(shù)

Argument Explanation Accepted value and notes
-GO 基因排序算法
total(default) 第一個輪廓圖中總體富集程度
hc 層次聚類
max 第一個輪廓圖中的peak 值大小。如果表觀基因組標記傾向于產(chǎn)生更尖銳的峰,這種選擇就更有意義。
prod 同一區(qū)域內(nèi)所有富集度的乘積。
diff 第一個輪廓圖和第二個輪廓圖的差異
km K-means 聚類. 默認聚 5 類.
none 沒有使用排序算法。使用基因列表中提供的順序。
-LOW 基于排序的標準化中read count閾值 默認 10.
-KNC K-means 聚類的數(shù)目 默認為 5.
-MIT K-means 最大迭代次數(shù) 默認20.
-NRS s設(shè)定K-means 隨機開始的數(shù) k -均值傾向于局部最優(yōu)。反復(fù)重啟它可能有助于找到更好的聚類方法。默認值是30。
-RR 折合率 控制熱圖的高度。值越小,熱圖就越高。默認值是30。
-SC 熱圖的顏色比例 設(shè)置數(shù)據(jù)值映射到顏色的范圍。一定范圍任何值都將映射到與相同顏色范圍。
local(default) 每一個熱圖都有一個自己顏色范圍
region 同樣region的所有的熱圖用同樣的顏色范圍
global 在當前的圖中使用相同的顏色范圍
min_val,max_val 自定義顏色范圍;0,5表示最小值是0,最大值是5
-FC 過濾分數(shù) 默認 0.02(2%). 最大最小的2%數(shù)都丟棄
-CO 熱圖顏色 對于一對bam文件,使用color-tri(neg_color:[neu_color]:pos_color). 注意: 必需使用 R 的顏色, 例如 darkgreen, yellow and blue2.
-CD 熱圖的顏色分布 默認為 0.6. 必需是正數(shù). 注意: 數(shù)值越低,負數(shù)端的顏色間距越大.

參考:

ProgramArguments101



ChIP-Seq 數(shù)據(jù)挖掘系列文章目錄:
ChIP-Seq數(shù)據(jù)挖掘系列-1:Motif 分析(1)-HOMER 安裝
ChIP-Seq數(shù)據(jù)挖掘系列-2: Motif 分析(2) - HOMER Motif 分析基本步驟
ChIP-Seq數(shù)據(jù)挖掘系列-3: Motif 分析(3) - 利用ChIP-Seq結(jié)果在基因組區(qū)域中尋找富集的Motifs
ChIP-Seq數(shù)據(jù)挖掘系列-4: liftOver - 基因組坐標在不同基因組注釋版本間轉(zhuǎn)換
ChIP-Seq數(shù)據(jù)挖掘系列-5.1: ngs.plot 可視化ChIP-Seq 數(shù)據(jù)
ChIP-Seq數(shù)據(jù)挖掘系列-5.2: ngs.plot 畫圖工具ngs.plot.r 和 replot.r 參數(shù)詳解
ChIP-Seq數(shù)據(jù)挖掘系列-6: 怎么選擇HOMMER結(jié)果中的motif

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容