
ngs.plot
必需參數(shù)
| 參數(shù) | 參數(shù)釋義 | 參數(shù)示例 |
|---|---|---|
| -G | 基因組名 | hg18,hg19,mm9,mm10; 詳情參見: SupportedGenomes |
| -R | 需要展示的基因組區(qū)域 | tss, tes, genebody, exon, cgi, enhancer, dhs or bed(custom regions) |
| -C | Bam 文件或配置文件 | 配置文件詳情參見:: HowToUseConfiguration |
| -O | 輸出結(jié)果名 | 輸出文件前綴 |
可選參數(shù):
| 參數(shù) | 參數(shù)釋義 | 參數(shù)示例 |
|---|---|---|
| -E | 基因列表或bed文件自定義作圖區(qū)域 | 如果不提供列表,那么整個基因組都會被繪圖;transcript ID,gene ID 和symbol都適用,可以混著用,一行一個;使用bed文件時,與-R bed連用。 |
| -T | 圖標題 | 圖的標題 |
覆蓋度生成
| Argument | Explanation | Accepted value and notes |
|---|---|---|
| -F | 為數(shù)據(jù)庫表或畫圖類型的選擇提供的進一步信息 | protein_coding,K562,rnaseq (順序不重要) 表示 coding genes in K562 cell line drawn in rnaseq mode. 更多信息見: UseFurtherInfo;-F [gene_type][,sub_region][,cell_line or tissue][,exon_type][,rnaseq or chipseq] |
| -D | 基因數(shù)據(jù)庫 | 默認使用 ensembl, refseq. |
| -L | 兩側(cè)區(qū)域大小 | 以bp為單位. 默認情況: -R=tss, tes, genebody, -L=2000; -R=exon, cgi, -L=500; when -R=*.bed, -L=1000. |
| -N | 側(cè)翼區(qū)域因子 | 當使用時,兩側(cè)區(qū)域大小等于interval 乘以側(cè)翼區(qū)域因子。這樣做的好處就是允許側(cè)翼區(qū)域大小可以動態(tài)變化,使得做出來的圖更加自然。 |
| -RB | 粗暴統(tǒng)計過濾 | 設(shè)定極值占總體的比例,將會從數(shù)據(jù)的兩端刪除. 默認設(shè)置為 0 (0%). 設(shè)置為 0.05 表示從總體中移除 5% 極值. |
| -S | 隨機抽樣率 | (0, 1]. 從全基因組或者gene list 中抽取一定比例的樣本;對于想快速查看結(jié)果有很大的幫助。 |
| -P | 調(diào)用CPU數(shù)量 | 設(shè)置0調(diào)用本地所有CPU |
| -AL | 標準化覆蓋度向量的算法 | 覆蓋度向量可以時任意長度.但是必須歸一化為等長,以便取平均值和作圖。. |
| spline(default) | 先進行曲線擬合,然后以相等的間距取值。 | |
| bin | 整個向量被分割成固定數(shù)量的大小相等的bin,并計算每個bin的平均值。 | |
| -CS | 一次加載基因的塊多少。 | 在計算覆蓋度時,控制一次加載的基因數(shù)目,加載的少消耗內(nèi)存小花費時間多。 |
| -MQ | 設(shè)置比對質(zhì)量閾值過濾reads | 默認 20. 20 意味著錯配率為 1%. |
| -FL | 建庫插入片段大小用于計算物理覆蓋度 | 默認150. ngs.plot 使用物理覆蓋度代替reads豐度. 插入片段大小因該是建庫插入片段的平均長度 |
| -SS | 特定鏈的覆蓋度計算 | both(default), same, opposite. |
| -IN | 是否是大間隔 | 0 或1. 默認情況下, exon 和 cgi 是小 interval; genebody 和*.bed 是大 interval. X軸一般分成5部分;對于小的interval,中間一部分作為interval 區(qū)域,兩側(cè)各2個側(cè)翼區(qū)域;對于大的interval,中間三部分作為interval 區(qū)域,兩側(cè)各1個側(cè)翼區(qū)域。 |
| -FI | 是否輸出圖 | 0 或1. 設(shè)置1表示不輸出圖,;后續(xù)可以利用replot.r處理輸出數(shù)據(jù)生成圖。 |
ngs.plot.r 和 replot.r 共有的參數(shù)
通用參數(shù)
| Argument | Explanation | Accepted value and notes |
|---|---|---|
| -FS | 字體大小 | 默認為 12 pt. |
富集輪廓圖參數(shù)
| Argument | Explanation | Accepted value and notes |
|---|---|---|
| -WD | 圖的寬度 | Default is 8 in. |
| -HG | 圖的高度 | Default is 7 in. |
| -SE | 布爾值,是否展示標準誤差 | 0 或1. 默認情況下,標準誤差將呈現(xiàn)為每個曲線周圍的陰影區(qū)域。 |
| -MW | 移動窗口寬度以平滑輪廓圖 | 默認1沒有移動. window 大小的單位就是一個數(shù)據(jù)點. ngs.plot圖中,x軸為100各數(shù)據(jù)點. |
| -H | 陰影區(qū)不透明度 | 建議值:[0,0.5]。將在每個曲線下添加半透明陰影。 |
| -YAS | Y軸大小 | 默認自動調(diào)整(auto),也可以通過min_val,max_val設(shè)定 |
| -LEG | 是否畫圖列 | 默認為1,展示圖列, 0 不展示圖列. |
| -BOX | 是否給圖畫上邊框 | 默認為1,畫出邊框, 0 不畫邊框. |
| -VLN | 是否畫豎線 | 是否畫垂直線在位點(e.g., TSS 和 TES);默認為1,畫線, 0 不畫線. |
| -XYL | 是否繪制X軸和y軸標簽? | 默認為1,畫出X軸和y軸, 0 不畫X軸和y軸. |
| -LWD | 線寬度 | 默認3 pt. |
熱圖參數(shù)
| Argument | Explanation | Accepted value and notes |
|---|---|---|
| -GO | 基因排序算法 | |
| total(default) | 第一個輪廓圖中總體富集程度 | |
| hc | 層次聚類 | |
| max | 第一個輪廓圖中的peak 值大小。如果表觀基因組標記傾向于產(chǎn)生更尖銳的峰,這種選擇就更有意義。 | |
| prod | 同一區(qū)域內(nèi)所有富集度的乘積。 | |
| diff | 第一個輪廓圖和第二個輪廓圖的差異 | |
| km | K-means 聚類. 默認聚 5 類. | |
| none | 沒有使用排序算法。使用基因列表中提供的順序。 | |
| -LOW | 基于排序的標準化中read count閾值 | 默認 10. |
| -KNC | K-means 聚類的數(shù)目 | 默認為 5. |
| -MIT | K-means 最大迭代次數(shù) | 默認20. |
| -NRS | s設(shè)定K-means 隨機開始的數(shù) | k -均值傾向于局部最優(yōu)。反復(fù)重啟它可能有助于找到更好的聚類方法。默認值是30。 |
| -RR | 折合率 | 控制熱圖的高度。值越小,熱圖就越高。默認值是30。 |
| -SC | 熱圖的顏色比例 | 設(shè)置數(shù)據(jù)值映射到顏色的范圍。一定范圍任何值都將映射到與相同顏色范圍。 |
| local(default) | 每一個熱圖都有一個自己顏色范圍 | |
| region | 同樣region的所有的熱圖用同樣的顏色范圍 | |
| global | 在當前的圖中使用相同的顏色范圍 | |
| min_val,max_val | 自定義顏色范圍;0,5表示最小值是0,最大值是5 | |
| -FC | 過濾分數(shù) | 默認 0.02(2%). 最大最小的2%數(shù)都丟棄 |
| -CO | 熱圖顏色 | 對于一對bam文件,使用color-tri(neg_color:[neu_color]:pos_color). 注意: 必需使用 R 的顏色, 例如 darkgreen, yellow and blue2. |
| -CD | 熱圖的顏色分布 | 默認為 0.6. 必需是正數(shù). 注意: 數(shù)值越低,負數(shù)端的顏色間距越大. |
參考:
ChIP-Seq 數(shù)據(jù)挖掘系列文章目錄:
ChIP-Seq數(shù)據(jù)挖掘系列-1:Motif 分析(1)-HOMER 安裝
ChIP-Seq數(shù)據(jù)挖掘系列-2: Motif 分析(2) - HOMER Motif 分析基本步驟
ChIP-Seq數(shù)據(jù)挖掘系列-3: Motif 分析(3) - 利用ChIP-Seq結(jié)果在基因組區(qū)域中尋找富集的Motifs
ChIP-Seq數(shù)據(jù)挖掘系列-4: liftOver - 基因組坐標在不同基因組注釋版本間轉(zhuǎn)換
ChIP-Seq數(shù)據(jù)挖掘系列-5.1: ngs.plot 可視化ChIP-Seq 數(shù)據(jù)
ChIP-Seq數(shù)據(jù)挖掘系列-5.2: ngs.plot 畫圖工具ngs.plot.r 和 replot.r 參數(shù)詳解
ChIP-Seq數(shù)據(jù)挖掘系列-6: 怎么選擇HOMMER結(jié)果中的motif