MEME 使用簡介

原作者:?濃香鴨腿面

MEME 是一款用于研究 Motif 的 組合工具套。Motif 是指在一組序列中重復(fù)出現(xiàn)的相似的序列模式(pattern)。MEME包含多個小工具,如 MEME、STREME、 CentriMo、 AME、 FIMO、 Tomtom 等等。MEME 工具套的功能全面,包括 挖掘 Motif(Motif Discovery)、富集 Motif(Motif Enrichment)、查詢 Motif(Motif Scanning)、比較 Motif(Motif Comparison)。

以下內(nèi)容參考 MEME Manual (http://meme-suite.org/doc/overview.html?man_type=web)

一、挖掘 Motif(Motif Discovery)

挖掘 Motif 是指:MEME 基于用戶所提供的序列,根據(jù)特定的算法,預(yù)測(Predict) 序列中可能包含的 Motif。需要注意的是,挖掘 Motif 的算法不是將序列與數(shù)據(jù)庫中已知的 Motif 比對,也不是用已知的 Motif 模型對序列進(jìn)行掃描(Scanning),而是基于用于提供的序列信息獨(dú)立計(jì)算出的,即 全新 的Motif。

輸入:Fasta 序列

輸出:序列中 預(yù)測包含 的 Motif

1. MEME

MEME 是最基本的挖掘 Motif 模塊,可以在 少量(<50) 的序列中挖掘 全新(novel)、無間隙(ungapped) 的 Motif。如果序列中存在長度不定的 Motif,MEME 會將其分割為兩個或多個單獨(dú)的 Motif。

注意,MEME 在挖掘 Motif 時使用的閾值是挖掘到的 Motif 的數(shù)量,而非 Motif 的可信度(E-value)。所以使用 MEME 時,需要提供想要從序列中挖掘到的 Motif 的數(shù)量,同時也要檢查挖掘到的 Motif 的可信度。

注意,使用 Discriminative mode 或 Differential Enrichment mode 兩種模式時,用戶需要向 MEME 提交第二個序列文件,MEME 會以第二個序列文件作為對照,挖掘在第一個文件序列中 富集 的 Motif。


2. STREME

相比 MEME 可以在 大量(>50) 的序列中挖掘 全新、無間隙、富集 的 Motif。STREME 挖掘富集 Motif 時使用的對照序列有兩種來源:

重排輸入序列(DNA 序列以 3 個字符為整體進(jìn)行重排)作為對照序列,無需額外提供對照序列(默認(rèn));

用戶上傳對照序列。

注意,以相同的序列作為輸入時,MEME 挖掘的 Motif 較長,許多 Motif 的長度 >20,而 STREME 挖掘的 Motif 較短(約10)


二、富集 Motif(Motif Enrichment)

富集 Motif 是指:以一組序列為對照組,挖掘在另一組序列中 富集且已知 的 Motif。

輸入:Fasta 序列

輸出:序列中 富集且已知 的 Motif

1. AME (Analysis of Motif Enrichment)

AME 挖掘序列中 已知、富集 的 Motif。因?yàn)槭峭诰蛞阎?Motif,所以使用 AME 要指定 Motif 數(shù)據(jù)庫。判斷 Motif 是否富集的方式與 STREME 一致。


2. CentriMo

CentriMo 挖掘序列中 固定位點(diǎn)(局部)、已知、富集 的Motif。相比 AME,CentriMo 的特點(diǎn)是找尋固定位點(diǎn)處的已知 Motif,即 Motif 處在所有序列中相同的位置,要求輸入的序列長度必須相等。CentriMo 默認(rèn)只尋找輸入序列中間區(qū)段內(nèi)已知的 Motif,適合 ChIP-Seq 數(shù)據(jù),用于快速 尋找ChIP-Seq 的峰中所包含的已知 Motif。CentriMo 也可以尋找輸入序列所有區(qū)段內(nèi)已知的 Motif,適用于 尋找啟動子區(qū)內(nèi)的已知Motif 等。


三、掃描 Motif(Motif Scanning)

掃描 Motif 是指:用特定 Motif(用戶上傳)掃描序列(公共數(shù)據(jù)庫或用戶上傳),篩選出包含特定 Motif 的序列。

輸入:Motif 模型

輸出:包含 Motif 的 序列

1. FIMO

FIMO 是最基本的掃描 Motif 模塊,篩選出包含用戶上傳 Motif 的序列,篩選出的 序列可能包含多個 Motif。


2. MAST

相比 FIMO,MAST 篩選出的序列只展示 最佳匹配 的 Motif,即 每個序列只包含一個Motif。

3. MCAST

掃描序列為基因組,挖掘基因組上用戶上傳的 Motif 的富集區(qū)域。用戶可以將某蛋白復(fù)合體的 DNA bind Motif 上傳給MCAST,尋找此蛋白復(fù)合體在 染色體上 可能的結(jié)合位點(diǎn)等。


四、比較 Motif(Motif Comparison)

比較 Motif 是指:將 用戶上傳的 Motif 與數(shù)據(jù)庫中 已知的 Motif 比較,篩選出與上傳 Motif 相似的已知 Motif??梢詫⑼诰?Motif 模塊找到的 Motif 作為輸入,尋找數(shù)據(jù)庫中與其相似的 Motif,預(yù)測挖掘到 Motif 的功能。 注意,AME 的輸入是序列,Tomtom 的輸入是 Motif。

輸入:Motif 模型

輸出:已知 的 Motif 模型

工具:Tomtom


?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容