lncRNA芯片分析 1. 歸一化 lncRNA芯片采用的歸一化的方法為quantile normalization,。
2. 差異LncRNA的篩選 lncRNA芯片中既有lncRNA的探針又有mRNA的探針,分別做差異基因的篩選,,篩選方法同表達譜的篩選方法是一致的,,參見表達譜的差異基因篩選。
3. 差異lncRNA的重注釋 lncRNA芯片注釋不完善,,因此需要將篩選出來的lncRNA進行重注釋,。將差異lncRNA在基因組上位置上下游延伸,以尋找lncRNA附近的有功能的基因,。 4. 差異lncRNA靶基因的預測 lncRNA可能通過調(diào)控相應的mRNA發(fā)揮功能,,因此有必要預測lncRNA的靶基因。我們提取差異lncRNA和mRNA的序列,,首先用blast進行初篩,之后用RNAplex進行進一步篩選,,以預測lncRNA可能調(diào)控的mRNA,。 5. 差異lncRNA與靶基因共表達網(wǎng)絡 預測出lncRNA的靶基因后,并可進一步在mRNA的數(shù)據(jù)中探尋該mRNA是否發(fā)生表達量的變化,。由此構建差異lncRNA與靶基因相互作用網(wǎng)絡圖,。 6. 差異lncRNA與差異mRNA的共表達分析 SBC Human lncRNA芯片能同時檢測出差異表達的lncRNA和mRNA。我們將差異lncRNA和差異mRNA在一組樣品中進行共表達分析,,可以發(fā)現(xiàn)與某個lncRNA具有相同表達模式的mRNA,。 要求:每組數(shù)據(jù)3個或3個以上生物學重復 實驗組: 對照組: 7. 差異lncRNA靶基因的GO analysis 對lncRNA的靶基因進行GO Ontology的生物學的分類,,根據(jù)Fisher's Exact Test,得到p-value,得到lncRNA靶基因?qū)娘@著性功能,,從而了解lncRNA的功能,。
8. 差異lncRNA靶基因的pathway analysis 對lncRNA靶基因按照Pathway的主要公共數(shù)據(jù)庫KEGG和Biocarta來進行分類,對Pathway中的基因進行基于離散分布的顯著性分析,,得到與實驗目的有顯著聯(lián)系的Pathway 分類,由這些pathway對應相應的靶基因,,從而獲得該分類即導致lncRNA差異的最重要Pathway。
9. 差異lncRNA的轉錄因子的預測 提取lncRNA TSS的上游2000bp,,下游500bp,利用HMM的算法根據(jù)TRANSFAC8.1數(shù)據(jù)庫預測其轉錄因子,。
10. lncRNA cis作用機制研究:對于感興趣的差異表達lncRNAs,搜索其上下游100K范圍內(nèi)的所有編碼基因,,并與該lncRNAs 有顯著共表達的基因取交集,。這些在基因組上臨近、且表達模式上共表達的基因很可能被該lncRNAs 所調(diào)控,。 11. lncRNA trans作用機制研究:計算LncRNAs 共表達的編碼基因,,集合與轉錄因子/染色質(zhì)調(diào)控復合物的靶基因集合的交集,利用超幾何分布計算該交集的富集程度,,得到與lncRNAs 顯著相關的轉錄因子,,從而識別可能與lncRNAs 聯(lián)合發(fā)揮調(diào)控作用的轉錄因子/染色質(zhì)調(diào)控因子。
[綜述]長鏈非編碼RNA(lncRNA) lncRNA 長鏈非編碼RNA(long noncoding RNA,,lncRNA)是一類不編碼蛋白的RNA 分子,,長度在200bp 以上,起初被認為是RNA 聚合酶II 轉錄的副產(chǎn)物,,不具有生物學功能,;近期的研究表明lncRNA 具有保守的二級結構,可以與蛋白,、DNA 和RNA 相互作用,,參與多種生物學過程的調(diào)控,尤其在腫瘤當中發(fā)揮了重要的調(diào)控角色,,如染色質(zhì)修飾,、轉錄激活和抑制、轉錄后調(diào)解以及作為miRNA 的誘導分子干擾基因的表達等,。隨著高通量測序技術的發(fā)展,,越來越多的lncRNA 被注釋,但是絕大多數(shù)的lncRNA 的功能仍然不清楚,,因此lncRNA 的研究是一片非常廣闊的未知領域,,具有極大的研究價值和意義。
lncRNA介紹 長鏈非編碼RNA(long non-coding RNA,,lncRNA)是一類轉錄本長度超過200nt,、不編碼蛋白的RNA,。lncRNA起初被認為是基因組轉錄的“噪音”,不具有生物學功能,。然而,,近年來的研究表明lncRNA能在表觀遺傳、轉錄及轉錄后水平上調(diào)控基因表達,,參與了X染色體沉默,、基因組印記以及染色質(zhì)修飾、轉錄激活,、轉錄干擾,、核內(nèi)運輸?shù)榷喾N重要的調(diào)控過程,與人類疾病的發(fā)生,、發(fā)展和防治都有著密切聯(lián)系,。 為何細胞不惜耗費能量對這些非編碼RNA的表達和定位進行嚴格調(diào)控呢?這些RNA分析究竟有何功能,?RNA測序技術的發(fā)展使人們得以初窺這一神秘分子,,現(xiàn)在lncRNA的許多相關信息都可以再新數(shù)據(jù)庫中查到,例如Broad研究所,、哈佛大學和麻省理工共同開發(fā)的Human Body Map lincRNAs catalog,。雖然近年來關于lncRNA的研究進展迅猛,但是現(xiàn)在人們了解到的lncRNA只是冰山一角,,絕大部分的lncRNA的功能仍然是不清楚的,。隨著研究的推進,各類lncRNA的大量發(fā)現(xiàn),,lncRNA的研究作為RNA研究的新領域,,已經(jīng)成為一個非常吸引人的方向,有待廣大科學家去探尋,。 lncRNA研究當前面臨的一個主要挑戰(zhàn)是,,研究工具還在不斷開發(fā)和改進中,而lncRNA研究中非常關鍵的一步就是發(fā)現(xiàn)與特定疾病相關的lncRNA?,F(xiàn)階段,,基因芯片技術發(fā)展趨于成熟穩(wěn)定,在此平臺上,,通過設計不同檢測lncRNA探針篩選lncRNA是一種準確快捷的方法,。
lncRNA特征 lncRNA通常較長,具有mRNA樣結構,,有些具有poly(A)尾巴,有些沒有poly(A)尾巴,,分化過程中有動態(tài)的表達與不同的剪接方式,,與編碼基因相比,,lncRNA表達量更低。 ※ 組織特異性:不同組織之間的lncRNA表達量不同,。 ※ 時空特異性:同一組織或器官的不同生長階段,,其中的lncRNA表達量也會變化。 ※ lncRNA啟動子同樣可以結合轉錄因子,,如Oct3/4,,Nanog,CREB,,Sp1,,c-myc,Sox2與p53,,局部染色質(zhì)組蛋白同樣具有特征性的修飾方式與結構特征,。 ※ 大多數(shù)的lncRNA在組織分化發(fā)育過程中,都具有明顯的時空表達特異性,,如有人針對小鼠的1300個lncRNA進行研究,,發(fā)現(xiàn)在腦組織中的不同部位,lncRNA具有不同的表達模式,。 ※ 在腫瘤與其他疾病中有特征性的表達方式,。 ※ lncRNA的亞細胞位置上也呈多樣化,在細胞核,、細胞質(zhì)和細胞器均有分布,,甚至某些lncRNA具有獨特的亞細胞位置,有可能是全新的亞細胞構成,。 lncRNA功能 lncRNA可從染色質(zhì)重塑,、轉錄調(diào)控及轉錄后加工等多種層面實現(xiàn)對基因表達的調(diào)控: a) lncRNA通過招募染色質(zhì)重塑復合物至特定的基因組位點使其發(fā)生催化活性。如HOTAIR21,,Xist,、RepA和Kcnqot1招募Polycomb complex至HoxD位點,使得X染色體或Kcnq1功能域的組蛋白H3 第27位賴氨酸發(fā)生3甲基化(me3K27),,誘導異染色質(zhì)形成,,從而抑制該區(qū)域基因表達。 b) lncRNA通過多種機制進行轉錄水平調(diào)控,。lncRNA結合到基因cyclin D1上,,招募RNA結合蛋白TLS來調(diào)控蛋白CBP和p300的組蛋白乙酰轉移酶活性,進而抑制cyclin D1轉錄,。 c) 超保守增強子轉錄出lncRNA-Evf2,,該lncRNA能激活轉錄因子DLX2,進而調(diào)控基因Dlx6轉錄。 d) DHFR次要啟動子區(qū)域轉錄出的lncRNA與該基因主要啟動子區(qū)域結合形成三聚體,,抑制轉錄因子TFIID結合,,從而使基因DHFR發(fā)生沉默。 e) 反義lncRNA能夠與剪接體(splicesome)中鋅指同源mRNA Zeb2的5'剪切位點結合,,使內(nèi)含子未被剪切掉,,而該內(nèi)含子序列中保留有內(nèi)部核糖體進入位點(IRE位點),翻譯過程中識別并結合該位點,,導致Zeb2基因表達和翻譯,。 lncRNA分子機制 隨著lncRNA功能逐步顯現(xiàn),其與靶點的作用機制成為進一步的熱點,。早期認為原位調(diào)控是LncRNA作用的唯一機制,,它通過招募形成染色質(zhì)修飾復合物而沉默鄰近基因轉錄,例如IGF2R反義RNA(antisense of IGF2RRNA,,AIR),、XIST等。而Hox基因反義基因間RNA(Hox antisense intergenic RNA,,HOTAIR)的發(fā)現(xiàn)提示LncRNA可能存在遠程調(diào)控,。同源異型基因(homeotic genes,HOX)在細胞增殖與定向分化中起關鍵作用,,人類Hox基因簇約含100個ncRNA基因,,其中HOTAIR定位于HOXC基因座12q13.13。HOTAIR的5'端可招募結合多梳蛋白抑制復合物2(polycomb repressive complex2,,PRC2),,借助PRC2上三個H3K27甲基化酶EZH2、SUZ12和EED,,使另一基因座HOXD上長約40kb的序列轉錄沉默,,從而在乳腺上皮細胞內(nèi)使細胞內(nèi)轉錄傾向于胚胎成纖維細胞樣表型。超過20%的LncRNA能夠通過結合PRC2或其他類似復合物發(fā)揮作用,,提示LncRNA的遠程調(diào)控機制在生物體內(nèi)廣泛存在,。 其作用機制如下圖所示,主要包括以下幾種情況: 1) 在編碼蛋白基因的上游啟動子區(qū)(橘色)轉錄,,從而干擾鄰近蛋白編碼基因(藍色)的表達(如酵母SER3基因),; 2) 抑制RNA 聚合酶Ⅱ,或介導染色質(zhì)重構和組蛋白修飾,,而影響基因(藍色)表達,; 3) lncRNA(紫色)與編碼蛋白基因的轉錄本形成互補雙鏈,干擾mRNA的剪切,,進而產(chǎn)生不同的剪切形式,; 4) lncRNA(紫色)與編碼蛋白基因的轉錄本形成互補雙鏈,,在Dicer酶作用下產(chǎn)生內(nèi)源性的siRNA,調(diào)控基因的表達水平,; 5) lncRNA(綠色)結合在特定蛋白質(zhì)上調(diào)節(jié)相應蛋白的活性,; 6) 作為結構組分與蛋白質(zhì)形成核酸蛋白質(zhì)復合體; 7) 結合在特定蛋白上從而改變該蛋白的胞質(zhì)定位,; 8) 可作為小分子RNA(如miRNA)的前體分子。
|
|
來自: 阿非ycfg > 《LncRNA相關》