編譯:小北,,編輯:景行、江舜堯,。 原創(chuàng)微文,,歡迎轉(zhuǎn)發(fā)轉(zhuǎn)載。 RNA結(jié)合蛋白(RBPs)是一組多樣的參與基因表達(dá)的蛋白,,能夠與RNA相互作用形成核糖核蛋白復(fù)合體,,調(diào)控RNA底物的成熟和命運(yùn),并且調(diào)節(jié)基因表達(dá)的多個(gè)方面,,包括pre-mRNA剪切,、裂解以及聚腺苷化、RNA穩(wěn)定,、RNA定位,、RNA編輯還有翻譯。一些RBPs參與多個(gè)過程,,例如利用NOVA調(diào)節(jié)選擇性剪接以及polyA位點(diǎn),,這些作用對(duì)于正常人的生理非常重要。RBP功能缺失與基因和機(jī)體的紊亂有關(guān),,例如神經(jīng)退行性病變,、自身免疫和癌癥。RBPs的調(diào)節(jié)功能同樣受RBPs亞細(xì)胞定位以及RNA底物的影響,,因?yàn)檗D(zhuǎn)錄后的步驟通常發(fā)生在膜分離和相分離的亞細(xì)胞腔中,。 在本文中研究者介紹了人類基因組中通過RNA結(jié)合蛋白(RBPs)識(shí)別的一組新的RNA元件,,構(gòu)成了ENCODE課題III階段的一部分。這組調(diào)控元件只有當(dāng)轉(zhuǎn)錄進(jìn)入RNA時(shí)才會(huì)發(fā)揮功能,,因?yàn)樗鼈兊淖饔檬?strong>為RBPs提供結(jié)合位點(diǎn)以控制轉(zhuǎn)錄后生物學(xué)過程,,例如剪切、裂解,、聚腺苷化以及mRNA的編輯、定位,、穩(wěn)定和翻譯,。研究者在K562和HepG2細(xì)胞中繪制和描述了人類RBPs所識(shí)別RNA元件的圖譜特征。將體內(nèi)RNA和染色質(zhì)上確定的RBP結(jié)合位點(diǎn),、體外RBPs結(jié)合的傾向,、RBP結(jié)合位點(diǎn)的功能、RBPs亞細(xì)胞定位以及356個(gè)RBPs生成的1223個(gè)復(fù)制數(shù)據(jù)集這五個(gè)實(shí)驗(yàn)進(jìn)行整合分析,。研究者對(duì)整體轉(zhuǎn)錄組RBP結(jié)合的范圍以及這些相互作用與包括RNA穩(wěn)定性,、剪接調(diào)節(jié)以及RNA定位等多個(gè)RNA生物學(xué)方面之間的關(guān)系進(jìn)行描述,這些結(jié)果通過添加在RNA水平與RBPs相互作用的元件,,擴(kuò)展了人類基因組中編碼的功能元件的目錄,。 論文ID 原名:A large-scale binding and functional map of human RNA-binding proteins 譯名:人類RNA結(jié)合蛋白的大規(guī)模結(jié)合及功能圖 期刊:Nature IF:42.778 發(fā)表時(shí)間:2020年7月 通訊作者:Brenton R. Graveley,Gene W. Yeo 通訊作者單位:加利福尼亞大學(xué) DOI號(hào):10.1038/s41586-020-2077-3 實(shí)驗(yàn)設(shè)計(jì) 結(jié)果 為了更好的理解人類RBP的結(jié)合和功能,,研究者利用五種方法針對(duì)于356個(gè)RBPs,,產(chǎn)生了1223個(gè)可復(fù)制的數(shù)據(jù)集。這些RBPs參與RNA生物學(xué)的多個(gè)方面并且包含不同的序列和結(jié)構(gòu)特征,。從功能上而言,,這些RBPs大多參與調(diào)節(jié)RNA剪接(98 RBPs, 28%),,并且162 RBPs (46%)已經(jīng)報(bào)道含有多個(gè)功能,,但是83 (23%)尚未證實(shí)RNA的功能機(jī)制(圖1b)。盡管57%的RBPs包含已經(jīng)確定的RNA結(jié)合結(jié)構(gòu)域,,剩余的包括研究較少的結(jié)構(gòu)域或者尚不知曉的RNA結(jié)合結(jié)構(gòu)域(圖1b),。一些RBPs,包括核糖體蛋白R(shí)PL23A和剪接體因子HNRNPC在ENCODE細(xì)胞系和一系列人類組織中高表達(dá),,但是一些的表達(dá)具有組織特異性,,表明這些RBPs的調(diào)節(jié)活性可能通過細(xì)胞類型特異的基因表達(dá)程序調(diào)節(jié)。五種方法中的每一種都聚焦于RBP活性的不同方面(圖1a),,如下所述,。 圖1. 對(duì)實(shí)驗(yàn)和數(shù)據(jù)類型回顧。(a)區(qū)分RBPs的五種實(shí)驗(yàn),;(b)至少通過一組ENCODE實(shí)驗(yàn)(黃色或者紅色),,結(jié)合免疫熒光(綠色)、CRISPR篩選的重要基因(栗色)、手動(dòng)注釋的RBP功能(藍(lán)色或者紫色)以及蛋白結(jié)構(gòu)域的注釋繪制356個(gè)RBPs,,每一類別的直方圖如下所示,;(c)PTBP3的組合表達(dá)以及剪接調(diào)節(jié)。 2 RBPs的全轉(zhuǎn)錄組RNA結(jié)合位點(diǎn) 研究者鑒定并證實(shí)數(shù)以百計(jì)IP級(jí)別的抗體能夠識(shí)別人類RBPs,,并且開發(fā)了eCLIP,。研究者分別對(duì)K562細(xì)胞中120個(gè)RBPs以及HepG2細(xì)胞中103個(gè)RBPs進(jìn)行了高質(zhì)量的eCLIP圖譜繪制。該項(xiàng)工作鑒定了844854個(gè)差異富集的峰圖,,涵蓋了18.5%個(gè)注釋的mRNA轉(zhuǎn)錄以及2.6%個(gè)mRNA前體的轉(zhuǎn)錄組,。 3 RBP應(yīng)答的基因和選擇性剪接事件 為了探究eCLIP峰圖的功能,研究者利用shRNA或者CRISPR對(duì)個(gè)體RBPs進(jìn)行敲除,,隨后進(jìn)行RNA-seq,。研究者分別在K562細(xì)胞中敲除了235個(gè)RBPs,在HepG2細(xì)胞中敲除了237個(gè)RBPs,,與配對(duì)的非靶向?qū)φ諗?shù)據(jù)集相比,,在20542個(gè)基因中鑒定出375,873個(gè)差異表達(dá)基因的事件在至少一個(gè)RBP敲除后受到影響,,以及221,,612個(gè)差異剪接體事件,包含38,,555個(gè)選擇性剪接事件在至少一個(gè)RBP敲除時(shí)受到影響,。進(jìn)一步分析證實(shí)在一些數(shù)據(jù)集中GC對(duì)read密度的影響可通過Salmon和CAN工具校正。除了每個(gè)實(shí)驗(yàn)的批次對(duì)照,,批次校正能夠?qū)φ麄€(gè)數(shù)據(jù)集整合分析,。 4 體外RBP結(jié)合基序 研究者利用帶有重組純化RBPs的RBNS以及隨機(jī)RNA寡核苷酸的工具對(duì)體外78個(gè)RBPs進(jìn)行了RNA序列和結(jié)構(gòu)結(jié)合的鑒定。研究者在接近半數(shù)的RBPs (37 of 78)中鑒定五個(gè)核苷酸(nt) (k = 5)高度富集的k-mers,,并且聚類為單一的基序,。剩余的RBPs具有更加復(fù)雜的結(jié)合圖譜,由兩個(gè)基序(32 of 78),,或者三個(gè)或者更多的基序(9 RBPs),。這些結(jié)果提示一些RBPs對(duì)包含基序的序列和RNA結(jié)構(gòu)是敏感的。 5 RBPs的亞細(xì)胞定位 為了闡釋細(xì)胞空間內(nèi)RBPs的功能特性,,研究者利用已經(jīng)證實(shí)的抗體分別對(duì)HepG2細(xì)胞中274個(gè)RBPs以及HeLa細(xì)胞中268個(gè)RBPs進(jìn)行了系統(tǒng)的免疫熒光成像,,發(fā)現(xiàn)它們與特異細(xì)胞器和亞細(xì)胞結(jié)構(gòu)中12個(gè)標(biāo)記物結(jié)合。這些數(shù)據(jù)包括217,,412個(gè)圖像并且采用詞匯定位描述符,,被收錄在RBP圖像數(shù)據(jù)庫(kù)中(http://rnabiology.ircm./RBPImage/)。 6 RBPs與染色質(zhì)結(jié)合 為了研究RBP與染色質(zhì)結(jié)合在轉(zhuǎn)錄和共轉(zhuǎn)錄剪接中的作用,,研究者進(jìn)行了ChIP-seq實(shí)驗(yàn)發(fā)現(xiàn)了37個(gè)RBPs相關(guān)聯(lián)的DNA元件資源,,這些實(shí)驗(yàn)確定了792,,007個(gè)ChIP-seq的峰圖,占基因組的3.8%,。 7 數(shù)據(jù)整合分析 為了進(jìn)行整合分析,,每個(gè)數(shù)據(jù)類型中的所有數(shù)據(jù)都通過相同的數(shù)據(jù)加工管道,并且所有試驗(yàn)中數(shù)據(jù)的標(biāo)準(zhǔn)都是一致的,。研究者利用至少兩種不同的方法研究了70%的RBPs,,并且利用至少三種方法對(duì)129 (37%)個(gè)RBPs進(jìn)行了分析,利用多個(gè)數(shù)據(jù)集實(shí)現(xiàn)了整合分析,,例如PTBP1調(diào)節(jié)PTBP3(圖1c),。PTBP3的mRNA包含外顯子2改變了起始密碼子的使用并且增加了PTBP3蛋白的細(xì)胞質(zhì)定位,在對(duì)照細(xì)胞中PTBP3外顯子2缺失,,但是在PTBP1敲低的條件下增加,這與之前的報(bào)道一致,。剪接事件可能受PTBP1的直接調(diào)節(jié),,正如研究者在PTBP3外顯子2的3’端剪接位點(diǎn)的eCLIP的峰圖一致,在RBNS中富含U的基序與PTB家族相連,。研究者也發(fā)現(xiàn)了與PTBP3外顯子10之間的強(qiáng)相互作用,,沒有表現(xiàn)出選擇性剪接,但是是與PTBP1外顯子10和PTBP2外顯子11是直系同源的,,以PTBP1和PTBP2介導(dǎo)的方式選擇性剪接,,從而引發(fā)無意義的mRNA衰減。因此通過PTBP1介導(dǎo)的PTBP3外顯子10的剪接并不是由于PTBP1不結(jié)合導(dǎo)致的,。在另一個(gè)案例中,,研究者觀察到GTPBP2隱顯子HNRNPL下游的富集包含首個(gè)HNRNPL RBNS基序的重復(fù),表明HNRNPL抑制外顯子的剪接,,并且對(duì)帶有全長(zhǎng)開放閱讀框的GTPBP2 mRNA的產(chǎn)生發(fā)揮重要作用,。 8 eCLIP數(shù)據(jù)組的分析 研究者進(jìn)行了488例eCLIP實(shí)驗(yàn),每一例都包含生物學(xué)重復(fù)的IPs以及一個(gè)配對(duì)的且大小匹配的input,?;贗P驗(yàn)證、文庫(kù)產(chǎn)量,、重現(xiàn)峰的存在或重復(fù)家族信號(hào),、基序富集(已知結(jié)合的RBPs) 以及已經(jīng)建立的生物學(xué)功能對(duì)質(zhì)量進(jìn)行評(píng)估,獲取了223個(gè)高質(zhì)量的eCLIP數(shù)據(jù)組,,并且發(fā)布在了ENCODE數(shù)據(jù)協(xié)調(diào)中心(https://www.),。另外50個(gè)數(shù)據(jù)組由于不符合嚴(yán)格的標(biāo)準(zhǔn)并不包含在進(jìn)一步分析中,但是包含可重復(fù)的信號(hào)(GSE107768),。自動(dòng)量化的標(biāo)準(zhǔn)也能準(zhǔn)確的劃分83% eCLIP數(shù)據(jù)組的質(zhì)量,。通過手動(dòng)而非自動(dòng)質(zhì)量評(píng)估的數(shù)據(jù)組有特殊的注釋,。盡管研究者觀察到嚴(yán)格的IP洗滌條件通常限制了非直接相互作用的回收,在本研究中eCLIP實(shí)驗(yàn)并不包括蛋白相關(guān)RNA的可視化,,因此能夠通過比對(duì)體外基序單獨(dú)證實(shí)eCLIP圖譜,,并且敲低后效應(yīng)的改變也能證實(shí)真實(shí)的結(jié)合作用。 標(biāo)準(zhǔn)的CLIP-seq分析通常能夠鑒定成千上萬個(gè)read密度富集的集簇,。然而,,研究者在之前的研究中發(fā)現(xiàn)IP vs input實(shí)驗(yàn)中所需要的富集通過移除轉(zhuǎn)錄本中非特異的信號(hào)特異的證實(shí)了生物學(xué)相關(guān)的峰圖。因此,,盡管所有集簇中的數(shù)據(jù)都只經(jīng)過IP分析證實(shí),,在本研究中研究者所需要的峰圖需要符合相對(duì)于input富集的嚴(yán)格標(biāo)準(zhǔn)(富集倍數(shù) ≥8,P ≤ 0.001),。研究者進(jìn)一步利用不可復(fù)制發(fā)現(xiàn)率(IDR)方法對(duì)生物學(xué)重復(fù)中特異的峰圖進(jìn)行了重復(fù)驗(yàn)證,。最終,研究者將57個(gè)“黑名單”區(qū)域中重疊的峰圖進(jìn)行了移除,,結(jié)果與人造信號(hào)一致,。下游樣本分析提示在低表達(dá)基因中標(biāo)準(zhǔn)測(cè)序深度下也能夠檢測(cè)到峰圖。當(dāng)研究者將峰圖疊加到GENCODE轉(zhuǎn)錄本注釋中時(shí),,大多數(shù)RBPs的峰圖與特異的區(qū)域重疊,,與之前鑒定的RBPs功能是一致的(圖2a)?;谥饕D(zhuǎn)錄本區(qū)域結(jié)合的類型,,研究者將這些RBPs聚類稱6個(gè)RNA類型,為后續(xù)基于峰圖的分析提供了參考比對(duì)(圖2a),。根據(jù)觀察一些eCLIP數(shù)據(jù)組中特異匹配的read代表總數(shù)的一小部分,,研究者開發(fā)了一種家庭意識(shí)的映射策略,能夠?qū)Χ嗫截愒系南鄬?duì)富集進(jìn)行準(zhǔn)確的定量,,包括多個(gè)假基因的基因家族,、逆轉(zhuǎn)錄轉(zhuǎn)座子以及其他重復(fù)元件。結(jié)合這種方法,,研究者觀察到與已知功能一致的rRNA或者snRNA信號(hào)調(diào)控的RBPs集簇,,以及與反義Alu以及L1/LINE信號(hào)介導(dǎo)的集簇(圖2b、c),,與近期的分析一致,,與逆轉(zhuǎn)座元件結(jié)合包含RBP結(jié)合圖譜中被忽視的一部分。 圖2. RBP-靶基因相互作用調(diào)控網(wǎng)絡(luò)的整合分析,。(a)堆積的條形圖提示223個(gè)eCLIP實(shí)驗(yàn)中顯著的eCLIP峰圖,,峰圖的數(shù)量在對(duì)數(shù)范圍,條形圖的高度依據(jù)與pre-RNA,、mRNA以及非編碼RNAs重疊的線性部分標(biāo)注,,數(shù)據(jù)集依據(jù)相同區(qū)域圖譜層次聚類為6個(gè)集簇,;(b)針對(duì)223個(gè)eCLIP實(shí)驗(yàn)中特異的基因組以及多拷貝元件信號(hào)的t-SNE聚類,分為17個(gè)集簇和一個(gè)RBPs的離群值,;(c)熱圖顯示圖B中RBPs集簇,,提示每個(gè)RNA區(qū)域或者元件中平均相關(guān)信息;(d)每個(gè)點(diǎn)代表在K562細(xì)胞中RBFOX2 eCLIP對(duì)應(yīng)HepG2細(xì)胞中可重復(fù)的RBFOX2 eCLIP峰圖的富集倍數(shù),;(e)在K562和HepG2細(xì)胞中繪制的每個(gè)RBP,。 9 RBP元件的發(fā)現(xiàn)飽和 盡管大多數(shù)表達(dá)的基因都表現(xiàn)為差異表達(dá)并且至少在一個(gè)數(shù)據(jù)集中有eCLIP峰圖,只有5214個(gè)基因具有來自同一個(gè)RBP的eCLIP峰圖并且對(duì)該RBP的敲除應(yīng)答,,提示大部分基因敲除的應(yīng)答改變是間接效應(yīng)的結(jié)果,。選擇性剪接反應(yīng)了更大的可變性,由RNA解旋酶和剪接體蛋白AQR的敲除鑒定出13000個(gè)剪接改變,。單獨(dú)考慮eCLIP,,在至少一個(gè)峰圖上可以發(fā)現(xiàn)3.4%內(nèi)含子序列以及33.5%外含子序列,盡管一些峰圖反映了蛋白質(zhì)包裹或者短暫的與RNAs結(jié)合,,例如與RNA聚合酶II的成分POLR2G與pre-mRNAs 之間相互作用,,而不是RNA加工過程調(diào)節(jié)位點(diǎn)。 接下來,,研究者探究了RBP的調(diào)節(jié)是否在不同細(xì)胞類型中一致,。研究者在HepG2細(xì)胞中觀察到如果整體靶向RNA的表達(dá)在5的因子內(nèi),,RBFOX2 eCLIP的峰圖在K562細(xì)胞中富集(圖2d),。將這一觀察拓展到兩種細(xì)胞系中全部73個(gè)RBPs的eCLIP數(shù)據(jù)匯總,在未改變的或者中度差異表達(dá)的基因內(nèi)大多數(shù)峰圖在第二種細(xì)胞系中四倍甚至更多倍的富集,,并且在其他細(xì)胞類型中與重現(xiàn)且顯著的峰圖重疊(富集倍數(shù)≥8,, P ≤ 0.001)(圖2e)。相反,,46.3%RBP峰圖的平均值在第二種細(xì)胞系細(xì)胞類型特異表達(dá)的基因上沒有富集,,而只有21.6%的發(fā)生在未改變、微弱或者適中差異表達(dá)的基因上,。因此,,這些結(jié)果表明大多數(shù)RBP的eCLIP信號(hào)在細(xì)胞系相似基因的表達(dá)上是保守的,而峰圖的差異往往反映了細(xì)胞類型特異的RNA表達(dá)而不是差異結(jié)合,。 10 體外的特異性驅(qū)動(dòng)了體內(nèi)的結(jié)合 體內(nèi)RBP的結(jié)合是由RNA內(nèi)在的結(jié)合特異性以及其他因素,,例如RNA結(jié)構(gòu)和蛋白質(zhì)的輔因子決定的。為了比較體外和體內(nèi)的特異性,,研究者計(jì)算了RBNS結(jié)合序列中每5mer的原始富集(R值),,并且與eCLIP峰圖(ReCLIP)中對(duì)應(yīng)的富集進(jìn)行比對(duì),發(fā)現(xiàn)聚焦于5mers是因?yàn)樗鼈兪亲钬S富的,,且大多數(shù)蛋白經(jīng)過RBNS包含的RNA識(shí)別基序(RRM)或者h(yuǎn)nRNP K同源(KH)結(jié)構(gòu)域分析,,它們與RNA的3-5個(gè)堿基相連,。在體內(nèi)和體外顯著富集的5mers大都是一致的,有15/23個(gè)RBPs顯著重疊(圖3a),。一個(gè)RBP的首個(gè)RBNS 5mer幾乎富集在eCLIP峰圖上(圖3a),,并且相較于相同RNA類型中其他RBPs的eCLIP峰圖,RBNS基序能夠更多對(duì)應(yīng)的eCLIP峰圖,。在大多數(shù)案例中,,在編碼區(qū)、內(nèi)含子區(qū)域或者UTR區(qū)域的eCLIP峰圖觀察到了相似的結(jié)果(圖3a),。顯著的是,,單一最富集的RBNS 5mer出現(xiàn)在30%的RBPs峰中,包括SRSF9,, TRA2A,, RBFOX2, PTBP3,, TIA1,,HNRNPC,并且近一半的eCLIP峰圖包含前五個(gè)RBNS 5mers中的一個(gè)(圖3a),。因此這些5mers的案例提供了候選的核苷酸分辨結(jié)合位點(diǎn),,能夠預(yù)測(cè)改變RNA加工過程的遺傳變異。當(dāng)在RBNS和eCLIP中有兩個(gè)或者更多不同的基序富集時(shí),,大部分體外富集的基序通常也在體內(nèi)富集,。這些結(jié)果與那些研究中稱RBPs包含更多單鏈RNA結(jié)合結(jié)構(gòu)域的觀點(diǎn)是一致的。內(nèi)在的結(jié)合特異性解釋了很大一部分體內(nèi)結(jié)合的傾向,。 對(duì)于近一半的RBPs(10/23),,前5個(gè)RBNS 5mers闡釋了少于一半的eCLIP峰圖。這些RBPs中的一些與RNA結(jié)構(gòu)特征相關(guān)或者延伸RNA序列元件,,而其他的可能通過相互作用的蛋白連接,。在一些案例中,RBNS只和一小部分富集在eCLIP峰圖上的基序有親和性,,例如C富集的6mers主要富集在PCBP2的RBNS數(shù)據(jù)以及PCBP2的eCLIP峰圖上(圖3b),,但是也有一部分eCLIP富集的kmers并不通過RBNS富集(圖3b)。這種“只有eCLIP”的基序通常G-,, GC-,,或者GU-富集,可能代表RNA與其他蛋白的結(jié)合或者代表在共純化或交聯(lián)位置或接近交聯(lián)位點(diǎn)的序列偏差,。 在PCBP2的案例中,,C富集的(RBNS)基序而不是G富集的(只有eCLIP)基序在鄰近PCBP2調(diào)節(jié)的外顯子上富集,提示RBNS基序可能幫助證實(shí)某個(gè)eCLIP的峰圖與因子特異的調(diào)節(jié)相對(duì)應(yīng),。考慮到RBPs與eCLIP,RBNS以及KD-RNA-seq數(shù)據(jù),,靠近選擇性的外顯子上eCLIP富集與18/28個(gè)已知剪接調(diào)節(jié)RBPs敲低后剪接改變?cè)龆嘞嚓P(guān)。為了探究序列特異結(jié)合和調(diào)節(jié)之間的關(guān)系,,研究者將eCLIP峰圖中包含(RBNS+)或者缺乏(RBNS–)最高親和性的RBNS基序進(jìn)行分類。在外顯子區(qū)域,,RBNS+ eCLIP峰圖與外顯子跳躍收到強(qiáng)抑制有關(guān),,包含RBNS–的峰圖外顯子約有25%的升高(圖3c)。因此,,能夠反映體外結(jié)合序列特異性的eCLIP峰圖賦予了更強(qiáng)的調(diào)節(jié)作用,,可能是因?yàn)樗鼈兇淼南嗷プ饔酶映志谩Mㄟ^首個(gè)只有eCLIP的5mer存在或者缺失對(duì)eCLIP峰圖分離,,結(jié)果發(fā)現(xiàn)在剪接調(diào)節(jié)活性方面具有微小的差異,。與RBP抑制的外顯子不同,RBP激活的外顯子在RBNS+和RBNS–的峰圖之間只有在內(nèi)含子區(qū)域的下游有一個(gè)微弱的顯著差異(P < 0.02),,而在其他地方?jīng)]有顯著差異,。是否在RBP抑制的而不是RBP激活的外顯子上有一個(gè)更強(qiáng)的效應(yīng)尚不清楚,可能更加持久的結(jié)合對(duì)于剪接抑制而不是激活更加關(guān)鍵,。 圖3. 體內(nèi)序列特異性的結(jié)合主要是由RBPs的內(nèi)在RNA親和力決定的,。(a)RBNS-和eCLIP富集5mers的首個(gè)序列基序,依據(jù)RBNS與eCLIP富集的相關(guān)性降低排序,。填充的圓圈提示RBNS與eCLIP基序顯著富集,。左邊的熱圖表示所有5mers RBNS和eCLIP富集之間的斯皮爾曼相關(guān)性,中間的熱圖表示不同基因區(qū)域eCLIP峰圖中首個(gè)RBNS 5mer富集,,右邊的熱圖表示eCLIP峰圖的比例歸因于10個(gè)最高親和力RBNS 5mers中的每一個(gè),,以及RBNS 5mers 11–24的結(jié)合,;(b)比較體內(nèi)vs體外5mer富集的PCBP2,,以及包含CCCC和GGGG的5mers;(c)在RBP敲除后比較剪接的改變,。 11 RBP靶向的功能特征 對(duì)KD–RNA-seq數(shù)據(jù)進(jìn)行分析使得研究者對(duì)eCLIP鑒定的RNA元件進(jìn)行了功能推斷,。研究者首先鑒定了RBP KD–RNA-seq中對(duì)轉(zhuǎn)錄本豐度的顯著變化,因?yàn)閷?duì)RNA穩(wěn)定性的調(diào)節(jié)可以改變穩(wěn)定的mRNA水平,。為了證實(shí)RNA穩(wěn)定性的潛在調(diào)節(jié)因子,,研究者將RBP敲除后在eCLIP富集的5′UTRs、CDSs以及3′UTRs的差異基因進(jìn)行了比較,。盡管與標(biāo)準(zhǔn)的DESeq分析比較,,KD-RNA-seq具有更多與eCLIP富集的顯著重疊,研究者發(fā)現(xiàn)從與RNA穩(wěn)定性調(diào)節(jié)相關(guān)的序列偏差的文庫(kù)制備中很難解決基因水平GC含量的偏差,。因此研究者進(jìn)行了一項(xiàng)保守的分析,,利用Salmon以及CQN工具對(duì)KD-RNA-seq倍數(shù)改變的潛在GC含量的偏差進(jìn)行了完全的清除,。研究者鑒定出了4個(gè)RBPs在eCLIP富集和敲除后表達(dá)升高之間存在相關(guān)性,有7個(gè)RBPs的eCLIP峰圖與表達(dá)降低相關(guān)(圖4a),。當(dāng)與同一結(jié)合類的RBPs比較時(shí)(圖2a),,靶向的RBP在5/11案例中具有最大的富集,并且用于大多數(shù)比較,。 在RBP敲除后RBPs的eCLIP與靶基因的表達(dá)升高相關(guān)也包括之前鑒定的RNA衰減因子(如DDX6),,在敲除后RBPs的eCLIP和表達(dá)降低相關(guān)包括IGF2BP3和FMR1,在之前的報(bào)道中稱能夠提高RNA靶基因的穩(wěn)定性(圖4c),。除了這11個(gè)RBPs,,其他的例如UPF1在更高的eCLIP富集中止時(shí)顯著相關(guān)(圖5e),暗示更復(fù)雜的模型可能顯示更多的重疊,。 圖4. 敲除后RBP結(jié)合和RNA表達(dá)之間的相關(guān)性,。(a)熱圖說明RBP敲除的RNA-seq實(shí)驗(yàn)中,基因顯著富集的區(qū)域與顯著升高或者降低基因之間顯著重合,;(b-c)線條表示HepG2細(xì)胞中DDX6 eCLIP富集以及HepG2中IGF2BP3 eCLIP富集基因表達(dá)倍數(shù)變化的累積分布,。 12 RBP與剪接調(diào)節(jié)相關(guān) RBP與外顯子結(jié)合能夠調(diào)節(jié)包含或者排除外顯子或者5′或者3′選擇性剪接位點(diǎn)。為了探究RBP富集如何與剪接調(diào)節(jié)相關(guān)聯(lián),,研究者通過比較細(xì)胞中RBPs敲除后的RNA-seq數(shù)據(jù)鑒定了所有顯著的選擇性剪接事件,。接下來研究者在每個(gè)RBP中構(gòu)建了一個(gè)RNA剪接圖譜,利用自定義的方法對(duì)元-外顯子上敲除響應(yīng)的剪接事件的eCLIP富集取平均,,對(duì)配對(duì)的input進(jìn)行整合,。在近內(nèi)含子下游RBFOX2 eCLIP的富集與RBP敲除外顯子外以及近內(nèi)含子上游PTBP1富集相關(guān)(圖5a),與之前的報(bào)道RBFOX2和PTBP1基序的富集以及CLIP的結(jié)合相一致,。在同一細(xì)胞系中203對(duì)eCLIP和KD–RNA-seq,,研究者發(fā)現(xiàn)外顯子、3′選擇性剪接以及5′選擇性剪接事件中的各種RNA圖譜,。SR蛋白的結(jié)合與敲除后外顯子的降低相關(guān),,而hnRNP蛋白與外顯子的升高相關(guān),與經(jīng)典的模型中SR和hnRNP蛋白對(duì)剪接具有拮抗效應(yīng)相關(guān)(圖5b),。當(dāng)研究者比較不同細(xì)胞系中同一RBP的數(shù)據(jù)時(shí)發(fā)現(xiàn)了更高的剪接圖譜相關(guān)性,。重要的是,一些剪接體的RBPs具有不同的剪接圖譜,,表明剪接體停留的時(shí)間與敲除后的敏感性之間的關(guān)聯(lián)需要進(jìn)一步被探索,。對(duì)于非剪接體的RBPs,RBP的關(guān)聯(lián)性在外顯子邊界的內(nèi)含子區(qū)域更高,,這與之前的報(bào)道選擇性事件對(duì)單個(gè)RBPs的剪接調(diào)節(jié)更加敏感是一致的,。值得注意的是,上游5’剪接位點(diǎn)的富集程度顯著高于選擇性外顯子側(cè)的內(nèi)含子區(qū)域(圖5c),表明外顯子上游的內(nèi)含子的5 '剪接位點(diǎn)表示一個(gè)剪接體的調(diào)節(jié)未被充分認(rèn)識(shí)的區(qū)域,。 作為一個(gè)額外的對(duì)照,,研究者將同一RNA類型中所有eCLIP數(shù)據(jù)集每個(gè)敲除數(shù)據(jù)進(jìn)行了比較,并且發(fā)現(xiàn)相似的剪接圖譜,。盡管一些RBPs僅在同一RBP中富集,,其他的提示具有潛在的共調(diào)節(jié)作用。例如,,QKI在RBFOX2敲除外的外顯子中eCLIP富集(圖5d,、e),并且與敲除RBFOX2或者QKI后剪接體的改變顯著相關(guān),,與之前在SKOV3ip1卵巢癌細(xì)胞中觀察到的結(jié)果一致,。這些結(jié)果反映了復(fù)雜的協(xié)調(diào)是由于RBFOX2和QKI很少在同一內(nèi)含子具有富集的eCLIP信號(hào)。相反,,TIA1和TIAL1在TIA1敲除誘導(dǎo)的外顯子上具有重疊的富集圖譜,,盡管與其他因子沒有co-IP,這與之前對(duì)TIA1和TIAL1的研究是一致的,。然而,,TIA1和TIAL1敲除后對(duì)應(yīng)的外顯子與剪接體的改變沒有關(guān)聯(lián),暗示結(jié)合的調(diào)節(jié)效應(yīng)在這些位點(diǎn)可能不是共有的,。 圖5. eCLIP 和RNA-seq整合鑒定剪接調(diào)控圖譜,。(a)敲除后RBFOX2和PTBP1標(biāo)準(zhǔn)化剪接圖譜;(b)熱圖提示SBP敲除后所有HNRNP和SR蛋白圖譜中nSE-標(biāo)準(zhǔn)化eCLIP密度之間的差異,;(c)線條提示eCLIP峰圖上RBPs的平均數(shù)量,;(d)熱圖提示HepG2細(xì)胞中敲除RBFOX2外顯子上標(biāo)準(zhǔn)化的eCLIP信號(hào);(e)線條提示在下游近內(nèi)含子區(qū)域RBFOX2和QKI標(biāo)準(zhǔn)化的eCLIP信號(hào)軌跡,。 13 RBP與染色質(zhì)相互作用 表觀標(biāo)記物通過剪接調(diào)節(jié)因子的共轉(zhuǎn)錄沉積影響RNA的加工過程,,并且調(diào)節(jié)型RNAs與染色質(zhì)相互作用,協(xié)調(diào)表觀和轉(zhuǎn)錄的狀態(tài),。為了探究特異的RBPs與DNA之間的關(guān)聯(lián),,研究者對(duì)HepG2細(xì)胞中58個(gè)核RBPs以及K562細(xì)胞中45個(gè)RBPs進(jìn)行了ChIP-seq實(shí)驗(yàn)。HepG2細(xì)胞中約52%的RBPs以及K562細(xì)胞中約64%的RBPs具有可重復(fù)的ChIP-seq峰圖,。這些RBPs具有廣泛的功能分類,,包括SR和hnRNP蛋白,,剪接體成分以及視為轉(zhuǎn)錄因子的RBPs,,例如POLR2G和GTF2F1??紤]到已經(jīng)建立起的染色質(zhì)特征,,RBP的ChIP-seq峰圖在常染色質(zhì)上具有更多的重疊,特別是在單個(gè)RBPs差異的基因啟動(dòng)子區(qū)域。然而,,當(dāng)研究者將RBPs間ChIP-seq的峰圖進(jìn)行直接比較時(shí)研究者發(fā)現(xiàn)僅在一小部分特異的RBP對(duì)中有很少的重疊和很高的一致性(圖6b),。總之,,這些RBPs占據(jù)大約30%超敏的或者開放的染色質(zhì)區(qū)域,,并且在兩種細(xì)胞類型中注釋的基因啟動(dòng)子區(qū)域占據(jù)70%,提示RBPs和人類基因組中轉(zhuǎn)錄活化的區(qū)域存在廣泛的相互聯(lián)系,。 接下來研究者探究了在什么程度ChIP-seq鑒定的DNA靶向與eCLIP中鑒定的RNA靶向在同一RBP上重合,,并且觀察到平均的重合中只有6%的eCLIP峰圖以及2.4%的ChIP-seq峰圖(圖6c),。然而,在有限的RBPs中觀察到了更高的重合,,包括之前報(bào)道過的RBFOX2,。在非啟動(dòng)子區(qū)域,很少有RBPs在ChIP以及eCLIP信號(hào)中有重合,,表明ChIP信號(hào)反映了與DNA或者DNA結(jié)合蛋白之間的相互作用,,而在大部分RBP中不依賴于RNA的直接結(jié)合(圖6d)。然而,,研究者觀察到在HNRNPK和PCBP1/2之間存在關(guān)聯(lián),。這些RBPs具有共同的進(jìn)化歷史和結(jié)構(gòu)域組成,但是卻具有不同的功能,,在基因體內(nèi)ChIP-seq和eCLIP的峰圖之間重合(圖6d),。PCBP1, PCBP2,,以及HNRNPK的ChIP-seq信號(hào)以eCLIP的峰圖為中心,,盡管HNRNPK的eCLIP峰圖上游具有一個(gè)輕微的上移,,這可能反映了這些潛在的RBP復(fù)合體在染色質(zhì)上依賴轉(zhuǎn)錄方向的方式的一種特異的拓?fù)浣Y(jié)構(gòu)(圖6e)。因此盡管一些RBPs的ChIP-seq信號(hào)反映了在啟動(dòng)子區(qū)域前期或者共轉(zhuǎn)錄的關(guān)聯(lián),,一個(gè)子集也反映出在基因體內(nèi)DNA和RNA的靶向重合可能反映了不同的招募機(jī)制,。在有限數(shù)目的RBPs中ChIP-seq的靶向也反映出了RBP敲除后差異基因表達(dá)或者選擇性剪接的顯著富集,提示RBPs與染色質(zhì)的相互作用于RNA加工的下游相關(guān),。 14 亞細(xì)胞內(nèi)RBP的調(diào)節(jié)特征 每個(gè)RBP的亞細(xì)胞定位對(duì)于解釋其生物學(xué)功能是非常重要的,,又因?yàn)镽NA加工發(fā)生在多個(gè)時(shí)期和膜分離的位置。研究者系統(tǒng)的免疫熒光成像發(fā)現(xiàn)了不同的定位圖譜(圖7a),,大部分RBPs與核以及胞漿中的多個(gè)結(jié)構(gòu)相關(guān),。考慮到在特異類型RNA加工過程中細(xì)胞器已知的功能,,定位在核內(nèi)的RBPs與45S前體rRNAs以及小核RNAs上eCLIP的富集對(duì)應(yīng),,定位在線粒體與線粒體RNAs的富集對(duì)應(yīng),定位在核斑點(diǎn)與近端內(nèi)含子區(qū)域的富集對(duì)應(yīng),,證實(shí)了定位和RNA靶向之間存在關(guān)聯(lián)(圖7b),。核仁的RBPs包括18個(gè)參與rRNA加工的因子,例如BOP1,, UTP18,,以及WDR3。重要的是,,其他15個(gè)RBPs在人類RNA加工功能中并沒有注釋,,表現(xiàn)出核仁定位(表1)。有三個(gè)RBPs在45S rRNA上的eCLIP信號(hào)富集:在大數(shù)據(jù)篩選出表現(xiàn)出rRNA加工缺陷的AATF以及PHF6,,以及酵母rRNA加工因子SAS10的人類同源物UTP3,。同樣在核內(nèi),14/18個(gè)RBPs(78%)在一個(gè)或者多個(gè)小核RNAs上具有至少五倍的富集,,表現(xiàn)出核斑點(diǎn)的定位,,而只有51%的RBPs在HepG2細(xì)胞的eCLIP以及免疫熒光數(shù)據(jù)中顯示與斑點(diǎn)共定位。研究者同樣觀察到相對(duì)于胞漿中RBPs的剪接轉(zhuǎn)錄本,,核內(nèi)RBPs未剪接的轉(zhuǎn)錄本eCLIP的信號(hào)升高,,并且對(duì)RBP缺失相關(guān)剪接改變分析發(fā)現(xiàn),定位在斑點(diǎn)的RBPs能夠影響更多的剪接事件,,這與核斑點(diǎn)在剪接機(jī)制中的組織和調(diào)節(jié)的關(guān)鍵作用一致,。 聚焦于特異胞漿細(xì)胞器中的定位,42個(gè)RBPs定位在線粒體,,該細(xì)胞器具有獨(dú)特的轉(zhuǎn)錄和RNA加工調(diào)節(jié),。這些線粒體定位的RBPs與在線粒體RNAs重鏈、輕鏈或者兩條鏈上顯著富集的eCLIP高度重合,,并且免疫熒光顯示的線粒體定位也與線粒體RNAs上eCLIP的顯著富集升高相關(guān)(圖7b-d),。接下來研究者聚焦于DHX30,,它對(duì)于合適的線粒體核糖體組裝和氧化磷酸化非常重要,。與一些線粒體轉(zhuǎn)錄本相關(guān)聯(lián),,與之前RNA IP以及RIP-seq的數(shù)據(jù)一致,DHX30在所有注釋的基因下游中未注釋的H鏈區(qū)域富集且具有很大可能形成莖環(huán)結(jié)構(gòu)(圖7d),。由于線粒體H鏈轉(zhuǎn)錄的終止信號(hào)尚不明確,,研究者試圖推算這一位點(diǎn)標(biāo)記這一信號(hào)。這些案例說明RBPs細(xì)胞內(nèi)如何定位,,結(jié)合連接和功能缺失的數(shù)據(jù),,能夠幫助推斷不同細(xì)胞間隔和細(xì)胞器中轉(zhuǎn)錄后調(diào)節(jié)。 結(jié)論 更多推薦 1 科研 | Oncogene:Lewis肺癌細(xì)胞胞外泌體中miR-21a通過靶向PDCD4加速腫瘤的生長(zhǎng)(國(guó)人作品) END
|
|