2018年2月,,國家癌癥中心發(fā)布了最新一期的全國癌癥統(tǒng)計數據,,記載了全國腫瘤登記中心統(tǒng)計的2014年登記資料:2014年全國惡性腫瘤估計新發(fā)病例380.4萬例,平均每天超過1萬人被確診為癌癥,,每分鐘有7人被確診為癌癥[1]。面對這可怕的數據,腫瘤無疑已成為人類健康的“大敵”,。 “知己知彼,,百戰(zhàn)不殆”,面對腫瘤這一“大敵”,,研究其發(fā)病機制,,是了解、治療,、消滅它的第一步,。微分基因現推出系列腫瘤研究產品,其中針對腫瘤發(fā)病機制研究,,微分基因成熟穩(wěn)定全面的“殺敵”工具,,能夠全方位、多角度“一網打盡”致病突變,,擊破腫瘤發(fā)病機制,。 圖1微分基因腫瘤致病機制研究產品分析條目 當然,小編也不能光顧著吹牛,,總要給各位提供些干貨,,如何利用這些名稱各異的分析條目解決生物學問題,才是各位看官最關心的,。 下面和小編一起來看看,,這些“殺敵利器”都是如何work的。 易感基因篩查 根據醫(yī)學統(tǒng)計發(fā)現,,部分腫瘤的發(fā)生并不是完全隨機的,,存在一定的家族聚集性,如乳腺癌,、子宮內膜癌,、結直腸癌等。攜帶遺傳性腫瘤致病突變家系中的成員,,可能會通過生殖細胞中攜帶的突變信息將患有該類腫瘤的“宿命”傳遞給下一代,。醫(yī)學上將攜帶生殖細胞突變、引起癌癥發(fā)生風險增加的基因稱為易感基因(Susceptibility gene),。通過對腫瘤患者外周血進行測序分析,,可得到該患者正常組織中的胚系突變(Germline mutation),再將此類突變與包括CGC(Cancer Gene Census)[2],、intOGen[3]在內的不同數據庫進行比較,,得到該患者的癌癥易感基因。表1中,,記錄了檢測到的易感基因名稱,,同時也記載了位于該基因上的突變信息以及同哪些癌癥發(fā)病相關,。 表1易感基因篩查結果 已知驅動基因分析 體細胞突變是導致癌變的重要因素,但在癌變過程中不同體細胞突變所發(fā)揮的作用卻不盡相同,,能夠直接導致癌變的體細胞突變?yōu)?司機突變'(Driver Mutation),,而與癌癥發(fā)生相關,但不起主導作用的突變,,為'乘客突變'(Passenger Mutation),。對于腫瘤配對樣本數較少的研究者,一般尋找每個癌組織中驅動基因的手段,,是對檢測到的體細胞突變通過數據庫的信息進行注釋與篩選,,尋找在數據庫或者文獻中已經記載的驅動基因。主要參考的數據庫,、文獻信息包括:SMG127,,CGC513[2],IntOGen[3] ,,Comprehensive435[4],。表2展示了該腫瘤中分析得到的已知驅動基因信息,包括具體突變類型以及在不同數據庫中記載它“驅動”了哪些癌癥的相關信息,。 表2已知驅動基因分析結果 腫瘤突變負荷 腫瘤突變負荷(Tumor Mutation Burden, TMB)是基因組上每百萬堿基中,,發(fā)生在體細胞編碼區(qū)堿基的替換或者缺失、增加的事件數,。不同的腫瘤細胞由于基因組上存在的變異位點密度不同,,導致不同腫瘤細胞呈遞在細胞表面異常的免疫系統(tǒng)識別物密度不同,而人體內的免疫細胞可以有效識別,、殺死異常的腫瘤細胞,,因此使用TMB可以有效預測某特定腫瘤患者使用細胞免疫治療的效果。參照下圖結果,,患有黑色素瘤的群體相對于患有成神經管細胞瘤的群體TMB較高,,指示著黑色素瘤患者可能在接受細胞免疫治療后會有相對較好的療效。 圖2不同類別腫瘤突變負荷統(tǒng)計 突變特征譜 根據體細胞突變堿基的種類以及該堿基上,、下游1 bp的種類,,我們可以將SNV的類型分成96種。例如,,假設某個位置發(fā)生了C>A的突變,,C的上游堿基類別可以是A、T,、G,、C的任意一種,下游也是,,將三個位置的堿基類型進行排列組合,,共4×1×4=16種可能性,。而中間位置的突變,根據C>A,、C>G,、C>T,、T>A,、T>C,、T>G劃分共6種不同的突變形式,所以綜合考慮SNV上下游堿基的類型,,SNV共有96種不同形式。 通過Maftools[5],,Emu[6]等軟件,,對腫瘤樣本中每一種SNV突變類型發(fā)生的頻率進行統(tǒng)計,繪制此類腫瘤所有的突變特征譜(Mutational signature),。COSMIC[7](Catalogue of Somatic Mutations in Cancer)網站總結了30種腫瘤中常見的突變頻譜,,并對每一種突變頻譜的腫瘤致病因素給出了解釋。如下圖的Signature 1在所有的癌癥中都存在,,導致此類突變出現的原因可能與自發(fā)的5-甲基胞嘧啶脫氨基作用相關,。一般來說,同一種腫瘤樣本可能會檢測到不止一種突變特征譜,,如若分析得到的突變特征譜為COSMIC數據庫中已經記載的,,可借鑒數據庫中記錄的導致該突變特征譜產生的致癌因素。 圖3 COSMIC網站上記錄的Signature 1腫瘤突變特征譜 高頻突變基因 當我們能夠獲得的腫瘤配對樣本較多時,,可以采用非數據庫注釋的方法依據腫瘤樣本本身各種體細胞突變發(fā)生的頻率去預測可能的Driver Gene,。高頻突變基因(Significantly mutated genes)綜合考慮了所有腫瘤樣本體細胞中的SNV和InDel,尋找突變頻率顯著高于背景突變頻率的基因,。高頻突變基因的分析采用MutSigCV[8]軟件,,在基因水平上分析大量腫瘤樣本中的Somatic SNV/InDel豐度,并結合突變熱點,、功能以及進化保守性,,篩選得到可能具有生物學意義的高頻突變基因,進一步鎖定Driver Gene范圍,。 圖4位于胰腺神經內分泌腫瘤上的高頻突變基因統(tǒng)計 [9] 通過Pathscan[10]軟件進行Pathway顯著性富集能確定高頻突變基因參與的最主要生化代謝途徑和信號轉導途徑,,并與研究樣本表型進行比較,找到與表型產生相關性最高的通路以及通路中的關鍵基因,。 圖5肝內膽管癌腫瘤樣本中高頻突變基因富集的通路 [11] 高頻拷貝數變異分析 當然,,腫瘤基因組上的變異肯定不僅限于上述的Somatic SNV/InDel,還存在影響基因組上更多堿基的體細胞拷貝數變異(Somatic CNA)以及結構變異(Somatic SV),。先就著體細胞拷貝數變異來說,,我們知道拷貝數的變化一般分為Loss和Gain,,假設在抑癌基因上出現了拷貝數的Loss,那該抑癌基因的功能也會隨之“Loss”,;假設在癌基因上出現了拷貝數的Gain,,相當于癌基因的功能被激活,致癌效果更“佳”,。因此,,使用GISTIC軟件[12]對大量同類癌組織進行發(fā)生頻率較高的拷貝數變異事件統(tǒng)計,并對該變異事件區(qū)段所有基因進行注釋以及功能分析,,可以幫我們有效鎖定哪些體細胞CNA可能與腫瘤的發(fā)生密切相關,,同時也可以鎖定哪些基因可能會因為CNA的發(fā)生影響了功能。下圖展示了胰腺神經內分泌腫瘤不同染色體上出現的高頻拷貝數Loss(左)和高頻拷貝數Gain(右),。 圖6位于胰腺神經內分泌腫瘤上的高頻拷貝數變異 [9] 融合基因分析 基因融合(Gene Fusion)是指染色體上兩個或者更多本來物理距離較遠的基因通過某種原因首尾相連,,形成一個嵌合基因(即融合基因)的現象,一般來說是由于染色體水平上發(fā)生了易位,、缺失或者倒位引起的,。融合基因在癌癥的發(fā)生過程中扮演了重要的角色,尤其是在血液系統(tǒng)惡性腫瘤中,,以慢性粒細胞白血病BCR-ABL基因融合最為經典[13],,該融合事件導致蛋白激酶持續(xù)性激活,使得白細胞過分增殖而出現慢性淋巴白血病的癥狀,。在后續(xù)的研究中發(fā)現,,無論是血液腫瘤還是實體瘤中,都存在基因融合的現象,。 通過人全基因組重測序技術,,借助CREST[14]軟件分析得到每個腫瘤樣本中所有的Somatic SV,由于SV事件斷點發(fā)生的位置多樣,,為了研究發(fā)生在基因編碼區(qū)的融合基因,,我們僅僅保留斷點發(fā)生在基因編碼區(qū)的SV事件。隨后結合多個腫瘤樣本的信息,,得到該類癌種中的高頻融合基因,,并對涉及的基因信息進行注釋(如下表3)。 表3融合基因分析結果 圖7基于二代測序的reads CREST軟件分析融合基因斷點位置的示意圖 介紹完了這滿滿一籮筐的“干貨”,,不知道大家有沒有get到微分基因為大家提供的這款腫瘤致病機制研究產品的分析思路,? 這還沒完,最后再讓小編簡單整理一下微分基因腫瘤研究的優(yōu)勢吧: 全面 參考腫瘤經典研究,,多角度探討致病機制 快速 自動化核酸提取與建庫平臺,,搭配5臺NovaSeq 6000,保證項目周期與腫瘤研究大數據產出需求 專業(yè) 豐富的文庫構建經驗,,外顯子文庫DNA起始量可低至20ng,,FFPE樣本核酸提取成功率高達80%+ 高效 使用Sentieion軟件進行變異挖掘,,極大縮短分析周期,讓GATK飛起來,! 參考資料 [1] 2014年中國分地區(qū)惡性腫瘤發(fā)病和死亡分析,中華腫瘤雜志,2018年第27卷第1期 [2]數據庫鏈接:https://cancer./census/ [3]數據庫鏈接:https://www./search [4]David T, Abel G P, Christian P L,et al. Comprehensive identification of mutational cancer driver genes across 12 tumor types[J]. Sci Rep, 2013, 3(10):2650. [5]網頁鏈接: http://www./packages/release/bioc/vignettes/maftools/inst/doc/maftools.html [6]Fischer A, Illingworth C J, Campbell P J,et al. EMu: probabilistic inference of mutational processes and their localization in the cancer genome[J]. Genome Biology, 2013, 14(4):R39-R39. [7]數據庫鏈接: http://cancer./cosmic/signatures [8]Lawrence M S, Stojanov P, Polak P,et al. Mutational heterogeneity in cancer and the search for new cancer-associated genes[J]. Nature, 2013, 499(7457): 214-218. [9] Scarpa A, Chang D K, Nones K,et al. Whole-genome landscape of pancreatic neuroendocrine tumours.[J]. Nature, 2017, 543(7643):65. [10] Wendl M C, Wallis J W, Lin L,et al. PathScan: a tool for discerning mutational significance in groups of putative cancer genes. Bioinformatics, 2011, 27(12): 1595-1602. [11] Zou S, Li J, Zhou H,et al. Mutational landscape of intrahepatic cholangiocarcinoma[J]. Nature Communications, 2014, 5:5696. [12] Mermel C H, Schumacher S E, Hill B,et al. GISTIC2.0 facilitates sensitive and confident localization of the targets of focal somatic copy-number alteration in human cancers. Genome biology, 2011, 12(4): R41. [13] Tkachuk DC, Westbrook CA, Andreeff M,et al. Detection of bcr-abl fusion in chronic myelogeneous leukemia by in situ hybridization[J]. Science, 1990, 250(4980):559-562. [14] Jianmin Wang, Charles G Mullighan, John Easton,et al.CREST maps somatic structural variation in cancer genomes with base-pair resolution[J]. Nature Methods, 2011, 8(8):652-654. 微分基因為國家大基因中心“基因檢測平臺”運營方,,專注于高通量測序技術,公司憑借國際領先的高通量測序平臺,,依托獨具優(yōu)勢的高通量基因測序和大數據挖掘技術,,為各大高校、醫(yī)院,、科研單位以及第三方健康管理服務平臺,,提供專業(yè)的基因檢測和數據分析解讀服務。2017年,,微分基因在國家大基因中心建成2133平方米的潔凈分子生物實驗室,公司科研團隊匯聚了一批國內外優(yōu)秀的基因組學實驗和生物信息分析研究人員,。 科技服務部依托公司先進的自動化建庫儀,、高通量測序儀等實驗設備,提供多種測序服務,;憑借強大的科研團隊,,為高校、科研院所等研究單位提供領先的生物信息分析服務,。主營業(yè)務包括DNA測序,、RNA測序、表觀組學測序,、單細胞測序,、ICELL8單細胞表達譜測序、芯片服務,、三代全長轉錄組測序等,。 健康|醫(yī)療|基因|科普 微分基因科技服務 記得這是一個有溫度的公眾號 |
|
來自: 昵稱41082923 > 《醫(yī)學》