COSMIC遺傳資源數(shù)據(jù)庫 1.簡介COSMIC是一個在人類癌癥中發(fā)現(xiàn)的體細胞獲得性突變的在線數(shù)據(jù)庫,。體細胞突變是在非生殖細胞中發(fā)生的,不是由兒童遺傳的,。 COSMIC是癌癥中體細胞突變目錄(Catalogue Of Somatic Mutations In Cancer)的首字母縮寫,,它從科學(xué)文獻中的論文和桑格研究所癌癥基因組計劃的大規(guī)模實驗篩選中提取數(shù)據(jù)。該數(shù)據(jù)庫可供學(xué)術(shù)研究人員免費使用,,并可向其他人商業(yè)許可,。 COSMIC數(shù)據(jù)庫旨在收集和顯示有關(guān)癌癥體細胞突變的信息。它于2004年推出,,僅有四種基因HRAS,,KRAS2,,NRAS和BRAF的數(shù)據(jù)。已知這四種基因在癌癥中是體細胞突變的,。自創(chuàng)建以來,,數(shù)據(jù)庫迅速擴展。到2005年,,COSMIC包含從115,327個腫瘤中篩選出的529個基因,,描述了20,981個突變。到2009年8月,,它包含了150萬次實驗的信息,,包括近370,000個腫瘤中的13,423個基因,并描述了超過90,000個突變,。2010年7月發(fā)布的COSMIC第48版,,與國際癌癥研究機構(gòu)合作,整合了p53的突變數(shù)據(jù),。此外,,它還為最新的人類參考基因組構(gòu)建提供了更新的基因坐標。以后每 3 個月更新一次,。 該網(wǎng)站專注于以圖形方式呈現(xiàn)復(fù)雜的表型特異性突變數(shù)據(jù),。數(shù)據(jù)取自選定的基因,最初在癌癥基因普查中,,以及PubMed的文獻檢索,。 可以通過選擇基因或癌癥組織類型(表型)來訪問數(shù)據(jù),使用按功能瀏覽或搜索框,。結(jié)果顯示具有突變計數(shù)和頻率的摘要信息,。基因摘要頁面提供了突變譜圖和外部資源;表型(組織)摘要頁面提供了突變基因的列表,。 COSMIC數(shù)據(jù)庫包含數(shù)千種與癌癥發(fā)展有關(guān)的體細胞突變,。該數(shù)據(jù)庫從兩個主要來源收集信息:
image CDKN2A_COSMIC_histogram.png 2.數(shù)據(jù)庫介紹網(wǎng)址如下:https://cancer./cosmic/ 網(wǎng)站首頁 最新版本為v87,更新與2018年11月13日。 核心板塊 2.1 COSMIC網(wǎng)址:https://cancer./cosmic 2.2 Cell Lines Project網(wǎng)址:https://cancer./cell_lines 2.3 COSMIC-3D網(wǎng)址:https://cancer./cosmic3d/ EGFR示例 ▲ 這個功能超級好玩,!可以看蛋白質(zhì)的三維結(jié)構(gòu),可以放大,,縮小,,旋轉(zhuǎn),截圖…… EGFR示例 ▲ 繼續(xù)往下拉,,可以看到各種錯義突變的位置,,炫酷的是,右上角的蛋白結(jié)構(gòu)還在轉(zhuǎn)個不停 2.4 Cancer Gene CensusCancer Gene Census首頁 網(wǎng)址: https://cancer./census 在CGC種,將所有的癌癥相關(guān)基因分成兩類
image CGC的完整列表 導(dǎo)出的格式有CSV和TSV 2.4.1 Census 以 DNMT3A 為例,,點擊基因名,,可以進入詳細的頁面: ▲最右邊的灰色條可上下拉動,以控制頁面中峰的顯示幅度,。鼠標落在一個突位點上,,顯示該突變點的位置以及突變數(shù)。 ▲根據(jù)結(jié)構(gòu)信息,,分析該突變位點是否落在具有功能的結(jié)構(gòu)域,。 其他的功能,,比如Tissue、Distribution,、Drug Resistance,、Variant 等也非常重要,這里不逐一介紹,。 2.4.2 Breakdown(統(tǒng)計分析) ▲這里是對所有癌細胞中的突變進行了整理 2.4.3 Abbreviations:對表格中的縮寫進行解釋,。 2.5 Drug Sensitivity▲鑒定腫瘤的分子特征,預(yù)測抗腫瘤藥物的響應(yīng) 這里主要包括 Compound,、Cancer Feature,、Cell Line 三種數(shù)據(jù)。 ▲一共有265個小分子化合物,,可以靶向不同的癌基因和信號通路 2.6 Mutational Signatures(突變特征)導(dǎo)致體細胞突變的原因很多,,比如 DNA 復(fù)制的失真、暴露到內(nèi)源性或外源性的誘變源,、 DNA 酶修飾,、DNA修 復(fù)的缺陷。不同的突變過程會產(chǎn)生不同的突變組合,,這里定義為“突變特征”,。在癌癥中,突變位點是非常多,。研究人員提出了Mutational Signatures這個概念,,突變的特征集合,共劃分了96種突變類型,,首先根據(jù)堿基突變的類型,,有C>A, C>G, C>T, T>A, T>C, T>G共6種基本類型,然后在考慮突變位點上有和下游的1個堿基,,每個堿基有A,T,C,G 4種可能的情況,,一共就有6X4X4 = 96 種突變類型。 不同癌癥中這96種突變類型出現(xiàn)的頻率有所不同,,將96種突變類型的頻率結(jié)合起來,,可以作為一種固定的突變模式,用來表征某一類癌癥,。 image ▲Cosmic基于10952給外顯子和1048個全基因組數(shù)據(jù),,總結(jié)出了 30 種“突變特征” 2.7 ToolsTools 中主要包括 Cancer Browser、Genome Browser,、CONAN,、Beacon
通過不同的組織來查看相關(guān)類型的癌癥,更加的直觀方便,。
image
一個API工具,,可以快速查詢 image 3.數(shù)據(jù)下載網(wǎng)址:https://cancer./cell_lines/download
下載時需要登陸的,,而且部分數(shù)據(jù)只對大學(xué)和非盈利機構(gòu)的用戶公開。 |
|
來自: 生物_醫(yī)藥_科研 > 《軟件、包》