久久国产成人av_抖音国产毛片_a片网站免费观看_A片无码播放手机在线观看,色五月在线观看,亚洲精品m在线观看,女人自慰的免费网址,悠悠在线观看精品视频,一级日本片免费的,亚洲精品久,国产精品成人久久久久久久

分享

COSMIC遺傳資源數(shù)據(jù)庫

 生物_醫(yī)藥_科研 2018-12-10

COSMIC遺傳資源數(shù)據(jù)庫

1.簡介


COSMIC是一個在人類癌癥中發(fā)現(xiàn)的體細胞獲得性突變的在線數(shù)據(jù)庫,。體細胞突變是在非生殖細胞中發(fā)生的,不是由兒童遺傳的,。 COSMIC是癌癥中體細胞突變目錄(Catalogue Of Somatic Mutations In Cancer)的首字母縮寫,,它從科學(xué)文獻中的論文和桑格研究所癌癥基因組計劃的大規(guī)模實驗篩選中提取數(shù)據(jù)。該數(shù)據(jù)庫可供學(xué)術(shù)研究人員免費使用,,并可向其他人商業(yè)許可,。

COSMIC數(shù)據(jù)庫旨在收集和顯示有關(guān)癌癥體細胞突變的信息。它于2004年推出,,僅有四種基因HRAS,,KRAS2,,NRAS和BRAF的數(shù)據(jù)。已知這四種基因在癌癥中是體細胞突變的,。自創(chuàng)建以來,,數(shù)據(jù)庫迅速擴展。到2005年,,COSMIC包含從115,327個腫瘤中篩選出的529個基因,,描述了20,981個突變。到2009年8月,,它包含了150萬次實驗的信息,,包括近370,000個腫瘤中的13,423個基因,并描述了超過90,000個突變,。2010年7月發(fā)布的COSMIC第48版,,與國際癌癥研究機構(gòu)合作,整合了p53的突變數(shù)據(jù),。此外,,它還為最新的人類參考基因組構(gòu)建提供了更新的基因坐標。以后每 3 個月更新一次,。

該網(wǎng)站專注于以圖形方式呈現(xiàn)復(fù)雜的表型特異性突變數(shù)據(jù),。數(shù)據(jù)取自選定的基因,最初在癌癥基因普查中,,以及PubMed的文獻檢索,。

可以通過選擇基因或癌癥組織類型(表型)來訪問數(shù)據(jù),使用按功能瀏覽或搜索框,。結(jié)果顯示具有突變計數(shù)和頻率的摘要信息,。基因摘要頁面提供了突變譜圖和外部資源;表型(組織)摘要頁面提供了突變基因的列表,。

COSMIC數(shù)據(jù)庫包含數(shù)千種與癌癥發(fā)展有關(guān)的體細胞突變,。該數(shù)據(jù)庫從兩個主要來源收集信息:

  • (1)從文獻中收集已知癌癥基因的突變。經(jīng)歷人工治療的基因列表通過它們在癌癥基因普查中的存在來確定,。

  • (2)納入數(shù)據(jù)庫的數(shù)據(jù)來自癌癥基因組計劃進行的癌癥樣本的全基因組重測序研究,。

image

CDKN2A_COSMIC_histogram.png

2.數(shù)據(jù)庫介紹


網(wǎng)址如下:https://cancer./cosmic/

網(wǎng)站首頁

最新版本為v87,更新與2018年11月13日。

核心板塊

2.1 COSMIC


網(wǎng)址:https://cancer./cosmic
整個網(wǎng)站的核心,,癌癥相關(guān)的體細胞突變數(shù)據(jù),。


2.2 Cell Lines Project

網(wǎng)址:https://cancer./cell_lines
Cell Lines Project 是對最常使用的 1000 多種腫瘤細胞系的深入分析的數(shù)據(jù),而標準的 COSMIC 版本中,,包含的數(shù)據(jù)更多,,但是分析沒有 Cell Lines Project 深入,可以理解為網(wǎng)站的兩種模式,。


2.3 COSMIC-3D

網(wǎng)址:https://cancer./cosmic3d/
通過交互式的網(wǎng)頁,,展現(xiàn)了基因突變導(dǎo)致的蛋白結(jié)構(gòu)域的變化,。在搜索框中輸入一個具體的基因名稱或者蛋白名稱,可以查看具體的記錄,。

EGFR示例

▲ 這個功能超級好玩,!可以看蛋白質(zhì)的三維結(jié)構(gòu),可以放大,,縮小,,旋轉(zhuǎn),截圖……

EGFR示例

▲ 繼續(xù)往下拉,,可以看到各種錯義突變的位置,,炫酷的是,右上角的蛋白結(jié)構(gòu)還在轉(zhuǎn)個不停
還可以預(yù)測小分子結(jié)合位點,,也可直接轉(zhuǎn)至PDB詳細查看


2.4 Cancer Gene Census


Cancer Gene Census首頁

網(wǎng)址: https://cancer./census
在癌癥研究中,找到相關(guān)的突變基因是最核心的目的之一,。通過對各種癌癥進行調(diào)研,,整理了一份癌癥相關(guān)的突變基因列表,這份列表就是Cancer Gene Census,簡稱CGC,。這里又分為三個子菜單 Census,、Breakdown(統(tǒng)計分析)、Abbreviations,,其中 Census 菜單,,顯示目前所有的癌基因,而且這個數(shù)據(jù)表可以搜索,,導(dǎo)出(需要先注冊),。

CGC種,將所有的癌癥相關(guān)基因分成兩類

  • (1)Tier1
    基因必須具有與癌癥相關(guān)的記錄活動,,以及癌癥突變的證據(jù),,其以促進致癌轉(zhuǎn)化的方式改變基因產(chǎn)物的活性。

  • (2) Tier2
    包含具有癌癥作用的強烈跡象但具有較少廣泛可用證據(jù)的基因,。只能說在癌癥中檢測到了大量該基因的突變,,但是并沒有充分證據(jù)表明該基因突變對癌癥發(fā)生的影響。

image

CGC的完整列表

導(dǎo)出的格式有CSV和TSV


2.4.1 Census

以 DNMT3A 為例,,點擊基因名,,可以進入詳細的頁面:

▲最右邊的灰色條可上下拉動,以控制頁面中峰的顯示幅度,。鼠標落在一個突位點上,,顯示該突變點的位置以及突變數(shù)。

▲根據(jù)結(jié)構(gòu)信息,,分析該突變位點是否落在具有功能的結(jié)構(gòu)域,。

其他的功能,,比如Tissue、Distribution,、Drug Resistance,、Variant 等也非常重要,這里不逐一介紹,。


2.4.2 Breakdown(統(tǒng)計分析)

▲這里是對所有癌細胞中的突變進行了整理


2.4.3 Abbreviations:對表格中的縮寫進行解釋,。


2.5 Drug Sensitivity


▲鑒定腫瘤的分子特征,預(yù)測抗腫瘤藥物的響應(yīng)

這里主要包括 Compound,、Cancer Feature,、Cell Line 三種數(shù)據(jù)。

▲一共有265個小分子化合物,,可以靶向不同的癌基因和信號通路


2.6 Mutational Signatures(突變特征)

導(dǎo)致體細胞突變的原因很多,,比如 DNA 復(fù)制的失真、暴露到內(nèi)源性或外源性的誘變源,、 DNA 酶修飾,、DNA修 復(fù)的缺陷。不同的突變過程會產(chǎn)生不同的突變組合,,這里定義為“突變特征”,。在癌癥中,突變位點是非常多,。研究人員提出了Mutational Signatures這個概念,,突變的特征集合,共劃分了96種突變類型,,首先根據(jù)堿基突變的類型,,有C>A, C>G, C>T, T>A, T>C, T>G共6種基本類型,然后在考慮突變位點上有和下游的1個堿基,,每個堿基有A,T,C,G 4種可能的情況,,一共就有6X4X4 = 96 種突變類型。

不同癌癥中這96種突變類型出現(xiàn)的頻率有所不同,,將96種突變類型的頻率結(jié)合起來,,可以作為一種固定的突變模式,用來表征某一類癌癥,。

image

▲Cosmic基于10952給外顯子和1048個全基因組數(shù)據(jù),,總結(jié)出了 30 種“突變特征”


2.7 Tools

Tools 中主要包括 Cancer Browser、Genome Browser,、CONAN,、Beacon

  • (1)Cancer Browser

通過不同的組織來查看相關(guān)類型的癌癥,更加的直觀方便,。

  • (2) Genome Broswer基因組瀏覽器

image

  • (3) CONAN
    copy nunber analysis, 查詢拷貝數(shù)變異的工具,。
    ▲這里需要輸入基因名稱或基因區(qū)間

  • (4) GA4GH Beacon Query

一個API工具,,可以快速查詢COSMIC數(shù)據(jù)庫中某個突變是否存在。返回JSON格式的數(shù)據(jù),,

image


3.數(shù)據(jù)下載

網(wǎng)址:https://cancer./cell_lines/download
可下載內(nèi)容:

Complete mutation data
Copy Number Data
PICNIC Average Ploidies
Gene Expression
Non coding variants
Raw Gene Expression
VCF files (coding and non-coding mutations)
QC
Sequence Coverage Statistics
Genotypes
Fasta File (genes)
Oracle Database Dump

下載時需要登陸的,,而且部分數(shù)據(jù)只對大學(xué)和非盈利機構(gòu)的用戶公開。



    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,,所有內(nèi)容均由用戶發(fā)布,,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式,、誘導(dǎo)購買等信息,,謹防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,,請點擊一鍵舉報,。
    轉(zhuǎn)藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多