簡介 Genome Aggregation Database(簡稱gnomAD)是由各國研究者聯(lián)合發(fā)展起來的基因組突變頻率數據庫。其目的是匯集和協(xié)調來自眾多大規(guī)模測序計劃的全外顯子組和全基因組測序數據,,為廣泛的科學研究團體匯總數據,。 該數據庫提供的數據集包括123,136個個體的全外顯子組測序數據和15,496個個體的全基因組測序數據,這些數據來源于各種疾病研究項目及大型人群測序項目,。 左側的圖表對1000Genomes,、ESP、ExAC和gnomAD數據庫收集的人群分布及其數量進行了比較統(tǒng)計,,不難發(fā)現gnomAD是目前最大的人群頻率數據庫,。右表對gnomAD數據庫收錄的人種類型及測序數據進行了分類統(tǒng)計。該數據庫所有的數據都可免費下載,。 數據庫使用 通過gnomAD瀏覽器,,我們可以在搜索框中輸入自己感興趣的基因、變異或者區(qū)域進行相關信息的查詢 例如以ACTN2基因進行查詢: 可以獲取基因上每個位點的覆蓋信息圖,,其中全基因組數據的測序深度用綠線表示,,外顯子數據深度為藍色部分。變異注釋表格記錄了變異位點,,來源,,注釋信息,變異flags,,變異等位基因數,,等位基因總數,等位基因頻率等信息,。通過復選框我們也可以選擇特異的數據進行展示,,用戶可以選擇包括或排除SNPs、indels,、外顯子組變異,、基因組變異及被過濾掉的變異,。 需要注意的是該數據庫展示的等位基因數默認是只計數了高質量的基因型,即通過了設定的閾值(GQ>=20,DP>=10,,雜合基因型allele balance > 0.2)的,,原始的等位基因數可通過AC_raw查看。另外在全基因組數據中沒有Y染色體的覆蓋度及變異信息提供,,也無法通過該數據庫獲取每個測序個體的基因型信息,。 數據下載 可通過鏈接http://gnomad./downloads 進行全外顯子組,全基因組變異vcf文件及覆蓋度數據的下載,。 Annovar中也于2017年3月11日更新了該數據庫,,可利用該軟件對gnomAD數據庫進行下載注釋。 由于該數據庫去除了攜帶有嚴重兒童疾病的患者及其父母的基因組數據,,可以很好的應用于單基因遺傳病人群頻率的查詢,。對于評估罕見位點的致病性,如果某位點在該數據庫未見報道,,則致病幾率增大,。 gnomAD數據庫網址:http://gnomad./ 參考資料:https:///2017/02/27/the-genome-aggregation-database-gnomad/ 遺傳資源數據庫專題 |
|