下圖是一份微基因的基因檢測(cè)報(bào)告,,基于全基因組芯片分型原始檢測(cè)結(jié)果生成:
微基因檢測(cè)報(bào)告圖示,,點(diǎn)擊跳轉(zhuǎn)示例報(bào)告頁面 那么,如何科學(xué)的把原始數(shù)據(jù)中這些 ACGT 文件,變成一份解讀報(bào)告呢,? 微基因十大類檢測(cè)項(xiàng)目一覽,,含 500+ 項(xiàng)解讀報(bào)告 先來說說,,在一個(gè)人的基因組中,,22 對(duì)是常染色體;還有一對(duì)性染色體,,比如男性性染色分別編號(hào)為 X 和 Y,,以及細(xì)胞核外的線粒體。 而細(xì)胞核里的染色體,,最重要的部分是纏繞折疊的一個(gè)巨大的 DNA 分子,。 DNA 由 ACGT 四種堿基組成;這四種堿基通過 A 和 T 互補(bǔ),,C 和 G 互補(bǔ),,形成堿基對(duì),然后連接成我們熟知的雙螺旋結(jié)構(gòu),。 在最長的 1 號(hào)染色體中,,超過兩億四千九百萬個(gè)堿基對(duì),形成了一個(gè)超龐大的 DNA 分子,。 把單個(gè)細(xì)胞核中的 46 個(gè) DNA 分子連接起來,,總長度能達(dá)到 2 米左右。 一個(gè)人體內(nèi)約有 50 萬億個(gè)細(xì)胞,,每個(gè)細(xì)胞擁有幾乎相同的 DNA 拷貝,,總長度可以超過 1000 億千米。這個(gè)長度比太陽到冥王星距離(半長軸)的 20 倍還多,。 這些 DNA 分子,,其中大約只有 2% 的片段會(huì)直接編碼信使 RNA,進(jìn)而可以轉(zhuǎn)錄翻譯成蛋白質(zhì),,這樣的區(qū)域一般被稱為基因,。 剩下 98% 的 DNA,在過去被認(rèn)為是「垃圾 DNA」,,最近被發(fā)現(xiàn)也能轉(zhuǎn)錄成非編碼 RNA,,并且對(duì)其他基因表達(dá)的調(diào)控起重要作用。 人類 DNA 有 99% 左右是完全一致的,,這部分決定了我們?yōu)槭裁词侵绷⑿凶叩娜祟悺?span style="margin: 0px;padding: 0px;outline-style: initial;outline-width: 0px;max-width: 100%;color: rgb(79, 177, 247);box-sizing: border-box ;overflow-wrap: break-word ;">剩下的 1% 的變異,,塑造了人類膚色、血型,、食物偏好甚至是性格特征的多樣性,。 在 DNA 變異中,最常見的是單核苷酸變異,,其中變異頻率超過 1% 的,,被稱為 SNP(Single-Nucleotide Polymorphism)——單核苷酸多態(tài)性,。 舉個(gè)例子,位于 12 號(hào)染色體上的乙醛脫氫酶 ALDH2 基因上的 SNP 位點(diǎn)——rs671,,如果是 G-C,,G-C 組合,代謝乙醛的酶活性很強(qiáng),,喝酒就不會(huì)臉紅,。 而如果是 A-T,A-T 組合,,不僅會(huì)喝酒臉紅,,乙醛積累導(dǎo)致的毒性還會(huì)增加食管癌、膀胱癌,、結(jié)直腸癌,、動(dòng)脈粥樣硬化等疾病風(fēng)險(xiǎn)。 ALDH2 基因的 rs671 位點(diǎn)如何致使動(dòng)脈粥樣硬化|doi.org/10.1172/JCI125433 這些 SNP 靠基因變異出現(xiàn),,然后在自然選擇的壓力下,,有優(yōu)勢(shì)的變異越來越多,而不適合環(huán)境的變異越來越少,。 要解讀一份基因組數(shù)據(jù),,就得先了解這些 SNP 影響的方面,以及影響的大小,,這一般被稱為位點(diǎn)的效應(yīng)量(Effect size),。 在遺傳相關(guān)的疾病方面,科學(xué)家們總結(jié)了 SNP 的頻率和影響的關(guān)系:一個(gè) SNP 造成影響越大,,疾病越嚴(yán)重,,就越會(huì)被自然選擇清除,頻率也就越低,。 對(duì)應(yīng)圖里的這個(gè)部分,。這類疾病一個(gè)變異就決定了生病與否,這樣的變異遺傳過程中符合孟德爾遺傳規(guī)律,,因此也被叫做「孟德爾疾?。∕endelian Disease)」。 像苯丙酮尿癥(Phenylketonuria,,PKU)就比較典型,,出生 3 個(gè)月后的患者,尿液,、汗液中會(huì)散發(fā)出鼠臭味,,隨之出現(xiàn)智能和語言發(fā)育障礙,患者必須限制苯丙氨酸的攝入量。 這個(gè)疾病是由 PAH 基因變異導(dǎo)致的,,發(fā)病率不足萬分之一,,是名副其實(shí)的「罕見病」。 而常見的疾病,,遺傳模式一般就不是孟德爾疾病式的了,。比如抑郁癥、高血壓這種有明確遺傳因素的疾病,,卻沒有明確一一對(duì)應(yīng)的致病基因,。 對(duì)應(yīng)了圖里的這個(gè)部分,是一系列高頻率,,低影響的 SNP 決定了這類疾病的遺傳風(fēng)險(xiǎn)。 基于常見疾病-常見變異(Common disease-Common variant)假設(shè),,科學(xué)家們使用一種叫做全基因組關(guān)聯(lián)分析(Genome-Wide Association Study),,也就是 GWAS 的方法,來發(fā)現(xiàn)常見疾病的遺傳相關(guān) SNP,。 在 2019 年發(fā)表的一項(xiàng)研究中,,研究者共納入了 24.6 萬郁抑癥患者,并把他們的基因組和另外 56.1 萬非抑郁癥患者比較,。 結(jié)果發(fā)現(xiàn),,基因組上從 1 號(hào)染色體到 22 號(hào)染色體,都有和抑郁癥風(fēng)險(xiǎn)顯著相關(guān)的 SNP,,總共有超過 102 個(gè)互相不連鎖的變異被發(fā)現(xiàn): 目前主流的商業(yè)檢測(cè)芯片,,比如基因檢測(cè)行業(yè)巨頭 illumina 的 GSA、CGA 等芯片版本,,一般能檢測(cè) 75 萬個(gè) SNP,。 而利用剛才提到的 GWAS 研究結(jié)果預(yù)測(cè)抑郁癥風(fēng)險(xiǎn),則至少需要知道這 102 個(gè)位點(diǎn)的基因型,,其中很大一部分并不在這些芯片檢測(cè)的 75 萬 SNP 中,。 這個(gè)問題可以通過基因型填補(bǔ)(Genotype Imputation)的算法解決。 舉個(gè)例子,,假設(shè)張三(A),,有個(gè)女朋友王五(C)喜歡逛街,有個(gè)死黨李四(G)喜歡電競(jìng),;如果我們發(fā)現(xiàn)張三在化妝品店,,那可以推測(cè)他邊上的人更可能是王五。 而如果我們發(fā)現(xiàn)張三在網(wǎng)吧,,那他邊上更可能出現(xiàn)李四,。 而基因組也有類似的特性,SNP 和 SNP 之間在不同的位置也有親疏關(guān)系,被稱為連鎖不平衡(Linkage Disequilibrium, LD),。 利用 SNP 之間的連鎖關(guān)系形成的概率分布,,通過隱馬爾科夫模型(Hidden Markov Model, HMM)的算法,結(jié)合海量群體基因組的數(shù)據(jù),,就可以用于推算個(gè)體未檢測(cè)部分的 SNP 基因型了,。 利用這套算法,微基因使用其定制的 CGA 芯片,,可以準(zhǔn)確推算出超過 2300 萬 SNP 位點(diǎn),,提供更全面的疾病風(fēng)險(xiǎn)預(yù)測(cè)。 比如,,微基因的「抑郁癥」項(xiàng)目在 2020 年更新后,,使用了 126 個(gè) SNP 來預(yù)測(cè)遺傳風(fēng)險(xiǎn)。 但是隱馬爾科夫算法的計(jì)算,,需要消耗大量的計(jì)算資源,;所以大部分基因檢測(cè)公司都不愿意提升成本來進(jìn)行基因型填補(bǔ),而只是用一兩個(gè)直接檢測(cè)的 SNP 給出結(jié)果,,這也是不同機(jī)構(gòu)的基因檢測(cè)報(bào)告結(jié)果差異很大的原因之一,。 比起市面上很多基因檢測(cè)公司,微基因不光提供了多達(dá) 500+ 項(xiàng)的報(bào)告解讀,,也在持續(xù)不斷增加解讀位點(diǎn),,為大家?guī)砀娴慕庾x服務(wù)。 以微基因「2 型糖尿病」項(xiàng)目為例,,報(bào)告隨研究不斷更新 GWAS 第一篇成功的研究,,是 2005 年的老年性黃斑病變研究;自此之后,,GWAS 的研究成果越來越豐富,。 感興趣的朋友,可以在 GWAS Catalog 網(wǎng)站找到截至目前的相關(guān)研究匯總,。 得益于微基因的 CGA 芯片設(shè)計(jì),,以及基因型填補(bǔ)技術(shù),微基因可以持續(xù)追蹤最新的科學(xué)研究發(fā)現(xiàn),。 從 2016 年成立至今,,微基因提供的檢測(cè)項(xiàng)目從原來不足 200 項(xiàng),到至今超過 500 個(gè)項(xiàng)目,,平均年化增速達(dá)到 27.7%,。 從 1ml 口水到最終拿到的報(bào)告,用戶可以在微基因的專業(yè)解讀里了解到包括「健康風(fēng)險(xiǎn)」,、「藥物指南」,、「遺傳特質(zhì)」等 10 大項(xiàng)目,,500+ 項(xiàng)報(bào)告。
|