作者:閔 隨著NGS二代測序技術在非小細胞肺癌,、乳腺癌等癌種的日常診療中應用越來越普遍,,越來越多的病友開始學習了解這項基因檢測技術,,并對一些技術參數很好奇,。 不少基因檢測的宣傳中經常提及測序深度高、血液檢測準,,無形中讓很多病人產生了“測序深度高=檢測技術好=能檢測的突變多=血液一定準”的概念,。那么真相是否是這樣呢? 認識NGS二代測序 NGS二代測序是現在使用最為普遍的基因檢測技術,,所謂“測序”通俗來說就是搞清楚目標基因的堿基(ATCG)排列順序,。目前市面上常用的二代測序儀大多為Illumina公司生產,也有部分為ABI公司或者華大自主研發(fā)生產的,,不同公司的具體檢測原理略有區(qū)別,,但步驟大體上還是分為: 1、建庫 2,、擴增 3,、測序 我們常說的各種基因實際上是完整DNA鏈上的某一段具有實際意義的堿基序列,它們與很多冗余無意義的堿基對首尾相連共同組成了遺傳物質DNA,。 DNA與基因的長度是通過堿基對多少來衡量,,一個堿基即為1bp(各位可以想象成長度單位1cm等等),通常一個基因的長度都在幾千個bp,。 二代測序的具體流程,,簡單來說就是先通過試劑將提取好的待檢測完整DNA打斷成長度較短(200bp - 500bp)的DNA鏈,再利用PCR技術將這些較短的DNA鏈數量增加,,接著通過各自的特有方式分析前面所得全部DNA鏈的具體堿基排布(即測序),,最后使用生物信息分析工具將所得信息匯總拼接得出待檢測目標基因的狀態(tài),比如突變與否,、哪個位點發(fā)生突變,。 什么是測序深度 測序深度是NGS技術特有的一個技術參數,,指測序得到的堿基總量(bp)與目標基因組大小(Genome)的比值,由reads數量乘以reads長度再除以目標基因組量計算得到,。 舉個例子,,比如某次檢測產生10000條reads,讀長150bp,,而目標基因總長為20000bp,,那么測序深度就是10000*150/20000=75X。 reads長度簡單來說就是測序儀閱讀的長度,,以illumina nextseq500型號為例,,讀長一般為75bp或150bp;reads數量可以理解為讀取的次數,,比如目標DNA被打斷成500bp的短鏈,,最少需要讀取3條才能覆蓋,也有可能出現重疊部分,,導致讀取條數增加,,總之讀取條數越多越有把握覆蓋目標DNA鏈。 決定測序深度的關鍵在于reads的數量與長度,,不同的二代測序設備的讀長有不同,,但reads數量可根據需要自行調整,換句話說,,較高的測序深度并非某設備,、某檢測公司獨有,各個二代測序儀可以自行調整需要的測序深度,。 提升測序深度帶來的一些討論 1,、不同樣本需要的測序深度不同 常用的基因檢測標本分為組織樣本(FFPE)與血液樣本(ctDNA)兩大類,兩者之間優(yōu)先選擇誰的討論已經很多,,這里不再贅述,,也暫時不討論能否做病理診斷而給兩者帶來的差異。 從檢測技術角度來看,,FFPE樣本與ctDNA樣本最大的區(qū)別在于所提取到的DNA總量,。通常情況下FFPE樣本中提取到的樣本至少應在250ng以上才算合格,而ctDNA樣本的DNA總量則應在30ng以上,。 由于兩種樣本能夠提取到的DNA總量差異很大,,因此實際檢測過程中所需要的測序深度也有差異,通常情況下FFPE樣本只需要2000-5000x即可,,而ctDNA樣本則需要10000x上下,,簡單點說就是能夠提取到的DNA總量足夠多就不需要太高的測序深度。 2、提升測序深度可以提升檢測靈敏度 和特異性,,但存在檢測極限 根據測序深度的定義及計算方法,,我們可以認為測序深度越高,測序量越大,,相應的每一個堿基被讀取到的次數就越多,,那么理論上發(fā)現位點突變的可能性就變大,因此提升測序深度有助于提升檢測的靈敏度與特異性,。 然而這種檢測覆蓋存在上限,,當測序深度達到一定程度后,reads足夠多,,待檢測目標基因的每個堿基都至少被讀取一次甚至更多次,,此時再增加測序深度對于靈敏度及特異性提升不明顯。 2022年由赫捷教授與高樹庚教授領銜發(fā)表了一項研究 [1],,納入了292例I期的肺腺癌患者以及230例健康人群作為對照,,采用全基因組測序[注]。研究比較了從0.5x到4x等不同測序深度下,,靈敏度與特異性的差異,,可以看到隨著測序深度提升到2X以上時,靈敏度與特異性的AUC曲線提升就不顯著了,。 注:該研究采用的測序Panel為全基因組測序,,自身Panel大小遠高于平時各位接觸到的“靶向套餐”與“全基因套餐”,,因此根據公式計算得到的測序深度看起來不高,,實際測序數據量很大。 3,、測序深度升高能增加 檢測出基因突變的概率嗎,? 前面提到當接近檢測極限時,增加測序深度對于提升檢測靈敏度及特異性的幫助有限,,繼續(xù)盲目提升測序深度會產生的大量PCR及讀取數據反而可能會引入低頻率的假陽性突變,。 未加特殊糾錯處理的常規(guī)情況下,ctDNA樣本的測序深度一般控制在5000x-10000x左右,,最低的檢測限約在0.5%-1%,,即突變頻率(即“豐度”)在此以上的基因突變基本都可以檢測到。 在這基礎上提升測序深度則可能由于冗余擴增導致低頻的假陽性結果[2,、3],,讀取到極低頻率的非源自于原始DNA樣本的突變。 為了減少讀取錯誤,,可以在測序過程中加入單分子標簽(UMI,,一種減弱低頻假陽性干擾的糾錯方式,不局限于特定二代測序儀)。加入UMI之后,,為滿足糾錯目的,,通常需要將測序深度提升到20000x以上,可將最低檢測限提升至0.01%,。 從結果來看,,提升測序深度確實能夠增加檢測到低頻(低于0.5%)突變的可能,即混在樣本中的含量偏低的突變基因也有可能被檢測到,,但也給我們帶來一個困惑——這些低頻突變中即使有諸如EGFR等驅動基因是否能夠指導治療,?(注:即有可能檢測到的低頻驅動基因點突變也是假陽性) 另外由于加入UMI的同時會增加檢測成本,因此一般選擇100個基因左右或以下的小Panel,,大Panel出于成本考慮及檢測數據量考慮,,通常不會添加UMI。 4,、測序深度達到30000x以上是否就能完全 克服血液假陰性導致的漏檢現象,? 關于這個問題,我在之前一篇MRD的討論中舉過例子,。(詳情請點擊文章閱讀《MRD≈血液基因檢測,?》) 2021年由高樹庚教授團隊發(fā)表了一篇MRD預測術后輔助治療收益的研究,研究中采用138個基因的Panel,,測序深度達30000x,。 該研究的補充材料統計共89名患者接受了術前血檢測與術后組織樣本檢測,其中有28名患者術前血液檢測為陰性,,然而這28名術前MRD陰性的患者中僅1人術后組織標本檢測確實沒有發(fā)現突變,,即剩下27名患者經手術樣本確認存在基因突變,但術前血液卻發(fā)生了漏檢,。 這樣的結果也提示,,即便測序深度達到30000x,能夠檢測到豐度0.02%的低頻突變,,也無法完全克服血液的假陰性漏檢問題,。 總結 測序深度是NGS檢測技術中一個常見的技術參數,定義為測序得到的堿基總量(bp)與目標基因組大小(Genome)的比值,,測序深度越高,,待檢測DNA中每個堿基被讀取到的次數就越多。 我們需要認識以下4點:
簡單來說就是一句話,,測序深度并非越高越好,,要根據樣本、檢測技術以及檢測目的選擇,。 |
|