看起來(lái)確實(shí)是陷入了一個(gè)困局,而且很早之前我們也討論過(guò)這個(gè)話題,,并不是所有的批次效應(yīng)都可以被矯正,,因?yàn)槿绻轻槍?duì)生物學(xué)差異與批次效應(yīng)交叉的情況來(lái)去除批次效應(yīng),很簡(jiǎn)單的,,比如:
這個(gè)時(shí)候,,就可以使用 limma包 的 removeBatchEffect 函數(shù)或者 SVA(Surrogate Variable Analysis)包 的 ComBat 函數(shù),,把批次效應(yīng)去除掉,然后保留生物學(xué)差異供后續(xù)的差異分析。 但是如果你的實(shí)驗(yàn)設(shè)計(jì)是:
那我就只能奉勸你,,對(duì)這個(gè)數(shù)據(jù)集說(shuō)拜拜了,! 而提問(wèn)的小伙伴的南北不同地域的病人的微生物情況的差異就是這樣的,其實(shí)在實(shí)驗(yàn)設(shè)計(jì)之初就可以把南北地域 樣品放在不同實(shí)驗(yàn)室,,這樣可以一定程度抹除實(shí)驗(yàn)室差異但是保留地區(qū)差異,。這個(gè)方法稱為"交叉設(shè)計(jì)"或"交叉批次設(shè)計(jì)",它的基本思想是將不同地區(qū)的樣品均勻地分配到不同實(shí)驗(yàn)室,,以使實(shí)驗(yàn)室效應(yīng)在不同地區(qū)之間均勻分布,。這種設(shè)計(jì)的優(yōu)勢(shì)在于可以控制實(shí)驗(yàn)室效應(yīng),使得南北地域之間的差異更有可能反映地區(qū)特有的生物學(xué)差異,。然而,,需要注意的是,南北地域差異仍然可能受到實(shí)驗(yàn)室效應(yīng)的輕微影響,,因此在分析時(shí)仍然需要考慮實(shí)驗(yàn)室作為一個(gè)潛在的協(xié)變量,。在實(shí)施這種設(shè)計(jì)時(shí),需要格外注意確保樣品處理和測(cè)序的一致性,,以減小實(shí)驗(yàn)室效應(yīng)的影響,。此外,還需要在分析中考慮和控制其他可能的協(xié)變量,,如樣品處理時(shí)間,、測(cè)序批次等因素。 因?yàn)樘釂?wèn)者關(guān)心的是微生物數(shù)據(jù)的批次,,所以我沒(méi)有貿(mào)然插嘴,,畢竟我的經(jīng)驗(yàn)都是在轉(zhuǎn)錄組相關(guān)的,表達(dá)量芯片或者轉(zhuǎn)錄組測(cè)序數(shù)據(jù)處理,,詳見(jiàn): 而且現(xiàn)在絕大部分都是多個(gè)類似的數(shù)據(jù)集可以供找差異,,不一定要去批次,完全是可以各自內(nèi)部獨(dú)立處理后取交集或者其它統(tǒng)計(jì)學(xué)方法,,比如: 而且單細(xì)胞轉(zhuǎn)錄組又是另外一個(gè)情況,,每個(gè)樣品都是獨(dú)立的建庫(kù)測(cè)序本身就是一個(gè)批次,,這個(gè)時(shí)候我們可以叫做是去批次也可以叫做是多樣品整合: 如果大家感興趣這個(gè)微生物數(shù)據(jù)批次效應(yīng)處理會(huì)議本身是已經(jīng)是錯(cuò)過(guò)啦,,但是既然是生信半月談為公開(kāi)活動(dòng),而且騰訊會(huì)議是錄屏了的,,所以肯定是有回放?。?/p> 感興趣的小伙伴可以關(guān)注《BioLinkX》 團(tuán)隊(duì)公眾號(hào)哈,本次分享的錄屏?xí)谄鋌站發(fā)布,,敬請(qǐng)期待,!( https://space.bilibili.com/1672827724 ) 自我介紹王怡雯,副研究員,,碩士生導(dǎo)師,,中國(guó)農(nóng)業(yè)科學(xué)院農(nóng)業(yè)基因組研究所Pre-PI。2022年獲得墨爾本大學(xué)生物統(tǒng)計(jì)學(xué)博士學(xué)位,。研究專長(zhǎng)為針對(duì)生物學(xué)問(wèn)題分析和可視化數(shù)據(jù),,同時(shí)開(kāi)發(fā)針對(duì)微生物組數(shù)據(jù)分析的統(tǒng)計(jì)和計(jì)算方法,開(kāi)發(fā)了PLSDAbatch等算法軟件包,。以第一作者在Briefing in Bioinformatics,,Annals of the Rheumatic Diseases 等期刊發(fā)表學(xué)術(shù)論文多篇。主持中國(guó)農(nóng)業(yè)科學(xué)院博士后國(guó)際交流計(jì)劃引進(jìn)項(xiàng)目,、中國(guó)博士后科學(xué)基金站前特別資助,、面上項(xiàng)目、國(guó)家自然科學(xué)基金青年科學(xué)基金項(xiàng)目等基金,。 報(bào)告內(nèi)容
報(bào)告概要研究微生物組成和表型(包括人類疾?。┲g的聯(lián)系是微生物組研究的主要目標(biāo),例如,,腸道微生物群落的破壞與多種疾病和亞健康狀態(tài)有關(guān),,從炎癥性腸病、糖尿病,、到肥胖和營(yíng)養(yǎng)不良,。然而,由于微生物群落是高度動(dòng)態(tài)的,,因此微生物組數(shù)據(jù)極易受到批次效應(yīng)的影響,,批次效應(yīng)通常掩蓋了研究人員所感興趣的生物學(xué)效應(yīng)。因此,,處理批次效應(yīng)對(duì)于提高微生物組研究的有效性至關(guān)重要?,F(xiàn)有的批次效應(yīng)校正方法主要是為基因表達(dá)量數(shù)據(jù)開(kāi)發(fā)的,沒(méi)有考慮到微生物組數(shù)據(jù)的固有特征,包括零膨脹,、過(guò)度離散和變量之間的相關(guān)性,。我們開(kāi)發(fā)了一種基于偏最小二乘判別分析(PLSDA)的多元非參數(shù)批次效應(yīng)去除法,該算法在充分考慮上述微生物組數(shù)據(jù)的固有特征的前提下,,能在去除批次效應(yīng)的同時(shí)很好地保留實(shí)驗(yàn)組差異,,其延伸算法也可以應(yīng)對(duì)不平衡的實(shí)驗(yàn)設(shè)計(jì)和過(guò)擬合現(xiàn)象。 |
|