東方科技論壇第60次學(xué)術(shù)研討會(huì)于2005年7月2~3日在上海滬杏科技圖書館舉行。本次論壇由上海生物信息技術(shù)研究中心與復(fù)旦大學(xué)生命科學(xué)學(xué)院共同承辦,,論壇主題為"計(jì)算生物學(xué)最新進(jìn)展",。中科院上海生命科學(xué)研究院趙國(guó)屏研究員和新加坡國(guó)立大學(xué)計(jì)算科學(xué)系陳宇綜教授共同主持了會(huì)議。
一,、會(huì)議背景
隨著人類基因組計(jì)劃的實(shí)施和深入,,生物學(xué)數(shù)據(jù)積累出現(xiàn)了前所未有的飛躍。不僅數(shù)據(jù)量呈指數(shù)級(jí)增長(zhǎng),,而且,,數(shù)據(jù)的本質(zhì)出現(xiàn)了從生理生化數(shù)據(jù)向遺傳信息飛躍以及進(jìn)一步向遺傳與結(jié)構(gòu)功能相互關(guān)系信息的飛躍。這種科學(xué)數(shù)據(jù)的急速海量積累,,在人類的科學(xué)研究歷史中是空前的。如何從這些海量的生物學(xué)數(shù)據(jù)中提取有用的知識(shí),,成為了對(duì)當(dāng)前生物學(xué)家,、數(shù)學(xué)家,、計(jì)算機(jī)專家等的巨大挑戰(zhàn)。由此引出了一門新興學(xué)科:計(jì)算生物學(xué),。計(jì)算生物學(xué)是指開發(fā)和應(yīng)用數(shù)據(jù)分析及理論的方法,、數(shù)學(xué)建模和計(jì)算機(jī)仿真技術(shù),用于生物學(xué)研究的一門學(xué)科,。計(jì)算生物學(xué)正在成為現(xiàn)代生物學(xué)研究的核心方法之一,,它們的重要性和復(fù)雜性在當(dāng)前生物學(xué)數(shù)據(jù)量的不斷增長(zhǎng)中日益得以顯示,要回答的問題越是復(fù)雜就越顯得尤為突出,,使得計(jì)算生物學(xué)成為當(dāng)今生命科學(xué)最具活力的新興前沿學(xué)科之一,。計(jì)算生物學(xué)運(yùn)用大規(guī)模高效的理論模型和數(shù)值計(jì)算來識(shí)別基因組序列中代表蛋白質(zhì)的編碼區(qū),破譯隱藏在核酸序列中的遺傳語言規(guī)律,;直接從蛋白質(zhì)序列預(yù)測(cè)蛋白質(zhì)三維結(jié)構(gòu)以及動(dòng)力學(xué)特征,,研究生物大分子結(jié)構(gòu)與功能的關(guān)系、生物大分子之間相互作用以及生物大分子與配體的相互作用,,促進(jìn)蛋白質(zhì)工程,、蛋白質(zhì)設(shè)計(jì)和計(jì)算機(jī)輔助藥物設(shè)計(jì)的發(fā)展;同時(shí),,歸納,、整理與基因組遺傳語言信息釋放及其調(diào)控相關(guān)的轉(zhuǎn)錄譜和蛋白質(zhì)譜的數(shù)據(jù),模擬生命體內(nèi)的信息流過程,,從而認(rèn)識(shí)代謝,、發(fā)育、分化,、進(jìn)化的規(guī)律,,使從基因組科學(xué)新視角來探究人類健康和疾病各個(gè)方面,將人類基因組計(jì)劃的成功轉(zhuǎn)化為醫(yī)學(xué)領(lǐng)域的進(jìn)步成為可能,。
運(yùn)用計(jì)算生物學(xué),,科學(xué)家們有望鑒定基因和途徑在健康和疾病中的角色,挖掘它們與環(huán)境因素之間的關(guān)系,;發(fā)展,、評(píng)價(jià)以及應(yīng)用以基因組為基礎(chǔ)的診斷方法來預(yù)測(cè)對(duì)疾病的易感性,預(yù)測(cè)藥物反應(yīng),,疾病的早期診斷標(biāo)記,,疾病在分子水平上的發(fā)展機(jī)制;應(yīng)用基因組和代謝通路的知識(shí),,通過分子模擬等方法進(jìn)行計(jì)算機(jī)輔助藥物設(shè)計(jì),,縮短新藥開發(fā)周期,從而開發(fā)有效的,、新的疾病治療方法,;發(fā)展基于基因組的工具來改善大眾的健康狀況,,從而促進(jìn)人類基因組計(jì)劃造福于人類。
當(dāng)前,,計(jì)算生物學(xué)在國(guó)際上受到高度重視,。美國(guó)國(guó)立衛(wèi)生研究院(National Institutes of Health,NIH)是世界上從事生命科學(xué)研究最重要的研究機(jī)構(gòu),,它的年度預(yù)算占了美國(guó)政府科學(xué)投入的60%左右,。在人類基因組計(jì)劃的完成和后基因組時(shí)代的到來之際,NIH經(jīng)過與來自美國(guó)學(xué)術(shù)機(jī)構(gòu),、政府部門和私人團(tuán)體的300多名生物醫(yī)學(xué)權(quán)威人士長(zhǎng)達(dá)一年多時(shí)間的一系列討論,,于2003年形成了一個(gè)通向生命科學(xué)未來的"中長(zhǎng)期發(fā)展規(guī)劃"--國(guó)立衛(wèi)生研究院路線圖(NIH Roadmap)。NIH路線圖中啟動(dòng)了一個(gè)"生物信息學(xué)和計(jì)算生物學(xué)"計(jì)劃,,希望通過這個(gè)項(xiàng)目的實(shí)施而鋪設(shè)一條通向生命科學(xué)未來的"信息高速公路",。該項(xiàng)目計(jì)劃從2004年開始,建立數(shù)個(gè)"國(guó)立生物醫(yī)學(xué)計(jì)算中心"(National Centers for Biomedical Computing),,以便開發(fā)相關(guān)軟件和數(shù)據(jù)管理工具,。2003年,NIH下屬的國(guó)家人類基因組研究所(The National Human Genome Research Institute,,NHGRI)負(fù)責(zé)人在Nature上發(fā)表了題為"基因組學(xué)研究前景展望"的文章,。文章中所述的基因組研究展望來自上百位科學(xué)家和社會(huì)公眾,舉行了十幾場(chǎng)討論會(huì)和無數(shù)的與個(gè)人之間的探討,,歷經(jīng)近兩年的熱烈討論,。文章將對(duì)基因組研究的展望分為三個(gè)主題和六個(gè)橫切面,三個(gè)主題是:基因組學(xué)與生物學(xué),、基因組學(xué)與健康和基因組學(xué)與社會(huì),;六個(gè)橫切面是:資源、技術(shù)發(fā)展,、計(jì)算生物學(xué),、培訓(xùn)、倫理法律和社會(huì)應(yīng)用,以及教育,。六個(gè)重要橫切面與所有三個(gè)主題相關(guān),,而計(jì)算生物學(xué)是重要要成分之一。
在國(guó)內(nèi),,我國(guó)國(guó)家自然科學(xué)基金委員會(huì)將計(jì)算生物學(xué)作為重點(diǎn)資助的研究方向之一,。對(duì)于將生物醫(yī)藥產(chǎn)業(yè)作為重點(diǎn)發(fā)展高科技產(chǎn)業(yè)的上海市,對(duì)計(jì)算生物學(xué)研究更是高度重視,。2002年,,中科院上海藥物研究所與美國(guó)SGI計(jì)算機(jī)公司聯(lián)合建立的計(jì)算生物學(xué)實(shí)驗(yàn)室在上海藥物所揭牌成立。中科院和德國(guó)最大的研究機(jī)構(gòu)-馬克斯·普朗克學(xué)院合作,,籌劃在上海合作開展計(jì)算生物學(xué)研究,,且于2004年6月在中科院上海生命科學(xué)研究院舉行了計(jì)算生物學(xué)研究所成立籌備會(huì),。IBM是全球唯一一家能夠?qū)⑵鋵I(yè)研究技術(shù)應(yīng)用于計(jì)算生物學(xué)、并行計(jì)算的公司,。2002年,IBM與上海生物信息技術(shù)研究中心以及英國(guó)InforSense公司一起,,合作建立了高性能的生物科學(xué)研究實(shí)驗(yàn)室,,合作進(jìn)行計(jì)算生物學(xué)方面的研究和開發(fā)。因而,,在上海舉行計(jì)算生物學(xué)學(xué)術(shù)研討會(huì),,將促進(jìn)我市和我國(guó)對(duì)計(jì)算生物學(xué)這一前沿研究領(lǐng)域的更好發(fā)展,并對(duì)我市生物醫(yī)藥學(xué)產(chǎn)業(yè)的發(fā)展起到積極的推動(dòng)作用,。
由于分子模擬和計(jì)算機(jī)輔助藥物設(shè)計(jì)是當(dāng)前計(jì)算生物學(xué)中的熱點(diǎn)問題,,又是計(jì)算生物學(xué)與生物醫(yī)藥產(chǎn)業(yè)結(jié)合最緊密的方向,計(jì)算生物學(xué)在這些方面取得的進(jìn)展將直接推動(dòng)生物醫(yī)藥產(chǎn)業(yè)的發(fā)展,,因此,,本次會(huì)議將生物大分子計(jì)算模擬,計(jì)算機(jī)輔助藥物設(shè)計(jì)和計(jì)算生物學(xué)的發(fā)展及未來方向作為中心議題。
二,、會(huì)議簡(jiǎn)況
中科院上海分院院長(zhǎng),、上海市科協(xié)主席、東方科技論壇理事會(huì)副理事長(zhǎng),、著名核物理學(xué)家沈文慶院士出席了開幕式并講話,。他首先對(duì)本次論壇的召開表示熱烈祝賀,同時(shí)也對(duì)與會(huì)代表提出了殷切的希望,。沈院士肯定了東方科技論壇是上海地區(qū)具有重要影響的高層次論壇,,但也存在著一些需要改進(jìn)的地方,如減少偏多偏長(zhǎng)的報(bào)告,,增加與會(huì)代表討論的時(shí)間等,。他希望各位專家、代表能夠?yàn)槲覀兊纳霞?jí)領(lǐng)導(dǎo)和有關(guān)部門提出一些宏觀或具體的指導(dǎo)意見,,為本學(xué)科領(lǐng)域的未來發(fā)展闡明方向,;同時(shí)也要更加重視論壇每期簡(jiǎn)報(bào)的撰寫,使其真正成為具有實(shí)際指導(dǎo)意義的文件,。
會(huì)議執(zhí)行主席,、中科院上海生命科學(xué)研究院趙國(guó)屏教授接著講話。作為國(guó)內(nèi)生物信息學(xué)領(lǐng)域的先驅(qū)之一,,他回顧了計(jì)算生物學(xué)和生物信息學(xué)在上海的發(fā)展歷程,。他認(rèn)為,"九五"期間上海的計(jì)算生物學(xué)研究開始迅速發(fā)展,,進(jìn)入"十五"可以說更是突飛猛進(jìn),。中科院和德國(guó)最大的研究機(jī)構(gòu)--馬克斯·普朗克學(xué)會(huì)合作,,在上海聯(lián)合開展計(jì)算生物學(xué)研究,并且在中科院上海生命科學(xué)研究院成立了計(jì)算生物學(xué)研究所,。幾天之前,,上海市生物信息學(xué)會(huì)成立大會(huì)隆重舉行,標(biāo)志著上海地區(qū)生物信息學(xué)及計(jì)算生物學(xué)的發(fā)展進(jìn)入了一個(gè)嶄新的階段,。計(jì)算生物學(xué)的任務(wù)就是將生物學(xué)問題轉(zhuǎn)化為數(shù)學(xué)表達(dá),,其發(fā)展對(duì)醫(yī)藥產(chǎn)業(yè)至關(guān)重要。東方科技論壇是一個(gè)重要的學(xué)術(shù)交流和討論平臺(tái),,我們應(yīng)充分利用這一平臺(tái)來研討我們想要解決的問題,,學(xué)術(shù)討論與交流的內(nèi)容要與學(xué)科、產(chǎn)業(yè)及社會(huì)發(fā)展相結(jié)合,,同時(shí)要注意做好會(huì)后的總結(jié),,產(chǎn)生建議,并真正加以落實(shí),。
本次論壇另一位執(zhí)行主席,、新加坡國(guó)立大學(xué)計(jì)算科學(xué)系系主任陳宇綜教授作了主旨發(fā)言。他首先介紹了什么是計(jì)算生物學(xué),。國(guó)際上對(duì)計(jì)算生物學(xué)已經(jīng)有明確定義,,它系統(tǒng)發(fā)展并將計(jì)算系統(tǒng)和計(jì)算技術(shù)應(yīng)用于解決生命現(xiàn)象中的實(shí)際問題,是用高級(jí)計(jì)算方法來管理,、分析生物學(xué)數(shù)據(jù)并從中挖掘發(fā)現(xiàn)知識(shí)的一門學(xué)科,。他舉了兩個(gè)計(jì)算生物學(xué)的成功范例。一個(gè)是基因和蛋白質(zhì)序列分析工具BLAST,,其應(yīng)用之廣,、影響之大可以說是空前的,在10年的時(shí)間里該算法的引用率高達(dá)10萬多次,。另一個(gè)是HIV蛋白酶抑制劑的設(shè)計(jì),,全世界多家藥廠經(jīng)過多年的研發(fā)和篩選,現(xiàn)在已經(jīng)有Inverase,、Norvir,、Crixivan、Viracept等HIV蛋白酶抑制劑進(jìn)入市場(chǎng),,這背后蘊(yùn)涵了大量計(jì)算生物學(xué)家的工作,。總之,,計(jì)算生物學(xué)是一門相對(duì)年輕但發(fā)展十分迅速的學(xué)科,,《計(jì)算生物學(xué)雜志》(Journal of Computational Biology)的影響因子從1999年的1.6上升到2004年的4.4就很有力地說明了這一點(diǎn)。
出席會(huì)議的代表有來自美國(guó)加州大學(xué)河邊分校、美國(guó)默克制藥公司,、新加坡國(guó)立大學(xué),、日本大阪產(chǎn)業(yè)大學(xué)、上海第二醫(yī)科大學(xué),、中國(guó)疾病預(yù)防控制中心寄生蟲病預(yù)防控制所,、哈爾濱醫(yī)科大學(xué)、北京大學(xué)生物信息中心,、清華大學(xué),、暨南大學(xué)信息科學(xué)技術(shù)學(xué)院、南京大學(xué),、第二軍醫(yī)大學(xué)、四川大學(xué)化學(xué)學(xué)院,、上海大學(xué),、東華大學(xué)生物科學(xué)與技術(shù)研究所、上海交通大學(xué)醫(yī)學(xué)院,、國(guó)家人類基因組南方研究中心,、中科院上海有機(jī)化學(xué)研究所、中科院上海生命科學(xué)研究院,、復(fù)旦大學(xué)生命科學(xué)學(xué)院,、上海生物信息技術(shù)研究中心等20多個(gè)大學(xué)及科研院所的30多位著名專家和學(xué)者。
三,、會(huì)議內(nèi)容
本次學(xué)術(shù)研討會(huì)圍繞主題,,對(duì)當(dāng)前計(jì)算生物學(xué)中的熱點(diǎn)問題就以下3個(gè)專題進(jìn)行了全方位、系統(tǒng)性地闡述,,同時(shí)也展開了熱烈的討論:1,、計(jì)算機(jī)輔助藥物設(shè)計(jì);2,、生物大分子計(jì)算模擬,;3、計(jì)算生物學(xué)的發(fā)展及未來方向,。本次研討會(huì)的召開對(duì)促進(jìn)我國(guó)計(jì)算生物學(xué),、生物信息學(xué)及相關(guān)領(lǐng)域的研究,加速生命科學(xué)中復(fù)雜系統(tǒng)的研究進(jìn)程,,提高我國(guó)前瞻性,、個(gè)性化生物醫(yī)藥的研發(fā)水平具有重要的意義。
新加坡國(guó)立大學(xué)計(jì)算科學(xué)系主任陳宇綜教授作了題為"藥物相關(guān)蛋白質(zhì)的計(jì)算技術(shù)及在新藥開發(fā)中的應(yīng)用"的報(bào)告,。所謂藥物相關(guān)蛋白質(zhì),,就是說我們總是選擇一些與疾病作用過程息息相關(guān)的蛋白質(zhì)作為藥物的主要作用靶點(diǎn),如果能夠阻止這些靶點(diǎn)的致病作用,則藥物也就可以發(fā)揮治病功效,;而藥物-靶點(diǎn)之間的相互作用遵循的是"鑰匙和鎖"機(jī)制,。ADME(吸收、分布,、代謝及排出)是藥物設(shè)計(jì)時(shí)要考慮的關(guān)鍵因素,,需要不斷地進(jìn)行優(yōu)化。大多數(shù)藥物的開發(fā),,之所以會(huì)以失敗告終,,最主要的原因就是ADME與毒副作用。我們要在分子水平上找到疾病所對(duì)應(yīng)靶點(diǎn),,就要先建立蛋白質(zhì)結(jié)構(gòu)模型,,通過高通量篩選,再結(jié)合分子化學(xué)方法如QSAR,,預(yù)測(cè)其ADME等藥物動(dòng)力學(xué)性質(zhì),,符合要求的才能進(jìn)入臨床試驗(yàn)階段。新加坡國(guó)立大學(xué)計(jì)算科學(xué)系建立了一個(gè)藥物靶點(diǎn)數(shù)據(jù)庫(kù)TTD(Therapeutic Target Database),,包括1174個(gè)藥物靶點(diǎn)和1251個(gè)藥物/配體,。通過對(duì)該數(shù)據(jù)庫(kù)數(shù)據(jù)的分析,發(fā)現(xiàn)好的藥物靶點(diǎn)一般都分布在1-2個(gè)代謝途徑上,,而且傾向于與人類蛋白質(zhì)的相似度較低,。那用什么方法來尋找這些靶點(diǎn)呢?這就是計(jì)算學(xué)的問題,。常用計(jì)算方法有兩大類,,一類是基于序列相似性的,其特點(diǎn)是準(zhǔn)確度高,,容易使用,,但對(duì)于新出現(xiàn)的靶點(diǎn)則束手無策;另一類是基于結(jié)構(gòu)和物理化學(xué)特性方面的相似性,,它適用于傳統(tǒng)的和新興的靶點(diǎn),,但要求現(xiàn)有靶點(diǎn)有較高的代表性。如果沒有確切的關(guān)于靶點(diǎn)三維結(jié)構(gòu)的信息,,可以使用支持向量機(jī)(SVM)等人工智能的方法來建立模型,。
復(fù)旦大學(xué)/華東理工大學(xué)藥學(xué)院的唐赟教授作了題為"HIV-1 整合酶的分子模擬與抑制物設(shè)計(jì)"的報(bào)告。HIV病毒編碼反轉(zhuǎn)錄酶,、蛋白水解酶和整合酶(IN)這三種酶,。整合酶在人類細(xì)胞中并無已知的結(jié)構(gòu)類似物,因此,,它就成為了抗HIV藥物設(shè)計(jì)的理想靶點(diǎn),。根據(jù)前人研究工作積累的經(jīng)驗(yàn),唐教授認(rèn)為了解整合酶以及它和病毒DNA和金屬離子形成的復(fù)合物的結(jié)構(gòu)信息是開發(fā)整合酶有效抑制劑的關(guān)鍵,于是采取了如下策略:首先建立全長(zhǎng)HIV-1整合酶以及它和病毒DNA和金屬離子形成的復(fù)合物的三維結(jié)構(gòu)模型,,然后獲得IN-DNA-抑制物對(duì)接模型,,并且使用它作為設(shè)計(jì)強(qiáng)有力、高選擇性抑制物的平臺(tái),。根據(jù)這個(gè)思想,,唐教授領(lǐng)導(dǎo)的研究小組已經(jīng)建立了相應(yīng)的模型,進(jìn)而預(yù)測(cè)了一批參與形成IN-DNA界面靜電及氫鍵相互作用的氨基酸殘基,,并與實(shí)驗(yàn)證據(jù)相吻合,。
四川大學(xué)化學(xué)院的薛英教授作了題為"通過支持向量機(jī)方法預(yù)測(cè)化合物的藥理動(dòng)力學(xué)和毒理學(xué)性質(zhì)"的報(bào)告。她首先介紹了支持向量機(jī)的方法以及他們使用的一系列用來對(duì)分子結(jié)構(gòu)和物理化學(xué)性質(zhì)進(jìn)行數(shù)學(xué)表征的分子描述符,,如拓?fù)涿枋龇?、量子化學(xué)描述符和幾何描述符等;為了提高支持向量機(jī)的預(yù)測(cè)精度和模型的直觀性,,她又接著重點(diǎn)介紹了他們采用的變量選擇方法---遞歸變量消除法,。通過P-糖蛋白底物、人類小腸可吸收分子,、可穿透血腦屏障的藥物以及梨形四膜蟲毒性化合物等幾個(gè)案例和相關(guān)測(cè)試數(shù)據(jù)集,比較了該支持向量機(jī)方法和一些其它預(yù)測(cè)方法(如k-NN,,PNN,,決策樹等)各自在準(zhǔn)確率、敏感性等方面的實(shí)驗(yàn)數(shù)據(jù),,指出結(jié)合分子變量選擇的支持向量機(jī)方法可以在預(yù)測(cè)化合物的藥理動(dòng)力學(xué)和毒理學(xué)性質(zhì)方面大有作為,。
哈爾濱醫(yī)科大學(xué)生物信息系的李霞教授作了題為"基于生物譜的復(fù)雜疾病基因挖掘"的報(bào)告。她說,,功能基因組學(xué)強(qiáng)調(diào)在基因組水平或系統(tǒng)水平闡明基因功能,,包括人體中全部基因的位置、結(jié)構(gòu),、功能,、表達(dá)、調(diào)控方式及致病突變的全部信息,,而生物信息學(xué)已經(jīng)成為功能基因組學(xué)研究的重要工具,。生物譜主要是指遺傳譜(SNP標(biāo)記、MS數(shù)據(jù)),、表達(dá)譜(基因芯片表達(dá)譜數(shù)據(jù),、EST和SAGE數(shù)據(jù))和蛋白質(zhì)譜(2D-PAGE數(shù)據(jù))等信息。復(fù)雜疾病有很強(qiáng)的遺傳異質(zhì)性,,即表型相似的疾病可能是由不同的遺傳機(jī)制所造成的,。所以,我們需要在基因組與蛋白質(zhì)組水平上研究和發(fā)展高通量生物信息數(shù)據(jù)挖掘新方法和新技術(shù)。她介紹了基于"遺傳譜同胞對(duì)連鎖分析"的模式識(shí)別方法GMSP,,以及應(yīng)用該方法在遺傳性耳聾基因識(shí)別,、酗酒的分子遺傳機(jī)制等研究中得到的成果。李教授著重強(qiáng)調(diào)了在生物芯片平臺(tái)上進(jìn)行研究的必要性,,介紹了芯片研究算法及平臺(tái)設(shè)計(jì)的一些方法和技巧,;對(duì)于復(fù)雜疾病如彌漫性大B細(xì)胞淋巴瘤,對(duì)其進(jìn)行異質(zhì)性分析時(shí)要使用特別的基因網(wǎng)絡(luò)方法,,包括構(gòu)建決策樹,、評(píng)估和確認(rèn)調(diào)節(jié)關(guān)系和建立調(diào)控網(wǎng)絡(luò)等步驟。
美國(guó)加州大學(xué)河邊分校的姜濤教授作了題為"通過基因組重排計(jì)算直系同源基因的分配"的報(bào)告,。他首先介紹了直系同源基因的概念和研究直系同源基因的重要性,,指出其在分子進(jìn)化分析、蛋白質(zhì)結(jié)構(gòu)及功能預(yù)測(cè),、功能域確定,、代謝及信號(hào)轉(zhuǎn)導(dǎo)途徑重建等諸多方面所起到的關(guān)鍵作用。然后姜教授對(duì)現(xiàn)有的一些分配直系同源基因的方法,,如BBH,、COG、INPARANOID,、ORTHOMCL,、TOGA等,進(jìn)行了簡(jiǎn)要的回顧,,重點(diǎn)評(píng)述了它們各自的優(yōu)缺點(diǎn),。這些已有軟件的一個(gè)共同特點(diǎn)就是都主要依靠序列相似性信息,沒有考慮基因在基因組上的具體位置,。姜教授認(rèn)為,,一套完備的直系同源基因分配體系還應(yīng)該綜合利用分子進(jìn)化的信息,包括局部的突變和全局范圍的重排,。直系同源可能對(duì)應(yīng)于最簡(jiǎn)約的重排方式,,根據(jù)這個(gè)思想,姜教授將問題用數(shù)學(xué)語言表達(dá)成為兩個(gè)基因組復(fù)制基因之間反向帶號(hào)距離(SRDD)的問題,,這是一種在過去文獻(xiàn)中沒有出現(xiàn)過的全新思路,。姜教授進(jìn)一步提出了解決SRDD問題的算法途徑,包括將其優(yōu)化成的最小共同分割(MCP)和最大循環(huán)分解(MCD)問題,。根據(jù)這些算法,,姜教授及其領(lǐng)導(dǎo)的小組開發(fā)了一套高通量基因組層面上分配直系同源基因的系統(tǒng),命名為SOAR,,并用模擬數(shù)據(jù)和來自人,、小鼠,、大鼠X染色體的實(shí)際基因組序列數(shù)據(jù)對(duì)其進(jìn)行了測(cè)試。與INPARANOID軟件相比較,,發(fā)現(xiàn)兩者雖然使用的是完全不同的方法,,但殊途同歸,它們的結(jié)果非常接近,,SOAR的靈敏度略高于INPARANOID,。姜教授最后還就如何進(jìn)一步改進(jìn)該方法提出了一些設(shè)想。
日本大阪產(chǎn)業(yè)大學(xué)電機(jī)工程與電子系的陳洛南教授作了題為"細(xì)胞系統(tǒng)中基因調(diào)控網(wǎng)絡(luò)的建模"的報(bào)告,。他首先回顧了人工合成基因網(wǎng)絡(luò)的發(fā)展歷史,,闡明在DNA水平上對(duì)細(xì)胞調(diào)節(jié)進(jìn)行控制的必要性??紤]到傳統(tǒng)的還原論結(jié)合反向工程的方法,,因?yàn)閿?shù)據(jù)量不夠多的緣故而比較難于進(jìn)行,陳教授倡議一種正向工程(Forward Engineering)的手段,,直接從最簡(jiǎn)單的形式入手構(gòu)建系統(tǒng)模型,。根據(jù)這個(gè)思想,陳教授使用泛微分方程(FDE)作為數(shù)學(xué)模型構(gòu)建了一些低等生物,,如酵母,、大腸桿菌的基因調(diào)控網(wǎng)絡(luò),并且綜合考慮了各種"噪音"干擾,。
北京大學(xué)生物信息中心的羅靜初教授作了題為"水稻基因組的復(fù)制和DNA片斷丟失及其對(duì)二倍體形成的影響"的報(bào)告,。他指出,許多目前從分子遺傳學(xué)和細(xì)胞遺傳學(xué)上被認(rèn)為是二倍體的高等植物種類,,在古代其實(shí)都是多倍體的,水稻也是如此,。最近郝柏林院士的學(xué)生王希胤及其同事,,以及美國(guó)和比利時(shí)的科學(xué)家都在開展水稻基因組重復(fù)序列的研究。采用共線性方法,,發(fā)現(xiàn)水稻基因組中有兩次大規(guī)模復(fù)制事件發(fā)生,,時(shí)間分別是7000萬和500萬年前;然后隨之發(fā)生了重復(fù)片斷的DNA丟失和DNA重排,,從而導(dǎo)致二倍體型的最終形成,。
南京大學(xué)生命科學(xué)院的王進(jìn)教授作了題為"Annexin V導(dǎo)向的抗凝融合蛋白設(shè)計(jì)與模擬"的報(bào)告。該項(xiàng)工作的目的,,是要構(gòu)建一個(gè)融合蛋白,,具備活化血小板導(dǎo)向性和抗凝血酶雙重功能,以達(dá)到高效,、安全的抗凝目的,。設(shè)計(jì)的原則是要兼顧彈性與柔性,,確保上述兩項(xiàng)功能都不丟失;蛋白質(zhì)之間融合連接方式的設(shè)計(jì),,必須考慮動(dòng)力學(xué)效應(yīng),。由于Annexin V對(duì)暴露于活化血小板表面的磷酯酰絲氨酸具有高親和性,而水蛭素是迄今發(fā)現(xiàn)的對(duì)凝血酶最強(qiáng)的天然抑制物,,所以可以將Annexin V與水蛭素C-末端抑制凝血酶肽段相連接構(gòu)成融合蛋白分子,。根據(jù)這個(gè)思路,王教授領(lǐng)導(dǎo)的小組構(gòu)建了一系列融合蛋白,,并對(duì)它們進(jìn)行了動(dòng)力學(xué)分析,。
清華大學(xué)自動(dòng)化系/生物信息學(xué)教育部重點(diǎn)實(shí)驗(yàn)室的張學(xué)工教授作了題為"再看高通量表達(dá)數(shù)據(jù)的機(jī)器學(xué)習(xí)分析"的報(bào)告。作為機(jī)器學(xué)習(xí)方法的重要一部分,,張教授重點(diǎn)解析了如何使用統(tǒng)計(jì)和分類的方法分析癌癥基因組的生物芯片數(shù)據(jù),。擺在我們面前的任務(wù)有兩個(gè):一是開發(fā)出診斷工具;二是對(duì)其生物學(xué)意義有更加深入地理解,,找出疾病或疾病亞型的分子機(jī)理,。常用方法有兩大類:一種是過濾加分類的兩步法;另一種是封裝(wrapper)這種基于遞歸的方法,。張教授以遞歸支持向量機(jī)(R-SVM)為例,,重點(diǎn)介紹了后面一種方法,及其在白血病基因芯片數(shù)據(jù)分析中的應(yīng)用,。
最后,,美國(guó)默克制藥公司的陳榮華博士作了題為"應(yīng)用計(jì)算基因組學(xué)和芯片技術(shù)發(fā)現(xiàn)基因"的總結(jié)性報(bào)告。他首先讓大家對(duì)新藥開發(fā)的艱巨程度有了更加清醒的認(rèn)識(shí),。在美國(guó),,一個(gè)新的藥物要想獲得批準(zhǔn)進(jìn)入市場(chǎng),必須經(jīng)過臨床前嚴(yán)格的檢測(cè)及臨床I,、II,、III期實(shí)踐檢驗(yàn),這個(gè)過程通常需要12年,,耗資8億美元,。隨著后基因組時(shí)代的到來,一方面我們已經(jīng)積聚了大量的基因組數(shù)據(jù),,另一方面生物信息學(xué)算法和數(shù)據(jù)庫(kù)也取得了很大的進(jìn)展,,這就為計(jì)算基因組學(xué)在藥物開發(fā)方面大顯身手創(chuàng)造了條件。運(yùn)用計(jì)算基因組學(xué),,可以解析基因結(jié)構(gòu)和功能,,找出可能作為藥物靶點(diǎn)的基因表達(dá)產(chǎn)物,同時(shí)研究基因之間的相互作用,;但這也面臨著巨大的挑戰(zhàn),,包括海量序列數(shù)據(jù),、人類基因組以及基因功能的復(fù)雜性等。陳博士就利用計(jì)算基因組學(xué)方法進(jìn)行基因識(shí)別作了詳細(xì)地介紹,。他所領(lǐng)導(dǎo)的小組開發(fā)了一套高通量基因組分析流程,,用來創(chuàng)建綜合的基因模型目錄,然后使用芯片技術(shù)對(duì)用計(jì)算方法找到的基因加以驗(yàn)證,,對(duì)于特別感興趣的基因,,則優(yōu)先進(jìn)行實(shí)驗(yàn)驗(yàn)證,并評(píng)估其作為潛在藥物靶點(diǎn)的作用,。
四,、專家共識(shí)和建議
伴隨著每一個(gè)發(fā)言者的報(bào)告,與會(huì)專家都展開了活躍地討論,。例如,,在陳榮華博士的報(bào)告中提到了非編碼的RNA基因及其對(duì)mRNA表達(dá)的調(diào)控,就引起了大家的濃厚興趣,。王進(jìn)教授關(guān)心如何掌握受microRNA調(diào)控的mRNA水平,,陳博士指出這主要看其它基因的變化情況,結(jié)合通過計(jì)算得到的匹配結(jié)果,、3'-UTR的比對(duì)等,。陳洛南教授詢問microRNA是否直接作用于蛋白質(zhì),陳博士對(duì)此作出了澄清:過去的觀點(diǎn)認(rèn)為microRNA可以作用于蛋白質(zhì),,但最新的實(shí)驗(yàn)表明microRNA能夠直接分解mRNA,,而沒有證據(jù)支持其和蛋白質(zhì)有直接作用。
經(jīng)過長(zhǎng)時(shí)間熱烈的討論,,專家們達(dá)成了如下共識(shí)及建議:
|