?序列比較是生物信息學中最基本,、最重要的操作,通過序列比對可以發(fā)現(xiàn)生物序列中的功能,、結(jié)構(gòu)和進化的信息,。序列比較的根本任務是:通過比較生物分子序列,發(fā)現(xiàn)它們的相似性,,找出序列之間共同的區(qū)域,,同時辨別序列之間的差異。在分子生物學中,,DNA或蛋白質(zhì)的相似性是多方面的,,可能是核酸或氨基酸序列的相似,可能是結(jié)構(gòu)的相似,,也可能是功能的相似,。一個普遍的規(guī)律是序列決定結(jié)構(gòu),結(jié)構(gòu)決定功能,。研究序列相似性的目的之一是,,通過相似的序列得到相似的結(jié)構(gòu)或相似的功能。這種方法在大多數(shù)情況下是成功的,,當然,,也存在著這樣的情況,即兩條序列幾乎沒有相似之處,,但分子卻折疊成相同的空間形狀,,并具有相同的功能。這里先不考慮空間結(jié)構(gòu)或功能的相似性,僅研究序列的相似性,。研究序列相似性的另一個目的是通過序列的相似性,,判別序列之間的同源性,推測序列之間的進化關系,。這里,,將序列看成由基本字符組成的字符串,無論核酸序列還是蛋白質(zhì)序列,,都是特殊的字符串.
BLAST全稱Basic Local Alignment Search Tool [1] ,,即基于局部序列比對算法的搜索工具。是由美國國家生物技術信息中心(National Center for Biotechnology Information,,NCBI)開發(fā)和管理的一套生物大分子一級結(jié)構(gòu)序列比對程序,。"BLAST"是美國國立醫(yī)學圖書館(U.S. National Library of Medicine)的注冊商標。 程序可將輸入的核酸堿基或蛋白質(zhì)氨基酸序列與數(shù)據(jù)庫中的已知來源序列進行比對,,輸出序列之間的同源性信息,,從而輔助判斷輸入的序列來源或與已知序列的進化關系。目前這套軟件包含五種基本功能: 核酸序列對核酸序列庫比對(blastn):直接將輸入的核酸序列與數(shù)據(jù)庫中的核酸序列進行比對,。 核酸序列對蛋白質(zhì)序列庫比對(blastx):自動將輸入的核酸序列翻譯為蛋白質(zhì)氨基酸序列后(根據(jù)可能的讀碼框和編碼鏈的差別,,一段核酸序列可能翻譯為六種氨基酸序列),比對數(shù)據(jù)庫中的蛋白質(zhì)序列,。 蛋白質(zhì)序列對蛋白質(zhì)序列庫比對(blastp):直接將輸入的蛋白質(zhì)氨基酸序列與數(shù)據(jù)庫中的氨基酸序列進行比對,。 蛋白序列對核酸序列庫比對(tblastn):將輸入的蛋白質(zhì)氨基酸序列,與由核酸數(shù)據(jù)庫中的序列翻譯而來的潛在的蛋白質(zhì)氨基酸序列進行比對,。 核酸序列的翻譯序列對核酸序列庫的翻譯序列的比對(tblastx):自動將輸入的核酸序列翻譯為蛋白質(zhì)氨基酸序列后,,與由核酸數(shù)據(jù)庫中的序列翻譯而來的潛在的蛋白質(zhì)氨基酸序列進行比對。 BLAST程序有在線版亦有本地版,。在線版可將輸入序列與龐大的已知來源序列信息庫進行比對,,一般用于確定未知序列的來源,以及尋找不同物種中的同源基因,;本地版是將輸入序列與本地自行構(gòu)建的序列信息庫進行比對,,比對的針對性更強,常用于在未發(fā)表基因組數(shù)據(jù)庫中尋找同源基因信息,,不依賴于網(wǎng)絡,,安全性和可靠性更高,。
|
|