久久国产成人av_抖音国产毛片_a片网站免费观看_A片无码播放手机在线观看,色五月在线观看,亚洲精品m在线观看,女人自慰的免费网址,悠悠在线观看精品视频,一级日本片免费的,亚洲精品久,国产精品成人久久久久久久

分享

NCBI中Blast種類(lèi)簡(jiǎn)介

 whitecl 2011-05-26
NCBI中Blast種類(lèi)簡(jiǎn)介
  NCBI中Blast種類(lèi)簡(jiǎn)介
  
  1. Blast Assembled Genomes
  
  在一個(gè)選擇的物種基因組序列中去搜索。
  
  2.Basic Blast
  
   2.1 nucleotide blast--- 用核酸序列到核酸數(shù)據(jù)庫(kù)中進(jìn)行搜索,包括3個(gè)程序
  
  2.1.1 Blastn----核酸序列(n)到核酸序列數(shù)據(jù)庫(kù)中搜索,,是一種標(biāo)準(zhǔn)的搜索。
  
  2.1.2 megablast----該程序使用“模糊算法”加快了比較速度,可以用于快速比較兩大系列序列,。 可以用來(lái)搜索一匹ESTs序列和大的cDNA或基因組序列, 適用于由于測(cè)序或者其他原因形成的輕微的差別的序列之間的比較
  
  2.1.3 discontiguous megablast----與megablast不同的是主要用來(lái)比較來(lái)自不同物種之間的相似性較低的分歧序列,。
  
  2.2 Protein Blast
  
   2.2.1 Blastp ---蛋白質(zhì)序列到蛋白質(zhì)序列數(shù)據(jù)庫(kù)中搜索,是一種標(biāo)準(zhǔn)的搜索,。
  
   2.2.2 psi-blast---位點(diǎn)特異迭代BLAST — 用蛋白查詢來(lái)搜索蛋白資料庫(kù)的一個(gè)程式,。所有被BLAST發(fā)現(xiàn)的統(tǒng)計(jì)有效的對(duì)齊被總和起來(lái)形成一個(gè)多次對(duì)齊,從這個(gè)對(duì)齊,,一個(gè)位置特異的分值矩陣建立起來(lái),。這個(gè)矩陣被用來(lái)搜索資料庫(kù),以找到額外的顯著對(duì)齊,,這個(gè)過(guò)程可能被反復(fù)迭代一直到?jīng)]有新的對(duì)齊可以被發(fā)現(xiàn),。
  
  2.2.3 PHI-BLAST---以常規(guī)的表達(dá)模型為特別位置進(jìn)行PSI - BLAST檢索,找出和待查詢序列具有一樣的表達(dá)模型且具有同源性的蛋白質(zhì)序列。
  
  2.3 Translating BLAST
  
   2.3.1 blastx----先將待查詢的核酸序列按6 種讀框翻譯成蛋白質(zhì)序列,然后將翻譯出的蛋白質(zhì)序列與NCBI 蛋白質(zhì)序列數(shù)據(jù)庫(kù)比較,。
  
   2.3.2 tblastn-----先將核酸序列數(shù)據(jù)庫(kù)中的核酸序列按6 種讀框翻譯成蛋白質(zhì)序列,然后將待查詢的蛋白質(zhì)序列與翻譯結(jié)果進(jìn)行比較,。
  
   2.3.3 tblastx----先將待查詢的
  核酸序列和核酸序列數(shù)據(jù)庫(kù)中的核酸序列按6 種讀框翻譯成蛋白質(zhì)序列,然后再將兩種翻譯結(jié)果在蛋白質(zhì)水平上進(jìn)行比較
  
  3.Specialized Blast Specialized BLAST pages 可以對(duì)特殊生物或特殊研究領(lǐng)域的序列數(shù)據(jù)庫(kù)進(jìn)行檢索。
  
   例:CD - Search
  CD - Search 是使用RPS - BLAST程序以一個(gè)蛋白質(zhì)序列與保守結(jié)構(gòu)域數(shù)據(jù)庫(kù)(Conserved Domain Database) 做比較,。
  
   Pairwise BLAST
  Pairwise BLAST是用BLAST程序?qū)崿F(xiàn)兩個(gè)序列之間的比較,。選擇“序列1”為待比較序列,則“序列2”就是被比較序列。
  
  IgBLAST —IgBLAST被開(kāi)發(fā)出來(lái)以便於分析在GenBank中的免疫球蛋白的序列,。它允許用blastp或blastn來(lái)搜索nr資料庫(kù)或一個(gè)由免疫球蛋白生殖系變化區(qū)基因的特殊的資料庫(kù),。搜索可以限制在人類(lèi)或小鼠的基因。IgBLAST執(zhí)行三個(gè)主要的功能∶1)報(bào)告與查詢序列最相似的可變,,D,,或J區(qū),2)根據(jù)Kabat et al.來(lái)注解免疫球蛋白domains(從FWR1到FWR3),,3)對(duì)於搜索核酸或蛋白nr資料庫(kù),,通過(guò)匹配IgBLAST的發(fā)現(xiàn)和最接近的生殖系變化區(qū)基因來(lái)簡(jiǎn)化識(shí)別相關(guān)序列的過(guò)程。
  
   等等,。,。。,。,。。,。,。?! ?br>  
  
  在線BLAST的使用方法
  
  1,、登陸blast主頁(yè):http://www.ncbi.nlm./BLAST/
  2、根據(jù)數(shù)據(jù)類(lèi)型,,選擇合適的程序
  
  3,、填寫(xiě)表單信息
  序列的輸入,、比對(duì)搜索區(qū)域的選擇、數(shù)據(jù)庫(kù)的選擇:
  
  _/ [&限制調(diào)節(jié),、打分矩陣及其他參數(shù)的設(shè)置:
  
  圖中各參數(shù)的含義:(不同的平臺(tái)有少許差異,,請(qǐng)對(duì)比參照)9 L4 N3 I) u+ N0 {$ q
  Word siez選項(xiàng):4 c, r* F* g" t' g) B, j9 u
   BLAST 程序是通過(guò)比對(duì)未知序列與數(shù)據(jù)庫(kù)序列中的短序列來(lái)發(fā)現(xiàn)最佳匹配序列的。最初進(jìn)行“掃描”(scanning)就是確定匹配片段,。序列的匹配程序由短序列(定義為“word”,即字)的聯(lián)配得分總和來(lái)決定,。聯(lián)配時(shí),“字”的每個(gè)堿基均被計(jì)分:如果堿基對(duì)完全相同(如 A 與 A),,得某一正值,;如果堿基對(duì)不很匹配(W與A或 T),則得某一略小的正值,;如果兩個(gè)堿基不匹配,,則得一負(fù)值??偟?合計(jì)得分便決定了序列間的相似程度,。得分高的匹配序列被稱(chēng)為高比值片段對(duì)(high-scoring segment pairs, HSP)。BLAST 程序在兩個(gè)方向擴(kuò)展 HSP,,直至序列結(jié)束或聯(lián)配已變?yōu)椴伙@著,。替 換矩陣在掃描(scanning)和擴(kuò)展過(guò)程被應(yīng)用。最后在 BLAST 報(bào)告中被列出的序列 都是所有得分最高的序列,。
   以上述及的初始字長(zhǎng)便是由Word siez值設(shè)定,。BLAST只對(duì)字長(zhǎng)為W的“字”進(jìn)行擴(kuò)展聯(lián)配。BLAST 的字長(zhǎng)缺省值為 11,,即 BLASTN 將掃描數(shù)據(jù)庫(kù),,直到發(fā)現(xiàn)那些與未知序列的 11 個(gè)連續(xù)堿基完全匹配的11個(gè)連續(xù)堿基長(zhǎng)度片段為止。然后這些片段(即字)被擴(kuò)展,。11個(gè)堿基的字長(zhǎng)已能有效地排除中等分叉的同源性和幾乎所有隨機(jī)產(chǎn)生的顯著聯(lián)配,。
   “Filter”(過(guò)濾器)選項(xiàng):
   BLAST 2.0版本的新功能,過(guò)濾器將鎖定諸如組成低復(fù)雜(low compositional complexity)序列區(qū)(如Alu序列),,用一系列N(NNNNNN)替代這些程序,。N 代表任意堿基(IUB-code)。只有未知待檢序列被過(guò)濾替代,,而數(shù)據(jù)庫(kù)的序列將不被過(guò)濾,。過(guò)濾對(duì)絕大多數(shù)序列都是有益的,例如,,多A 堿基的尾部和脯氨酸富積的序列,,會(huì)得到人為的高聯(lián)配得分而誤導(dǎo)分析。這是因?yàn)檫@類(lèi)序列數(shù)量極大,遍布整個(gè)基因組,,直至整個(gè)數(shù)據(jù)庫(kù),。# p$ r4 W! O1 x5 n8 i! j3 m
  
   “Matrix”(矩陣)選項(xiàng):
   聯(lián)配的顯著性是由返回的比對(duì)分值決定的,該分值反映的是所得到的聯(lián)配隨機(jī)產(chǎn)生的概率有多大,。矩陣被用于鑒別數(shù)據(jù)庫(kù)中的序列,,同時(shí)又用來(lái)預(yù)測(cè)匹配的顯著性大小。一般應(yīng)接受運(yùn)行程序推薦的矩陣,。BLAST系列程序主要使用兩種類(lèi)型矩陣(PAM和BLOSUM,前面都有介紹),。要準(zhǔn)確地選擇矩陣,,必須了解矩陣和矩陣的具體計(jì)分方式。值得注意的是,,直接比較使用不同替換矩陣而獲得的聯(lián)配得分是沒(méi)有意義的,。
   “EXPECT”選項(xiàng):
   您可以為搜索設(shè)定一個(gè)期望值閥值(EXPECT),例如缺省值設(shè)為10,。這一設(shè)置則表示聯(lián)配結(jié)果中將有10個(gè)匹配序列是由隨機(jī)產(chǎn)生,,如果聯(lián)配的統(tǒng)計(jì)顯著性值(E值)小于該值(10),則該聯(lián)配將被檢出,。換句話說(shuō),,比較低的閥值將使搜索的匹配要求更嚴(yán)格,結(jié)果報(bào)告中隨機(jī)產(chǎn)生的匹配序列減少,。
   “Score Value”(分值)選項(xiàng):(有些平臺(tái)上沒(méi)有此選項(xiàng))6 [- q+ J# k9 ?6 N( M( d0 a
   在“wordsize”選項(xiàng)中曾論及堿基對(duì)匹配程度的賦分問(wèn)題,,其賦分的標(biāo)準(zhǔn)可由分值選項(xiàng)的M和N 兩個(gè)參數(shù)設(shè)置。M 參數(shù)為匹配堿基的賦值,,必需為一正整數(shù),;N 參數(shù)為不匹配堿基的賦值,必需為一負(fù)整數(shù),。M/N 的比率決定了你所接受的進(jìn)化分歧程度(degree of divergence),,M 和N 的缺省值為5和-4。該比率(1.25)相當(dāng)于在100個(gè)殘基中約有47可以觀測(cè)到的核酸點(diǎn)突變(PAM),。PAM 是被用來(lái)預(yù)測(cè)分子序列從祖先序列進(jìn)化而來(lái)的程度,。如果你調(diào)整M和N使比率提高,則 PAM 矩陣也應(yīng)選擇大些(指PAM矩陣后的數(shù)字),,以適應(yīng)相應(yīng)的較大的分歧程度,。

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,,不代表本站觀點(diǎn),。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買(mǎi)等信息,,謹(jǐn)防詐騙,。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類(lèi)似文章 更多