雖然已經(jīng)解析出來的蛋白質(zhì)結(jié)構(gòu)日益增多(可以到蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫(kù)PDB中查詢其結(jié)構(gòu)是否被解析),但是很多小伙伴們的研究目標(biāo)的結(jié)構(gòu)還沒有被解析(實(shí)際上是大部分蛋白結(jié)構(gòu)都沒有被解析),。 蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫(kù)PDB:http://www./ 那么,,在實(shí)驗(yàn)之外,有其他方法獲得生物大分子的結(jié)構(gòu)嗎,?當(dāng)然有啊,,那就是結(jié)構(gòu)預(yù)測(cè)啊。 PS:結(jié)構(gòu)預(yù)測(cè)獲得的結(jié)構(gòu)不一定準(zhǔn)確,,不過近年來隨著數(shù)據(jù)庫(kù)的擴(kuò)大以及算法的改進(jìn),,結(jié)構(gòu)預(yù)測(cè)的準(zhǔn)確性越來越高。 關(guān)于核酸RNA二級(jí)結(jié)構(gòu)的預(yù)測(cè),,之前我們公眾號(hào)介紹過RNAstructure的使用:《如何繪制高大上的RNA 二級(jí)結(jié)構(gòu)圖,?》(關(guān)于RNA三級(jí)結(jié)構(gòu)的預(yù)測(cè),我們稍后會(huì)有推文,。)我們先來介紹一下蛋白質(zhì)結(jié)構(gòu)的預(yù)測(cè),。 一、背景介紹 蛋白質(zhì)的結(jié)構(gòu)從低維度到高維度劃分為四級(jí): 一級(jí)結(jié)構(gòu)——氨基酸序列,; 二級(jí)結(jié)構(gòu)——主鏈原子形成的局部空間構(gòu)象,,如α螺旋,β折疊,; 三級(jí)結(jié)構(gòu)——二級(jí)結(jié)構(gòu)在三維空間排列形成三維結(jié)構(gòu),; 四級(jí)結(jié)構(gòu)——不同亞基組成的蛋白質(zhì)復(fù)合物大分子。 在二級(jí)結(jié)構(gòu)和三節(jié)結(jié)構(gòu)之間,,還存在超二級(jí)結(jié)構(gòu)(有些書籍稱作motif,,模體/基序)以及結(jié)構(gòu)域,。 二、工具使用 從一級(jí)序列我們能夠獲得哪些信息呢,?小師弟在此給大家安利一個(gè)網(wǎng)站,,https://web./protparam/。 它的主界面非常簡(jiǎn)單,,我們可以輸入蛋白質(zhì)的AC號(hào)或者蛋白質(zhì)序列,,然后點(diǎn)擊compute parameters, 然后就可以獲得這個(gè)蛋白質(zhì)的諸多信息了。 PS:ExPASy 是一個(gè)神器的網(wǎng)站,,大家可以通過網(wǎng)址https://www./resources來訪問其提供的各種生物信息學(xué)工具,,有很多妙用哦!之前我們?cè)?a style="margin: 0px; padding: 0px; color: rgb(2, 30, 170); word-wrap: break-word !important; max-width: 100%; box-sizing: border-box !important; -webkit-tap-highlight-color: rgba(0, 0, 0, 0);" target="_blank">研究Protein,,這些技術(shù)不得不看中有提到其中的PROSITE的用法,。 在跳轉(zhuǎn)出來的結(jié)果頁(yè),,我們可以獲得如下一些信息:
三、結(jié)果解讀和研究意義 分子質(zhì)量在SDS-PAGE電泳以及western blot中非常有用,。但是,,在SDS-PAGE或者western blot實(shí)驗(yàn)中,,分子條帶大小并一定和此處給的完全相符,排除了未充分煮樣等實(shí)驗(yàn)操作失誤外,,還可能是因?yàn)檫@些蛋白帶電荷過于特殊,,有別于正常蛋白。對(duì)于蛋白分子質(zhì)量,我們還可以使用氨基酸殘基數(shù)目*110來快速估算,。 等電點(diǎn)就是電解質(zhì)在此pH下,,其所帶的正電荷和負(fù)電荷一樣多,導(dǎo)致其凈電荷為0,。理論等電點(diǎn)在等電聚焦以及使用離子交換層析分離純化蛋白時(shí)非常有用,。使用離子交換層析分離純化兩個(gè)蛋白,一般需要兩個(gè)蛋白等電點(diǎn)相差至少0.5,。對(duì)于常見的蛋白純化親和標(biāo)簽,一般都已經(jīng)通過基因工程改造,,將其等電點(diǎn)改造成明顯偏離普通蛋白的等電點(diǎn)。如His-sumo標(biāo)簽的等電點(diǎn)為5.4,,GST標(biāo)簽的等電點(diǎn)為5.6,,MBP標(biāo)簽的等電點(diǎn)為4.9。而大多數(shù)蛋白的等電點(diǎn)為偏酸性,,略低于7,,因此可以方便的使用離子交換層析方法分離親和標(biāo)簽和不含標(biāo)簽的目的蛋白。 在氨基酸組成方面,我們可以方便的看到20種氨基酸占比(有幾個(gè)氨基酸在大多數(shù)蛋白中的占比相對(duì)恒定,,此是諸多蛋白質(zhì)濃度測(cè)定的統(tǒng)計(jì)學(xué)基礎(chǔ)),。有細(xì)心的小伙伴可能發(fā)現(xiàn),,在20種氨基酸下面,,還有3個(gè)氨基酸符號(hào),那是什么東東,?說實(shí)話,,第一次打開這個(gè)結(jié)果頁(yè),,我也被這三個(gè)符號(hào)唬住了。本著科研狗+理工男的嚴(yán)謹(jǐn)精神(對(duì),,我大生物就是理科,,那些常常懟生物像文科的,別逼逼,,我不接受反駁,,小師弟要傲嬌一回),我立馬查詢一番,,原來,,B就是Asx,Aspartic acidor Asparagine(天冬氨酸或者天冬酰胺),;Z就是Glx,,Glutamine or Glutamic acid(谷氨酰胺或者谷氨酸);X就是Xaa,,Any amino acid(任意氨基酸),。也就是說,這3個(gè)符號(hào)是用來表示暫時(shí)還有歧義的氨基酸殘基的,,并不是什么稀有氨基酸,。 下面還有荷電氨基酸統(tǒng)計(jì)。分別統(tǒng)計(jì)了帶負(fù)電氨基酸(天冬氨酸和谷氨酸)的數(shù)量,,以及帶正電氨基酸(賴氨酸和精氨酸)的數(shù)量,。有小伙伴可能會(huì)好奇,堿性氨基酸不是賴氨酸,、精氨酸,、組氨酸3個(gè)嗎?這里面為什么沒有組氨酸呢,?因?yàn)榻M氨酸是一種弱堿性氨基酸,,在生理狀態(tài)下基本上不帶電的,。不信,我給你看個(gè)表格,。 我們可以看到,,組氨酸的等電點(diǎn)為7.59,而人體血液的pH在7.35-7.45,,其他多種體液也都是偏弱堿性(當(dāng)然,,胃液這種變態(tài)不算的,它的pH變態(tài)的為0.9-1.5),,所以說組氨酸在生理狀態(tài)下基本上不帶電,,所以就不參與統(tǒng)計(jì)嘍! 酸堿體質(zhì)理論 消光系數(shù)和吸收度:根據(jù)朗伯比爾定律A=lg(1/T)=Kbc (A為吸光度,,T為透射比,,是出射光強(qiáng)度(I)比入射光強(qiáng)度(I0),c為吸光物質(zhì)的濃度,,單位為mol/L,,b為吸收層厚度,單位為厘米),,吸光度和溶液中的溶質(zhì)濃度以及光程長(zhǎng)度成正比,,這個(gè)比例系數(shù)K就是我們的消光系數(shù)。那么消光系數(shù)有什么用呢,?我們可以通過分光光度計(jì)測(cè)量出吸光度值A(chǔ)bs(測(cè)量入射光和出射光的比值,,并取對(duì)數(shù)),,然后除以(光程*消光系數(shù)),,就可以知道蛋白質(zhì)的濃度了。 簡(jiǎn)單的來說,,我們?nèi)? ul蛋白溶液,,使用nanodrop測(cè)量出吸光度值A(chǔ),,然后直接除以這里給的吸收度,,就可以得到蛋白質(zhì)濃度了(nanodrop默認(rèn)的設(shè)置是1 Abs=1mg/ml)。 整個(gè)過程不超過2分鐘,,比起B(yǎng)radford,Lowry之流測(cè)蛋白濃度,,不知道要快多少倍,。 實(shí)際上,,這個(gè)消光系數(shù)和吸收度我們自己都可以計(jì)算出來的,,計(jì)算方法也很簡(jiǎn)單: 消光系數(shù)=Numb(Trp)*5500 + Numb(Tyr)*1490+Numb(Cystine)*125 吸收度=消光系數(shù)/分子質(zhì)量 Numb表示個(gè)數(shù) 從上述公式,,我們也可以知道,,一個(gè)蛋白質(zhì)分子的消光系數(shù)主要取決于色氨酸(要不怎么叫做“色”氨酸呢,?)、酪氨酸以及胱氨酸的含量,。如果一個(gè)序列中含有多個(gè)半胱氨酸,,考慮到兩個(gè)半胱氨酸可以被氧化生成一個(gè)胱氨酸,因此,,有多個(gè)半胱氨酸的序列,ExPASy都給了兩個(gè)消光系數(shù),,一個(gè)是所有半胱氨酸都用于生成胱氨酸,,一個(gè)是所有半胱氨酸都是還原形式,,沒有生成任何胱氨酸。小伙伴們可以用計(jì)算器根據(jù)前面氨基酸組成的圖,,按照這里的公式計(jì)算一下消光系數(shù)和吸收度,看是否一致哦,! 我為什么詳細(xì)介紹消光系數(shù)的計(jì)算呢,?因?yàn)楹芏嘈』锇樵诘鞍讓?shí)驗(yàn)中會(huì)做突變分析,現(xiàn)在我們知道了,,如果沒有消除或者新增色氨酸,、酪氨酸以及半胱氨酸,,一個(gè)蛋白的消光系數(shù)是不會(huì)發(fā)生變化的(吸收度會(huì)變化一點(diǎn)點(diǎn),,因?yàn)榉肿淤|(zhì)量會(huì)有一點(diǎn)點(diǎn)變化,不過基本上不用考慮),,那么我們就不用重新計(jì)算消光系數(shù)了。 半衰期:半衰期用來衡量目的蛋白在體內(nèi)的穩(wěn)定性,。蛋白質(zhì)在細(xì)胞中處于動(dòng)態(tài)平衡,,在其合成之后,,它的壽命基本上就已經(jīng)決定了。也就是說,,細(xì)胞這個(gè)家伙為了保證自己的運(yùn)轉(zhuǎn)正常,給大多數(shù)蛋白都設(shè)定了一個(gè)使用期限,,防止超期限執(zhí)行任務(wù)的蛋白因?yàn)槔匣鲥e(cuò),,而衰老的蛋白會(huì)被回收利用或者消除(小師弟感受到了強(qiáng)烈的宿命論!?。,。?/p> 而決定這個(gè)使用期限(用半衰期表示)的,,就是蛋白質(zhì)自身N端的前幾個(gè)氨基酸序列,。因此,這個(gè)ExPASy程序會(huì)把我們輸入序列的前幾個(gè)氨基酸當(dāng)做N端序列計(jì)算這個(gè)蛋白質(zhì)的半衰期,,并且給出了在哺乳動(dòng)物網(wǎng)織紅細(xì)胞,、酵母和大腸桿菌這3種模式細(xì)胞中的半衰期。 文章中經(jīng)常通過蛋白半衰期來研究泛素化-蛋白酶體途徑介導(dǎo)的蛋白降解 不穩(wěn)定系數(shù):不穩(wěn)定系數(shù)用來衡量目的蛋白在體外的穩(wěn)定性,。不穩(wěn)定系數(shù)基于之前研究者的發(fā)現(xiàn),,也即某些二肽在穩(wěn)定蛋白和不穩(wěn)定蛋白中的出現(xiàn)概論相差很大,因此,,可以通過這些二肽的出現(xiàn)頻率來預(yù)測(cè)蛋白質(zhì)在體外的穩(wěn)定性,。不穩(wěn)定系數(shù)越小,表明此蛋白越穩(wěn)定。在判別標(biāo)準(zhǔn)上,,將不穩(wěn)定系數(shù)小于40的蛋白判定為能夠穩(wěn)定存在,。結(jié)合小師弟多年純化蛋白的經(jīng)驗(yàn)(苦逼經(jīng)歷),這項(xiàng)預(yù)測(cè)還是相對(duì)比較準(zhǔn)確的,。對(duì)于被預(yù)測(cè)為不穩(wěn)定的蛋白,,尤其是那些數(shù)值遠(yuǎn)遠(yuǎn)大于40的目的蛋白,小伙伴如果對(duì)其進(jìn)行操作,,一定要加快實(shí)驗(yàn)進(jìn)度哦,,因?yàn)檫@些蛋白在4℃放個(gè)兩三天,就可能降解了哦,! 脂肪系數(shù):脂肪系數(shù)也可以用來衡量目的蛋白的穩(wěn)定性,。我們知道,蛋白質(zhì)折疊的一個(gè)主要驅(qū)動(dòng)力就是疏水相互作用,。而脂肪系數(shù)用丙氨酸,、纈氨酸、亮氨酸,、異亮氨酸這4個(gè)疏水氨基酸的出現(xiàn)頻次*相關(guān)權(quán)重并加和,,得到了一個(gè)脂肪系數(shù)。脂肪系數(shù)越高,,蛋白相對(duì)越穩(wěn)定,。 總平均親水性:用于衡量目的蛋白的總體平均親水性。通過將親水氨基酸賦正值,,將疏水氨基酸賦負(fù)值,,加和后除以氨基酸數(shù)目,得到總體的平均親疏水性,。數(shù)值越大,,親水性越強(qiáng)。實(shí)際上,,對(duì)于多結(jié)構(gòu)域蛋白此數(shù)值意義不是很大,,因?yàn)榈鞍追肿又屑扔惺杷Y(jié)構(gòu)域,也有親水結(jié)構(gòu)域,,兩者數(shù)值會(huì)相互抵消,。GRAVY主要是結(jié)合局部親疏水性打分,獲得如下圖所示親疏水性打分圖,,可以用來預(yù)測(cè)跨膜區(qū)(跨膜區(qū)相對(duì)于總體序列高度疏水,,峰圖中間橫線就是代表總平均親水性)。 好了,,內(nèi)容就到這里,。第一次寫推文,可能有點(diǎn)過于詳細(xì)和啰嗦,大家多提點(diǎn)意見,,以后小師弟我多多改進(jìn),。 |
|