看到了一個(gè)蠻有意思的概念,;Tumor Specifically Expressed, Evolutionarily New (TSEEN) genes
來源于2019的文章:《Oncogenes, tumor suppressor and differentiation genes represent the oldest human gene classes and evolve concurrently》,,鏈接是:https://www./articles/s41598-019-52835-w 提到了:雖然癌基因,、抑癌基因和分化基因是人類最古老的基因類別,但是它們的進(jìn)化同時(shí)發(fā)生,。作者假設(shè)進(jìn)化上年輕的新基因應(yīng)該在腫瘤中特別表達(dá),,并且證實(shí)了這個(gè)假說,最典型的就是cancer/testis genes ,,作者建議把這一類基因稱作是:Tumor Specifically Expressed, Evolutionarily New (TSEEN) genes,,而且認(rèn)為TSEEN 基因可能成為最好的腫瘤標(biāo)志物。 作者收集整理了如下所示8類基因: - The Human Protein Atlas (housekeeping genes)
- Tumor-Associated Gene database (TAG database) (oncogenes)
- TSGene (tumor suppressor genes)
- CTDatabase (cancer/testis (CT) antigen genes)
- DeathBase (apoptosis genes)
- GeneOntology (differentiation genes)
- Biomedical Center Database (BMC GSTSE protein-coding genes and BMC GSTSE non-coding sequences).
中文是:人類蛋白質(zhì)圖譜(管家基因),、腫瘤相關(guān)基因數(shù)據(jù)庫(癌基因),、 TSGene (腫瘤抑制基因)、 CTDatabase (癌癥/睪丸(CT)抗原基因),、 HomeoDB (同源盒基因),、 DeathBase (凋亡基因)、分化基因(差異基因),、生物醫(yī)學(xué)中心數(shù)據(jù)庫(BMC GSTSE 蛋白編碼基因和 BMC GSTSE 非編碼序列) 下面我們一一介紹這8類基因: - Housekeeping genes are 7367 genes expressed in all analyzed tissues
- TAG 數(shù)據(jù)庫(腫瘤相關(guān)基因數(shù)據(jù)庫)(245個(gè)致癌基因)被設(shè)計(jì)用于利用來自特征明顯的致癌基因和腫瘤抑制基因的信息來促進(jìn)癌癥研究,。
- TSGene 2.0數(shù)據(jù)庫包含1217個(gè)人類腫瘤抑制基因(1018個(gè)編碼基因和199個(gè)非編碼基因) ,基于接近6000篇pubmed文獻(xiàn)整理得到的,。
- Differentiation genes (3697 genes) were obtained by manual search for “differentiation” in the Gene Ontology 數(shù)據(jù)庫,。
- 同源異型盒基因數(shù)據(jù)庫(HomeoDB2)(333個(gè)基因)是一個(gè)手工整理的同源盒基因數(shù)據(jù)庫及其分類系統(tǒng)。Homeodb2包括10個(gè)動(dòng)物基因組(人,、鼠,、雞、蛙,、斑馬魚,、文昌魚,、線蟲、果蠅,、甲蟲和蜜蜂)的所有同源盒基因座,。
- 死亡基因(53個(gè)基因)是一個(gè)涉及不同細(xì)胞死亡過程的蛋白質(zhì)數(shù)據(jù)庫。也是人工整理,,但是這個(gè)數(shù)據(jù)庫最后一次更新是在2011年,。
- CTdatabase (286個(gè)基因)提供了基本信息,包括基因名稱和別名,、 RefSeq 訪問號,、基因組位置、已知剪接變異,、基因復(fù)制和其他家族成員,。(使用了2017年的更新)
- 帶注釋的人類蛋白質(zhì)編碼基因(21694個(gè)基因)均來自于基因組版本 GRCh38
最后匯總的基因數(shù)量是; - 人類蛋白質(zhì)圖譜(管家基因)-6789個(gè)基因
- TAG 數(shù)據(jù)庫(致癌基因)-224個(gè)基因
- TSGene (腫瘤抑制基因)-984個(gè)基因
- 基因本體學(xué)(分化基因)-3697個(gè)基因
- 同源盒基因(HomeoDB)-231個(gè)基因
- CTDatabase (ct 抗原基因)- 187個(gè)基因,,包括109個(gè)常染色體和78個(gè) x 染色體定位基因
- 生物醫(yī)學(xué)中心數(shù)據(jù)庫-60個(gè)蛋白質(zhì)編碼基因
- 基因組裝 GRCh38(全蛋白質(zhì)編碼基因)-19911個(gè)基因
文末友情宣傳強(qiáng)烈建議你推薦給身邊的博士后以及年輕生物學(xué)PI,,多一點(diǎn)數(shù)據(jù)認(rèn)知,讓他們的科研上一個(gè)臺階:
|