來源:CreateAMind 人工智能的熱門到底有哪些,? 在過去的十年里,人工智能(AI)幾乎滲透到科學(xué)的每一個(gè)角落:機(jī)器學(xué)習(xí)模型被用來預(yù)測(cè)蛋白質(zhì)結(jié),、評(píng)估亞馬遜雨林因砍伐而損失的比例,,甚至對(duì)可能存在地外行星的遙遠(yuǎn)星系進(jìn)行分類。 然而,,盡管AI可以用來加速科學(xué)發(fā)現(xiàn),,幫助科學(xué)家預(yù)測(cè)在現(xiàn)實(shí)世界中很難研究或成本很高的現(xiàn)象,但AI也可能讓科學(xué)家誤入歧途,。就像ChatGPT有時(shí)會(huì)“產(chǎn)生幻覺”或“編造事實(shí)”一樣,,機(jī)器學(xué)習(xí)等AI模型有時(shí)也會(huì)給出誤導(dǎo)甚至完全錯(cuò)誤的結(jié)論。 九大熱門 MONDAY CADD計(jì)算機(jī)輔助藥物設(shè)計(jì) AIDD人工智能藥物發(fā)現(xiàn)與設(shè)計(jì) 蛋白晶體結(jié)構(gòu)解析 冷凍電鏡在結(jié)構(gòu)生物學(xué)的應(yīng)用及單顆粒冷凍電鏡結(jié)構(gòu)解析 CRISPR-Cas9基因編輯技術(shù) 機(jī)器學(xué)習(xí)代謝組學(xué) 機(jī)器學(xué)習(xí)微生物組學(xué) 深度學(xué)習(xí)基因組學(xué) 機(jī)器學(xué)習(xí)在生物醫(yī)學(xué)中的應(yīng)用 內(nèi)容介紹 第一天 上午 導(dǎo)論與基礎(chǔ) 1. 蛋白質(zhì)三維結(jié)構(gòu)的預(yù)測(cè)對(duì)于藥物發(fā)現(xiàn)的重要性 1.1 同源建模 1.2 從頭建模 2. 蛋白質(zhì)(酶/靶點(diǎn))活性位點(diǎn)在藥物發(fā)現(xiàn)的重要性 3. 藥物發(fā)現(xiàn)中的關(guān)鍵結(jié)構(gòu)特征(特別是小分子) 4. 藥物輔助發(fā)現(xiàn)常用的計(jì)算方法 4.1 分子對(duì)接 4.2 虛擬篩選 4.3 分子動(dòng)力學(xué)模擬 4.4 其他 下午 1. PDB數(shù)據(jù)庫的介紹 1.1 檢索蛋白 1.2 頁面功能及解讀 1.3 數(shù)據(jù)的下載 1.4 PDB文件格式的解讀 2. PyMol 2.1 軟件介紹 2.2 基本操作介紹 2.3 蛋白及小分子表面圖,、靜電勢(shì)表示 2.4 繪制相互作用圖及制作簡(jiǎn)單動(dòng)畫 第二天 上午 同源建模 1. 同源建模原理介紹 1.1 同源建模的功能及使用場(chǎng)景 1.2 同源建模的方法 2. Swiss-Model 同源建模,; 2.1 同源蛋白的搜索(blast等方法) 2.2 蛋白序列比對(duì) 2.3 蛋白模板選擇 2.4 蛋白模型搭建 2.5 模型評(píng)價(jià)(蛋白拉曼圖) 2.6 蛋白模型優(yōu)化 實(shí)例講解與練習(xí):用2019-nCoV spike蛋白序列建模,根據(jù)相應(yīng)參數(shù)和方法評(píng)價(jià)模型 下午 小分子構(gòu)建 1. ChemDraw軟件介紹 1.1 小分子結(jié)構(gòu)構(gòu)建 1.2 小分子理化性質(zhì)(如分子量,、clogP等)計(jì)算 1.3 分別構(gòu)建大環(huán),、氨基酸、DNA,、RNA等分子 小分子化合物庫 2 小分子數(shù)據(jù)庫 2.1 DrugBank,、ZINC,、ChEMBL等數(shù)據(jù)庫介紹及使用 2.2 天然產(chǎn)物,、中藥成分?jǐn)?shù)據(jù)庫介紹及使用 第三天 上午 1. 分子對(duì)接基礎(chǔ) 1.1 分子對(duì)接原理 1.2 分子對(duì)接分類 1.3 分子對(duì)接打分函數(shù) 2. 常規(guī)分子對(duì)接實(shí)踐 2.1 對(duì)接的執(zhí)行 2.1.1 藥物分子配體的準(zhǔn)備 2.1.2 蛋白受體的準(zhǔn)備 2.1.3 受體格點(diǎn)計(jì)算 2.1.3 執(zhí)行半柔性對(duì)接 下午 1.2對(duì)接結(jié)果評(píng)價(jià) 1.2.1 晶體結(jié)構(gòu)構(gòu)象進(jìn)行對(duì)比 1.2.2 能量角度評(píng)價(jià)對(duì)接結(jié)果 1.2.3 聚類分析評(píng)價(jià)對(duì)接結(jié)果 1.2.4 最優(yōu)結(jié)合構(gòu)象的選擇 2 對(duì)接其他方式的實(shí)現(xiàn) 第四天 上午 1 柔性對(duì)接 1.1 小分子配體優(yōu)化準(zhǔn)備 1.2 蛋白受體的準(zhǔn)備 1.3 柔性殘基的定義 1.4 蛋白受體格點(diǎn)計(jì)算 1.5 柔性對(duì)接計(jì)算及結(jié)果評(píng)價(jià) 1.6 半柔性對(duì)接與柔性對(duì)接比較與選擇 2 柔性對(duì)接其他方式的實(shí)現(xiàn) 下午 基于受體的藥物發(fā)現(xiàn) 1 虛擬篩選的準(zhǔn)備 1.1 小分子文件的不同格式 1.2 openbabel最實(shí)用功能的介紹 1.3 小分子不同格式的轉(zhuǎn)化 2. 基于對(duì)接的虛擬篩選 2.1 虛擬篩選定義、流程構(gòu)建及演示 2.2 靶點(diǎn)蛋白選擇,、化合物庫獲取 2.3 虛擬篩選 2.4 結(jié)果分析(打分值,、能量及相互作用分析) 第五天 上午 一些特殊的分子對(duì)接 1.小分子-小分子對(duì)接 1.1小分子-小分子相互作用簡(jiǎn)介 1.2小分子結(jié)構(gòu)預(yù)處理 1.3小分子-小分子對(duì)接(糖-小分子為例) 1.4對(duì)接結(jié)果展示與分析 2. 蛋白-核酸對(duì)接 3. 蛋白-蛋白對(duì)接 下午 基于配體的藥物發(fā)現(xiàn) 1. 3D-QSAR模型構(gòu)建(Sybyl軟件) 1.1 小分子構(gòu)建 1.2 創(chuàng)建小分子數(shù)據(jù)庫 1.3 小分子加電荷及能量?jī)?yōu)化 1.4 分子活性構(gòu)象確定及疊合 1.5 創(chuàng)建3D-QSAR模型 1.6 CoMFA和CoMSIA模型構(gòu)建 1.7 測(cè)試集驗(yàn)證模型 1.8 模型參數(shù)分析 1.9 模型等勢(shì)圖分析 1.10 3D-QSAR模型指導(dǎo)藥物設(shè)計(jì) 第六天 上午 1. linux系統(tǒng)介紹 2.常用命令介紹 3. linux上程序的安裝(gromacs) 下午 MD實(shí)踐一:溶劑化下蛋白質(zhì)分子動(dòng)力學(xué)模擬 全面熟悉分子動(dòng)力學(xué)模擬的一般流程 第七天 上午 MD實(shí)踐二:溶劑化下蛋白質(zhì)-配體的分子動(dòng)力學(xué)模擬 掌握處理非標(biāo)準(zhǔn)殘基的力場(chǎng)擬合 下午 分子動(dòng)力學(xué)模擬中的常用分析命令 蛋白-配體結(jié)合自由能的結(jié)算 第一天 1 人工智能藥物發(fā)現(xiàn)(AIDD)簡(jiǎn)介 2 機(jī)器學(xué)習(xí)和深度學(xué)習(xí)在藥物發(fā)現(xiàn)領(lǐng)域的應(yīng)用 2.1 分子屬性預(yù)測(cè)與優(yōu)化 2.2 虛擬篩選 2.3 藥物副作用預(yù)測(cè)與安全性評(píng)估 2.4 新藥分子設(shè)計(jì) 3 工具介紹與安裝 3.1 Anaconda3/Pycharm 安裝 3.2 Numpy 基礎(chǔ) 3.3 Pandas 基礎(chǔ) 3.4 Matplotlib 基礎(chǔ) 3.5 Scikit-learn 基礎(chǔ) 3.6 Pytorch 基礎(chǔ) 3.7 RDKit 基礎(chǔ) 第二天 1 機(jī)器學(xué)習(xí)簡(jiǎn)介 1.1 機(jī)器學(xué)習(xí)四要素 1.2 數(shù)據(jù)模塊 1.3 核心和高級(jí) API 2 回歸算法與應(yīng)用 2.1 線性回歸 2.2 Lasso 回歸 2.3 Ridge 回歸 2.4 ElasticNset 彈性網(wǎng)絡(luò) 3 分類算法與應(yīng)用 3.1 邏輯回歸 3.2 樸素貝葉斯 3.3 KNN 3.4 SVC 3.5 決策樹 3.6 隨機(jī)森林 3.7 集成學(xué)習(xí) 4 聚類算法 4.1 KMeans 4.2 密度聚類 DBSCAN 5 降維 5.1 奇異值分解 SVD 5.2 主成分分析 PCA 5.3 非負(fù)矩陣分解 NMF 6 模型的評(píng)估方法和評(píng)價(jià)指標(biāo) 6.1 超參數(shù)優(yōu)化 6.2 交叉驗(yàn)證 6.3 評(píng)價(jià)指標(biāo) 7 特征工程 8 機(jī)器學(xué)習(xí)藥物發(fā)現(xiàn)案例(一) ——化合物生物活性分類模型 9 機(jī)器學(xué)習(xí)藥物發(fā)現(xiàn)案例(二) ——化合物生物活性回歸模型 10 機(jī)器學(xué)習(xí)藥物發(fā)現(xiàn)案例(三) —— 藥物副作用預(yù)測(cè)模型 第三天 1 深度學(xué)習(xí)與藥物發(fā)現(xiàn)( 一) 1.1 深度神經(jīng)網(wǎng)絡(luò) 1.2 正向和反向傳播 1.3 優(yōu)化方法 1.3.1 梯度下降增加動(dòng)力 1.3.2 自適應(yīng)學(xué)習(xí) 1.3.3 Adam 1.4 損失函數(shù) 1.4.1 平均絕對(duì)誤差 1.4.2 均方誤差損失函數(shù) 1.4.3 交叉熵?fù)p失函數(shù) 1.5 卷積神經(jīng)網(wǎng)絡(luò) 1.5.1 卷 1.5.2 填充和步幅 1.5.3 池化層 1.5.4 LeNet 網(wǎng)絡(luò) 1.5.5 AlexNet 網(wǎng)絡(luò) 2 深度學(xué)習(xí)藥物發(fā)現(xiàn)案例(一) —— 藥物-藥物相互作用預(yù)測(cè)模型 第四天 1 深度學(xué)習(xí)與藥物發(fā)現(xiàn)( 二) 1.1 循環(huán)神經(jīng)網(wǎng)絡(luò) 1.2 消息傳遞神經(jīng)網(wǎng)絡(luò) 1.3 圖卷積神經(jīng)網(wǎng)絡(luò) 1.4 圖注意力神經(jīng)網(wǎng)絡(luò) 1.5 圖采樣和聚合 2 深度學(xué)習(xí)藥物發(fā)現(xiàn)案例(二) —— 藥物靶標(biāo)相互作用預(yù)測(cè)模型 3 深度學(xué)習(xí)藥物發(fā)現(xiàn)案例(三) —— 藥物重定位模型 第五天 1 深度學(xué)習(xí)與藥物發(fā)現(xiàn) (三) 1.1 注意力機(jī)制 1.2 自注意力模型 1.3 多頭自注意力模型 1.4 交叉注意力模型 1.5 Transformer 模型 2 深度學(xué)習(xí)藥物發(fā)現(xiàn)案例(四) —— 藥物-藥物相互作用預(yù)測(cè)模型 3 深度學(xué)習(xí)藥物發(fā)現(xiàn)案例(五) —— 藥物靶標(biāo)結(jié)合親和力預(yù)測(cè)模型 上下滑動(dòng)查看更多內(nèi)容 副作用在藥物-藥物相似性網(wǎng)絡(luò)中傳播 利用藥物關(guān)聯(lián)網(wǎng)絡(luò)特征和深度神經(jīng)網(wǎng)絡(luò)識(shí)別藥物之間潛在相互作用事件 通過深度學(xué)習(xí)整合來自異構(gòu)網(wǎng)絡(luò)的鄰接信息以發(fā)現(xiàn)新的藥物靶點(diǎn)相互作用 將藥物和蛋白質(zhì)信息關(guān)聯(lián)起來的帶有注意力區(qū)塊的 AttentionDTA 模型 Part.專題三 上下滑動(dòng)查看更多內(nèi)容 Part.專題四 冷凍電鏡結(jié)構(gòu)解析 冷凍電鏡在結(jié)構(gòu)生物學(xué)的應(yīng)用及單顆粒冷凍電鏡結(jié)構(gòu)解析 第一天 一,、冷凍電鏡的起源和發(fā)展 1,,冷凍電鏡的起源 2,冷凍電鏡原理 3,,相機(jī)的發(fā)展 4,,冷凍制樣方法的發(fā)展
1,,單顆粒冷凍電鏡(single particle Cryo-EM analysis) 2,,原位冷凍電鏡(cryo-ET) 3,微晶電子衍射(Micro-ED) 第二天
1,,結(jié)構(gòu)解析方法概述 2,單顆粒冷凍電鏡方法的應(yīng)用 3,,單顆粒冷凍電鏡在結(jié)構(gòu)解析和藥物開發(fā)中的應(yīng)用
1,基本概念 2,,冷凍透射電鏡的構(gòu)造 3,成像原理簡(jiǎn)介 第三天
1,,冷凍電鏡樣品概述 2,冷凍電鏡樣品類型和處理方法 3,樣品制備方法及優(yōu)缺點(diǎn) 4,,冷凍載網(wǎng)的選擇(載網(wǎng)類型及特點(diǎn))
1,數(shù)據(jù)收集軟件 2,,數(shù)據(jù)收集流程和注意事項(xiàng) 數(shù)據(jù)分析和評(píng)價(jià) 第四天
1,數(shù)據(jù)處理基本原理軟件介紹 2,,數(shù)據(jù)處理過程基本概念 3,,軟件使用,數(shù)據(jù)處理流程及注意事項(xiàng) 4,,數(shù)據(jù)處理軟件的注意事項(xiàng)和軟件系統(tǒng)的相互轉(zhuǎn)換 第五天
1,Chimera,,ChimeraX 軟件下載安裝 2,,軟件基本使用規(guī)則 3,Chimera在冷凍電鏡數(shù)據(jù)處理中的應(yīng)用
1,,Coot,Phenix 軟件的下載安裝 2,,模型搭建基本流程 3,,結(jié)構(gòu)修正及評(píng)價(jià) 上下滑動(dòng)查看更多內(nèi)容 Part.專題五 第一天 基因編輯簡(jiǎn)介 1.基因編輯基本概念介紹 2.單基因遺傳病數(shù)據(jù)庫 (實(shí)操) 3.基因編輯歷史 4.TALEN 5.Zinc finger 6.Base editor 7.Prime editor 第二天 1.如何選擇正確Cas9蛋白類型 2.gRNA設(shè)計(jì)和軟件(實(shí)操) 3.sgRNA修飾 4.手動(dòng)設(shè)計(jì)PegRNA的八個(gè)要點(diǎn)(實(shí)操) 5.七種PegRNA輔助設(shè)計(jì)軟件 第三天 1.AAV遞送(組織靶向) 2.脂質(zhì)體遞送 3.核糖核蛋白遞送 4.高分子遞送 5.Viral like particles遞送 6.外泌體遞送 7.無機(jī)納米粒遞送 8. 電轉(zhuǎn) 9. 超聲 10. 顯微注射 第四天 1.動(dòng)物模型 2.質(zhì)粒 3.分子克隆基礎(chǔ) 4.AAV設(shè)計(jì)(實(shí)操) 5.Base editing文章分析 6.Prime editing 相關(guān)的140篇文章概覽 7.如何提高Prime editing效率 第五天 1.基因編輯已經(jīng)批準(zhǔn)的藥物 2. 臨床試驗(yàn) 3.主要公司、科學(xué)家和專利 4.副作用和退市的產(chǎn)品 5.FDA政策 6.CRISPR在診斷中的應(yīng)用 7.CRISPR library 8.CRISPR與單細(xì)胞測(cè)序 9. CRISPR與表觀遺傳學(xué) 10. CIRPSR在植物學(xué)中的應(yīng)用 11. 設(shè)計(jì)課題與評(píng)價(jià)(實(shí)操) 上下滑動(dòng)查看更多內(nèi)容 Part.專題六 第一天 A1 代謝物及代謝組學(xué)的發(fā)展與應(yīng)用 (1) 代謝生理功能,; (2) 代謝疾?。?/strong> (3) 非靶向與靶向代謝組學(xué),; (4) 空間代謝組學(xué)與質(zhì)譜成像(MSI),; (5) 代謝流與機(jī)制研究; (6) 代謝組學(xué)與藥物和生物標(biāo)志物,。 A2 代謝組學(xué)實(shí)驗(yàn)流程簡(jiǎn)介 A3 色譜,、質(zhì)譜硬件原理 (1) 色譜分析原理; (2) 色譜的氣相,、液相和固相,; (3) 色譜儀和色譜柱的選擇; (4) 質(zhì)譜分析原理及動(dòng)畫演示,; (5) 正,、負(fù)離子電離模式; (6) 色譜質(zhì)譜聯(lián)用技術(shù),; (7) LC-MS 的液相系統(tǒng) A4 代謝通路及代謝數(shù)據(jù)庫 (1) 幾種經(jīng)典代謝通路簡(jiǎn)介,; (2) 能量代謝通路,; (3) 三大常見代謝物庫:HMDB、METLIN 和 KEGG; (4) 代謝組學(xué)原始數(shù)據(jù)庫:Metabolomics Workbench 和Metabolights. 第二天 B1 代謝物樣本處理與抽提 (1) 組織,、血液和體液樣本的提取流程與注意事項(xiàng),; (2) 用 ACN 抽提代謝物的流程與注意事項(xiàng); (3) 樣本及代謝物的運(yùn)輸與保存問題,; B2 LC-MS 數(shù)據(jù)質(zhì)控與搜庫 (1) LC-MS 實(shí)驗(yàn)過程中 QC 樣本的設(shè)置方法,; (2) LC-MS 上機(jī)過程的數(shù)據(jù)質(zhì)控監(jiān)測(cè)和分析; (3) XCMS 軟件數(shù)據(jù)轉(zhuǎn)換與提峰,; B3 R 軟件基礎(chǔ) (1) R 和 Rstudio 的安裝,; (2) Rstudio 的界面配置; (3) R 的基本數(shù)據(jù)結(jié)構(gòu)和語法,; (4) 下載與加載包,; (5) 函數(shù)調(diào)用和 debug; B4 ggplot2 (1) 安裝并使用 ggplot2 (2) ggplot2 的畫圖哲學(xué),; (3) ggplot2 的配色系統(tǒng),; (4) ggplot2 畫組合圖和火山圖; 第三天 機(jī)器學(xué)習(xí) C1 無監(jiān)督式機(jī)器學(xué)習(xí)在代謝組學(xué)數(shù)據(jù)處理中的應(yīng)用 (1) 大數(shù)據(jù)處理中的降維,; (2) PCA 分析作圖,; (3) 三種常見的聚類分析:K-means、層次分析與 SOM (4) 熱圖和 hcluster 圖的 R 語言實(shí)現(xiàn),; C2 一組代謝組學(xué)數(shù)據(jù)的降維與聚類分析的 R 演練 (1) 數(shù)據(jù)解析,; (2) 演練與操作; C3 有監(jiān)督式機(jī)器學(xué)習(xí)在代謝組學(xué)數(shù)據(jù)處理中的應(yīng)用 (1) 數(shù)據(jù)用 PCA 降維處理后仍然無法找到差異怎么辦,? (2) PLS-DA 找出最可能影響差異的代謝物,; (3) VIP score 和 coef 的意義及選擇; (4) 分類算法:支持向量機(jī),,隨機(jī)森林 C4 一組代謝組學(xué)數(shù)據(jù)的分類算法實(shí)現(xiàn)的 R 演練 (1) 數(shù)據(jù)解讀,; (2) 演練與操作; 第四天 D1 代謝組學(xué)數(shù)據(jù)清洗與 R 語言進(jìn)階 (1) 代謝組學(xué)中的 t,、fold-change 和響應(yīng)值,; (2) 數(shù)據(jù)清洗流程; (3) R 語言 tidyverse (4) R 語言正則表達(dá)式,; (5) 代謝組學(xué)數(shù)據(jù)過濾,; (6) 代謝組學(xué)數(shù)據(jù) Scaling 原理與 R 實(shí)現(xiàn); (7) 代謝組學(xué)數(shù)據(jù)的 Normalization,; (8) 代謝組學(xué)數(shù)據(jù)清洗演練,; D2 在線代謝組分析網(wǎng)頁 Metaboanalyst 操作 (1) 用 R 將數(shù)據(jù)清洗成網(wǎng)頁需要的格式; (2) 獨(dú)立組,、配對(duì)組和多組的數(shù)據(jù)格式問題,; (3) Metaboanalyst 的 pipeline 和注意事項(xiàng),; (4) Metaboanalyst 的結(jié)果查看和導(dǎo)出,; (5) Metaboanalyst 的數(shù)據(jù)編輯,; (6) 全流程演練與操作 第五天 E1 機(jī)器學(xué)習(xí)與代謝組學(xué)頂刊解讀(2-3 篇); (1) Nature Communication 一篇代謝組學(xué)小鼠腦組織樣本 database 類型的文獻(xiàn),; (2) Cell 一篇代謝組學(xué)患者血液樣本的機(jī)器學(xué)習(xí)與疾病判斷的文獻(xiàn),; (3) 1-2 篇代謝組學(xué)與轉(zhuǎn)錄組學(xué)和蛋白組學(xué)結(jié)合的文獻(xiàn)。 E2 文獻(xiàn)數(shù)據(jù)分析部分復(fù)現(xiàn)(1 篇) (1) 文獻(xiàn)深度解讀,; (2) 實(shí)操:從原始數(shù)據(jù)下載到圖片復(fù)現(xiàn),; (3) 學(xué)員實(shí)操。 上下滑動(dòng)查看更多內(nèi)容 第一天 1. 微生物學(xué)基礎(chǔ)知識(shí)回顧 2. 機(jī)器學(xué)習(xí)基本概念介紹 a. 什么是機(jī)器學(xué)習(xí) b. 監(jiān)督學(xué)習(xí),、無監(jiān)督學(xué)習(xí) c. 常用機(jī)器學(xué)習(xí)模型介紹 3. 混淆矩陣 4. ROC曲線 第二天 R語言簡(jiǎn)介與實(shí)操 1. R語言概述 2. R studio軟件與R包安裝 3. R語言語法及數(shù)據(jù)類型 4. 條件語句和循環(huán) Linux實(shí)操 1. Linux操作系統(tǒng) 2. Linux操作系統(tǒng)的安裝與設(shè)置 3. 網(wǎng)絡(luò)配置與服務(wù)進(jìn)程管理 4. Linux的遠(yuǎn)程登錄管理 5. 常用的Linux命令 6. 在Linux下獲取基因數(shù)據(jù) 7. Shell script與Vim編輯器 第三天 微生物組常用分析方法(實(shí)操) 1. 微生物豐度分析 2. 轉(zhuǎn)錄組豐度分析 3. 進(jìn)化樹分析 4. 降維分析 第四天 機(jī)器學(xué)習(xí)在微生物組學(xué)中的應(yīng)用案例分享 1. 疾病預(yù)測(cè)應(yīng)用:利用機(jī)器學(xué)習(xí)基于微生物組學(xué)數(shù)據(jù)預(yù)測(cè)疾病狀態(tài) 2. 腸道菌群研究:機(jī)器學(xué)習(xí)研究飲食對(duì)腸道微生物的影響 第五天 機(jī)器學(xué)習(xí)模型訓(xùn)練和分析(實(shí)操) 1. 加載數(shù)據(jù)及數(shù)據(jù)歸一化 2. 構(gòu)建訓(xùn)練模型(GLM, RF, SVM) 3. 模型參數(shù)優(yōu)化 4. 模型錯(cuò)誤率曲線繪制 5. 混淆矩陣計(jì)算 6. 重要特征篩選 7. 模型驗(yàn)證,,ROC曲線繪制利用模型進(jìn)行預(yù)測(cè) 利用機(jī)器學(xué)習(xí)基于微生物組學(xué)數(shù)據(jù)預(yù)測(cè)宿主表型 1. 加載數(shù)據(jù) 2. 數(shù)據(jù)歸一化 3. OUT特征處理 4. 機(jī)器學(xué)習(xí)模型構(gòu)建(RF, KNN, SVM, Lasso等多種機(jī)器學(xué)習(xí)方法) 5. 繪制ROC 曲線,比較不同機(jī)器學(xué)習(xí)模型模型性能評(píng)估 利用機(jī)器學(xué)習(xí)基于臨床特征和腸道菌群預(yù)測(cè)疾病風(fēng)險(xiǎn) 1. 加載數(shù)據(jù) 2. 機(jī)器學(xué)習(xí)模型構(gòu)建(RF, gbm, SVM等等) 3. 交叉驗(yàn)證 4. 模型性能評(píng)估 上下滑動(dòng)查看更多內(nèi)容 第一天 理論部分 深度學(xué)習(xí)算法介紹 1.有監(jiān)督學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)算法 1.1全連接深度神經(jīng)網(wǎng)絡(luò)DNN在基因組學(xué)中的應(yīng)用舉例 1.2卷積神經(jīng)網(wǎng)絡(luò)CNN在基因組學(xué)中的應(yīng)用舉例 1.3循環(huán)神經(jīng)網(wǎng)絡(luò)RNN在基因組學(xué)中的應(yīng)用舉例 1.4圖卷積神經(jīng)網(wǎng)絡(luò)GCN在基因組學(xué)中的應(yīng)用舉例 2.無監(jiān)督的神經(jīng)網(wǎng)絡(luò)算法 2.1自動(dòng)編碼器AE在基因組學(xué)中的應(yīng)用舉例 2.2生成對(duì)抗網(wǎng)絡(luò)GAN在基因組學(xué)中的應(yīng)用舉例 實(shí)操內(nèi)容 1.Linux操作系統(tǒng) 1.1常用的Linux命令 1.2 Vim編輯器 1.3基因組數(shù)據(jù)文件管理, 修改文件權(quán)限 1.4查看探索基因組區(qū)域 2.Python語言基礎(chǔ) 2.1.Python包安裝和環(huán)境搭建 2.2.常見的數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)類型 第二天 理論部分 基因組學(xué)基礎(chǔ) 1. 基因組數(shù)據(jù)庫 2. 表觀基因組 3. 轉(zhuǎn)錄基因組 4. 蛋白質(zhì)組 5. 功能基因組 實(shí)操內(nèi)容 基因組常用深度學(xué)習(xí)框架 1. 安裝并介紹深度學(xué)習(xí)工具包tensorflow, keras,,pytorch 2. 在工具包中識(shí)別深度學(xué)習(xí)模型要素 2.1.數(shù)據(jù)表示 2.2.張量運(yùn)算 2.3.神經(jīng)網(wǎng)絡(luò)中的“層” 2.4.由層構(gòu)成的模型 2.5.損失函數(shù)與優(yōu)化器 2.6.數(shù)據(jù)集分割 2.7.過擬合與欠擬合 3.基因組數(shù)據(jù)處理 3.1安裝并使用keras_dna處理各種基因序列數(shù)據(jù)如BED,、 GFF、GTF,、BIGWIG,、BEDGRAPH、WIG等 3.2使用keras_dna設(shè)計(jì)深度學(xué)習(xí)模型 3.3使用keras_dna分割訓(xùn)練集,、測(cè)試集 3.4使用keras_dna選取特定染色體的基因序列等 第三天 理論部分 卷積神經(jīng)網(wǎng)絡(luò)CNN在基因調(diào)控預(yù)測(cè)中的應(yīng)用 1. Chip-Seq中識(shí)別基序特征G4,,如DeepG4 2. Chip-Seq中預(yù)測(cè)DNA甲基化,DeepSEA 3. Chip-Seq中預(yù)測(cè)轉(zhuǎn)錄調(diào)控因子結(jié)合,,DeepSEA 實(shí)操內(nèi)容 復(fù)現(xiàn)卷積神經(jīng)網(wǎng)絡(luò)CNN識(shí)別基序特征DeepG4,、非編碼基因突變DeepSEA復(fù)現(xiàn)DeepG4從Chip-Seq中識(shí)別G4特征 1. 安裝selene_sdk,復(fù)現(xiàn)DeepSEA從Chip-Seq中預(yù)測(cè)DNA甲基化,,非編碼基因突變 第四天 理論部分 深度學(xué)習(xí)在識(shí)別拷貝數(shù)變異DeepCNV 1. SNP微陣列中預(yù)測(cè)拷貝數(shù)變異CNV,,DeepCNV 2. RNA-Seq中預(yù)測(cè)premiRNA,dnnMiRPre 實(shí)操內(nèi)容 1. 復(fù)現(xiàn)DeepCNV利用SNP微陣列聯(lián)合圖像分析識(shí)別拷貝數(shù)變異 2. 復(fù)現(xiàn)循環(huán)神經(jīng)網(wǎng)絡(luò)RNN工具 dnnMiRPre,,從RNA-Seq中預(yù)測(cè)premiRNA 第五天 理論部分 深度學(xué)習(xí)在識(shí)別及疾病表型及生物標(biāo)志物上的應(yīng)用 1. 從基因表達(dá)數(shù)據(jù)中識(shí)別乳腺癌分型的深度學(xué)習(xí)工具DeepType 實(shí)操內(nèi)容 1. 復(fù)現(xiàn)DeepType,,從METABRIC乳腺癌數(shù)據(jù)中區(qū)分乳腺癌亞型 第六天 理論部分 深度學(xué)習(xí)在預(yù)測(cè)藥物反應(yīng)機(jī)制上的應(yīng)用 1. 聯(lián)合腫瘤基因標(biāo)記及藥物分子結(jié)構(gòu)預(yù)測(cè)藥物反應(yīng)機(jī)制的深度學(xué)習(xí)工具SWnet 實(shí)操內(nèi)容 1. 預(yù)處理藥物分子結(jié)構(gòu)信息 2. 計(jì)算藥物相似性 3. 在不同數(shù)據(jù)集上構(gòu)建self-attention SWnet 4. 評(píng)估self-attention SWnet 5. 構(gòu)建多任務(wù)的SWnet 6. 構(gòu)建單層SWnet 7. 構(gòu)建帶權(quán)值層的SWnet 上下滑動(dòng)查看更多內(nèi)容 Part.專題九 第一天 機(jī)器學(xué)習(xí)及相關(guān)概念介紹 機(jī)器學(xué)習(xí)基本概念介紹 常用機(jī)器學(xué)習(xí)模型介紹 主成分分析 一致性聚類分析 ROC曲線及時(shí)間依賴的ROC曲線 生存分析及生存曲線 預(yù)后模型介紹 R語言入門 R語言概述 R軟件及R包安裝 R語言語法及數(shù)據(jù)類型 條件語句 循環(huán) 函數(shù) 常用的機(jī)器學(xué)習(xí)相關(guān)的R包介紹 第二天 機(jī)器學(xué)習(xí)在生物醫(yī)學(xué)中的應(yīng)用案例分享 利用機(jī)器學(xué)習(xí)方法篩選疾病相關(guān)的生物標(biāo)志物 機(jī)器學(xué)習(xí)+生存分析預(yù)測(cè)患病風(fēng)險(xiǎn) 機(jī)器學(xué)習(xí)+生存分析預(yù)測(cè)患者預(yù)后 常用生物醫(yī)學(xué)公共數(shù)據(jù)庫介紹 TCGA數(shù)據(jù)庫介紹 TCGA數(shù)據(jù)庫表達(dá)譜數(shù)據(jù)下載 TCGA臨床數(shù)據(jù)下載 合并TCGA表達(dá)譜數(shù)據(jù) GEO數(shù)據(jù)庫介紹 GEO數(shù)據(jù)庫檢索 GEO數(shù)據(jù)下載 第三天 機(jī)器學(xué)習(xí)+ GEO公共數(shù)據(jù),復(fù)現(xiàn)科研文章 差異表達(dá)分析 主成分分析 機(jī)器學(xué)習(xí)模型構(gòu)建 特征篩選及重要性評(píng)估 模型評(píng)估及ROC曲線繪制 構(gòu)建nomogram模型,,繪制列線圖 矯準(zhǔn)曲線繪制 決策曲線繪制 一致性聚類分析 GSEA分析 第四天 機(jī)器學(xué)習(xí)+TCGA公共數(shù)據(jù),,復(fù)現(xiàn)科研文章 差異表達(dá)分析 主成分分析 火山圖,熱圖繪制 GO和KEGG富集分析及可視化 生存分析,,生存曲線繪制 一致性聚類分析 訓(xùn)練集,,測(cè)試集拆分 單因素,多因素cox分析 Lasso回歸分析 風(fēng)險(xiǎn)評(píng)估模型構(gòu)建 riskscore計(jì)算 Nomogram模型構(gòu)建,,繪制列線圖 時(shí)間依賴ROC曲線繪制 矯準(zhǔn)曲線,,決策曲線繪制 第五天 ceRNA網(wǎng)格構(gòu)建 miRNA,,lncRNA,circRNA介紹 miRNA,,lncRNA,,circRNA相關(guān)數(shù)據(jù)庫及工具介紹 ceRNA案例分享 實(shí)操部分 差異mRNA,lncRNA,,miRNA分析 火山圖,,熱圖,聚類圖,,柱狀圖 差異表達(dá)基因GO,KEGG富集分析,,氣泡圖,柱狀圖,,KEGG通路圖展示 生存分析,,生存曲線繪制 mRNA,lncRNA表達(dá)相關(guān)性分析,,相關(guān)性散點(diǎn)圖 mRNA, lncRNA, miRNA網(wǎng)絡(luò)構(gòu)建 cytoscape展示ceRNA網(wǎng)絡(luò),,hub基因篩選 上下滑動(dòng)查看更多內(nèi)容 結(jié)果展示: 講師介紹 01.「CADD計(jì)算機(jī)輔助藥物設(shè)計(jì)」 主講老師來自國(guó)內(nèi)高校、中科院等單位,,老師主要擅長(zhǎng)深度學(xué)習(xí),、機(jī)器學(xué)習(xí)、藥物虛擬篩選,、計(jì)算機(jī)輔助藥物設(shè)計(jì),、人工智能藥物發(fā)現(xiàn)、分子對(duì)接,、分子動(dòng)力學(xué)等方面的研究 02.「AIDD人工智能藥物發(fā)現(xiàn)與設(shè)計(jì)」 授課老師余老師,,有十余年的計(jì)算機(jī)算法研究和程序設(shè)計(jì)經(jīng)驗(yàn)。研究方向涉及生物信息學(xué),,深度學(xué)習(xí),,藥物靶標(biāo)識(shí)別,藥物不良反應(yīng)等,。參與了國(guó)自然基金2項(xiàng),,主持了省廳級(jí)科研項(xiàng)目3項(xiàng)。一作身份發(fā)表SCI論文數(shù)篇,,包括BMC Bioinformatics, Journal of Biomedical Informatics, International Journal of Molecular Sciences等知名期刊,。 03.「蛋白晶體結(jié)構(gòu)解析」 范教授畢業(yè)于中國(guó)科學(xué)院生物物理研究所,師從著名結(jié)構(gòu)生物學(xué)家王院士,,具有美國(guó)耶魯大學(xué)留學(xué)六年多的背景,,為獨(dú)立PI。研究方向是結(jié)構(gòu)生物學(xué)和免疫學(xué),;除了深鉆結(jié)構(gòu)生物學(xué)和免疫學(xué),,還在積極參與和推動(dòng)結(jié)構(gòu)生物學(xué)的教育工作,,應(yīng)邀在多所高校或者科研研究所開展結(jié)構(gòu)生物學(xué)課程講授,,在多種國(guó)際期刊上發(fā)表論文30余篇,,均為SCI,作為第一作者或通訊作者4篇一區(qū),,包括國(guó)際頂尖雜志PNAS兩篇,,一區(qū)top2篇等,。并承擔(dān)國(guó)家自然科學(xué)基金面上項(xiàng)目等,;作為國(guó)際著名學(xué)術(shù)雜志Nature Communication和Journal of Virology, Structure等的審稿人。 04.「CRISPR-Cas9基因編輯技術(shù)」 主講老師來自加州大學(xué)生物醫(yī)學(xué)工程專業(yè)博士,,曾在麻省理工和哈佛大學(xué)從事基因編輯研究,,在耶魯大學(xué)從事基因遞送工作。文章發(fā)表在Nature Biomedical Engineering,、Nature Communications等雜志上,。曾在天使投資機(jī)構(gòu)工作,主要投資基因編輯,、單細(xì)胞測(cè)序,、AI制藥等方向的創(chuàng)業(yè)公司。 05.「機(jī)器學(xué)習(xí)代謝組學(xué)」 主講老師來自985高校神經(jīng)科學(xué)博士,,主要利用代謝組學(xué),、轉(zhuǎn)錄組學(xué)和分子生物學(xué)等技術(shù)研究神經(jīng)內(nèi)科慢性病的發(fā)病機(jī)制和生物標(biāo)志物。擅長(zhǎng)高效液相色譜-質(zhì)譜聯(lián)用(LC-MS)技術(shù)進(jìn)行非靶向和靶向代謝組學(xué)從樣本制備到數(shù)據(jù)分析的全流程研究,,以及多組學(xué)大數(shù)據(jù)的生物信息學(xué)整合分析,。5年內(nèi)在J Clin Invest, EBioMedicine, Cell Death Dis, Cell Death Discov, Nanotoxicology等雜志發(fā)表SCI論文10篇。 06.「機(jī)器學(xué)習(xí)微生物組學(xué)」 主講老師來自生物科技公司核心高管,,曾在麻省理工學(xué)院,、加州大學(xué)舊金山分校等機(jī)構(gòu)工作,過去5年科研工作發(fā)表于Cell,、PNAS等雜志 07.「深度學(xué)習(xí)基因組學(xué)」 主講老師劉老師,,生物信息學(xué)博士,有十余年的測(cè)序數(shù)據(jù)分析經(jīng)驗(yàn),。研究領(lǐng)域涉及人工智能,、自然語言處理、功能基因組學(xué),、轉(zhuǎn)錄組學(xué),、miRNA及靶基因網(wǎng)絡(luò)分析,單細(xì)胞測(cè)序數(shù)據(jù)分析,,基因調(diào)控網(wǎng)絡(luò)時(shí)序分析,,蛋白質(zhì)互作網(wǎng)絡(luò)分析,,多組學(xué)聯(lián)合分析等。主持省自然科學(xué)基金等項(xiàng)目4項(xiàng),,發(fā)表SCI論文23篇,,論著一部。 08.「機(jī)器學(xué)習(xí)在生物醫(yī)學(xué)中的應(yīng)用」 主講老師生物信息學(xué)博士,,有十余年的測(cè)序數(shù)據(jù)分析經(jīng)驗(yàn),。研究領(lǐng)域涉及機(jī)器學(xué)習(xí)、芯片數(shù)據(jù)分析,、核酸及蛋白序列分析,、DNA、RNA,、甲基化測(cè)序數(shù)據(jù)分析,,單細(xì)胞測(cè)序數(shù)據(jù)分析,miRNA及靶基因分析,,生存分析及預(yù)后模型構(gòu)建等,。具有5年培訓(xùn)經(jīng)驗(yàn),對(duì)常用公共數(shù)據(jù)庫TCGA,、NCBI,、UCSCGEO等非常熟悉。發(fā)表SCI論文30余篇,,其中一作及并列一作15篇,。 09.「冷凍電鏡結(jié)構(gòu)解析」 來自中科院所畢業(yè)的結(jié)構(gòu)生物學(xué)博士,主要利用單顆粒冷凍電鏡手段研究作用于藥物靶點(diǎn)的的分子機(jī)制和基于結(jié)構(gòu)的藥物設(shè)計(jì),。目前主要研究方向?yàn)槟さ鞍准安《鞠嚓P(guān)蛋白的結(jié)構(gòu)研究,。5年內(nèi)在國(guó)內(nèi)外頂尖雜志包括Nature、NatureCommunications,、Cell Research 等雜志發(fā)表文章數(shù)篇,。 01 培訓(xùn)對(duì)象 培訓(xùn)目標(biāo) 01.「CADD計(jì)算機(jī)輔助藥物設(shè)計(jì)」 讓學(xué)員能夠掌握包括PDB數(shù)據(jù)庫,、靶點(diǎn)蛋白、蛋白質(zhì)-配體,、蛋白-配體小分子,、蛋白-配體結(jié)構(gòu)、notepad的介紹和使用,、分子對(duì)接,、蛋白-配體對(duì)接、虛擬篩選,、蛋白-蛋白對(duì)接,、蛋白-多糖分子對(duì)接、蛋白-水合對(duì)接,、Linux安裝,、gromacs分 子動(dòng)力學(xué)全程實(shí)操、溶劑化分子動(dòng)力學(xué)模擬 02.「AIDD人工智能藥物發(fā)現(xiàn)與設(shè)計(jì)」 本課程讓學(xué)員了解藥物發(fā)現(xiàn)的前沿背景,,學(xué)習(xí)人工智能領(lǐng)域的各類常見算法,,熟悉工具包的安裝與使用,掌握一定的算法編程能力,能夠運(yùn)用計(jì)算機(jī)方法研究藥物相關(guān)問題,。通過大量的案例講解和實(shí)踐操作,,具備一定的AIDD模型構(gòu)建和數(shù)據(jù)分析能力 03.「蛋白晶體結(jié)構(gòu)解析」 近年來結(jié)構(gòu)生物學(xué)發(fā)展迅速并和其他學(xué)科相互滲透交叉,特別是受到結(jié)構(gòu)基因組學(xué)等熱點(diǎn)學(xué)科的極大帶動(dòng)。作為結(jié)構(gòu)生物學(xué)的基本手段和技術(shù),蛋白質(zhì)晶體學(xué)從解析簡(jiǎn)單的蛋白質(zhì)三維結(jié)構(gòu)延伸到解決各類生物大分子及復(fù)合物結(jié)構(gòu),并更加注重研究結(jié)構(gòu)與功能之間的相互關(guān)系,派生出諸如基于結(jié)構(gòu)的藥物設(shè)計(jì)等應(yīng)用性很強(qiáng)的分支,。生物技術(shù)及計(jì)算機(jī)技術(shù)的飛速發(fā)展,尤其是高通量技術(shù)在生物學(xué)領(lǐng)域的應(yīng)用,為蛋白質(zhì)晶體學(xué)帶來了全新的概念和更加廣闊的前景,。 04.「CRISPR-Cas9基因編輯技術(shù)」 課程從全局出發(fā),由淺入深,,課程通過基礎(chǔ)入門+應(yīng)用案例實(shí)操演練的方式,,從最初的原理講解到最后的應(yīng)用實(shí)戰(zhàn),學(xué)完本課程你將掌握基因編輯技術(shù)的相關(guān)原理及其應(yīng)用,,此外可以學(xué)到基因編輯系統(tǒng)的優(yōu)化策略,,可以學(xué)到如何操作常用的生物學(xué)軟件。能夠快速運(yùn)用到自己的科研項(xiàng)目和課題上,。 05.「機(jī)器學(xué)習(xí)代謝組學(xué)」 熟悉代謝組學(xué)和機(jī)器學(xué)習(xí)相關(guān)硬件和軟件,;熟悉代謝組學(xué)從樣本處理到數(shù)據(jù)分析的全流程;能復(fù)現(xiàn)至少1篇CNS或子刊級(jí)別的代謝組學(xué)文章圖片,。 06.「機(jī)器學(xué)習(xí)微生物組學(xué)」 通過本次培訓(xùn)多個(gè)案例的系統(tǒng)講解讓參會(huì)學(xué)員學(xué)會(huì)機(jī)器學(xué)習(xí)在微生物組數(shù)據(jù)分析流程,,能夠快速運(yùn)用到自己的科研項(xiàng)目和課題上。 07.「深度學(xué)習(xí)基因組學(xué)」 適于對(duì)深度學(xué)習(xí),、課程通過基礎(chǔ)入門+應(yīng)用案例實(shí)操演練的方式,,從初學(xué)及應(yīng)用研究的角度出發(fā),帶大家實(shí)戰(zhàn)演練多種深度學(xué)習(xí)模型(深度神經(jīng)網(wǎng)絡(luò) DNN,、 卷積神經(jīng)網(wǎng)絡(luò) CNN,、循環(huán)神經(jīng)網(wǎng)絡(luò) RNN、可變自動(dòng)編碼器 VAE,、圖卷積神經(jīng)網(wǎng)絡(luò) GCN)在基因組學(xué)分析中的各種應(yīng)用:識(shí)別 G4 基 序特征 DeepG4,,識(shí)別非編碼基因突變 DeepSEA,預(yù)測(cè)染色體親和性 Basset,,預(yù)測(cè)基因表達(dá) eQTL 的 Enformer,、識(shí)別拷貝數(shù)變異 DeepCNV、預(yù)測(cè)調(diào)控因子 DeepFactor,、預(yù)測(cè) premiRNA 的 dnnmiRNA,、從基因表達(dá)數(shù)據(jù)中識(shí)別乳腺癌分型 DeepType、從高維多 組學(xué)數(shù)據(jù)中識(shí)別疾病表型 XOmiVAE,、從基因序列及蛋白質(zhì)相互作用網(wǎng)絡(luò)中識(shí)別關(guān)鍵基因 DeepHE,、聯(lián)合腫瘤基因標(biāo)記及藥物分子結(jié) 構(gòu)預(yù)測(cè)藥物反應(yīng)機(jī)制的 SWnet 等深度學(xué)習(xí)工具。通過對(duì)這些深度學(xué)習(xí)在基因組學(xué)中的應(yīng)用案例進(jìn)行深度講解和實(shí)操,,讓學(xué)員能夠掌 握深度學(xué)習(xí)分析高維基因組學(xué),、轉(zhuǎn)錄組學(xué)、蛋白組學(xué)等多組學(xué)數(shù)據(jù)流程,系統(tǒng)學(xué)習(xí)深度學(xué)習(xí)及基因組學(xué)理論知識(shí)及熟悉軟件代碼實(shí)操,, 熟練掌握這些前沿的分析工具的使用以及研究創(chuàng)新深度學(xué)習(xí)算法解決生物學(xué)及臨床疾病問題與需求,。 08.「機(jī)器學(xué)習(xí)在生物醫(yī)學(xué)中的應(yīng)用」 通過本次學(xué)習(xí),你將了解機(jī)器學(xué)習(xí)基本概念及常用機(jī)器學(xué)習(xí)模型的原理,;生存分析及風(fēng)險(xiǎn)模型的構(gòu)建,;R語言構(gòu)建常用機(jī)器學(xué)習(xí)模型;機(jī)器學(xué)習(xí)常見圖,,表的繪制,;生存分析,預(yù)后模型常見圖,,表的繪制 09.「冷凍電鏡結(jié)構(gòu)解析」 冷凍電鏡結(jié)構(gòu)解析課程致力于培養(yǎng)學(xué)員掌握冷凍電鏡在結(jié)構(gòu)生物學(xué)和基于結(jié)構(gòu)的藥物設(shè)計(jì)中的應(yīng)用,,掌握單顆粒冷凍電鏡結(jié)構(gòu)解析原理,實(shí)驗(yàn)方法和實(shí)際應(yīng)用,。通過深入的理論講解和實(shí)際操作,,學(xué)員將逐步建立對(duì)這一關(guān)鍵領(lǐng)域的深刻理解。 |
|