久久国产成人av_抖音国产毛片_a片网站免费观看_A片无码播放手机在线观看,色五月在线观看,亚洲精品m在线观看,女人自慰的免费网址,悠悠在线观看精品视频,一级日本片免费的,亚洲精品久,国产精品成人久久久久久久

分享

世上至強 植物 phasiRNA 數(shù)據(jù)分析流程,!

 生信藥丸 2021-07-26

寫在前面

沒錯,,標(biāo)題黨就是我!
這幾天在忙課題的一些東西,,其中涉及到一些 PhasiRNA 數(shù)據(jù)分析,。討論了一下,發(fā)現(xiàn)了一些陳年老 bugs,。主要原因在于需求變了,,所以代碼邏輯也事實上需要更新。

更新了邏輯,,準(zhǔn)確性提高了

估計花了兩個多小時,,定位到了邏輯可調(diào)整的位置,一頓亂改,。測試了下來,,
水稻大概112套小RNA測序數(shù)據(jù),開 60 個線程,,不到兩分鐘,,鑒定完出所有PHAS位點,。我印象中 30M 的reads,即使是單線程也只是50s左右,?邏輯調(diào)整,,可能還是稍微有點影響。不過沒啥關(guān)系,。
出來的結(jié)果,,似乎假陽性有一定的降低。當(dāng)然本身結(jié)合下游過濾步驟,,假陽性其實 很低,。

增加了出圖步驟,方便人工校準(zhǔn)

前述,,海南道明寺和小庭子在夏老師的指導(dǎo)下,對數(shù)據(jù)庫做了一次不錯的更新,,增加了 PHAS位點的可視化,。

感興趣的可以登錄 http:/// 查看。

事實上,,這個非常實用,。人工校準(zhǔn),可以說是目前小RNA數(shù)據(jù)分析絕不可少的步驟,。當(dāng)然,,在數(shù)據(jù)庫上,重點就在于用戶可以查看,。圖片是使用 ggplot2 繪制的,,數(shù)據(jù)則是 python 腳本處理的。這個圖的繪制方式,,其實是文獻中常見的PHAS位點可視化方式,。項目這段時間不是我的工作重點,所以我前面主要只做了解,。其中可以加速的步驟有很多,,最簡單的包括 py準(zhǔn)備數(shù)據(jù)時可以注意內(nèi)存損耗和頻繁遍歷,R繪圖的調(diào)用要考慮終端調(diào)用的成本,。

既然流程更新了,,很明顯,我認(rèn)為這個可視化確實實用(Emmm,,值得進一步加速),,于是用 JIGplot 實現(xiàn)了類似的圖。

是的,,JIGplot 直接可以輸出可交互的圖片,。然而在此處沒啥用,。不過 JIGplot 其實支持直接出圖~~ 測試了下,大概2600+個 PHAS Loci,。

單線程的情況下 10分鐘搞定,!換句話說,如果是開 60個線程,,其實...加上開銷,,我估計 一分鐘 搞定,沒啥問題,。

題外話,,IGV-sRNA

還是要提一下,IGV-sRNA,,我自認(rèn)為這個工具應(yīng)是目前植物小RNA數(shù)據(jù)分析必備,!當(dāng)然,其人工校正 PHAS 位點的部分可以用通過上線取代,。但是他的交互,,和多組學(xué)數(shù)據(jù)整合,以及其他專門定制的植物小RNA數(shù)據(jù)人工探索功能,,幾乎是無法被取代~~~還是貼一下張圖,。

說實話,真的流弊,,而且有用,。之前我做的部分改進已經(jīng)PR到IGV官方版并被接收啦。

寫在最后

這里貼上之前寫了一半的推文,,我應(yīng)是不會完善他了,。不過希望我的朋友們明白,我一直都會是積極樂觀,,也非常感謝各位的關(guān)注和支持,。

Emmm... 最后還是要補充,流程屬于sRNAminer的一部分,,一個高效(超高速)且跨平臺(超順手)的 植物小RNA 數(shù)據(jù)分析工具,,不過我估計他不會太快面世,畢竟....還有很多其他東西要整,。所以感興趣的,,直接給PI: [email protected] 丟郵件。
當(dāng)然,,如果你有不錯的物種或者數(shù)據(jù),,比如課題組做了某個物種的基因組測序和小RNA測序,那么應(yīng)該試試 sRNAanno 的小RNA注釋服務(wù)http:///,。免費且快速,,高效而專業(yè),。

    轉(zhuǎn)藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多