久久国产成人av_抖音国产毛片_a片网站免费观看_A片无码播放手机在线观看,色五月在线观看,亚洲精品m在线观看,女人自慰的免费网址,悠悠在线观看精品视频,一级日本片免费的,亚洲精品久,国产精品成人久久久久久久

分享

VCF轉(zhuǎn)換PLINK格式的3種方法

 生信修煉手冊 2019-12-24

plink是目前使用的最為廣泛的關(guān)聯(lián)分析軟件,,其定義的ped/map文件系統(tǒng),,及其對應(yīng)的二進制bed/bim/fam已經(jīng)成為關(guān)聯(lián)分析的標準文件格式。在進行關(guān)聯(lián)分析之前,,我們首先要做的就是將其他格式的文件轉(zhuǎn)換為plink對應(yīng)的文件格式,。

VCF格式作為存儲分型結(jié)果的一種標準格式,在實際分析中也廣泛應(yīng)用,。本文總結(jié)了將vcf文件轉(zhuǎn)換為plink對應(yīng)文件格式的3種方式,,詳細展示如下

1. gatk3

在gatk3中,提供了一個名為VariantsToBinaryPed的功能,,可以將VCF格式轉(zhuǎn)換為plink對應(yīng)的二進制bed文件,,基本用法如下

java -jar GenomeAnalysisTK.jar \
-T VariantsToBinaryPed \
-R reference.fasta \
-V input.vcf \
-m input.fam \
-bed output.bed \
-bim output.bim \
-fam output.fam

要求三個輸入文件,-R參數(shù)指定參考基因組的fasta文件,,-V參數(shù)指定VCF文件,-m參數(shù)稱之為metadata, 保存了樣本對應(yīng)的家系信息,,支持兩種文件格式,,第一種示意如下

對應(yīng)ped文件的前六列內(nèi)容,如果樣本雙親信息不明確,,則用unknown表示,,簡寫成UNKN, 表型信息沒有的話用-9表示。第二種示意如下

由于VCF文件中只保存了樣本的分型結(jié)果,,所以家系信息通過一個額外的文件來補充,。更多詳情請參考以下文檔

https://software./gatk/documentation/tooldocs/3.8-0/org_broadinstitute_gatk_tools_walkers_variantutils_VariantsToBinaryPed.php

2. vcftools

vcftools是操作vcf文件的一款常用工具,,支持將vcf文件轉(zhuǎn)換成plink對應(yīng)的ped/map格式,基本用法如下

vcftools --vcf input.vcf --plink --out output

沒有額外的家系信息,,在輸出結(jié)果中,,family id和sample id是重復(fù)的,其他列全部為0,,示意如下

3. plink

plink1.9版本支持直接讀取vcf/gen等多種文件格式,,所以使用該版本時其實不需要專門進行格式轉(zhuǎn)換,軟件默認會將不同的格式轉(zhuǎn)換為二進制bed文件格式,。這里只是展示下其格式轉(zhuǎn)換的用法,,基本用法如下

plink --vcf input.vcf --recode --out output --double-id

默認轉(zhuǎn)換為二進制的bed格式,對于分析更加適用,,這里添加--recode參數(shù)將輸出結(jié)果調(diào)整為ped格式,,可以更好的查看其轉(zhuǎn)換的規(guī)則。

plink默認用下劃線對樣本名進行分隔,,分隔的兩個字段分別作為ped文件中的family id和sample id, 如果vcf中的樣本名含有多個下劃線,,無法正確進行劃分,軟件會報錯,,此時可以修改--id-delim參數(shù),,該參數(shù)設(shè)定了分隔符,默認是下劃線,,可以設(shè)置成其他字符,,以達到正確區(qū)分的目的。

除此之外,,還有一種解決方案,,通過參數(shù)指定family_id的設(shè)定方式,有兩種參數(shù),,第一種如上述示例中的--double_id, 將family id和sample id保持相同,,輸出的ped文件的前六列示意如下

第二種參數(shù)用法如下所示

plink --vcf input.vcf --recode --out output --const-fid family_id

通過--const-fid將family id設(shè)置成一個常量,默認值是0,,上述示例輸出的ped文件的前六列示意如下

雙親,,性別默認用0填充,表型默認用-9填充,。

·end·

    轉(zhuǎn)藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多