根据bed文件从fasta文件中获取基因

发布时间:2019-04-09 21:16:49编辑:auto阅读(3104)

    第一次写博客,分享一个做的提取基因序列的程序,根据bed文件里的位置信息从基因组里提取序列

    源码地址:https://github.com/Liuyuan2018/fastaTools/blob/master/pyGetFasta.py

    bed文件通常用来保存注释基因信息BED文件必须的3列:

    1. chrom - 染色体号
    2. chromStart - feature在染色体上起始位置(其实编号为0)
    3. chromEnd - feature在染色体上末尾位置(不包括此编号)

      第四列是基因的名称

      还有些列想了解参考:http://genome.ucsc.edu/FAQ/FAQformat.html#format1

    程序依赖 pyfasta模块(https://pypi.org/project/pyfasta/)

    安装pyfasta的命令:pip install pyfasta

     

关键字