1. 本际云推荐 - 专业推荐VPS、服务器,IDC点评首页
  2. 云主机运维
  3. VPS运维

Python脚本制作获得fasta文件单编码序列信息内容完成

Python脚本提取fasta文件单序列信息实现示例

大家好,我是本际云服务器推荐网的小编小本本。今天我要为大家介绍Python脚本提取fasta文件单序列信息的实现示例。如果有需要的朋友,可以参考借鉴下面的内容。希望能够有所帮助,祝大家多多进步,早日升职加薪。

Python脚本制作获得fasta文件单编码序列信息内容完成

Python脚本制作获得fasta文件单编码序列信息内容完成实例

这篇文章关键给大家介绍了Python脚本制作获得fasta文件单编码序列信息内容完成实例,感兴趣的小伙伴可以参考借鉴一下,希望可以有一定的帮助,祝愿大家多多的发展,尽早涨薪。

下面是具体的步骤和代码实现:

Python脚本制作编写

应用Python对fasta格式编码序列开展基本资料统计分析,预估设计方案导出文件中包括fasta文件名、编码序列长短、GC成分及其ATCG分别含量。

下面是制作脚本的具体代码:

import sys

file_fasta=sys.argv[1]

file_name=file_fasta.split('.')

以上代码通过sys模块从命令行获取文件名称,然后获取fasta文件的名称。

def get_info(chr):

chr=chr.upper()

count_g=chr.count('G')

count_c=chr.count('C')

count_a=chr.count('A')

count_t=chr.count('T')

gc=(count_g+count_c)/(count_a+count_t+count_c+count_g)

A=(count_a)/(count_a+count_t+count_c+count_g)

T=(count_t)/(count_a+count_t+count_c+count_g)

C=(count_c)/(count_a+count_t+count_c+count_g)

G=(count_g)/(count_a+count_t+count_c+count_g)

gc_con='{:.2%}'.format(gc)

A_content='{:.2%}'.format(A)

T_content='{:.2%}'.format(T)

C_content='{:.2%}'.format(C)

G_content='{:.2%}'.format(G)

return(gc_con,A_content,T_content,C_content,G_content)

以上代码编写了一个统计编码序列数据的函数公式,并进行了一些数学计算。

with open(file_fasta,'r') as read_fa:

  for val in read_fa:

    val=val.strip()

    if not val.startswith('>'):

      seq_info=get_info(val)

      len_fasta=len(val)

  print('******n{0}nlength:{1}ngccontent:{2}nAcontent:{3}nTcontent:{4}nCcontent:{5}nGcontent:{6}n******'.format(name,len_fasta,seq_info[0],seq_info[1],seq_info[2],seq_info[3],seq_info[4]))

以上代码对fasta文件进行读取,并对编码序列进行了信息统计和分析,结果以一定格式在屏幕上输出。

file_output=open("{}sum.txt".format(name),'a')

file_output.write('******n')

file_output.write('{}n'.format(name))

file_output.write('length:{:d}n'.format(len_fasta))

file_output.write('gc content:{}n'.format(seq_info[0]))

file_output.write('A content:{}n'.format(seq_info[1]))

file_output.write('T content:{}n'.format(seq_info[2]))

file_output.write('C content:{}n'.format(seq_info[3]))

file_output.write('G content:{}n'.format(seq_info[4]))

file_output.write('******')

file_output.close()

以上代码将编码序列的统计结果输出到txt文件里。

应用文件

test.fasta

stat.py

输入sys模块

以上是具体的文件和模块应用,可以直接使用这些文件和模块来运行脚本。

脚本运行

执行脚本(linux系统)

使用ls命令可以看到当前目录下有已经写好的py文件以及数据test.fasta。运行时注意我们编写时设置从命令行获得文件名称,所以要在后面跟上fasta文件,这样才能成功运行。运行结束后可以看见屏幕上有结果的打印,同时也生成了testsum.txt。

以上就是Python脚本提取fasta文件单序列信息实现的全部内容,希望对大家有所帮助。

原创文章,作者:小编小本本,如若转载,请注明出处:https://www.benjiyun.com/yunzhujiyunwei/vps-yunwei/6936.html