Python脚本提取fasta文件单序列信息实现示例
大家好,我是本际云服务器推荐网的小编小本本。今天我要为大家介绍Python脚本提取fasta文件单序列信息的实现示例。如果有需要的朋友,可以参考借鉴下面的内容。希望能够有所帮助,祝大家多多进步,早日升职加薪。

Python脚本制作获得fasta文件单编码序列信息内容完成实例
这篇文章关键给大家介绍了Python脚本制作获得fasta文件单编码序列信息内容完成实例,感兴趣的小伙伴可以参考借鉴一下,希望可以有一定的帮助,祝愿大家多多的发展,尽早涨薪。
下面是具体的步骤和代码实现:
Python脚本制作编写
应用Python对fasta格式编码序列开展基本资料统计分析,预估设计方案导出文件中包括fasta文件名、编码序列长短、GC成分及其ATCG分别含量。
下面是制作脚本的具体代码:
import sys
file_fasta=sys.argv[1]
file_name=file_fasta.split('.')
以上代码通过sys模块从命令行获取文件名称,然后获取fasta文件的名称。
def get_info(chr):
chr=chr.upper()
count_g=chr.count('G')
count_c=chr.count('C')
count_a=chr.count('A')
count_t=chr.count('T')
gc=(count_g+count_c)/(count_a+count_t+count_c+count_g)
A=(count_a)/(count_a+count_t+count_c+count_g)
T=(count_t)/(count_a+count_t+count_c+count_g)
C=(count_c)/(count_a+count_t+count_c+count_g)
G=(count_g)/(count_a+count_t+count_c+count_g)
gc_con='{:.2%}'.format(gc)
A_content='{:.2%}'.format(A)
T_content='{:.2%}'.format(T)
C_content='{:.2%}'.format(C)
G_content='{:.2%}'.format(G)
return(gc_con,A_content,T_content,C_content,G_content)
以上代码编写了一个统计编码序列数据的函数公式,并进行了一些数学计算。
with open(file_fasta,'r') as read_fa:
for val in read_fa:
val=val.strip()
if not val.startswith('>'):
seq_info=get_info(val)
len_fasta=len(val)
print('******n{0}nlength:{1}ngccontent:{2}nAcontent:{3}nTcontent:{4}nCcontent:{5}nGcontent:{6}n******'.format(name,len_fasta,seq_info[0],seq_info[1],seq_info[2],seq_info[3],seq_info[4]))
以上代码对fasta文件进行读取,并对编码序列进行了信息统计和分析,结果以一定格式在屏幕上输出。
file_output=open("{}sum.txt".format(name),'a')
file_output.write('******n')
file_output.write('{}n'.format(name))
file_output.write('length:{:d}n'.format(len_fasta))
file_output.write('gc content:{}n'.format(seq_info[0]))
file_output.write('A content:{}n'.format(seq_info[1]))
file_output.write('T content:{}n'.format(seq_info[2]))
file_output.write('C content:{}n'.format(seq_info[3]))
file_output.write('G content:{}n'.format(seq_info[4]))
file_output.write('******')
file_output.close()
以上代码将编码序列的统计结果输出到txt文件里。
应用文件
test.fasta
stat.py
输入sys模块
以上是具体的文件和模块应用,可以直接使用这些文件和模块来运行脚本。
脚本运行
执行脚本(linux系统)
使用ls命令可以看到当前目录下有已经写好的py文件以及数据test.fasta。运行时注意我们编写时设置从命令行获得文件名称,所以要在后面跟上fasta文件,这样才能成功运行。运行结束后可以看见屏幕上有结果的打印,同时也生成了testsum.txt。
以上就是Python脚本提取fasta文件单序列信息实现的全部内容,希望对大家有所帮助。
原创文章,作者:小编小本本,如若转载,请注明出处:https://www.benjiyun.com/yunzhujiyunwei/vps-yunwei/6936.html
