python从gbff文件上直接获取cds编码序列

小编小本本 • 2023年4月12日 am8:00 • VPS运维

什么是GBFF文档

GBFF文档是GenBank数据库系统中相关信息的企业，由多条编码序列构成，具体内容由字段名构成，每个字段包含一个关键字和实际内容。编码序列以“//”作为结束标识，并包含诸多信息，如编码序列的长短、种类、职业来源以及上传时间等。

python从gbff文件上直接获取cds编码序列

从GBFF文件上直接获取CDS编码序列实例

通过Python代码实现从GBFF文件中直接获取CDS编码序列实例，具体代码如下：

import re FILE_PATH='./input.gb' OUT_FILE_PATH='./output.fasta' d={} g={} tem=[] def con_spl(list_,n=2): return [list_[i:i+n] for i in range(0,len(list_),n)] with open(FILE_PATH,'r') as f: while True: text_line=f.readline().strip().split() if text_line: if text_line[0]=='DEFINITION': c=''.join(i for i in text_line[2:]) d[c]=[] g[c]=[] print(text_line) elif text_line[0]=='CDS': cds=re.findall(r"\d+",text_line[1]) if len(cds)==2: d[c].append(cds) else: for i in con_spl(cds): d[c].append(i) elif text_line[0]=='ORIGIN': while text_line[0]!='//': for i in text_line[1:]: tem.append(i) text_line=f.readline().strip().split() e=''.join(i for i in tem) g[c].append(e) else: pass elif f.readline().strip().split(): continue else: break with open(OUT_FILE_PATH,'w') as f: for i,o in d.items(): G=''.join(g) p='' for u in o: u1=int(u[0]) u2=int(u[1])+1 p+=G[u1:u2] print('>',i,sep='',file=f) print(p,file=f)

通过以上代码实现了从GBFF文件中直接获取CDS编码序列的功能。

总结

本文详细介绍了GBFF文档和Python如何通过GBFF文件获取CDS编码序列的实现方法。希望对读者有所帮助。

原创文章，作者：小编小本本，如若转载，请注明出处：https://www.benjiyun.com/yunzhujiyunwei/vps-yunwei/6935.html

赞 (0)

小编小本本

1核2g服务器带多少人

« 上一篇 2023年4月12日 am8:00

快速安装Nginx服务器，解决网站高负载问题

下一篇 » 2023年4月13日 am8:00

VPS运维

《云巅创新：阿里巴巴全球创业者洞察》有感

《云巅创新：阿里巴巴全球创业者洞察》有感你好，我是本际云服务器推荐网的小编小本本。最近读了一本书《云巅创新：阿里巴巴全球创业者洞察》，对书中讲述的云创新理念以及基于技术创新的创业…

2023年4月19日
VPS运维

危包证办理流程(危废押运证怎么办理？)

危废押运证怎么办理？作为从事危险货物运输的从业人员，需要持有危废品押运证，具体的办理方法是：向户籍地或暂住地的市级交通主管部门申请；接受相关法规、安全知识、专业技术、职业卫生…

2023年4月10日
VPS运维

oracle自增序列跳号,sequence跳号问题及解决办法

小本本的序列跳号问题解决方案作为一名际云服务器推荐网的小编小本本，我们今天来谈一下Oracle自增序列出现跳号现象的问题，并分享如何解决它。问题描述在数据库重启、刷新、奔溃等…

2023年4月16日
VPS运维

归档存储-安全、快速、低成本，带你了解UCloud归档存储技术

UCloud归档存储：海量数据安全、便携的极低成本存储方案作为本际云服务器推荐网的小编，云计算是我们最熟悉的专业领域之一。我们知道，云计算凭借其强大的分布式计算能力，可伸缩的特性…

2023年4月15日
VPS运维

Nginx如何正确启动和关闭？（附：优雅关闭Nginx的方法）

Nginx的启动方法 Nginx启动时一般使用以下命令： nginx 此命令会在后台启动Nginx进程，并使用默认的配置文件。如果需要使用自定义的配置文件，可以在启动时指定： ng…

2023年4月19日
VPS运维

Mysql升级之glibc包升级

Mysql升级之glibc包升级小编今天为大家介绍一种升级Mysql的方式：通过glibc包升级，将Mysql5.7.17升级至5.7.26。Mysql升级相对来说还是比较简单的…

2023年4月16日
VPS运维

数据泵异常后主机文件系统被占满

数据泵异常导致主机文件系统被占满我是本际云服务器推荐网的小编小本本，今天要分享的是一篇关于数据泵异常导致主机文件系统被占满的问题。问题分析和解决在SuSE11系列Linux操…

2023年4月19日
VPS运维

chemex容器化部署

咖啡壶Chemex介绍咖啡壶（Chemex）是一个轻量的、现代设计风格的ICT资产管理系统。得益于Laravel框架以及DcatAdmin开发平台，使其具备了优雅、简洁的优秀体验…

2023年4月18日
VPS运维

Ceph报错

ceph报错解决方法作为一名云服务器推荐网的小编小本本，告诉你们一些ceph报错的解决方法。以下是常见的ceph报错及其解决方法： auth:unableto find…

2023年4月19日
VPS运维

PGsql逻辑复制

PGsql逻辑复制我是本际云服务器推荐网的小编小本本，今天为大家介绍一下PGsql逻辑复制。逻辑复制特点 PGsql逻辑复制的特点包括：基于WAL日志；同步的最小单元是表；…

2023年4月15日