生物节律–序列输入/输出
原文:https://www . geesforgeks . org/bio Tyson-sequence-input-output/
Biopython 有一个内置的 Bio。SeqIO 模块,提供分别从文件读取序列和向文件写入序列的功能。生物。SeqIO 支持生物信息学中使用的几乎所有文件处理格式。Biopython 严格遵循单一方法,用电子病历对象向用户表示解析后的数据序列。
记录
电子病历对象由生物提供。SeqRecord 模块保存序列的元数据以及关于序列的信息。下面列出了一些主要数据信息:
| **记录** | **描述** | | --- | --- | | seq | 要解析的实际序列。 | | 身份证明(identification) | 序列的主要标识,默认情况下是字符串类型 | | 名字 | 序列的名称,默认情况下是字符串类型。 | | 描述 | 以人类可读的格式显示有关序列的信息。 | | 附注 | 包含与序列相关的附加信息的字典。 |读取顺序:
biophystonSeq模块有一个内置的 read() 方法,该方法获取一个序列文件,并根据文件格式将其转换为单个 SeqRecord 。它能够解析只有一条记录的序列文件,如果文件没有记录或者有多条记录,那么就会引发异常。 read() 方法的语法和参数如下:
Bio.SeqIO.read(handle, format, alphabet=None)
Python 3
# Import libraries
from Bio import SeqIO
# Reading file
record = SeqIO.read("sequence.gb", "genbank")
# Showing records
print("ID: %s" % record.id)
print("Sequence length: %i" % len(record))
print("Sequence description: %s" % record.description)
输出:
练习顺序:
生物提供的解析()方法。Seq 模块在我们必须从句柄中读取多条记录时使用。它基本上将序列文件转换成迭代器,迭代器返回 SeqRecords 。如果文件包含字符串数据,那么它必须被转换为句柄来解析它。无法确定字母表的文件格式,明确指定字母表(例如。FASTA)。 parse() 方法的语法和参数如下:
Bio.SeqIO.parse(handle, format, alphabet=None)
Python 3
# Import libraries
from Bio import SeqIO
# Parsing file
filename = "sequence.fasta"
for record in SeqIO.parse(filename, "fasta"):
# Showing records
print("ID: %s" % record.id)
print("Sequence length: %i" % len(record))
print("Sequence description: %s" % record.description)
输出:
写入序列:
用于写入文件生物。Seq 模块有一个 write() 方法,该方法将序列集写入文件,并返回一个代表写入记录数的整数。请确保在调用句柄后关闭该句柄,否则数据将被刷新到磁盘。写()方法的语法和论据如下:
Bio.SeqIO.write(sequences, handle, format)
注意:下载文件点击这里
Python 3
# Import libraries
from Bio import SeqIO
from Bio.Seq import Seq
from Bio.SeqRecord import SeqRecord
rec1 = SeqRecord(Seq("MMYQQGCFAGGTVLRLAKDLAENNRGARVLVVCSEITAVTFRGPSETHLDSMVGQALFGD"
+ "GAGAVIVGSDPDLSVERPLYELVWTGATLLPDSEGAIDGHLREVGLTFHLLKDVPGLISK"
+ "NIEKSLKEAFTPLGISDWNSTFWIAHPGGPAILDQVEAKLGLKEEKMRATREVLSEYGNM"),
id="gi|14150838|gb|AAK54648.1|AF376133_1",
description="chalcone synthase [Cucumis sativus]")
rec2 = SeqRecord(Seq("MVTVEEFRRAQCAEGPATVMAIGTATPSNCVDQSTYPDYYFRITNSEHKVELKEKFKRMC"
+ "EKSMIKKRYMHLTEEILKENPNICAYMAPSLDARQDIVVVEVPKLGKEAAQKAIKEWGQP"
+ "KSKITHLVFCTTSGVDMPGCDYQLTKLLGLRPSVKRFMMYQQGCFAGGTVLRMAKDLAEN"
+ "NKGARVLVVCSEITAVTFRGPNDTHLDSLVGQALFGDGAAAVIIGSDPIPEVERPLFELV"
+ "SAAQTLLPDSEGAIDGHLREVGLTFHLLKDVPGLISKNIEKSLVEAFQPLGISDWNSLFW"
+ "IAHPGGPAILDQVELKLGLKQEKLKATRKVLSNYGNMSSACVLFILDEMRKASAKEGLGT"
+ "TGEGLEWGVLFGFGPGLTVETVVLHSVAT"),
id="gi|13925890|gb|AAK49457.1|",
description="chalcone synthase [Nicotiana tabacum]")
sequences = [rec1, rec2]
# Writing to file
with open("example.fasta", "w") as output_handle:
SeqIO.write(sequences, output_handle, "fasta")
for record in SeqIO.parse("example.fasta", "fasta"):
print("ID %s" % record.id)
print("Sequence length %i" % len(record))
输出:
版权属于:月萌API www.moonapi.com,转载请注明出处