Bio.SeqIO.SeqXmlIO 模組

Bio.SeqIO 對 “seqxml” 檔案格式 (SeqXML) 的支援。

此模組用於讀取和寫入 SeqXML 格式的檔案作為 SeqRecord 物件,並預期通過 Bio.SeqIO API 使用。

SeqXML 是一種輕量級的 XML 格式,旨在作為 FASTA 檔案的替代方案。更多資訊請參閱 http://www.seqXML.org 和 Schmitt et al (2011), https://doi.org/10.1093/bib/bbr025

class Bio.SeqIO.SeqXmlIO.ContentHandler

基底類別:ContentHandler

處理剖析器產生的 XML 事件(私有)。

__init__()

建立處理 XML 事件的處理器。

startDocument()

當找到 XML 宣告時,設定 XML 處理器。

startSeqXMLElement(name, qname, attrs)

處理 seqXML 元素的開始。

endSeqXMLElement(name, qname)

處理 seqXML 元素的結束。

startEntryElement(name, qname, attrs)

設定具有 ID 和可選條目來源的新條目(私有)。

endEntryElement(name, qname)

處理條目元素的結束。

startEntryFieldElementVersion01(name, qname, attrs)

接收條目元素的欄位並將其轉發到版本 0.1。

startEntryFieldElement(name, qname, attrs)

接收條目元素的欄位並將其轉發到版本 >= 0.2。

startSpeciesElement(attrs)

解析物種資訊。

endSpeciesElement(name, qname)

處理物種元素的結束。

startDescriptionElement(attrs)

解析描述。

endDescriptionElement(name, qname)

處理描述元素的結束。

startSequenceElement(attrs)

解析 DNA、RNA 或蛋白質序列。

endSequenceElement(name, qname)

處理序列元素的結束。

startDBRefElement(attrs)

解析資料庫交叉參考。

endDBRefElement(name, qname)

處理 DBRef 元素的結束。

startPropertyElement(attrs)

處理屬性元素的開始。

endPropertyElement(name, qname)

處理屬性元素的結束。

characters(data)

處理字元資料。

class Bio.SeqIO.SeqXmlIO.SeqXmlIterator(stream_or_path, namespace=None)

基底類別:SequenceIterator

seqXML 檔案的剖析器。

剖析 seqXML 檔案並建立 SeqRecord。假定 seqXML 有效,請事先驗證。假定一個記錄的所有資訊都可以在一個記錄元素內或上方找到。當到達元素的開始標籤時,會呼叫兩種方法。若只想在元素的結束標籤到達之前接收元素的屬性,請實作 _attr_TAGNAME。若要取得元素及其子元素作為 DOM 樹,請實作 _elem_TAGNAME。DOM 樹的一部分不會觸發任何其他方法呼叫。

BLOCK = 1024
__init__(stream_or_path, namespace=None)

建立物件並初始化 XML 剖析器。

parse(handle)

開始解析檔案,並回傳一個 SeqRecord 生成器。

iterate(handle)

迭代 XML 檔案中的紀錄。

__abstractmethods__ = frozenset({})
__parameters__ = ()
class Bio.SeqIO.SeqXmlIO.SeqXmlWriter(target, source=None, source_version=None, species=None, ncbiTaxId=None)

基底類別:SequenceWriter

將 SeqRecord 寫入 seqXML 檔案。

SeqXML 需要 SeqRecord 注釋指定 molecule_type;molecule type 必須包含 "DNA"、"RNA" 或 "protein" 等詞。

__init__(target, source=None, source_version=None, species=None, ncbiTaxId=None)

建立物件並啟動 XML 生成器。

參數:
  • target - 以二進制模式開啟的輸出流,或檔案路徑。

  • source - 檔案的來源程式/資料庫,例如 UniProt。

  • source_version - 資料來源程式或資料庫的版本或發行號碼。

  • species - 檔案中所有條目的物種來源的學名。

  • ncbiTaxId - 物種來源的 NCBI 分類 ID。

write_header()

寫入包含文件元數據的根節點。

write_record(record)

寫入一筆紀錄。

關閉根節點並結束 XML 文件。