Bio.SeqIO.SeqXmlIO 模組
Bio.SeqIO 對 “seqxml” 檔案格式 (SeqXML) 的支援。
此模組用於讀取和寫入 SeqXML 格式的檔案作為 SeqRecord 物件,並預期通過 Bio.SeqIO API 使用。
SeqXML 是一種輕量級的 XML 格式,旨在作為 FASTA 檔案的替代方案。更多資訊請參閱 http://www.seqXML.org 和 Schmitt et al (2011), https://doi.org/10.1093/bib/bbr025
- class Bio.SeqIO.SeqXmlIO.ContentHandler
基底類別:
ContentHandler
處理剖析器產生的 XML 事件(私有)。
- __init__()
建立處理 XML 事件的處理器。
- startDocument()
當找到 XML 宣告時,設定 XML 處理器。
- startSeqXMLElement(name, qname, attrs)
處理 seqXML 元素的開始。
- endSeqXMLElement(name, qname)
處理 seqXML 元素的結束。
- startEntryElement(name, qname, attrs)
設定具有 ID 和可選條目來源的新條目(私有)。
- endEntryElement(name, qname)
處理條目元素的結束。
- startEntryFieldElementVersion01(name, qname, attrs)
接收條目元素的欄位並將其轉發到版本 0.1。
- startEntryFieldElement(name, qname, attrs)
接收條目元素的欄位並將其轉發到版本 >= 0.2。
- startSpeciesElement(attrs)
解析物種資訊。
- endSpeciesElement(name, qname)
處理物種元素的結束。
- startDescriptionElement(attrs)
解析描述。
- endDescriptionElement(name, qname)
處理描述元素的結束。
- startSequenceElement(attrs)
解析 DNA、RNA 或蛋白質序列。
- endSequenceElement(name, qname)
處理序列元素的結束。
- startDBRefElement(attrs)
解析資料庫交叉參考。
- endDBRefElement(name, qname)
處理 DBRef 元素的結束。
- startPropertyElement(attrs)
處理屬性元素的開始。
- endPropertyElement(name, qname)
處理屬性元素的結束。
- characters(data)
處理字元資料。
- class Bio.SeqIO.SeqXmlIO.SeqXmlIterator(stream_or_path, namespace=None)
基底類別:
SequenceIterator
seqXML 檔案的剖析器。
剖析 seqXML 檔案並建立 SeqRecord。假定 seqXML 有效,請事先驗證。假定一個記錄的所有資訊都可以在一個記錄元素內或上方找到。當到達元素的開始標籤時,會呼叫兩種方法。若只想在元素的結束標籤到達之前接收元素的屬性,請實作 _attr_TAGNAME。若要取得元素及其子元素作為 DOM 樹,請實作 _elem_TAGNAME。DOM 樹的一部分不會觸發任何其他方法呼叫。
- BLOCK = 1024
- __init__(stream_or_path, namespace=None)
建立物件並初始化 XML 剖析器。
- parse(handle)
開始解析檔案,並回傳一個 SeqRecord 生成器。
- iterate(handle)
迭代 XML 檔案中的紀錄。
- __abstractmethods__ = frozenset({})
- __parameters__ = ()
- class Bio.SeqIO.SeqXmlIO.SeqXmlWriter(target, source=None, source_version=None, species=None, ncbiTaxId=None)
基底類別:
SequenceWriter
將 SeqRecord 寫入 seqXML 檔案。
SeqXML 需要 SeqRecord 注釋指定 molecule_type;molecule type 必須包含 "DNA"、"RNA" 或 "protein" 等詞。
- __init__(target, source=None, source_version=None, species=None, ncbiTaxId=None)
建立物件並啟動 XML 生成器。
- 參數:
target - 以二進制模式開啟的輸出流,或檔案路徑。
source - 檔案的來源程式/資料庫,例如 UniProt。
source_version - 資料來源程式或資料庫的版本或發行號碼。
species - 檔案中所有條目的物種來源的學名。
ncbiTaxId - 物種來源的 NCBI 分類 ID。
- write_header()
寫入包含文件元數據的根節點。
- write_record(record)
寫入一筆紀錄。
關閉根節點並結束 XML 文件。