Bio.GenBank 套件

子模組

模組內容

用於處理 GenBank 格式檔案的程式碼。

現在建議您使用 Bio.SeqIO 以及 “genbank” 或 “embl” 格式名稱,將 GenBank 或 EMBL 檔案解析為 SeqRecord 和 SeqFeature 物件,而非使用 Bio.GenBank(詳情請參閱 Biopython 教學)。

直接使用 Bio.GenBank 解析 GenBank 檔案僅在您想要取得 GenBank 特有的 Record 物件時才有用,這比 FeatureParser(在 Bio.SeqIO 中使用)的 SeqRecord 替代方案更接近原始檔案內容的表示。

若要使用 Bio.GenBank 解析器,有兩個輔助函式

  • read 將包含單一 GenBank 記錄的 handle 解析為 Bio.GenBank 特有的 Record 物件。

  • parse 迭代包含多個 GenBank 記錄的 handle 作為 Bio.GenBank 特有的 Record 物件。

以下內部類別不適合直接使用,並可能在未來的版本中棄用。

類別
  • Iterator 迭代瀏覽 GenBank 條目的檔案

  • FeatureParser 將 GenBank 資料解析為 SeqRecord 和 SeqFeature 物件。

  • RecordParser 將 GenBank 資料解析為 Record 物件。

例外
  • ParserFailureError 例外狀況,表示解析器(即掃描器或消費者)中出現故障

class Bio.GenBank.Iterator(handle, parser=None)

基礎: object

一次移動瀏覽 GenBank 條目檔案的迭代器介面(已過時)。

此類別很可能在未來的 Biopython 版本中棄用。請改為使用 Bio.SeqIO.parse(…, format=”gb”) 或 Bio.GenBank.parse(…) 分別取得 SeqRecord 和 GenBank 特有的 Record 物件。

__init__(handle, parser=None)

初始化迭代器。

引數
  • handle - 具有要迭代瀏覽的 GenBank 條目的 handle。

  • parser - 一個可選的解析器,用於在傳回條目之前處理這些條目。如果為 None,則將傳回原始條目。

__next__()

從 handle 傳回下一個 GenBank 記錄。

如果記錄已耗盡,將傳回 None。

__iter__()

迭代瀏覽記錄。

exception Bio.GenBank.ParserFailureError

基礎: ValueError

由解析器中的某種問題造成的故障。

class Bio.GenBank.FeatureParser(debug_level=0, use_fuzziness=1, feature_cleaner=None)

基礎: object

將 GenBank 檔案解析為 Seq + Feature 物件(已過時)。

不建議直接使用此類別,並可能在未來的 Biopython 版本中棄用。

請改為使用 Bio.SeqIO.parse(…) 或 Bio.SeqIO.read(…)。

__init__(debug_level=0, use_fuzziness=1, feature_cleaner=None)

初始化 GenBank 解析器和 Feature 消費者。

引數
  • debug_level - 一個可選的引數,用於指定解析器應輸出的除錯資訊量。預設情況下,我們沒有除錯資訊(最快的方式),但如果您需要,您可以將其設定高達 2,並確切地查看解析失敗的位置。

  • use_fuzziness - 指定是否使用模糊表示。預設值為 1(使用模糊性)。

  • feature_cleaner - 將用於清除功能值的類別。此類別必須實作函式 clean_value。GenBank.utils 有一個「標準」清理器類別,預設情況下會使用此類別。

parse(handle)

解析指定的 handle。

class Bio.GenBank.RecordParser(debug_level=0)

基礎: object

將 GenBank 檔案解析為 Record 物件(已過時)。

不建議直接使用此類別,並可能在未來的 Biopython 版本中棄用。

請改為使用 Bio.GenBank.parse(…) 或 Bio.GenBank.read(…) 函式。

__init__(debug_level=0)

初始化解析器。

引數
  • debug_level - 一個可選的引數,用於指定解析器應輸出的除錯資訊量。預設情況下,我們沒有除錯資訊(最快的方式),但如果您需要,您可以將其設定高達 2,並確切地查看解析失敗的位置。

parse(handle)

將指定的 handle 解析為 GenBank 記錄。

Bio.GenBank.parse(handle)

迭代瀏覽 GenBank 格式的條目作為 Record 物件。

>>> from Bio import GenBank
>>> with open("GenBank/NC_000932.gb") as handle:
...     for record in GenBank.parse(handle):
...         print(record.accession)
['NC_000932']

若要取得 SeqRecord 物件,請改為使用 Bio.SeqIO.parse(…, format=”gb”)。

Bio.GenBank.read(handle)

將包含單一 GenBank 條目的 handle 讀取為 Record 物件。

>>> from Bio import GenBank
>>> with open("GenBank/NC_000932.gb") as handle:
...     record = GenBank.read(handle)
...     print(record.accession)
['NC_000932']

若要取得 SeqRecord 物件,請改為使用 Bio.SeqIO.read(…, format=”gb”)。