Bio.GenBank.Record 模組

以直接明瞭的格式保存 GenBank 資料。

類別
  • Record - GenBank 紀錄中的所有資訊。

  • Reference - 保存紀錄的參考資料。

  • Feature - 保存 Feature Table 中的資訊。

  • Qualifier - Feature 的限定詞。

class Bio.GenBank.Record.Record

基類:object

以類似於原始紀錄的格式保存 GenBank 資訊。

Record 類別旨在讓您在只想查看 GenBank 資料時,能夠輕鬆取得資料。

屬性
  • locus - GenBank 紀錄中 LOCUS 關鍵字後指定的名稱。這可能是登錄編號、複製 ID 或其他名稱。

  • size - 紀錄的大小。

  • residue_type - 組成此紀錄序列的殘基類型。通常是 RNA、DNA 或 PROTEIN 之類的東西,但也可能像「ss-RNA 環狀」這樣深奧。

  • data_file_division - 此紀錄在 GenBank 中儲存的區分(例如:PLN -> 植物;PRI -> 人類、靈長類動物;BCT -> 細菌...)。

  • date - 紀錄提交的日期,格式如「28-JUL-1998」。

  • accession - 序列的所有登錄編號的列表。

  • nid - 核苷酸識別號碼。

  • pid - 蛋白質識別號碼。

  • version - 登錄編號 + 版本(例如:AB01234.2)。

  • db_source - 有關紀錄來源資料庫的資訊。

  • gi - 紀錄的 NCBI gi 識別碼。

  • keywords - 與紀錄相關的關鍵字列表。

  • segment - 如果紀錄是一系列紀錄中的一個,則此為有關此紀錄是哪個片段的資訊(例如:「1 of 6」)。

  • source - 序列來源的材料來源。

  • organism - 生物的屬和種(例如:「Homo sapiens」)。

  • taxonomy - 生物的分類學分類列表,從一般到更具體。

  • references - Reference 物件的列表。

  • comment - 包含任何關於紀錄的註解的文字。

  • features - 組成 Feature Table 的 Feature 列表。

  • base_counts - 包含序列鹼基計數的字串。

  • origin - 指定序列來源資訊的字串。

  • sequence - 包含序列本身的字串。

  • contig - RefSeq 檔案中 CONTIG 的位置資訊字串。

  • project - 基因體定序專案編號(將在 2009 年被 dblink 交叉參考取代)。

  • dblinks - 基因體定序專案編號和其他連結。(將在 2009 年取代專案資訊)。

GB_LINE_LENGTH = 79
GB_BASE_INDENT = 12
GB_FEATURE_INDENT = 21
GB_INTERNAL_INDENT = 2
GB_OTHER_INTERNAL_INDENT = 3
GB_FEATURE_INTERNAL_INDENT = 5
GB_SEQUENCE_INDENT = 9
BASE_FORMAT = '%-12s'
INTERNAL_FORMAT = '  %-10s'
OTHER_INTERNAL_FORMAT = '   %-9s'
BASE_FEATURE_FORMAT = '%-21s'
INTERNAL_FEATURE_FORMAT = '     %-16s'
SEQUENCE_FORMAT = '%9s'
__init__()

初始化類別。

__str__()

為 Record 提供 GenBank 格式的輸出選項。

這樣做的目的是提供一種簡單的方法來讀取 GenBank 紀錄、以某種方式修改它,然後以「GenBank 格式」輸出它。我們正努力使此功能發揮作用,以便使用此函式輸出的已剖析 Record 看起來與原始紀錄完全相同。

大部分輸出都基於以下位置的格式描述資訊

ftp://ncbi.nlm.nih.gov/genbank/gbrel.txt

class Bio.GenBank.Record.Reference

基類:object

保存來自 GenBank 參考的資訊。

屬性
  • number - 參考清單中參考的編號。

  • bases - 參考所指序列中的鹼基。

  • authors - 包含所有作者的字串。

  • consrtm - 作者所屬的聯盟。

  • title - 參考的標題。

  • journal - 有關參考文獻發表期刊的資訊。

  • medline_id - 參考文獻的 medline id。

  • pubmed_id - 參考文獻的 pubmed_id。

  • remark - 有關參考文獻的自由格式備註。

__init__()

初始化類別。

__str__()

將參考文獻轉換為 GenBank 格式字串。

class Bio.GenBank.Record.Feature(key='', location='')

基類:object

保存有關 GenBank 紀錄的 Feature Table 中的 Feature 資訊。

屬性
  • key - Feature 的索引鍵名稱(例如:source)。

  • location - 指定 Feature 位置的字串。

  • qualifiers - Feature 中的 Qualifier 物件列表。

__init__(key='', location='')

初始化類別。

__repr__()

物件的除錯或記錄表示法。

__str__()

以 GenBank 格式字串回傳特徵。

class Bio.GenBank.Record.Qualifier(key='', value='')

基類:object

在 GenBank 特徵中保存關於限定詞的資訊。

屬性
  • key - 限定詞的鍵名稱 (例如 /organism=)

  • value - 限定詞的值 (“Dictyostelium discoideum”)。

__init__(key='', value='')

初始化類別。

__repr__()

物件的除錯或記錄表示法。

__str__()

以 GenBank 格式字串回傳特徵限定詞。