Bio.Align.sam 模組

Bio.Align 支援 "sam" 成對比對格式。

由 Wellcome Trust Sanger Institute 的 Heng Li 和 Richard Durbin 創建的序列比對/地圖 (SAM) 格式,在單個檔案中儲存一系列與基因組的比對。它們通常用於下一代定序數據。SAM 檔案儲存已映射序列的比對位置,並且還可以儲存比對的序列和其他與序列相關的資訊。

請參閱 http://www.htslib.org/ 以取得更多資訊。

您應該透過 Bio.Align 函式使用此模組。

SAM 格式中的座標是根據從 1 開始的起始位置定義的;解析器將這些轉換為從 0 開始的座標,以與 Python 和其他比對格式保持一致。

class Bio.Align.sam.AlignmentWriter(target, md=False)

基底類別:AlignmentWriter

序列比對/地圖 (SAM) 檔案格式的比對檔案寫入器。

fmt: str | None = 'SAM'
__init__(target, md=False)

建立 AlignmentWriter 物件。

引數
  • md - 如果為 True,則從比對計算 MD 標籤並將其包含

    在輸出中。如果為 False (預設值),則不在輸出中包含 MD 標籤。

write_header(stream, alignments)

寫入 SAM 標頭。

format_alignment(alignment, md=None)

傳回一個字串,其中包含格式化為單個 SAM 行的單個比對。

__abstractmethods__ = frozenset({})
class Bio.Align.sam.AlignmentIterator(source)

基底類別:AlignmentIterator

序列比對/地圖 (SAM) 檔案的比對迭代器。

檔案中的每一行都包含一個基因組比對,這些比對會被載入並以遞增方式傳回。以下欄會儲存為比對的屬性

  • flag:FLAG 位元旗標的組合;

  • mapq:映射品質(僅在可用時儲存)

  • rnext:下一個讀取的主要比對的參考序列名稱

    在比對中(僅在可用時儲存)

  • pnext:下一個讀取的主要比對的從 0 開始的位置

    在樣板中(僅在可用時儲存)

  • tlen:已簽署的觀察到的樣板長度(僅在可用時儲存)

與比對相關的標籤的其他資訊儲存在每個比對的 annotations 屬性中。

任何硬裁剪(查詢序列中不存在的已裁剪序列)都會以 'hard_clip_left' 和 'hard_clip_right' 的形式儲存在查詢序列記錄的 annotations 字典屬性中。

序列品質(如果可用)會以 'phred_quality' 的形式儲存在查詢序列記錄的 letter_annotations 字典屬性中。

fmt: str | None = 'SAM'
__abstractmethods__ = frozenset({})