Bio.Align.sam 模組
Bio.Align 支援 "sam" 成對比對格式。
由 Wellcome Trust Sanger Institute 的 Heng Li 和 Richard Durbin 創建的序列比對/地圖 (SAM) 格式,在單個檔案中儲存一系列與基因組的比對。它們通常用於下一代定序數據。SAM 檔案儲存已映射序列的比對位置,並且還可以儲存比對的序列和其他與序列相關的資訊。
請參閱 http://www.htslib.org/ 以取得更多資訊。
您應該透過 Bio.Align 函式使用此模組。
SAM 格式中的座標是根據從 1 開始的起始位置定義的;解析器將這些轉換為從 0 開始的座標,以與 Python 和其他比對格式保持一致。
- class Bio.Align.sam.AlignmentWriter(target, md=False)
基底類別:
AlignmentWriter
序列比對/地圖 (SAM) 檔案格式的比對檔案寫入器。
- fmt: str | None = 'SAM'
- __init__(target, md=False)
建立 AlignmentWriter 物件。
- 引數
- md - 如果為 True,則從比對計算 MD 標籤並將其包含
在輸出中。如果為 False (預設值),則不在輸出中包含 MD 標籤。
- write_header(stream, alignments)
寫入 SAM 標頭。
- format_alignment(alignment, md=None)
傳回一個字串,其中包含格式化為單個 SAM 行的單個比對。
- __abstractmethods__ = frozenset({})
- class Bio.Align.sam.AlignmentIterator(source)
基底類別:
AlignmentIterator
序列比對/地圖 (SAM) 檔案的比對迭代器。
檔案中的每一行都包含一個基因組比對,這些比對會被載入並以遞增方式傳回。以下欄會儲存為比對的屬性
flag:FLAG 位元旗標的組合;
mapq:映射品質(僅在可用時儲存)
- rnext:下一個讀取的主要比對的參考序列名稱
在比對中(僅在可用時儲存)
- pnext:下一個讀取的主要比對的從 0 開始的位置
在樣板中(僅在可用時儲存)
tlen:已簽署的觀察到的樣板長度(僅在可用時儲存)
與比對相關的標籤的其他資訊儲存在每個比對的 annotations 屬性中。
任何硬裁剪(查詢序列中不存在的已裁剪序列)都會以 'hard_clip_left' 和 'hard_clip_right' 的形式儲存在查詢序列記錄的 annotations 字典屬性中。
序列品質(如果可用)會以 'phred_quality' 的形式儲存在查詢序列記錄的 letter_annotations 字典屬性中。
- fmt: str | None = 'SAM'
- __abstractmethods__ = frozenset({})