Bio.Align.maf 模組
Bio.Align 支援 "maf" 多重比對格式。
多重比對格式 (Multiple Alignment Format, MAF),由 UCSC 描述,在單一檔案中儲存一系列多重比對。它適用於全基因體對全基因體比對,並可儲存來源染色體、起始位置、大小和鏈等元數據。
請參閱 http://genome.ucsc.edu/FAQ/FAQformat.html#format5
您應透過 Bio.Align 函式使用此模組。
MAF 格式中的座標是以零基準的起始位置(類似 Python)和比對區域大小來定義。
長度為 1 且起始於來源序列第一個位置的最小比對區域將具有 start == 0
和 size == 1
。
正如我們在此範例中所見,start + size
會比零基準的結束位置大 1。因此,我們可以將 start
和 start + size
作為 Python 列表切片的邊界來操作。
- class Bio.Align.maf.AlignmentWriter(target)
基底類別:
AlignmentWriter
接收 Alignment 物件,寫入 MAF 檔案。
- fmt: str | None = 'MAF'
- write_header(stream, alignments)
寫入 MAF 標頭。
- format_alignment(alignment)
傳回以 MAF 區塊格式化的單一比對字串。
- __abstractmethods__ = frozenset({})
- class Bio.Align.maf.AlignmentIterator(source)
基底類別:
AlignmentIterator
多重比對格式檔案的比對迭代器。
該檔案可能包含多個串聯的比對,這些比對會以遞增方式載入和傳回。
檔案元數據儲存在傳回迭代器的
.metadata
屬性中。比對註解儲存在Alignment
物件的.annotations
屬性中,除了比對分數,其會儲存為一個屬性。比對區塊中空部分的序列資訊(將前一個比對區塊連接到下一個比對區塊,但不與目前比對區塊對齊的序列)儲存在"empty"
鍵下的比對註解中。比對中每一行的特定註解會儲存在相應序列記錄的.annotations
屬性中。- fmt: str | None = 'MAF'
- status_characters = ('C', 'I', 'N', 'n', 'M', 'T')
- empty_status_characters = ('C', 'I', 'M', 'n')
- __abstractmethods__ = frozenset({})