Bio.Align.bigbed 模組

Bio.Align 支援 bigBed 格式的對齊檔案。

bigBed 格式在單一索引二進制檔案中儲存一系列的成對對齊。通常它們用於轉錄本與基因組的對齊。如同 BED 格式，會儲存對齊位置和對齊分數，但不儲存對齊序列。

請參閱 http://genome.ucsc.edu/goldenPath/help/bigBed.html 以取得更多資訊。

您應透過 Bio.Align 函式來使用此模組。

class Bio.Align.bigbed.Field(as_type, name, comment)

基底：tuple

__getnewargs__(): 將 self 回傳為一個純粹的 tuple。由 copy 和 pickle 使用。

static __new__(_cls, as_type, name, comment): 建立 Field(as_type, name, comment) 的新實例

__repr__(): 回傳格式良好的表示字串

__slots__ = ()

as_type: 欄位編號 0 的別名

comment: 欄位編號 2 的別名

name: 欄位編號 1 的別名

class Bio.Align.bigbed.AutoSQLTable(name, comment, fields)

基底：list

AutoSQL 表格描述（可能擴充的）BED 格式的欄位。

default: AutoSQLTable = [('string', 'chrom', '參考序列染色體或骨架'), ('uint', 'chromStart', '染色體中的起始位置'), ('uint', 'chromEnd', '染色體中的結束位置'), ('string', 'name', '項目名稱。'), ('uint', 'score', '分數 (0-1000)'), ('char[1]', 'strand', '+ 或 - 代表股'), ('uint', 'thickStart', '顯示應為粗體的起始位置 (起始密碼子)'), ('uint', 'thickEnd', '顯示應為粗體的結束位置 (終止密碼子)'), ('uint', 'reserved', '自 2004-11-22 起用作 itemRgb'), ('int', 'blockCount', '區塊數'), ('int[blockCount]', 'blockSizes', '以逗號分隔的區塊大小列表'), ('int[blockCount]', 'chromStarts', '相對於 chromStart 的起始位置')]

__init__(name, comment, fields): 建立 AutoSQL 表格，描述（擴充的）BED 格式的欄位。

classmethod from_bytes(data): 回傳使用位元組物件資料初始化的 AutoSQLTable。

classmethod from_string(data): 回傳使用字串物件資料初始化的 AutoSQLTable。

__str__(): 回傳 str(self)。

__bytes__()

__getitem__(i): x.__getitem__(y) <==> x[y]

__annotations__ = {'default': 'AutoSQLTable'}

class Bio.Align.bigbed.AlignmentWriter(target, bedN=12, declaration=None, targets=None, compress=True, itemsPerSlot=512, blockSize=256, extraIndex=())

基底：AlignmentWriter

bigBed 檔案格式的對齊檔案寫入器。

fmt: str | None = 'bigBed'

mode = 'wb'

__init__(target, bedN=12, declaration=None, targets=None, compress=True, itemsPerSlot=512, blockSize=256, extraIndex=())

建立一個 AlignmentWriter 物件。

參數：

target - 輸出串流或檔案名稱。
bedN - BED 檔案中的欄位數。
必須介於 3 到 12 之間；預設值為 12。
declaration - 一個 AutoSQLTable 物件，宣告 BED 檔案中的欄位。
只有在 BED 檔案包含額外（自訂）欄位時才需要。預設值為 None。
targets - 一個 SeqRecord 物件列表，其中包含比對中出現的染色體順序。
每個 SeqRecord 中的序列內容可能未定義，但序列長度必須定義，如以下範例所示：

SeqRecord(Seq(None, length=248956422), id=”chr1”)

如果 targets 為 None（預設值），則比對必須具有一個 .targets 屬性，提供 SeqRecord 物件列表。
compress - 如果為 True（預設值），則使用 zlib 壓縮資料。
如果為 False，則不壓縮資料。使用 compress=False 可以加快搜尋速度。
blockSize - 在 r-tree 中捆綁的項目數量。
請參閱 UCSC 的 bedToBigBed 程式以取得更多資訊。預設值為 256。
itemsPerSlot - 在最低層級捆綁的資料點數量。
請參閱 UCSC 的 bedToBigBed 程式以取得更多資訊。使用 itemsPerSlot=1 可以加快搜尋速度。預設值為 512。
extraIndex - 字串列表，其中包含要建立索引的額外欄位的名稱。
預設值為空列表。

write_file(stream, alignments)

將比對寫入檔案串流，並傳回比對的數量。

alignments - 一個返回 Alignment 物件的列表或迭代器 stream - 輸出檔案串流。

write_alignments(alignments, output, reductions, extra_indices)

將比對寫入輸出檔案，並傳回比對的數量。

alignments - 一個返回 Alignment 物件的列表或迭代器 stream - 輸出檔案串流。

__abstractmethods__ = frozenset({})

class Bio.Align.bigbed.AlignmentIterator(source)

基底類別：AlignmentIterator

bigBed 檔案的比對迭代器。

載入並以增量方式傳回 bigBed 檔案中儲存的成對比對。額外的比對資訊會儲存為每個比對的屬性。

fmt: str | None = 'bigBed'

mode = 'b'

__len__()

傳回比對的數量。

比對的數量會快取。如果尚未計算，則會將迭代器倒回開頭，並透過迭代比對來計算比對的數量。然後，迭代器會返回檔案中的原始位置。

search(chromosome=None, start=None, end=None)

迭代指定染色體區域中重疊的比對。

此方法搜尋索引以尋找指定染色體的比對，這些比對完全或部分重疊 start 和 end 之間的染色體區域。

參數：

chromosome - 染色體名稱。如果為 None（預設值），則包含所有比對。
start - 染色體上的起始位置。如果為 None（預設值），則使用 0 作為起始位置。
end - 染色體上的結束位置。如果為 None（預設值），則使用染色體的長度作為結束位置。

__abstractmethods__ = frozenset({})