Bio.Align.bigbed 模組
Bio.Align 支援 bigBed 格式的對齊檔案。
bigBed 格式在單一索引二進制檔案中儲存一系列的成對對齊。通常它們用於轉錄本與基因組的對齊。如同 BED 格式,會儲存對齊位置和對齊分數,但不儲存對齊序列。
請參閱 http://genome.ucsc.edu/goldenPath/help/bigBed.html 以取得更多資訊。
您應透過 Bio.Align 函式來使用此模組。
- class Bio.Align.bigbed.Field(as_type, name, comment)
基底:
tuple
- __getnewargs__()
將 self 回傳為一個純粹的 tuple。由 copy 和 pickle 使用。
- static __new__(_cls, as_type, name, comment)
建立 Field(as_type, name, comment) 的新實例
- __repr__()
回傳格式良好的表示字串
- __slots__ = ()
- as_type
欄位編號 0 的別名
- comment
欄位編號 2 的別名
- name
欄位編號 1 的別名
- class Bio.Align.bigbed.AutoSQLTable(name, comment, fields)
基底:
list
AutoSQL 表格描述(可能擴充的)BED 格式的欄位。
- default: AutoSQLTable = [('string', 'chrom', '參考序列染色體或骨架'), ('uint', 'chromStart', '染色體中的起始位置'), ('uint', 'chromEnd', '染色體中的結束位置'), ('string', 'name', '項目名稱。'), ('uint', 'score', '分數 (0-1000)'), ('char[1]', 'strand', '+ 或 - 代表股'), ('uint', 'thickStart', '顯示應為粗體的起始位置 (起始密碼子)'), ('uint', 'thickEnd', '顯示應為粗體的結束位置 (終止密碼子)'), ('uint', 'reserved', '自 2004-11-22 起用作 itemRgb'), ('int', 'blockCount', '區塊數'), ('int[blockCount]', 'blockSizes', '以逗號分隔的區塊大小列表'), ('int[blockCount]', 'chromStarts', '相對於 chromStart 的起始位置')]
- __init__(name, comment, fields)
建立 AutoSQL 表格,描述(擴充的)BED 格式的欄位。
- classmethod from_bytes(data)
回傳使用位元組物件資料初始化的 AutoSQLTable。
- classmethod from_string(data)
回傳使用字串物件資料初始化的 AutoSQLTable。
- __str__()
回傳 str(self)。
- __bytes__()
- __getitem__(i)
x.__getitem__(y) <==> x[y]
- __annotations__ = {'default': 'AutoSQLTable'}
- class Bio.Align.bigbed.AlignmentWriter(target, bedN=12, declaration=None, targets=None, compress=True, itemsPerSlot=512, blockSize=256, extraIndex=())
-
bigBed 檔案格式的對齊檔案寫入器。
- fmt: str | None = 'bigBed'
- mode = 'wb'
- __init__(target, bedN=12, declaration=None, targets=None, compress=True, itemsPerSlot=512, blockSize=256, extraIndex=())
建立一個 AlignmentWriter 物件。
- 參數:
target - 輸出串流或檔案名稱。
- bedN - BED 檔案中的欄位數。
必須介於 3 到 12 之間;預設值為 12。
- declaration - 一個 AutoSQLTable 物件,宣告 BED 檔案中的欄位。
只有在 BED 檔案包含額外(自訂)欄位時才需要。預設值為 None。
- targets - 一個 SeqRecord 物件列表,其中包含比對中出現的染色體順序。
每個 SeqRecord 中的序列內容可能未定義,但序列長度必須定義,如以下範例所示:
SeqRecord(Seq(None, length=248956422), id=”chr1”)
如果 targets 為 None(預設值),則比對必須具有一個 .targets 屬性,提供 SeqRecord 物件列表。
- compress - 如果為 True(預設值),則使用 zlib 壓縮資料。
如果為 False,則不壓縮資料。使用 compress=False 可以加快搜尋速度。
- blockSize - 在 r-tree 中捆綁的項目數量。
請參閱 UCSC 的 bedToBigBed 程式以取得更多資訊。預設值為 256。
- itemsPerSlot - 在最低層級捆綁的資料點數量。
請參閱 UCSC 的 bedToBigBed 程式以取得更多資訊。使用 itemsPerSlot=1 可以加快搜尋速度。預設值為 512。
- extraIndex - 字串列表,其中包含要建立索引的額外欄位的名稱。
預設值為空列表。
- write_file(stream, alignments)
將比對寫入檔案串流,並傳回比對的數量。
alignments - 一個返回 Alignment 物件的列表或迭代器 stream - 輸出檔案串流。
- write_alignments(alignments, output, reductions, extra_indices)
將比對寫入輸出檔案,並傳回比對的數量。
alignments - 一個返回 Alignment 物件的列表或迭代器 stream - 輸出檔案串流。
- __abstractmethods__ = frozenset({})
- class Bio.Align.bigbed.AlignmentIterator(source)
基底類別:
AlignmentIterator
bigBed 檔案的比對迭代器。
載入並以增量方式傳回 bigBed 檔案中儲存的成對比對。額外的比對資訊會儲存為每個比對的屬性。
- fmt: str | None = 'bigBed'
- mode = 'b'
- __len__()
傳回比對的數量。
比對的數量會快取。如果尚未計算,則會將迭代器倒回開頭,並透過迭代比對來計算比對的數量。然後,迭代器會返回檔案中的原始位置。
- search(chromosome=None, start=None, end=None)
迭代指定染色體區域中重疊的比對。
此方法搜尋索引以尋找指定染色體的比對,這些比對完全或部分重疊 start 和 end 之間的染色體區域。
- 參數:
chromosome - 染色體名稱。如果為 None(預設值),則包含所有比對。
start - 染色體上的起始位置。如果為 None(預設值),則使用 0 作為起始位置。
end - 染色體上的結束位置。如果為 None(預設值),則使用染色體的長度作為結束位置。
- __abstractmethods__ = frozenset({})