Bio.Align.bigbed 模組

Bio.Align 支援 bigBed 格式的對齊檔案。

bigBed 格式在單一索引二進制檔案中儲存一系列的成對對齊。通常它們用於轉錄本與基因組的對齊。如同 BED 格式,會儲存對齊位置和對齊分數,但不儲存對齊序列。

請參閱 http://genome.ucsc.edu/goldenPath/help/bigBed.html 以取得更多資訊。

您應透過 Bio.Align 函式來使用此模組。

class Bio.Align.bigbed.Field(as_type, name, comment)

基底:tuple

__getnewargs__()

將 self 回傳為一個純粹的 tuple。由 copy 和 pickle 使用。

static __new__(_cls, as_type, name, comment)

建立 Field(as_type, name, comment) 的新實例

__repr__()

回傳格式良好的表示字串

__slots__ = ()
as_type

欄位編號 0 的別名

comment

欄位編號 2 的別名

name

欄位編號 1 的別名

class Bio.Align.bigbed.AutoSQLTable(name, comment, fields)

基底:list

AutoSQL 表格描述(可能擴充的)BED 格式的欄位。

default: AutoSQLTable = [('string', 'chrom', '參考序列染色體或骨架'), ('uint', 'chromStart', '染色體中的起始位置'), ('uint', 'chromEnd', '染色體中的結束位置'), ('string', 'name', '項目名稱。'), ('uint', 'score', '分數 (0-1000)'), ('char[1]', 'strand', '+ 或 - 代表股'), ('uint', 'thickStart', '顯示應為粗體的起始位置 (起始密碼子)'), ('uint', 'thickEnd', '顯示應為粗體的結束位置 (終止密碼子)'), ('uint', 'reserved', '自 2004-11-22 起用作 itemRgb'), ('int', 'blockCount', '區塊數'), ('int[blockCount]', 'blockSizes', '以逗號分隔的區塊大小列表'), ('int[blockCount]', 'chromStarts', '相對於 chromStart 的起始位置')]
__init__(name, comment, fields)

建立 AutoSQL 表格,描述(擴充的)BED 格式的欄位。

classmethod from_bytes(data)

回傳使用位元組物件資料初始化的 AutoSQLTable。

classmethod from_string(data)

回傳使用字串物件資料初始化的 AutoSQLTable。

__str__()

回傳 str(self)。

__bytes__()
__getitem__(i)

x.__getitem__(y) <==> x[y]

__annotations__ = {'default': 'AutoSQLTable'}
class Bio.Align.bigbed.AlignmentWriter(target, bedN=12, declaration=None, targets=None, compress=True, itemsPerSlot=512, blockSize=256, extraIndex=())

基底:AlignmentWriter

bigBed 檔案格式的對齊檔案寫入器。

fmt: str | None = 'bigBed'
mode = 'wb'
__init__(target, bedN=12, declaration=None, targets=None, compress=True, itemsPerSlot=512, blockSize=256, extraIndex=())

建立一個 AlignmentWriter 物件。

參數:
  • target - 輸出串流或檔案名稱。

  • bedN - BED 檔案中的欄位數。

    必須介於 3 到 12 之間;預設值為 12。

  • declaration - 一個 AutoSQLTable 物件,宣告 BED 檔案中的欄位。

    只有在 BED 檔案包含額外(自訂)欄位時才需要。預設值為 None。

  • targets - 一個 SeqRecord 物件列表,其中包含比對中出現的染色體順序。

    每個 SeqRecord 中的序列內容可能未定義,但序列長度必須定義,如以下範例所示:

    SeqRecord(Seq(None, length=248956422), id=”chr1”)

    如果 targets 為 None(預設值),則比對必須具有一個 .targets 屬性,提供 SeqRecord 物件列表。

  • compress - 如果為 True(預設值),則使用 zlib 壓縮資料。

    如果為 False,則不壓縮資料。使用 compress=False 可以加快搜尋速度。

  • blockSize - 在 r-tree 中捆綁的項目數量。

    請參閱 UCSC 的 bedToBigBed 程式以取得更多資訊。預設值為 256。

  • itemsPerSlot - 在最低層級捆綁的資料點數量。

    請參閱 UCSC 的 bedToBigBed 程式以取得更多資訊。使用 itemsPerSlot=1 可以加快搜尋速度。預設值為 512。

  • extraIndex - 字串列表,其中包含要建立索引的額外欄位的名稱。

    預設值為空列表。

write_file(stream, alignments)

將比對寫入檔案串流,並傳回比對的數量。

alignments - 一個返回 Alignment 物件的列表或迭代器 stream - 輸出檔案串流。

write_alignments(alignments, output, reductions, extra_indices)

將比對寫入輸出檔案,並傳回比對的數量。

alignments - 一個返回 Alignment 物件的列表或迭代器 stream - 輸出檔案串流。

__abstractmethods__ = frozenset({})
class Bio.Align.bigbed.AlignmentIterator(source)

基底類別:AlignmentIterator

bigBed 檔案的比對迭代器。

載入並以增量方式傳回 bigBed 檔案中儲存的成對比對。額外的比對資訊會儲存為每個比對的屬性。

fmt: str | None = 'bigBed'
mode = 'b'
__len__()

傳回比對的數量。

比對的數量會快取。如果尚未計算,則會將迭代器倒回開頭,並透過迭代比對來計算比對的數量。然後,迭代器會返回檔案中的原始位置。

search(chromosome=None, start=None, end=None)

迭代指定染色體區域中重疊的比對。

此方法搜尋索引以尋找指定染色體的比對,這些比對完全或部分重疊 start 和 end 之間的染色體區域。

參數:
  • chromosome - 染色體名稱。如果為 None(預設值),則包含所有比對。

  • start - 染色體上的起始位置。如果為 None(預設值),則使用 0 作為起始位置。

  • end - 染色體上的結束位置。如果為 None(預設值),則使用染色體的長度作為結束位置。

__abstractmethods__ = frozenset({})