Bio.codonalign.codonseq 模組

用於處理編碼序列的程式碼。

CodonSeq 類別繼承自 Seq 類別。這是 Biopython 中處理 CodonAlignment 序列的核心類別。

class Bio.codonalign.codonseq.CodonSeq(data='', gap_char='-', rf_table=None)

基於: Seq

CodonSeq 設計用於 CodonAlignment 類別的 SeqRecords 中。

CodonSeq 非常有用,因為它允許使用者在轉換 CodonSeq 時指定讀碼框。

CodonSeq 也接受透過呼叫 get_codon() 方法的 codon 樣式切片。

重要: 如果您指定 rf_table,則無間隙的 CodonSeq 可以是任何長度。有間隙的 CodonSeq 應該是三的倍數。

>>> codonseq = CodonSeq("AAATTTGGGCCAAATTT", rf_table=(0,3,6,8,11,14))
>>> print(codonseq.translate())
KFGAKF

測試 get_full_rf_table 方法

>>> p = CodonSeq('AAATTTCCCGG-TGGGTTTAA', rf_table=(0, 3, 6, 9, 11, 14, 17))
>>> full_rf_table = p.get_full_rf_table()
>>> print(full_rf_table)
[0, 3, 6, 9, 12, 15, 18]
>>> print(p.translate(rf_table=full_rf_table, ungap_seq=False))
KFPPWV*
>>> p = CodonSeq('AAATTTCCCGGGAA-TTTTAA', rf_table=(0, 3, 6, 9, 14, 17))
>>> print(p.get_full_rf_table())
[0, 3, 6, 9, 12.0, 15, 18]
>>> p = CodonSeq('AAA------------TAA', rf_table=(0, 3))
>>> print(p.get_full_rf_table())
[0, 3.0, 6.0, 9.0, 12.0, 15]
__init__(data='', gap_char='-', rf_table=None)

初始化類別。

get_codon(index)

從序列中取得索引密碼子。

get_codon_num()

傳回 CodonSeq 中的密碼子數量。

translate(codon_table=None, stop_symbol='*', rf_table=None, ungap_seq=True)

根據 rf_table 中的讀碼框轉換 CodonSeq。

使用者可以在此處指定 rf_table。如果您想在轉換後的序列中包含間隙,這是唯一的方法。為此,ungap_seq 應設定為 true。

toSeq()

將 DNA 轉換為 seq 物件。

get_full_rf_table()

傳回 CodonSeq 記錄的完整 rf_table。

完整的 rf_table 與一般的 rf_table 不同之處在於它會轉換 CodonSeq 中的間隙。這有助於建構包含讀碼框移位的對齊。

full_translate(codon_table=None, stop_symbol='*')

套用考慮間隙的完整轉換。

ungap(gap='-')

傳回不含間隙字元的序列副本。

classmethod from_seq(seq, rf_table=None)

從序列資料取得密碼子序列。

__abstractmethods__ = frozenset({})
Bio.codonalign.codonseq.cal_dn_ds(codon_seq1, codon_seq2, method='NG86', codon_table=None, k=1, cfreq=None)

計算給定兩個序列的 dN 和 dS。

可用的方法
引數
  • codon_seq1 - CodonSeq 或包含 CodonSeq 的 SeqRecord

  • codon_seq2 - CodonSeq 或包含 CodonSeq 的 SeqRecord

  • w - 轉變/反轉比率

  • cfreq - 只有在使用 ML 方法時才能指定目前的密碼子頻率向量。取得 cfreq 的可能方法有:F1x4、F3x4 和 F61。