Bio.Align.Applications 套件
模組內容
比對命令列工具包裝器 (已過時)。
我們已決定在未來移除此模組,並建議直接使用 subprocess 模組建立您的命令並調用它。
- class Bio.Align.Applications.MuscleCommandline(cmd='muscle', **kwargs)
基底類別:
AbstractCommandline
多序列比對程式 MUSCLE 的命令列包裝器。
注意
最後檢查的版本:3.7,簡短測試過 3.8
參考文獻
Edgar, Robert C. (2004), MUSCLE: multiple sequence alignment with high accuracy and high throughput, Nucleic Acids Research 32(5), 1792-97.
Edgar, R.C. (2004) MUSCLE: a multiple sequence alignment method with reduced time and space complexity. BMC Bioinformatics 5(1): 113.
範例
>>> from Bio.Align.Applications import MuscleCommandline >>> muscle_exe = r"C:\Program Files\Alignments\muscle3.8.31_i86win32.exe" >>> in_file = r"C:\My Documents\unaligned.fasta" >>> out_file = r"C:\My Documents\aligned.fasta" >>> muscle_cline = MuscleCommandline(muscle_exe, input=in_file, out=out_file) >>> print(muscle_cline) "C:\Program Files\Alignments\muscle3.8.31_i86win32.exe" -in "C:\My Documents\unaligned.fasta" -out "C:\My Documents\aligned.fasta"
您通常會使用 muscle_cline() 或透過 Python subprocess 模組執行命令列,如 Biopython 教學中所述。
- __init__(cmd='muscle', **kwargs)
初始化類別。
- property anchors
在樹狀結構相關的精鍊迭代中使用錨點最佳化
此屬性控制 -anchors 開關的加入,請將此屬性視為布林值。
- property anchorspacing
錨點列之間的最小間距
這控制 -anchorspacing 參數及其相關值的加入。將此屬性設定為所需的參數值。
- property brenner
使用 Steve Brenner 的根比對方法
此屬性控制 -brenner 開關的加入,請將此屬性視為布林值。
- property center
中心參數 - 應為負數
這控制 -center 參數及其相關值的加入。將此屬性設定為所需的參數值。
- property cluster
執行輸入序列的快速分群,使用 -tree1 儲存樹狀結構
此屬性控制 -cluster 開關的加入,請將此屬性視為布林值。
- property cluster1
迭代 1 中使用的分群方法
這控制 -cluster1 參數及其相關值的加入。將此屬性設定為所需的參數值。
- property cluster2
迭代 2 中使用的分群方法
這控制 -cluster2 參數及其相關值的加入。將此屬性設定為所需的參數值。
- property clw
以 CLUSTALW 格式 (含 MUSCLE 標頭) 寫入輸出
此屬性控制 -clw 開關的加入,請將此屬性視為布林值。
- property clwout
將 CLUSTALW 輸出 (含 MUSCLE 標頭) 寫入指定檔案名稱
這控制 -clwout 參數及其相關值的加入。將此屬性設定為所需的參數值。
- property clwstrict
以 CLUSTALW 格式和版本 1.81 標頭寫入輸出
此屬性控制 -clwstrict 開關的加入,請將此屬性視為布林值。
- property clwstrictout
將 CLUSTALW 輸出 (含版本 1.81 標頭) 寫入指定檔案名稱
這控制 -clwstrictout 參數及其相關值的加入。將此屬性設定為所需的參數值。
- property core
不捕捉例外情況
此屬性控制 -core 開關的加入,請將此屬性視為布林值。
- property diagbreak
允許合併成一個對角線的兩個對角線之間的最大距離
這控制 -diagbreak 參數及其相關值的加入。將此屬性設定為所需的參數值。
- property diaglength
對角線的最小長度
這控制 -diaglength 參數及其相關值的加入。將此屬性設定為所需的參數值。
- property diagmargin
在對角線末端捨棄這麼多位置
這控制 -diagmargin 參數及其相關值的加入。將此屬性設定為所需的參數值。
- property diags
尋找對角線 (對於相似的序列更快)
此屬性控制 -diags 開關的加入,請將此屬性視為布林值。
- property dimer
使用更快的 (稍微不準確) 二聚體近似值作為 SP 分數
此屬性控制 -dimer 開關的加入,請將此屬性視為布林值。
- property distance1
迭代 1 的距離測量
這控制 -distance1 參數及其相關值的加入。將此屬性設定為所需的參數值。
- property distance2
迭代 2 的距離測量
這控制 -distance2 參數及其相關值的加入。將此屬性設定為所需的參數值。
- property fasta
以 FASTA 格式寫入輸出
此屬性控制是否加入 -fasta 開關,請將此屬性視為布林值。
- property fastaout
將 FASTA 格式輸出寫入指定的檔案名稱
此屬性控制是否加入 -fastaout 參數及其相關聯的值。請將此屬性設定為所需的參數值。
- property gapextend
間隙延伸懲罰
此屬性控制是否加入 -gapextend 參數及其相關聯的值。請將此屬性設定為所需的參數值。
- property gapopen
間隙開啟分數 - 負數
此屬性控制是否加入 -gapopen 參數及其相關聯的值。請將此屬性設定為所需的參數值。
- property group
將輸出中相似的序列分組
此屬性控制是否加入 -group 開關,請將此屬性視為布林值。
- property html
以 HTML 格式寫入輸出
此屬性控制是否加入 -html 開關,請將此屬性視為布林值。
- property htmlout
將 HTML 格式輸出寫入指定的檔案名稱
此屬性控制是否加入 -htmlout 參數及其相關聯的值。請將此屬性設定為所需的參數值。
- property hydro
疏水區域的視窗大小
此屬性控制是否加入 -hydro 參數及其相關聯的值。請將此屬性設定為所需的參數值。
- property hydrofactor
疏水區域中間隙懲罰的乘數
此屬性控制是否加入 -hydrofactor 參數及其相關聯的值。請將此屬性設定為所需的參數值。
- property in1
輪廓比對的第一個輸入檔案名稱
此屬性控制是否加入 -in1 參數及其相關聯的值。請將此屬性設定為所需的參數值。
- property in2
輪廓比對的第二個輸入檔案名稱
此屬性控制是否加入 -in2 參數及其相關聯的值。請將此屬性設定為所需的參數值。
- property input
輸入檔案名稱
此屬性控制是否加入 -in 參數及其相關聯的值。請將此屬性設定為所需的參數值。
- property le
使用對數期望值輪廓分數 (VTML240)
此屬性控制是否加入 -le 開關,請將此屬性視為布林值。
- property log
日誌檔案名稱
此屬性控制是否加入 -log 參數及其相關聯的值。請將此屬性設定為所需的參數值。
- property loga
日誌檔案名稱 (附加到現有檔案)
此屬性控制是否加入 -loga 參數及其相關聯的值。請將此屬性設定為所需的參數值。
- property matrix
NCBI 或 WU-BLAST 格式蛋白質取代矩陣的路徑 - 也會設定 -gapopen、-gapextend 和 -center
此屬性控制是否加入 -matrix 參數及其相關聯的值。請將此屬性設定為所需的參數值。
- property maxdiagbreak
在 v3.8 中已棄用,請改用 -diagbreak。
此屬性控制是否加入 -maxdiagbreak 參數及其相關聯的值。請將此屬性設定為所需的參數值。
- property maxhours
最長執行時間,以小時為單位
此屬性控制是否加入 -maxhours 參數及其相關聯的值。請將此屬性設定為所需的參數值。
- property maxiters
最大迭代次數
此屬性控制是否加入 -maxiters 參數及其相關聯的值。請將此屬性設定為所需的參數值。
- property maxtrees
在迭代 2 中要建構的最大樹狀結構數
此屬性控制是否加入 -maxtrees 參數及其相關聯的值。請將此屬性設定為所需的參數值。
- property minbestcolscore
一個欄位要成為錨點所必須擁有的最低分數
此屬性控制是否加入 -minbestcolscore 參數及其相關聯的值。請將此屬性設定為所需的參數值。
- property minsmoothscore
一個欄位要成為錨點所必須擁有的最低平滑分數
此屬性控制是否加入 -minsmoothscore 參數及其相關聯的值。請將此屬性設定為所需的參數值。
- property msf
以 MSF 格式寫入輸出
此屬性控制是否加入 -msf 開關,請將此屬性視為布林值。
- property msfout
將 MSF 格式輸出寫入指定的檔案名稱
此屬性控制是否加入 -msfout 參數及其相關聯的值。請將此屬性設定為所需的參數值。
- property noanchors
在樹狀結構相關的精煉迭代中不使用錨點最佳化
此屬性控制是否加入 -noanchors 開關,請將此屬性視為布林值。
- property nocore
捕捉例外狀況
此屬性控制是否加入 -nocore 開關,請將此屬性視為布林值。
- property objscore
樹狀結構相關精煉所使用的目標分數
此屬性控制是否加入 -objscore 參數及其相關聯的值。請將此屬性設定為所需的參數值。
- property out
輸出檔案名稱
此屬性控制是否加入 -out 參數及其相關聯的值。請將此屬性設定為所需的參數值。
- property phyi
以 PHYLIP 交錯格式寫入輸出
此屬性控制是否加入 -phyi 開關,請將此屬性視為布林值。
- property phyiout
將 PHYLIP 交錯格式輸出寫入指定的檔案名稱
此屬性控制是否加入 -phyiout 參數及其相關聯的值。請將此屬性設定為所需的參數值。
- property phys
以 PHYLIP 循序格式寫入輸出
此屬性控制是否加入 -phys 開關,請將此屬性視為布林值。
- property physout
將 PHYLIP 循序格式寫入指定的檔案名稱
此屬性控制是否加入 -physout 參數及其相關聯的值。請將此屬性設定為所需的參數值。
- property profile
執行輪廓比對
此屬性控制是否加入 -profile 開關,請將此屬性視為布林值。
- 屬性 quiet
不顯示進度訊息
此屬性控制 -quiet 參數的添加,請將此屬性視為布林值。
- 屬性 refine
僅執行依賴於樹狀結構的精煉
此屬性控制 -refine 參數的添加,請將此屬性視為布林值。
- 屬性 refinew
僅使用滑動窗口方法執行依賴於樹狀結構的精煉
此屬性控制 -refinew 參數的添加,請將此屬性視為布林值。
- 屬性 refinewindow
-refinew 的窗口長度
此屬性控制 -refinewindow 參數及其相關值的添加。請將此屬性設定為所需參數值。
- 屬性 root1
在第一次迭代中用於樹狀結構定根的方法
此屬性控制 -root1 參數及其相關值的添加。請將此屬性設定為所需參數值。
- 屬性 root2
在第二次迭代中用於樹狀結構定根的方法
此屬性控制 -root2 參數及其相關值的添加。請將此屬性設定為所需參數值。
- 屬性 scorefile
分數檔名,包含對齊中每列的平均 BLOSUM62 分數的單行
此屬性控制 -scorefile 參數及其相關值的添加。請將此屬性設定為所需參數值。
- 屬性 seqtype
序列類型
此屬性控制 -seqtype 參數及其相關值的添加。請將此屬性設定為所需參數值。
- 屬性 smoothscoreceil
用於平滑化的列分數最大值
此屬性控制 -smoothscoreceil 參數及其相關值的添加。請將此屬性設定為所需參數值。
- 屬性 smoothwindow
用於錨定列平滑化的窗口
此屬性控制 -smoothwindow 參數及其相關值的添加。請將此屬性設定為所需參數值。
- 屬性 sp
使用成對總和蛋白質輪廓分數 (PAM200)
此屬性控制 -sp 參數的添加,請將此屬性視為布林值。
- 屬性 spn
使用成對總和蛋白質核苷酸輪廓分數
此屬性控制 -spn 參數的添加,請將此屬性視為布林值。
- 屬性 spscore
計算多重對齊的 SP 目標分數
此屬性控制 -spscore 參數及其相關值的添加。請將此屬性設定為所需參數值。
- 屬性 stable
不要在輸出中對相似序列進行分組(v3.8 不支援)
此屬性控制 -stable 參數的添加,請將此屬性視為布林值。
- 屬性 sueff
UPGMB 分群中使用的常數
此屬性控制 -sueff 參數及其相關值的添加。請將此屬性設定為所需參數值。
- 屬性 sv
使用成對總和輪廓分數 (VTML240)
此屬性控制 -sv 參數的添加,請將此屬性視為布林值。
- 屬性 tree1
儲存第一次迭代的 Newick 樹
此屬性控制 -tree1 參數及其相關值的添加。請將此屬性設定為所需參數值。
- 屬性 tree2
儲存第二次迭代的 Newick 樹
此屬性控制 -tree2 參數及其相關值的添加。請將此屬性設定為所需參數值。
- 屬性 usetree
使用給定的 Newick 樹作為指導樹
此屬性控制 -usetree 參數及其相關值的添加。請將此屬性設定為所需參數值。
- 屬性 verbose
寫入參數設定和進度
此屬性控制 -verbose 參數的添加,請將此屬性視為布林值。
- 屬性 version
將版本字串寫入 stdout 並退出
此屬性控制 -version 參數的添加,請將此屬性視為布林值。
- 屬性 weight1
在第一次迭代中使用的加權方案
此屬性控制 -weight1 參數及其相關值的添加。請將此屬性設定為所需參數值。
- 屬性 weight2
在第二次迭代中使用的加權方案
此屬性控制 -weight2 參數及其相關值的添加。請將此屬性設定為所需參數值。
- 類別 Bio.Align.Applications.ClustalwCommandline(cmd='clustalw', **kwargs)
基底類別:
AbstractCommandline
clustalw(版本一或二)的命令列封裝器。
注意
最後檢查版本:1.83 和 2.1
參考文獻
Larkin MA, Blackshields G, Brown NP, Chenna R, McGettigan PA, McWilliam H, Valentin F, Wallace IM, Wilm A, Lopez R, Thompson JD, Gibson TJ, Higgins DG. (2007). Clustal W and Clustal X version 2.0. Bioinformatics, 23, 2947-2948.
範例
>>> from Bio.Align.Applications import ClustalwCommandline >>> in_file = "unaligned.fasta" >>> clustalw_cline = ClustalwCommandline("clustalw2", infile=in_file) >>> print(clustalw_cline) clustalw2 -infile=unaligned.fasta
您通常會使用 clustalw_cline() 或透過 Python subprocess 模組來執行命令列,如 Biopython 教學中所述。
- __init__(cmd='clustalw', **kwargs)
初始化類別。
- 屬性 align
進行完整的多重對齊。
此屬性控制 -align 參數的添加,請將此屬性視為布林值。
- 屬性 bootlabels
樹狀顯示中引導程序值的節點或分支位置
此屬性控制 -bootlabels 參數及其相關值的添加。請將此屬性設定為所需參數值。
- 屬性 bootstrap
引導 NJ 樹 (n = 引導程序數;預設值 = 1000)。
此屬性控制 -bootstrap 參數及其相關值的添加。請將此屬性設定為所需參數值。
- 屬性 case
LOWER 或 UPPER(僅適用於 GDE 輸出)
此屬性控制 -case 參數及其相關值的添加。請將此屬性設定為所需參數值。
- 屬性 check
概述命令列參數。
此屬性控制 -check 開關的加入,將此屬性視為布林值。
- 屬性 clustering
NJ 或 UPGMA
此屬性控制 -clustering 參數的加入及其關聯值。將此屬性設定為所需的參數值。
- 屬性 convert
以不同的檔案格式輸出輸入序列。
此屬性控制 -convert 開關的加入,將此屬性視為布林值。
- 屬性 dnamatrix
DNA權重矩陣=IUB、CLUSTALW 或檔案名稱
此屬性控制 -dnamatrix 參數的加入及其關聯值。將此屬性設定為所需的參數值。
- 屬性 endgaps
無末端間隙分離懲罰。
此屬性控制 -endgaps 開關的加入,將此屬性視為布林值。
- 屬性 fullhelp
輸出完整的說明內容。
此屬性控制 -fullhelp 開關的加入,將此屬性視為布林值。
- 屬性 gapdist
間隙分離懲罰範圍
此屬性控制 -gapdist 參數的加入及其關聯值。將此屬性設定為所需的參數值。
- 屬性 gapext
間隙延伸懲罰
此屬性控制 -gapext 參數的加入及其關聯值。將此屬性設定為所需的參數值。
- 屬性 gapopen
間隙開啟懲罰
此屬性控制是否加入 -gapopen 參數及其相關聯的值。請將此屬性設定為所需的參數值。
- 屬性 helixendin
螺旋內被視為末端的殘基數量
此屬性控制 -helixendin 參數的加入及其關聯值。將此屬性設定為所需的參數值。
- 屬性 helixendout
螺旋外被視為末端的殘基數量
此屬性控制 -helixendout 參數的加入及其關聯值。將此屬性設定為所需的參數值。
- 屬性 helixgap
螺旋核心殘基的間隙懲罰
此屬性控制 -helixgap 參數的加入及其關聯值。將此屬性設定為所需的參數值。
- 屬性 help
概述命令列參數。
此屬性控制 -help 開關的加入,將此屬性視為布林值。
- 屬性 hgapresidues
親水性殘基列表。
此屬性控制 -hgapresidues 開關的加入,將此屬性視為布林值。
- 屬性 infile
輸入序列。
此屬性控制 -infile 參數的加入及其關聯值。將此屬性設定為所需的參數值。
- 屬性 iteration
NONE 或 TREE 或 ALIGNMENT
此屬性控制 -iteration 參數的加入及其關聯值。將此屬性設定為所需的參數值。
- 屬性 kimura
使用 Kimura 的校正。
此屬性控制 -kimura 開關的加入,將此屬性視為布林值。
- 屬性 ktuple
詞大小
此屬性控制 -ktuple 參數的加入及其關聯值。將此屬性設定為所需的參數值。
- 屬性 loopgap
迴路區域的間隙懲罰
此屬性控制 -loopgap 參數的加入及其關聯值。將此屬性設定為所需的參數值。
- 屬性 matrix
蛋白質權重矩陣=BLOSUM、PAM、GONNET、ID 或檔案名稱
此屬性控制是否加入 -matrix 參數及其相關聯的值。請將此屬性設定為所需的參數值。
- 屬性 maxdiv
延遲的 % 相同性
此屬性控制 -maxdiv 參數的加入及其關聯值。將此屬性設定為所需的參數值。
- 屬性 maxseqlen
允許的最大輸入序列長度
此屬性控制 -maxseqlen 參數的加入及其關聯值。將此屬性設定為所需的參數值。
- 屬性 negative
蛋白質比對使用矩陣中的負值
此屬性控制 -negative 開關的加入,將此屬性視為布林值。
- 屬性 newtree
新建立的引導樹的輸出檔案名稱
此屬性控制 -newtree 參數的加入及其關聯值。將此屬性設定為所需的參數值。
- 屬性 newtree1
profile1 的新引導樹的輸出檔案名稱
此屬性控制 -newtree1 參數的加入及其關聯值。將此屬性設定為所需的參數值。
- 屬性 newtree2
profile2 的新引導樹的輸出檔案
此屬性控制 -newtree2 參數的加入及其關聯值。將此屬性設定為所需的參數值。
- 屬性 nohgap
關閉親水性間隙
此屬性控制 -nohgap 開關的加入,將此屬性視為布林值。
- 屬性 nopgap
關閉殘基特定間隙
此屬性控制 -nopgap 開關的加入,將此屬性視為布林值。
- 屬性 nosecstr1
不使用 profile 1 的二級結構間隙懲罰遮罩
此屬性控制 -nosecstr1 開關的加入,將此屬性視為布林值。
- 屬性 nosecstr2
不使用 profile 2 的二級結構間隙懲罰遮罩
此屬性控制 -nosecstr2 開關的加入,將此屬性視為布林值。
- 屬性 noweights
停用序列加權
此屬性控制 -noweights 開關的加入,請將此屬性視為布林值。
- 屬性 numiter
執行的最大疊代次數
此屬性控制 -numiter 參數及其關聯值的加入。請將此屬性設定為所需的參數值。
- 屬性 options
列出命令列參數
此屬性控制 -options 開關的加入,請將此屬性視為布林值。
- 屬性 outfile
輸出序列比對檔名
此屬性控制 -outfile 參數及其關聯值的加入。請將此屬性設定為所需的參數值。
- 屬性 outorder
輸出分類單元順序:INPUT 或 ALIGNED
此屬性控制 -outorder 參數及其關聯值的加入。請將此屬性設定為所需的參數值。
- 屬性 output
輸出格式:CLUSTAL(預設)、GCG、GDE、PHYLIP、PIR、NEXUS 和 FASTA
此屬性控制 -output 參數及其關聯值的加入。請將此屬性設定為所需的參數值。
- 屬性 outputtree
nj 或 phylip 或 dist 或 nexus
此屬性控制 -outputtree 參數及其關聯值的加入。請將此屬性設定為所需的參數值。
- 屬性 pairgap
間隙罰分
此屬性控制 -pairgap 參數及其關聯值的加入。請將此屬性設定為所需的參數值。
- 屬性 pim
輸出百分比一致性矩陣(在計算樹狀圖時)。
此屬性控制 -pim 開關的加入,請將此屬性視為布林值。
- 屬性 profile
透過概況比對合併兩個比對結果
此屬性控制是否加入 -profile 開關,請將此屬性視為布林值。
- 屬性 profile1
概況(舊的比對)。
此屬性控制 -profile1 參數及其關聯值的加入。請將此屬性設定為所需的參數值。
- 屬性 profile2
概況(舊的比對)。
此屬性控制 -profile2 參數及其關聯值的加入。請將此屬性設定為所需的參數值。
- 屬性 pwdnamatrix
DNA權重矩陣=IUB、CLUSTALW 或檔案名稱
此屬性控制 -pwdnamatrix 參數及其關聯值的加入。請將此屬性設定為所需的參數值。
- 屬性 pwgapext
間隙延伸懲罰
此屬性控制 -pwgapext 參數及其關聯值的加入。請將此屬性設定為所需的參數值。
- 屬性 pwgapopen
間隙開啟懲罰
此屬性控制 -pwgapopen 參數及其關聯值的加入。請將此屬性設定為所需的參數值。
- 屬性 pwmatrix
蛋白質權重矩陣=BLOSUM、PAM、GONNET、ID 或檔案名稱
此屬性控制 -pwmatrix 參數及其關聯值的加入。請將此屬性設定為所需的參數值。
- 屬性 quicktree
使用快速演算法進行比對導引樹
此屬性控制 -quicktree 開關的加入,請將此屬性視為布林值。
- 屬性 quiet
將主控台輸出降至最低
此屬性控制 -quiet 參數的添加,請將此屬性視為布林值。
- 屬性 range
要寫入的序列範圍,從 m 到 m+n。以字串形式輸入,例如 ‘24,200’
此屬性控制 -range 參數及其關聯值的加入。請將此屬性設定為所需的參數值。
- 屬性 score
可以是:PERCENT 或 ABSOLUTE
此屬性控制 -score 參數及其關聯值的加入。請將此屬性設定為所需的參數值。
- 屬性 secstrout
在比對檔案中輸出 STRUCTURE 或 MASK 或 BOTH 或 NONE
此屬性控制 -secstrout 參數及其關聯值的加入。請將此屬性設定為所需的參數值。
- 屬性 seed
用於自舉法的種子號碼。
此屬性控制 -seed 參數及其關聯值的加入。請將此屬性設定為所需的參數值。
- 屬性 seqno_range
OFF 或 ON(NEW - 用於所有輸出格式)
此屬性控制 -seqno_range 參數及其關聯值的加入。請將此屬性設定為所需的參數值。
- 屬性 seqnos
OFF 或 ON(僅限 Clustal 輸出)
此屬性控制 -seqnos 參數及其關聯值的加入。請將此屬性設定為所需的參數值。
- 屬性 sequences
將 profile2 序列依序新增至 profile1 比對結果
此屬性控制 -sequences 開關的加入,請將此屬性視為布林值。
- 屬性 stats
將一些比對統計資料記錄到檔案
此屬性控制 -stats 參數及其關聯值的加入。請將此屬性設定為所需的參數值。
- 屬性 strandendin
視為終端殘基的鏈內殘基數
此屬性控制 -strandendin 參數及其關聯值的加入。請將此屬性設定為所需的參數值。
- 屬性 strandendout
視為終端殘基的鏈外殘基數
此屬性控制 -strandendout 參數及其關聯值的加入。請將此屬性設定為所需的參數值。
- 屬性 strandgap
鏈核心殘基的間隙罰分
此屬性控制 -strandgap 參數及其關聯值的加入。請將此屬性設定為所需的參數值。
- 屬性 terminalgap
結構末端的間隙罰分
此屬性控制 -terminalgap 參數及其關聯值的加入。請將此屬性設定為所需的參數值。
- 屬性 topdiags
最佳對角線數量。
此屬性控制 -topdiags 參數及其關聯值的加入。請將此屬性設定為所需的參數值。
- 屬性 tossgaps
忽略有間隙的位置。
此屬性控制 -tossgaps 開關的加入,請將此屬性視為布林值。
- 屬性 transweight
轉換加權
此屬性控制 -transweight 參數及其關聯值的加入。請將此屬性設定為所需的參數值。
- 屬性 tree
計算 NJ 樹狀圖。
此屬性控制 -tree 開關的添加,將此屬性視為布林值。
- property type
蛋白質或 DNA 序列
此屬性控制 -type 參數及其相關值的添加。將此屬性設定為所需參數值。
- property usetree
引導樹的檔案名稱
此屬性控制 -usetree 參數及其相關值的添加。請將此屬性設定為所需參數值。
- property usetree1
profile1 引導樹的檔案名稱
此屬性控制 -usetree1 參數及其相關值的添加。將此屬性設定為所需參數值。
- property usetree2
profile2 引導樹的檔案名稱
此屬性控制 -usetree2 參數及其相關值的添加。將此屬性設定為所需參數值。
- property window
最佳對角線周圍的窗口。
此屬性控制 -window 參數及其相關值的添加。將此屬性設定為所需參數值。
- class Bio.Align.Applications.ClustalOmegaCommandline(cmd='clustalo', **kwargs)
基底類別:
AbstractCommandline
clustal omega 的命令列包裝器。
注意
最後檢查的版本:1.2.0
參考文獻
Sievers F, Wilm A, Dineen DG, Gibson TJ, Karplus K, Li W, Lopez R, McWilliam H, Remmert M, Söding J, Thompson JD, Higgins DG (2011). 使用 Clustal Omega 快速、可擴展地生成高品質蛋白質多序列比對。分子系統生物學 7:539 https://doi.org/10.1038/msb.2011.75
範例
>>> from Bio.Align.Applications import ClustalOmegaCommandline >>> in_file = "unaligned.fasta" >>> out_file = "aligned.fasta" >>> clustalomega_cline = ClustalOmegaCommandline(infile=in_file, outfile=out_file, verbose=True, auto=True) >>> print(clustalomega_cline) clustalo -i unaligned.fasta -o aligned.fasta --auto -v
您通常會使用 clustalomega_cline() 或透過 Python subprocess 模組來執行命令列,如 Biopython 教學中所述。
- __init__(cmd='clustalo', **kwargs)
初始化類別。
- property auto
自動設定選項(可能會覆蓋您的一些選項)
此屬性控制 –auto 開關的添加,將此屬性視為布林值。
- property clusteringout
群集輸出檔案
此屬性控制 –clustering-out 參數及其相關值的添加。將此屬性設定為所需參數值。
- property clustersize
子群集中序列的軟性最大值
此屬性控制 –cluster-size 參數及其相關值的添加。將此屬性設定為所需參數值。
- property dealign
取消對齊輸入序列
此屬性控制 –dealign 開關的添加,將此屬性視為布林值。
- property distmat_full
使用完整距離矩陣計算引導樹(速度較慢;預設為 mBed)
此屬性控制 –full 開關的添加,將此屬性視為布林值。
- property distmat_full_iter
在迭代期間使用完整距離矩陣計算引導樹(預設為 mBed)
此屬性控制 –full-iter 開關的添加,將此屬性視為布林值。
- property distmat_in
成對距離矩陣輸入檔案(跳過距離計算)。
此屬性控制 –distmat-in 參數及其相關值的添加。將此屬性設定為所需參數值。
- property distmat_out
成對距離矩陣輸出檔案。
此屬性控制 –distmat-out 參數及其相關值的添加。將此屬性設定為所需參數值。
- property force
強制覆寫檔案。
此屬性控制 –force 開關的添加,將此屬性視為布林值。
- property guidetree_in
引導樹輸入檔案(跳過距離計算和引導樹群集步驟)。
此屬性控制 –guidetree-in 參數及其相關值的添加。將此屬性設定為所需參數值。
- property guidetree_out
引導樹輸出檔案。
此屬性控制 –guidetree-out 參數及其相關值的添加。將此屬性設定為所需參數值。
- property help
列印說明並結束。
此屬性控制 -h 開關的添加,將此屬性視為布林值。
- property hmm_input
HMM 輸入檔案
此屬性控制 –hmm-in 參數及其相關值的添加。將此屬性設定為所需參數值。
- property infile
多序列輸入檔案
此屬性控制 -i 參數及其相關值的添加。將此屬性設定為所需參數值。
- property infmt
強制序列輸入檔案格式(預設:自動)
允許的值:a2m, fa[sta], clu[stal], msf, phy[lip], selex, st[ockholm], vie[nna]
此屬性控制 –infmt 參數及其相關值的添加。將此屬性設定為所需參數值。
- property isprofile
停用檢查是否為 profile,強制 profile(預設為否)
此屬性控制 –is-profile 開關的添加,將此屬性視為布林值。
- property iterations
(組合引導樹/HMM)迭代次數
此屬性控制 –iterations 參數及其相關值的添加。將此屬性設定為所需參數值。
- property log
將所有非必要輸出記錄到此檔案。
此屬性控制 -l 參數及其相關值的添加。將此屬性設定為所需參數值。
- property long_version
列印長版本資訊並結束
此屬性控制 –long-version 開關的添加,將此屬性視為布林值。
- property max_guidetree_iterations
最大導引樹迭代次數
此屬性控制 `--max-guidetree-iterations` 參數的加入及其關聯的值。將此屬性設定為所需的參數值。
- property max_hmm_iterations
最大 HMM 迭代次數
此屬性控制 `--max-hmm-iterations` 參數的加入及其關聯的值。將此屬性設定為所需的參數值。
- property maxnumseq
允許的最大序列數量
此屬性控制 `--maxnumseq` 參數的加入及其關聯的值。將此屬性設定為所需的參數值。
- property maxseqlen
允許的最大序列長度
此屬性控制 `--maxseqlen` 參數的加入及其關聯的值。將此屬性設定為所需的參數值。
- property outfile
多重序列比對輸出檔案 (預設:stdout)。
此屬性控制 `-o` 參數的加入及其關聯的值。將此屬性設定為所需的參數值。
- property outfmt
MSA 輸出檔案格式:a2m=fa[sta],clu[stal],msf,phy[lip],selex,st[ockholm],vie[nna] (預設:fasta)。
此屬性控制 `--outfmt` 參數的加入及其關聯的值。將此屬性設定為所需的參數值。
- property outputorder
MSA 輸出順序,如同輸入/導引樹
此屬性控制 `--output-order` 參數的加入及其關聯的值。將此屬性設定為所需的參數值。
- property percentid
將距離轉換為百分比一致性 (預設:否)
此屬性控制 `--percent-id` 開關的加入,將此屬性視為布林值。
- property profile1
預先比對的多重序列檔案 (比對的欄位將保持固定)。
此屬性控制 `--profile1` 參數的加入及其關聯的值。將此屬性設定為所需的參數值。
- property profile2
預先比對的多重序列檔案 (比對的欄位將保持固定)。
此屬性控制 `--profile2` 參數的加入及其關聯的值。將此屬性設定為所需的參數值。
- property residuenumber
在 Clustal 格式中列印殘基編號 (預設:否)
此屬性控制 `--residuenumber` 開關的加入,將此屬性視為布林值。
- property seqtype
{蛋白質, RNA, DNA} 強制序列類型 (預設:自動)。
此屬性控制 `-t` 參數的加入及其關聯的值。將此屬性設定為所需的參數值。
- property threads
要使用的處理器數量
此屬性控制 `--threads` 參數的加入及其關聯的值。將此屬性設定為所需的參數值。
- property usekimura
對比對的序列使用 Kimura 距離校正 (預設:否)
此屬性控制 `--use-kimura` 開關的加入,將此屬性視為布林值。
- property verbose
詳細輸出
此屬性控制 `-v` 開關的加入,將此屬性視為布林值。
- property version
列印版本資訊並退出
此屬性控制 `--version` 開關的加入,將此屬性視為布林值。
- property wrap
輸出中換行前的殘基數
此屬性控制 `--wrap` 參數的加入及其關聯的值。將此屬性設定為所需的參數值。
- class Bio.Align.Applications.PrankCommandline(cmd='prank', **kwargs)
基底類別:
AbstractCommandline
多重比對程式 PRANK 的命令列封裝。
http://www.ebi.ac.uk/goldman-srv/prank/prank/
注意
上次檢查的版本:081202
參考文獻
Loytynoja, A. and Goldman, N. 2005. An algorithm for progressive multiple alignment of sequences with insertions. Proceedings of the National Academy of Sciences, 102: 10557–10562.
Loytynoja, A. and Goldman, N. 2008. Phylogeny-aware gap placement prevents errors in sequence alignment and evolutionary analysis. Science, 320: 1632.
範例
要比對 FASTA 檔案 (unaligned.fasta),並以比對後的 FASTA 格式輸出,且輸出檔案名稱以「aligned」開頭 (您無法明確選擇檔案名稱),且沒有樹狀圖輸出和 XML 輸出,請使用
>>> from Bio.Align.Applications import PrankCommandline >>> prank_cline = PrankCommandline(d="unaligned.fasta", ... o="aligned", # prefix only! ... f=8, # FASTA output ... notree=True, noxml=True) >>> print(prank_cline) prank -d=unaligned.fasta -o=aligned -f=8 -noxml -notree
您通常會使用 prank_cline() 或透過 Python subprocess 模組執行命令列,如 Biopython 教學中所述。
- __init__(cmd='prank', **kwargs)
初始化類別。
- property F
強制始終跳過插入:與 +F 相同
此屬性控制 `-F` 開關的加入,將此屬性視為布林值。
- property codon
是否進行密碼子感知比對
此屬性控制 `-codon` 開關的加入,將此屬性視為布林值。
- property convert
將輸入比對轉換為新格式。不執行比對
此屬性控制 -convert 開關的加入,將此屬性視為布林值。
- property d
輸入檔案名稱
此屬性控制 `-d` 參數的加入及其關聯的值。將此屬性設定為所需的參數值。
- property dnafreqs
DNA 頻率 - 'A,C,G,T'。例如,'25,25,25,25' 作為引號包圍的字串值。預設:經驗值
此屬性控制 `-dnafreqs` 參數的加入及其關聯的值。將此屬性設定為所需的參數值。
- property dots
將插入間隙顯示為點
此屬性控制 `-dots` 開關的加入,將此屬性視為布林值。
- property f
輸出比對格式。預設:8 FASTA 選項有:1. IG/Stanford 8. Pearson/Fasta 2. GenBank/GB 11. Phylip3.2 3. NBRF 12. Phylip 4. EMBL 14. PIR/CODATA 6. DNAStrider 15. MSF 7. Fitch 17. PAUP/NEXUS
此屬性控制 `-f` 參數的加入及其關聯的值。將此屬性設定為所需的參數值。
- property fixedbranches
使用輸入值的固定分支長度
此屬性控制 `-fixedbranches` 參數的加入及其關聯的值。將此屬性設定為所需的參數值。
- property gapext
間隙延伸機率。預設:dna 0.5 / prot 0.5
此屬性控制 -gapext 參數的加入及其關聯值。將此屬性設定為所需的參數值。
- property gaprate
間隙開啟率。預設:dna 0.025 prot 0.0025
此屬性控制 `-gaprate` 參數的加入及其關聯的值。將此屬性設定為所需的參數值。
- property kappa
轉變/橫越比率。預設:2
此屬性控制 `-kappa` 參數的加入及其關聯的值。將此屬性設定為所需的參數值。
- property longseq
節省成對比對中的空間
此屬性控制 -longseq 開關的加入,請將此屬性視為布林值。
- property m
使用者定義的比對模型檔案名稱。預設值:HKY2/WAG
此屬性控制 -m 參數及其相關值的加入。將此屬性設定為所需的參數值。
- property matinitsize
矩陣初始大小乘數
此屬性控制 -matinitsize 參數及其相關值的加入。將此屬性設定為所需的參數值。
- property matresize
矩陣調整大小乘數
此屬性控制 -matresize 參數及其相關值的加入。將此屬性設定為所需的參數值。
- property maxbranches
使用輸入值的最大分支長度
此屬性控制 -maxbranches 參數及其相關值的加入。將此屬性設定為所需的參數值。
- property mttranslate
使用 mt 表格翻譯為蛋白質
此屬性控制 -mttranslate 開關的加入,請將此屬性視為布林值。
- property nopost
不計算後驗支持度。預設值:計算
此屬性控制 -nopost 開關的加入,請將此屬性視為布林值。
- property notree
不輸出 dnd 樹狀檔案 (PRANK 版本早於 v.120626)
此屬性控制 -notree 開關的加入,請將此屬性視為布林值。
- property noxml
不輸出 XML 檔案 (PRANK 版本早於 v.120626)
此屬性控制 -noxml 開關的加入,請將此屬性視為布林值。
- property o
- 輸出檔案名稱前綴。預設值:'output'
將寫入:output.?.fas (取決於請求的格式)、output.?.xml 和 output.?.dnd
此屬性控制 `-o` 參數的加入及其關聯的值。將此屬性設定為所需的參數值。
- property once
僅執行一次。預設值:如果沒有給定引導樹,則執行兩次
此屬性控制 -once 開關的加入,請將此屬性視為布林值。
- property printnodes
輸出每個節點;主要用於除錯
此屬性控制 -printnodes 開關的加入,請將此屬性視為布林值。
- property pwdist
計算引導樹的預期成對距離。預設值:dna 0.25 / prot 0.5
此屬性控制 -pwdist 參數及其相關值的加入。將此屬性設定為所需的參數值。
- property pwgenomic
執行成對比對,不使用引導樹
此屬性控制 -pwgenomic 開關的加入,請將此屬性視為布林值。
- property pwgenomicdist
成對比對的距離。預設值:0.3
此屬性控制 -pwgenomicdist 參數及其相關值的加入。將此屬性設定為所需的參數值。
- property quiet
減少冗長訊息
此屬性控制 -quiet 參數的添加,請將此屬性視為布林值。
- property realbranches
停用分支長度截斷
此屬性控制 -realbranches 開關的加入,請將此屬性視為布林值。
- property rho
嘌呤/嘧啶比例。預設值:1
此屬性控制 -rho 參數及其相關值的加入。將此屬性設定為所需的參數值。
- property scalebranches
縮放分支長度。預設值:dna 1 / prot 2
此屬性控制 -scalebranches 參數及其相關值的加入。將此屬性設定為所需的參數值。
- property shortnames
在第一個空格處截斷名稱
此屬性控制 -shortnames 開關的加入,請將此屬性視為布林值。
- property showtree
輸出 dnd 樹狀檔案 (PRANK v.120626 及更新版本)
此屬性控制 -showtree 開關的加入,請將此屬性視為布林值。
- property showxml
輸出 XML 檔案 (PRANK v.120626 及更新版本)
此屬性控制 -showxml 開關的加入,請將此屬性視為布林值。
- property skipins
在後驗支持度中略過插入
此屬性控制 -skipins 開關的加入,請將此屬性視為布林值。
- property t
輸入引導樹檔案名稱
此屬性控制 `-t` 參數的加入及其關聯的值。將此屬性設定為所需的參數值。
- property termgap
正常懲罰終端間隙
此屬性控制 -termgap 開關的加入,請將此屬性視為布林值。
- property translate
翻譯為蛋白質
此屬性控制 -translate 開關的加入,請將此屬性視為布林值。
- property tree
以 Newick 字串輸入引導樹
此屬性控制 -tree 參數及其相關值的加入。將此屬性設定為所需的參數值。
- property twice
永遠執行兩次
此屬性控制 -twice 開關的加入,請將此屬性視為布林值。
- property uselogs
速度較慢,但應適用於更多序列
此屬性控制 -uselogs 開關的加入,請將此屬性視為布林值。
- property writeanc
輸出祖先序列
此屬性控制 -writeanc 開關的加入,請將此屬性視為布林值。
- class Bio.Align.Applications.MafftCommandline(cmd='mafft', **kwargs)
基底類別:
AbstractCommandline
多重比對程式 MAFFT 的命令列包裝器。
http://align.bmr.kyushu-u.ac.jp/mafft/software/
注意
上次檢查的版本:MAFFT v6.717b (2009/12/03)
參考文獻
Katoh, Toh (BMC Bioinformatics 9:212, 2008) Improved accuracy of multiple ncRNA alignment by incorporating structural information into a MAFFT-based framework (描述 RNA 結構比對方法)
Katoh, Toh (Briefings in Bioinformatics 9:286-298, 2008) Recent developments in the MAFFT multiple sequence alignment program (概述版本 6)
Katoh, Toh (Bioinformatics 23:372-374, 2007) Errata PartTree: an algorithm to build an approximate tree from a large number of unaligned sequences (描述 PartTree 演算法)
Katoh, Kuma, Toh, Miyata (Nucleic Acids Res. 33:511-518, 2005) MAFFT version 5: improvement in accuracy of multiple sequence alignment (描述 [祖先版本] 的 G-INS-i、L-INS-i 和 E-INS-i 策略)
Katoh, Misawa, Kuma, Miyata (Nucleic Acids Res. 30:3059-3066, 2002)
範例
>>> from Bio.Align.Applications import MafftCommandline >>> mafft_exe = "/opt/local/mafft" >>> in_file = "../Doc/examples/opuntia.fasta" >>> mafft_cline = MafftCommandline(mafft_exe, input=in_file) >>> print(mafft_cline) /opt/local/mafft ../Doc/examples/opuntia.fasta
如果 mafft 二進制檔案位於路徑上 (通常在 Unix 樣式的作業系統上是這種情況),則您不需要提供可執行檔位置
>>> from Bio.Align.Applications import MafftCommandline >>> in_file = "../Doc/examples/opuntia.fasta" >>> mafft_cline = MafftCommandline(input=in_file) >>> print(mafft_cline) mafft ../Doc/examples/opuntia.fasta
您通常會使用 mafft_cline() 或透過 Python subprocess 模組執行命令列,如 Biopython 教學中所述。
請注意,MAFFT 會將比對結果寫入標準輸出 (stdout),您可能需要將其儲存到檔案中,然後再進行解析,例如:
stdout, stderr = mafft_cline() with open("aligned.fasta", "w") as handle: handle.write(stdout) from Bio import AlignIO align = AlignIO.read("aligned.fasta", "fasta")
或者,若要使用 AlignIO 直接解析輸出,您可以使用 StringIO 將字串轉換為一個控制代碼。
stdout, stderr = mafft_cline() from io import StringIO from Bio import AlignIO align = AlignIO.read(StringIO(stdout), "fasta")
- __init__(cmd='mafft', **kwargs)
初始化類別。
- 屬性 LEXP
跳過比對的 gap 延伸懲罰值。預設值:0.00
此屬性控制 `–LEXP` 參數及其相關值的添加。請將此屬性設定為所需的參數值。
- 屬性 LOP
跳過比對的 gap 開啟懲罰值。預設值:-6.00
此屬性控制 `–LOP` 參數及其相關值的添加。請將此屬性設定為所需的參數值。
- 屬性 aamatrix
使用使用者定義的 AA 評分矩陣。預設值:BLOSUM62
此屬性控制 `–aamatrix` 參數及其相關值的添加。請將此屬性設定為所需的參數值。
- 屬性 adjustdirection
根據第一個序列調整方向。預設為關閉。
此屬性控制 `–adjustdirection` 開關的添加,請將此屬性視為布林值。
- 屬性 adjustdirectionaccurately
根據第一個序列調整方向,適用於高度發散的資料;速度非常慢。預設為關閉。
此屬性控制 `–adjustdirectionaccurately` 開關的添加,請將此屬性視為布林值。
- 屬性 amino
假設序列為胺基酸 (True/False)。預設值:自動
此屬性控制 `–amino` 開關的添加,請將此屬性視為布林值。
- 屬性 auto
自動選擇策略。預設為關閉。
此屬性控制 –auto 開關的添加,將此屬性視為布林值。
- 屬性 bl
使用 BLOSUM 數字矩陣。預設值:62
此屬性控制 `–bl` 參數及其相關值的添加。請將此屬性設定為所需的參數值。
- 屬性 clustalout
輸出格式:clustal (True) 或 fasta (False,預設)
此屬性控制 `–clustalout` 開關的添加,請將此屬性視為布林值。
- 屬性 dpparttree
使用基於 DP 距離的 PartTree 演算法。預設值:關閉
此屬性控制 `–dpparttree` 開關的添加,請將此屬性視為布林值。
- 屬性 ep
群組對群組比對的偏移值,其作用類似於 gap 延伸懲罰值。預設值:0.123
此屬性控制 `–ep` 參數及其相關值的添加。請將此屬性設定為所需的參數值。
- 屬性 fastapair
所有成對比對都使用 FASTA (Pearson 和 Lipman 1988) 計算。預設值:關閉
此屬性控制 `–fastapair` 開關的添加,請將此屬性視為布林值。
- 屬性 fastaparttree
使用基於 FASTA 距離的 PartTree 演算法。預設值:關閉
此屬性控制 `–fastaparttree` 開關的添加,請將此屬性視為布林值。
- 屬性 fft
在群組對群組比對中使用 FFT 近似。預設值:開啟
此屬性控制 `–fft` 開關的添加,請將此屬性視為布林值。
- 屬性 fmodel
將 AA/nuc 組成資訊納入評分矩陣 (True) 或不納入 (False,預設)
此屬性控制 `–fmodel` 開關的添加,請將此屬性視為布林值。
- 屬性 genafpair
所有成對比對都使用具有廣義仿射 gap 成本的局部演算法 (Altschul 1998) 計算。預設值:關閉
此屬性控制 `–genafpair` 開關的添加,請將此屬性視為布林值。
- 屬性 globalpair
所有成對比對都使用 Needleman-Wunsch 演算法計算。預設值:關閉
此屬性控制 `–globalpair` 開關的添加,請將此屬性視為布林值。
- 屬性 groupsize
不要使比對大於數字序列。預設值:輸入序列的數量
此屬性控制 `–groupsize` 開關的添加,請將此屬性視為布林值。
- 屬性 input
輸入檔案名稱
此屬性控制 `input` 參數及其相關值的添加。請將此屬性設定為所需的參數值。
- 屬性 input1
mafft-profile 命令的第二個輸入檔案名稱
此屬性控制 `input1` 參數及其相關值的添加。請將此屬性設定為所需的參數值。
- 屬性 inputorder
輸出順序:與輸入相同 (True,預設) 或基於比對 (False)
此屬性控制 `–inputorder` 開關的添加,請將此屬性視為布林值。
- 屬性 jtt
使用 JTT PAM 數字 (Jones et al. 1992) 矩陣。數字 > 0。預設值:BLOSUM62
此屬性控制 `–jtt` 參數及其相關值的添加。請將此屬性設定為所需的參數值。
- 屬性 lep
局部成對比對的偏移值。預設值:0.1
此屬性控制 `–lep` 參數及其相關值的添加。請將此屬性設定為所需的參數值。
- 屬性 lexp
局部成對比對的 gap 延伸懲罰值。預設值:-0.1
此屬性控制 `–lexp` 參數及其相關值的添加。請將此屬性設定為所需的參數值。
- 屬性 localpair
所有成對比對都使用 Smith-Waterman 演算法計算。預設值:關閉
此屬性控制 `–localpair` 開關的添加,請將此屬性視為布林值。
- 屬性 lop
局部成對比對的 gap 開啟懲罰值。預設值:0.123
此屬性控制 `–lop` 參數及其相關值的添加。請將此屬性設定為所需的參數值。
- 屬性 maxiterate
執行迭代精煉的次數。預設值:0
此屬性控制 `–maxiterate` 參數及其相關值的添加。請將此屬性設定為所需的參數值。
- 屬性 memsave
使用 Myers-Miller (1988) 演算法。預設值:當比對長度超過 10,000 (aa/nt) 時自動開啟。
此屬性控制 –memsave 開關的加入,請將此屬性視為布林值。
- property namelength
CLUSTAL 和 PHYLIP 輸出中的名稱長度。
MAFFT v6.847 (2011) 新增了 –namelength,用於 CLUSTAL 輸出的 –clustalout 選項。
MAFFT v7.024 (2013) 新增了對 PHYLIP 輸出的 –phylipout 選項的支援(預設值為 10)。
這會控制 –namelength 參數及其相關值的加入。請將此屬性設定為所需的參數值。
- property nofft
在群組對群組比對中不使用 FFT 近似。預設值:關閉
此屬性控制 –nofft 開關的加入,請將此屬性視為布林值。
- property noscore
在迭代精煉階段不檢查比對分數。預設值:關閉(檢查分數)
此屬性控制 –noscore 開關的加入,請將此屬性視為布林值。
- property nuc
假設序列為核苷酸 (True/False)。預設值:自動
此屬性控制 –nuc 開關的加入,請將此屬性視為布林值。
- property op
群組對群組比對時的間隙開啟懲罰。預設值:1.53
這會控制 –op 參數及其相關值的加入。請將此屬性設定為所需的參數值。
- property partsize
PartTree 演算法中的分割數量。預設值:50
這會控制 –partsize 參數及其相關值的加入。請將此屬性設定為所需的參數值。
- property parttree
使用 6mer 距離的快速樹狀結構建立方法。預設值:關閉
此屬性控制 –parttree 開關的加入,請將此屬性視為布林值。
- property phylipout
輸出格式:phylip (True),或 fasta (False,預設值)
此屬性控制 –phylipout 開關的加入,請將此屬性視為布林值。
- property quiet
不報告進度 (True) 或報告進度 (False,預設值)。
此屬性控制 –quiet 開關的加入,請將此屬性視為布林值。
- property reorder
輸出順序:比對後 (True) 或輸入順序 (False,預設值)
此屬性控制 –reorder 開關的加入,請將此屬性視為布林值。
- property retree
在漸進式階段中,引導樹狀結構的建構次數。使用 6mer 距離時有效。預設值:2
這會控制 –retree 參數及其相關值的加入。請將此屬性設定為所需的參數值。
- property seed
以 alignment_n (fasta 格式) 給定的種子比對會與輸入中的序列比對。
這會控制 –seed 參數及其相關值的加入。請將此屬性設定為所需的參數值。
- property sixmerpair
距離是根據共用 6mers 的數量計算。預設值:開啟
此屬性控制 –6merpair 開關的加入,請將此屬性視為布林值。
- property thread
要使用的執行緒數量。預設值:1
這會控制 –thread 參數及其相關值的加入。請將此屬性設定為所需的參數值。
- property tm
使用跨膜 PAM 數字 (Jones 等人,1994) 矩陣。數字>0。預設值:BLOSUM62
這會控制 –tm 參數及其相關值的加入。請將此屬性設定為所需的參數值。
- property treeout
將引導樹狀結構輸出到 input.tree 檔案 (True) 或不輸出 (False,預設值)
此屬性控制 –treeout 開關的加入,請將此屬性視為布林值。
- property weighti
從成對比對計算的一致性項目的加權因子。預設值:2.7
這會控制 –weighti 參數及其相關值的加入。請將此屬性設定為所需的參數值。
- class Bio.Align.Applications.DialignCommandline(cmd='dialign2-2', **kwargs)
基底類別:
AbstractCommandline
多重比對程式 DIALIGN2-2 的命令列包裝函式。
http://bibiserv.techfak.uni-bielefeld.de/dialign/welcome.html
注意
上次針對版本:2.2 檢查
參考文獻
B. Morgenstern (2004)。DIALIGN:BiBiServ 上的多重 DNA 和蛋白質序列比對。核酸研究 32, W33-W36。
範例
要使用名稱為 aligned.* 的輸出檔案(包括 FASTA 輸出檔案 (aligned.fa))比對 FASTA 檔案 (unaligned.fasta),請使用
>>> from Bio.Align.Applications import DialignCommandline >>> dialign_cline = DialignCommandline(input="unaligned.fasta", ... fn="aligned", fa=True) >>> print(dialign_cline) dialign2-2 -fa -fn aligned unaligned.fasta
您通常會使用 dialign_cline() 或透過 Python subprocess 模組執行命令列,如 Biopython 教學課程中所述。
- __init__(cmd='dialign2-2', **kwargs)
初始化類別。
- property afc
建立額外的輸出檔案 ‘*.afc’,其中包含所有考慮用於比對的片段的資料 警告:此檔案可能非常龐大!
此屬性控制 -afc 開關的加入,請將此屬性視為布林值。
- property afc_v
與 ‘-afc’ 類似,但更詳細:會明確列印片段。警告:此檔案可能更龐大!
此屬性控制 -afc_v 開關的加入,請將此屬性視為布林值。
- property anc
錨定比對。需要包含錨點的 <seq_file>.anc 檔案。
此屬性控制 -anc 開關的加入,請將此屬性視為布林值。
- property cs
如果轉換片段,不僅會查看「華生鏈」,還會查看「克里克鏈」。
此屬性控制 -cs 開關的加入,請將此屬性視為布林值。
- property cw
以 CLUSTAL W 格式建立額外的輸出檔案。
此屬性控制 -cw 開關的加入,請將此屬性視為布林值。
- property ds
「DNA 比對加速」- 只有以至少兩個比對開始的非轉換核酸片段才會被考慮。加速 DNA 比對,但會犧牲靈敏度。
此屬性控制 -ds 開關的加入,請將此屬性視為布林值。
- property fa
以 FASTA 格式建立額外的輸出檔案。
此屬性控制 -fa 開關的加入,請將此屬性視為布林值。
- property ff
建立檔案 *.frg,其中包含關於各最佳成對比對一部分的所有片段的資訊,以及關於多重比對中一致性的資訊
此屬性控制 -ff 開關的加入,請將此屬性視為布林值。
- property fn
輸出檔案命名為 <out_file>.<extension>。
這會控制 -fn 參數及其相關值的加入。請將此屬性設定為所需的參數值。
- property fop
建立檔案 *.fop,其中包含屬於各成對比對一部分的所有片段的座標。
此屬性控制 -fop 開關的加入,請將此屬性視為布林值。
- property fsm
建立檔案 *.fsm,其中包含屬於最終比對一部分的所有片段的座標
此屬性控制 -fsm 開關的加入,請將此屬性視為布林值。
- property input
輸入檔案名稱。必須為 FASTA 格式
此屬性控制 `input` 參數及其相關值的添加。請將此屬性設定為所需的參數值。
- 屬性 iw
關閉重疊權重 (預設情況下,如果對齊的序列最多為 35 個,則使用重疊權重)。此選項可加快對齊速度,但可能會降低對齊品質。
此屬性控制 -iw 開關的加入,請將此屬性視為布林值。
- 屬性 lgs
「長基因組序列」- 結合以下選項:-ma、-thr 2、-lmax 30、-smin 8、-nta、-ff、-fop、-ff、-cs、-ds、-pst
此屬性控制 -lgs 開關的加入,請將此屬性視為布林值。
- 屬性 lgs_t
與「-lgs」類似,但所有片段對都在胜肽水平上進行評估(而不是像「-lgs」選項那樣的「混合對齊」)。因此比 -lgs 快,但對於非編碼區域不太敏感。
此屬性控制 -lgs_t 開關的加入,請將此屬性視為布林值。
- 屬性 lmax
最大片段長度 = x (預設值:x = 40 或 x = 120 表示「翻譯」片段)。較短的 x 會加快程式速度,但可能會影響對齊品質。
這控制了 -lmax 參數及其關聯值的加入。將此屬性設定為所需的參數值。
- 屬性 lo
(長輸出) 額外檔案 *.log,其中包含有關選擇用於成對對齊的片段以及多重對齊程序中一致性的資訊。
此屬性控制 -lo 開關的加入,請將此屬性視為布林值。
- 屬性 ma
「混合對齊」,如果對齊核酸序列,則由 P 片段和 N 片段組成。
此屬性控制 -ma 開關的加入,請將此屬性視為布林值。
- 屬性 mask
不屬於所選片段的殘基在輸出對齊中以「*」字元取代(而不是以小寫字元列印)
此屬性控制 -mask 開關的加入,請將此屬性視為布林值。
- 屬性 mat
建立檔案 *mat,其中包含從已選擇用於對齊的片段衍生的取代計數。
此屬性控制 -mat 開關的加入,請將此屬性視為布林值。
- 屬性 mat_thr
與「-mat」類似,但僅考慮權重分數 > t 的片段
此屬性控制 -mat_thr 開關的加入,請將此屬性視為布林值。
- 屬性 max_link
用於建構序列樹的「最大連結」叢集(而不是 UPGMA)。
此屬性控制 -max_link 開關的加入,請將此屬性視為布林值。
- 屬性 min_link
使用「最小連結」叢集。
此屬性控制 -min_link 開關的加入,請將此屬性視為布林值。
- 屬性 mot
「動機」選項。
這控制了 -mot 參數及其關聯值的加入。將此屬性設定為所需的參數值。
- 屬性 msf
以 MSF 格式輸出單獨的檔案。
此屬性控制是否加入 -msf 開關,請將此屬性視為布林值。
- 屬性 n
輸入序列為核酸序列。不翻譯片段。
此屬性控制 -n 開關的加入,請將此屬性視為布林值。
- 屬性 nt
輸入序列為核酸序列,並且「核酸片段」被翻譯成「胜肽片段」。
此屬性控制 -nt 開關的加入,請將此屬性視為布林值。
- 屬性 nta
「無文字對齊」- 抑制文字對齊。如果對其他輸出檔案感興趣(例如,使用 -ff、-fop、-fsm 或 -lo 建立的片段檔案),此選項才有意義。
此屬性控制 -nta 開關的加入,請將此屬性視為布林值。
- 屬性 o
快速版本,產生的對齊可能會略有不同。
此屬性控制 -o 開關的加入,請將此屬性視為布林值。
- 屬性 ow
強制執行重疊權重 (預設情況下,僅在對齊最多 35 個序列時才使用重疊權重,因為計算重疊權重很耗時)。
此屬性控制 -ow 開關的加入,請將此屬性視為布林值。
- 屬性 pst
「列印狀態」。建立並更新檔案 *.sta,其中包含有關程式執行目前狀態的資訊。如果對齊大型資料集,建議使用此選項,因為它允許使用者估計剩餘執行時間。
此屬性控制 -pst 開關的加入,請將此屬性視為布林值。
- 屬性 smin
片段中第一個殘基對(或密碼子對)的最小相似值。以犧牲靈敏度為代價,加快蛋白質對齊或翻譯 DNA 片段的對齊速度。
此屬性控制 -smin 開關的加入,請將此屬性視為布林值。
- 屬性 stars
指示序列之間局部相似程度的最大「*」字元數。預設情況下,不使用星號,而是使用 0 到 9 之間的數字。
這控制了 -stars 參數及其關聯值的加入。將此屬性設定為所需的參數值。
- 屬性 stdo
結果寫入標準輸出。
此屬性控制 -stdo 開關的加入,請將此屬性視為布林值。
- 屬性 ta
列印標準文字對齊 (覆蓋特殊選項中對文字對齊的抑制,例如 -lgs)
此屬性控制 -ta 開關的加入,請將此屬性視為布林值。
- 屬性 thr
閾值 T = x。
這控制了 -thr 參數及其關聯值的加入。將此屬性設定為所需的參數值。
- 屬性 xfr
「排除片段」- 可以指定不考慮用於成對對齊的片段清單
此屬性控制 -xfr 開關的加入,請將此屬性視為布林值。
- 類別 Bio.Align.Applications.ProbconsCommandline(cmd='probcons', **kwargs)
基底類別:
AbstractCommandline
多重對齊程式 PROBCONS 的命令列包裝器。
注意
上次檢查版本:1.12
參考文獻
Do, C.B., Mahabhashyam, M.S.P., Brudno, M., and Batzoglou, S. 2005. PROBCONS: Probabilistic Consistency-based Multiple Sequence Alignment. Genome Research 15: 330-340.
範例
若要使用 ClustalW 格式輸出並使用其他預設設定對齊 FASTA 檔案 (unaligned.fasta),請使用
>>> from Bio.Align.Applications import ProbconsCommandline >>> probcons_cline = ProbconsCommandline(input="unaligned.fasta", ... clustalw=True) >>> print(probcons_cline) probcons -clustalw unaligned.fasta
您通常會使用 probcons_cline() 或透過 Python 子程序模組執行命令列,如 Biopython 教學中所述。
請注意,PROBCONS 會將對齊寫入標準輸出,您可能需要將其儲存到檔案,然後進行剖析,例如
stdout, stderr = probcons_cline() with open("aligned.aln", "w") as handle: handle.write(stdout) from Bio import AlignIO align = AlignIO.read("aligned.fasta", "clustalw")
或者,若要使用 AlignIO 直接解析輸出,您可以使用 StringIO 將字串轉換為一個控制代碼。
stdout, stderr = probcons_cline() from io import StringIO from Bio import AlignIO align = AlignIO.read(StringIO(stdout), "clustalw")
- __init__(cmd='probcons', **kwargs)
初始化類別。
- 屬性 a
以對齊順序而非輸入順序列印序列 (預設:關閉)
此屬性控制 -a 開關的加入,請將此屬性視為布林值。
- 屬性 annot
將多重對齊的註釋寫入 FILENAME
這控制了 -annot 參數及其關聯值的加入。將此屬性設定為所需的參數值。
- 屬性 clustalw
使用 CLUSTALW 輸出格式而非 MFA
此屬性控制 -clustalw 開關的加入,請將此屬性視為布林值。
- 屬性 consistency
使用 0 <= REPS <= 5 (預設:2) 次一致性轉換。
這控制了 -c 參數及其相關值的添加。將此屬性設定為所需的參數值。
- 屬性 emissions
也重新估計排放機率 (預設:關閉)
此屬性控制 -e 開關的添加,將此屬性視為布林值。
- 屬性 input
輸入檔案名稱。必須為多重 FASTA 比對 (MFA) 格式。
此屬性控制 `input` 參數及其相關值的添加。請將此屬性設定為所需的參數值。
- 屬性 ir
使用 0 <= REPS <= 1000 (預設:100) 次迭代改進。
這控制了 -ir 參數及其相關值的添加。將此屬性設定為所需的參數值。
- 屬性 pairs
產生所有配對的成對比對。
此屬性控制 -pairs 開關的添加,將此屬性視為布林值。
- 屬性 paramfile
從 FILENAME 讀取參數。
這控制了 -p 參數及其相關值的添加。將此屬性設定為所需的參數值。
- 屬性 pre
使用 0 <= REPS <= 20 (預設:0) 輪的預訓練。
這控制了 -pre 參數及其相關值的添加。將此屬性設定為所需的參數值。
- 屬性 train
計算 EM 轉移機率,儲存於 FILENAME (預設:不訓練)。
此屬性控制 `-t` 參數的加入及其關聯的值。將此屬性設定為所需的參數值。
- 屬性 verbose
在比對時回報進度 (預設:關閉)。
此屬性控制 -verbose 參數的添加,請將此屬性視為布林值。
- 屬性 viterbi
使用 Viterbi 演算法產生所有配對 (自動啟用 -pairs)。
此屬性控制 -viterbi 開關的添加,將此屬性視為布林值。
- 類別 Bio.Align.Applications.TCoffeeCommandline(cmd='t_coffee', **kwargs)
基底類別:
AbstractCommandline
TCoffee 比對程式的命令列物件。
http://www.tcoffee.org/Projects_home_page/t_coffee_home_page.html
T-Coffee 命令列工具有許多開關和選項。此封裝實作了非常有限的選項 - 如果您想協助改進,請聯繫我們。
注意
上次檢查版本:Version_6.92
參考文獻
T-Coffee:一種用於多序列比對的新方法。Notredame, Higgins, Heringa, JMB,302(205-217) 2000
範例
若要使用 ClustalW 格式輸出 (檔案 aligned.aln) 比對 FASTA 檔案 (unaligned.fasta),並使用其他預設設定,請使用
>>> from Bio.Align.Applications import TCoffeeCommandline >>> tcoffee_cline = TCoffeeCommandline(infile="unaligned.fasta", ... output="clustalw", ... outfile="aligned.aln") >>> print(tcoffee_cline) t_coffee -output clustalw -infile unaligned.fasta -outfile aligned.aln
您通常會使用 tcoffee_cline() 或透過 Python subprocess 模組執行命令列,如 Biopython 教學中所述。
- SEQ_TYPES = ['dna', 'protein', 'dna_protein']
- __init__(cmd='t_coffee', **kwargs)
初始化類別。
- 屬性 convert
指定您想要執行檔案轉換。
此屬性控制 -convert 開關的加入,將此屬性視為布林值。
- 屬性 gapext
表示延伸缺口的懲罰 (負整數)。
此屬性控制 -gapext 參數的加入及其關聯值。將此屬性設定為所需的參數值。
- 屬性 gapopen
表示開啟缺口的懲罰 (負整數)。
此屬性控制是否加入 -gapopen 參數及其相關聯的值。請將此屬性設定為所需的參數值。
- 屬性 infile
指定輸入檔案。
此屬性控制 -infile 參數的加入及其關聯值。將此屬性設定為所需的參數值。
- 屬性 matrix
指定要使用的取代矩陣的檔案名稱。預設值:blosum62mt
此屬性控制是否加入 -matrix 參數及其相關聯的值。請將此屬性設定為所需的參數值。
- 屬性 mode
指定特殊模式:genome、quickaln、dali、3dcoffee
這控制了 -mode 參數及其相關值的添加。將此屬性設定為所需的參數值。
- 屬性 outfile
指定輸出檔案。預設值:<您的序列>.aln
此屬性控制 -outfile 參數及其關聯值的加入。請將此屬性設定為所需的參數值。
- 屬性 outorder
指定輸出序列的順序。可以是 ‘input’、‘aligned’ 或具有序列順序的 Fasta 檔案的 <filename>
此屬性控制 -outorder 參數及其關聯值的加入。請將此屬性設定為所需的參數值。
- 屬性 output
指定輸出類型。
下列其中一個 (或多個以逗號分隔):‘clustalw_aln’、‘clustalw’、‘gcg’、‘msf_aln’、‘pir_aln’、‘fasta_aln’、‘phylip’、‘pir_seq’、‘fasta_seq’
此屬性控制 -output 參數及其關聯值的加入。請將此屬性設定為所需的參數值。
- 屬性 quiet
關閉記錄輸出。
此屬性控制 -quiet 參數的添加,請將此屬性視為布林值。
- 屬性 type
指定要比對的序列類型。
此屬性控制 -type 參數及其相關值的添加。將此屬性設定為所需參數值。
- 類別 Bio.Align.Applications.MSAProbsCommandline(cmd='msaprobs', **kwargs)
基底類別:
AbstractCommandline
MSAProbs 的命令列封裝。
http://msaprobs.sourceforge.net
注意
上次檢查版本:0.9.7
參考文獻
Yongchao Liu, Bertil Schmidt, Douglas L. Maskell: “MSAProbs: multiple sequence alignment based on pair hidden Markov models and partition function posterior probabilities”. Bioinformatics, 2010, 26(16): 1958 -1964
範例
>>> from Bio.Align.Applications import MSAProbsCommandline >>> in_file = "unaligned.fasta" >>> out_file = "aligned.cla" >>> cline = MSAProbsCommandline(infile=in_file, outfile=out_file, clustalw=True) >>> print(cline) msaprobs -o aligned.cla -clustalw unaligned.fasta
您通常會使用 cline() 或透過 Python subprocess 模組執行命令列,如 Biopython 教學中所述。
- __init__(cmd='msaprobs', **kwargs)
初始化類別。
- 屬性 alignment_order
以比對順序而非輸入順序印出序列 (預設:關閉)。
此屬性控制 -a 開關的加入,請將此屬性視為布林值。
- 屬性 annot
將多重比對的註解寫入 FILENAME。
這控制了 -annot 參數及其關聯值的加入。將此屬性設定為所需的參數值。
- 屬性 clustalw
使用 CLUSTALW 輸出格式而非 FASTA 格式。
此屬性控制 -clustalw 開關的加入,請將此屬性視為布林值。
- 屬性 consistency
使用 0 <= REPS <= 5 (預設:2) 次一致性轉換。
這控制了 -c 參數及其相關值的添加。將此屬性設定為所需的參數值。
- 屬性 infile
多序列輸入檔案
這控制了 infile 參數及其相關值的添加。將此屬性設定為所需的參數值。
- 屬性 iterative_refinement
使用 0 <= REPS <= 1000 (預設:10) 次迭代改進。
這控制了 -ir 參數及其相關值的添加。將此屬性設定為所需的參數值。
- 屬性 numthreads
指定使用的執行緒數,否則自動偵測。
這控制了 -num_threads 參數及其相關值的添加。將此屬性設定為所需的參數值。
- 屬性 outfile
指定輸出檔案名稱 (預設為 STDOUT)。
此屬性控制 `-o` 參數的加入及其關聯的值。將此屬性設定為所需的參數值。
- 屬性 verbose
在比對時回報進度 (預設:關閉)。
此屬性控制 `-v` 開關的加入,將此屬性視為布林值。
- 屬性 version
印出 MSAPROBS 的版本。
這控制了 -version 參數及其相關值的添加。將此屬性設定為所需的參數值。