Bio.Align.Applications 套件

模組內容

比對命令列工具包裝器 (已過時)。

我們已決定在未來移除此模組,並建議直接使用 subprocess 模組建立您的命令並調用它。

class Bio.Align.Applications.MuscleCommandline(cmd='muscle', **kwargs)

基底類別: AbstractCommandline

多序列比對程式 MUSCLE 的命令列包裝器。

http://www.drive5.com/muscle/

注意

最後檢查的版本:3.7,簡短測試過 3.8

參考文獻

Edgar, Robert C. (2004), MUSCLE: multiple sequence alignment with high accuracy and high throughput, Nucleic Acids Research 32(5), 1792-97.

Edgar, R.C. (2004) MUSCLE: a multiple sequence alignment method with reduced time and space complexity. BMC Bioinformatics 5(1): 113.

範例

>>> from Bio.Align.Applications import MuscleCommandline
>>> muscle_exe = r"C:\Program Files\Alignments\muscle3.8.31_i86win32.exe"
>>> in_file = r"C:\My Documents\unaligned.fasta"
>>> out_file = r"C:\My Documents\aligned.fasta"
>>> muscle_cline = MuscleCommandline(muscle_exe, input=in_file, out=out_file)
>>> print(muscle_cline)
"C:\Program Files\Alignments\muscle3.8.31_i86win32.exe" -in "C:\My Documents\unaligned.fasta" -out "C:\My Documents\aligned.fasta"

您通常會使用 muscle_cline() 或透過 Python subprocess 模組執行命令列,如 Biopython 教學中所述。

__init__(cmd='muscle', **kwargs)

初始化類別。

property anchors

在樹狀結構相關的精鍊迭代中使用錨點最佳化

此屬性控制 -anchors 開關的加入,請將此屬性視為布林值。

property anchorspacing

錨點列之間的最小間距

這控制 -anchorspacing 參數及其相關值的加入。將此屬性設定為所需的參數值。

property brenner

使用 Steve Brenner 的根比對方法

此屬性控制 -brenner 開關的加入,請將此屬性視為布林值。

property center

中心參數 - 應為負數

這控制 -center 參數及其相關值的加入。將此屬性設定為所需的參數值。

property cluster

執行輸入序列的快速分群,使用 -tree1 儲存樹狀結構

此屬性控制 -cluster 開關的加入,請將此屬性視為布林值。

property cluster1

迭代 1 中使用的分群方法

這控制 -cluster1 參數及其相關值的加入。將此屬性設定為所需的參數值。

property cluster2

迭代 2 中使用的分群方法

這控制 -cluster2 參數及其相關值的加入。將此屬性設定為所需的參數值。

property clw

以 CLUSTALW 格式 (含 MUSCLE 標頭) 寫入輸出

此屬性控制 -clw 開關的加入,請將此屬性視為布林值。

property clwout

將 CLUSTALW 輸出 (含 MUSCLE 標頭) 寫入指定檔案名稱

這控制 -clwout 參數及其相關值的加入。將此屬性設定為所需的參數值。

property clwstrict

以 CLUSTALW 格式和版本 1.81 標頭寫入輸出

此屬性控制 -clwstrict 開關的加入,請將此屬性視為布林值。

property clwstrictout

將 CLUSTALW 輸出 (含版本 1.81 標頭) 寫入指定檔案名稱

這控制 -clwstrictout 參數及其相關值的加入。將此屬性設定為所需的參數值。

property core

不捕捉例外情況

此屬性控制 -core 開關的加入,請將此屬性視為布林值。

property diagbreak

允許合併成一個對角線的兩個對角線之間的最大距離

這控制 -diagbreak 參數及其相關值的加入。將此屬性設定為所需的參數值。

property diaglength

對角線的最小長度

這控制 -diaglength 參數及其相關值的加入。將此屬性設定為所需的參數值。

property diagmargin

在對角線末端捨棄這麼多位置

這控制 -diagmargin 參數及其相關值的加入。將此屬性設定為所需的參數值。

property diags

尋找對角線 (對於相似的序列更快)

此屬性控制 -diags 開關的加入,請將此屬性視為布林值。

property dimer

使用更快的 (稍微不準確) 二聚體近似值作為 SP 分數

此屬性控制 -dimer 開關的加入,請將此屬性視為布林值。

property distance1

迭代 1 的距離測量

這控制 -distance1 參數及其相關值的加入。將此屬性設定為所需的參數值。

property distance2

迭代 2 的距離測量

這控制 -distance2 參數及其相關值的加入。將此屬性設定為所需的參數值。

property fasta

以 FASTA 格式寫入輸出

此屬性控制是否加入 -fasta 開關,請將此屬性視為布林值。

property fastaout

將 FASTA 格式輸出寫入指定的檔案名稱

此屬性控制是否加入 -fastaout 參數及其相關聯的值。請將此屬性設定為所需的參數值。

property gapextend

間隙延伸懲罰

此屬性控制是否加入 -gapextend 參數及其相關聯的值。請將此屬性設定為所需的參數值。

property gapopen

間隙開啟分數 - 負數

此屬性控制是否加入 -gapopen 參數及其相關聯的值。請將此屬性設定為所需的參數值。

property group

將輸出中相似的序列分組

此屬性控制是否加入 -group 開關,請將此屬性視為布林值。

property html

以 HTML 格式寫入輸出

此屬性控制是否加入 -html 開關,請將此屬性視為布林值。

property htmlout

將 HTML 格式輸出寫入指定的檔案名稱

此屬性控制是否加入 -htmlout 參數及其相關聯的值。請將此屬性設定為所需的參數值。

property hydro

疏水區域的視窗大小

此屬性控制是否加入 -hydro 參數及其相關聯的值。請將此屬性設定為所需的參數值。

property hydrofactor

疏水區域中間隙懲罰的乘數

此屬性控制是否加入 -hydrofactor 參數及其相關聯的值。請將此屬性設定為所需的參數值。

property in1

輪廓比對的第一個輸入檔案名稱

此屬性控制是否加入 -in1 參數及其相關聯的值。請將此屬性設定為所需的參數值。

property in2

輪廓比對的第二個輸入檔案名稱

此屬性控制是否加入 -in2 參數及其相關聯的值。請將此屬性設定為所需的參數值。

property input

輸入檔案名稱

此屬性控制是否加入 -in 參數及其相關聯的值。請將此屬性設定為所需的參數值。

property le

使用對數期望值輪廓分數 (VTML240)

此屬性控制是否加入 -le 開關,請將此屬性視為布林值。

property log

日誌檔案名稱

此屬性控制是否加入 -log 參數及其相關聯的值。請將此屬性設定為所需的參數值。

property loga

日誌檔案名稱 (附加到現有檔案)

此屬性控制是否加入 -loga 參數及其相關聯的值。請將此屬性設定為所需的參數值。

property matrix

NCBI 或 WU-BLAST 格式蛋白質取代矩陣的路徑 - 也會設定 -gapopen、-gapextend 和 -center

此屬性控制是否加入 -matrix 參數及其相關聯的值。請將此屬性設定為所需的參數值。

property maxdiagbreak

在 v3.8 中已棄用,請改用 -diagbreak。

此屬性控制是否加入 -maxdiagbreak 參數及其相關聯的值。請將此屬性設定為所需的參數值。

property maxhours

最長執行時間,以小時為單位

此屬性控制是否加入 -maxhours 參數及其相關聯的值。請將此屬性設定為所需的參數值。

property maxiters

最大迭代次數

此屬性控制是否加入 -maxiters 參數及其相關聯的值。請將此屬性設定為所需的參數值。

property maxtrees

在迭代 2 中要建構的最大樹狀結構數

此屬性控制是否加入 -maxtrees 參數及其相關聯的值。請將此屬性設定為所需的參數值。

property minbestcolscore

一個欄位要成為錨點所必須擁有的最低分數

此屬性控制是否加入 -minbestcolscore 參數及其相關聯的值。請將此屬性設定為所需的參數值。

property minsmoothscore

一個欄位要成為錨點所必須擁有的最低平滑分數

此屬性控制是否加入 -minsmoothscore 參數及其相關聯的值。請將此屬性設定為所需的參數值。

property msf

以 MSF 格式寫入輸出

此屬性控制是否加入 -msf 開關,請將此屬性視為布林值。

property msfout

將 MSF 格式輸出寫入指定的檔案名稱

此屬性控制是否加入 -msfout 參數及其相關聯的值。請將此屬性設定為所需的參數值。

property noanchors

在樹狀結構相關的精煉迭代中不使用錨點最佳化

此屬性控制是否加入 -noanchors 開關,請將此屬性視為布林值。

property nocore

捕捉例外狀況

此屬性控制是否加入 -nocore 開關,請將此屬性視為布林值。

property objscore

樹狀結構相關精煉所使用的目標分數

此屬性控制是否加入 -objscore 參數及其相關聯的值。請將此屬性設定為所需的參數值。

property out

輸出檔案名稱

此屬性控制是否加入 -out 參數及其相關聯的值。請將此屬性設定為所需的參數值。

property phyi

以 PHYLIP 交錯格式寫入輸出

此屬性控制是否加入 -phyi 開關,請將此屬性視為布林值。

property phyiout

將 PHYLIP 交錯格式輸出寫入指定的檔案名稱

此屬性控制是否加入 -phyiout 參數及其相關聯的值。請將此屬性設定為所需的參數值。

property phys

以 PHYLIP 循序格式寫入輸出

此屬性控制是否加入 -phys 開關,請將此屬性視為布林值。

property physout

將 PHYLIP 循序格式寫入指定的檔案名稱

此屬性控制是否加入 -physout 參數及其相關聯的值。請將此屬性設定為所需的參數值。

property profile

執行輪廓比對

此屬性控制是否加入 -profile 開關,請將此屬性視為布林值。

屬性 quiet

不顯示進度訊息

此屬性控制 -quiet 參數的添加,請將此屬性視為布林值。

屬性 refine

僅執行依賴於樹狀結構的精煉

此屬性控制 -refine 參數的添加,請將此屬性視為布林值。

屬性 refinew

僅使用滑動窗口方法執行依賴於樹狀結構的精煉

此屬性控制 -refinew 參數的添加,請將此屬性視為布林值。

屬性 refinewindow

-refinew 的窗口長度

此屬性控制 -refinewindow 參數及其相關值的添加。請將此屬性設定為所需參數值。

屬性 root1

在第一次迭代中用於樹狀結構定根的方法

此屬性控制 -root1 參數及其相關值的添加。請將此屬性設定為所需參數值。

屬性 root2

在第二次迭代中用於樹狀結構定根的方法

此屬性控制 -root2 參數及其相關值的添加。請將此屬性設定為所需參數值。

屬性 scorefile

分數檔名,包含對齊中每列的平均 BLOSUM62 分數的單行

此屬性控制 -scorefile 參數及其相關值的添加。請將此屬性設定為所需參數值。

屬性 seqtype

序列類型

此屬性控制 -seqtype 參數及其相關值的添加。請將此屬性設定為所需參數值。

屬性 smoothscoreceil

用於平滑化的列分數最大值

此屬性控制 -smoothscoreceil 參數及其相關值的添加。請將此屬性設定為所需參數值。

屬性 smoothwindow

用於錨定列平滑化的窗口

此屬性控制 -smoothwindow 參數及其相關值的添加。請將此屬性設定為所需參數值。

屬性 sp

使用成對總和蛋白質輪廓分數 (PAM200)

此屬性控制 -sp 參數的添加,請將此屬性視為布林值。

屬性 spn

使用成對總和蛋白質核苷酸輪廓分數

此屬性控制 -spn 參數的添加,請將此屬性視為布林值。

屬性 spscore

計算多重對齊的 SP 目標分數

此屬性控制 -spscore 參數及其相關值的添加。請將此屬性設定為所需參數值。

屬性 stable

不要在輸出中對相似序列進行分組(v3.8 不支援)

此屬性控制 -stable 參數的添加,請將此屬性視為布林值。

屬性 sueff

UPGMB 分群中使用的常數

此屬性控制 -sueff 參數及其相關值的添加。請將此屬性設定為所需參數值。

屬性 sv

使用成對總和輪廓分數 (VTML240)

此屬性控制 -sv 參數的添加,請將此屬性視為布林值。

屬性 tree1

儲存第一次迭代的 Newick 樹

此屬性控制 -tree1 參數及其相關值的添加。請將此屬性設定為所需參數值。

屬性 tree2

儲存第二次迭代的 Newick 樹

此屬性控制 -tree2 參數及其相關值的添加。請將此屬性設定為所需參數值。

屬性 usetree

使用給定的 Newick 樹作為指導樹

此屬性控制 -usetree 參數及其相關值的添加。請將此屬性設定為所需參數值。

屬性 verbose

寫入參數設定和進度

此屬性控制 -verbose 參數的添加,請將此屬性視為布林值。

屬性 version

將版本字串寫入 stdout 並退出

此屬性控制 -version 參數的添加,請將此屬性視為布林值。

屬性 weight1

在第一次迭代中使用的加權方案

此屬性控制 -weight1 參數及其相關值的添加。請將此屬性設定為所需參數值。

屬性 weight2

在第二次迭代中使用的加權方案

此屬性控制 -weight2 參數及其相關值的添加。請將此屬性設定為所需參數值。

類別 Bio.Align.Applications.ClustalwCommandline(cmd='clustalw', **kwargs)

基底類別: AbstractCommandline

clustalw(版本一或二)的命令列封裝器。

http://www.clustal.org/

注意

最後檢查版本:1.83 和 2.1

參考文獻

Larkin MA, Blackshields G, Brown NP, Chenna R, McGettigan PA, McWilliam H, Valentin F, Wallace IM, Wilm A, Lopez R, Thompson JD, Gibson TJ, Higgins DG. (2007). Clustal W and Clustal X version 2.0. Bioinformatics, 23, 2947-2948.

範例

>>> from Bio.Align.Applications import ClustalwCommandline
>>> in_file = "unaligned.fasta"
>>> clustalw_cline = ClustalwCommandline("clustalw2", infile=in_file)
>>> print(clustalw_cline)
clustalw2 -infile=unaligned.fasta

您通常會使用 clustalw_cline() 或透過 Python subprocess 模組來執行命令列,如 Biopython 教學中所述。

__init__(cmd='clustalw', **kwargs)

初始化類別。

屬性 align

進行完整的多重對齊。

此屬性控制 -align 參數的添加,請將此屬性視為布林值。

屬性 bootlabels

樹狀顯示中引導程序值的節點或分支位置

此屬性控制 -bootlabels 參數及其相關值的添加。請將此屬性設定為所需參數值。

屬性 bootstrap

引導 NJ 樹 (n = 引導程序數;預設值 = 1000)。

此屬性控制 -bootstrap 參數及其相關值的添加。請將此屬性設定為所需參數值。

屬性 case

LOWER 或 UPPER(僅適用於 GDE 輸出)

此屬性控制 -case 參數及其相關值的添加。請將此屬性設定為所需參數值。

屬性 check

概述命令列參數。

此屬性控制 -check 開關的加入,將此屬性視為布林值。

屬性 clustering

NJ 或 UPGMA

此屬性控制 -clustering 參數的加入及其關聯值。將此屬性設定為所需的參數值。

屬性 convert

以不同的檔案格式輸出輸入序列。

此屬性控制 -convert 開關的加入,將此屬性視為布林值。

屬性 dnamatrix

DNA權重矩陣=IUB、CLUSTALW 或檔案名稱

此屬性控制 -dnamatrix 參數的加入及其關聯值。將此屬性設定為所需的參數值。

屬性 endgaps

無末端間隙分離懲罰。

此屬性控制 -endgaps 開關的加入,將此屬性視為布林值。

屬性 fullhelp

輸出完整的說明內容。

此屬性控制 -fullhelp 開關的加入,將此屬性視為布林值。

屬性 gapdist

間隙分離懲罰範圍

此屬性控制 -gapdist 參數的加入及其關聯值。將此屬性設定為所需的參數值。

屬性 gapext

間隙延伸懲罰

此屬性控制 -gapext 參數的加入及其關聯值。將此屬性設定為所需的參數值。

屬性 gapopen

間隙開啟懲罰

此屬性控制是否加入 -gapopen 參數及其相關聯的值。請將此屬性設定為所需的參數值。

屬性 helixendin

螺旋內被視為末端的殘基數量

此屬性控制 -helixendin 參數的加入及其關聯值。將此屬性設定為所需的參數值。

屬性 helixendout

螺旋外被視為末端的殘基數量

此屬性控制 -helixendout 參數的加入及其關聯值。將此屬性設定為所需的參數值。

屬性 helixgap

螺旋核心殘基的間隙懲罰

此屬性控制 -helixgap 參數的加入及其關聯值。將此屬性設定為所需的參數值。

屬性 help

概述命令列參數。

此屬性控制 -help 開關的加入,將此屬性視為布林值。

屬性 hgapresidues

親水性殘基列表。

此屬性控制 -hgapresidues 開關的加入,將此屬性視為布林值。

屬性 infile

輸入序列。

此屬性控制 -infile 參數的加入及其關聯值。將此屬性設定為所需的參數值。

屬性 iteration

NONE 或 TREE 或 ALIGNMENT

此屬性控制 -iteration 參數的加入及其關聯值。將此屬性設定為所需的參數值。

屬性 kimura

使用 Kimura 的校正。

此屬性控制 -kimura 開關的加入,將此屬性視為布林值。

屬性 ktuple

詞大小

此屬性控制 -ktuple 參數的加入及其關聯值。將此屬性設定為所需的參數值。

屬性 loopgap

迴路區域的間隙懲罰

此屬性控制 -loopgap 參數的加入及其關聯值。將此屬性設定為所需的參數值。

屬性 matrix

蛋白質權重矩陣=BLOSUM、PAM、GONNET、ID 或檔案名稱

此屬性控制是否加入 -matrix 參數及其相關聯的值。請將此屬性設定為所需的參數值。

屬性 maxdiv

延遲的 % 相同性

此屬性控制 -maxdiv 參數的加入及其關聯值。將此屬性設定為所需的參數值。

屬性 maxseqlen

允許的最大輸入序列長度

此屬性控制 -maxseqlen 參數的加入及其關聯值。將此屬性設定為所需的參數值。

屬性 negative

蛋白質比對使用矩陣中的負值

此屬性控制 -negative 開關的加入,將此屬性視為布林值。

屬性 newtree

新建立的引導樹的輸出檔案名稱

此屬性控制 -newtree 參數的加入及其關聯值。將此屬性設定為所需的參數值。

屬性 newtree1

profile1 的新引導樹的輸出檔案名稱

此屬性控制 -newtree1 參數的加入及其關聯值。將此屬性設定為所需的參數值。

屬性 newtree2

profile2 的新引導樹的輸出檔案

此屬性控制 -newtree2 參數的加入及其關聯值。將此屬性設定為所需的參數值。

屬性 nohgap

關閉親水性間隙

此屬性控制 -nohgap 開關的加入,將此屬性視為布林值。

屬性 nopgap

關閉殘基特定間隙

此屬性控制 -nopgap 開關的加入,將此屬性視為布林值。

屬性 nosecstr1

不使用 profile 1 的二級結構間隙懲罰遮罩

此屬性控制 -nosecstr1 開關的加入,將此屬性視為布林值。

屬性 nosecstr2

不使用 profile 2 的二級結構間隙懲罰遮罩

此屬性控制 -nosecstr2 開關的加入,將此屬性視為布林值。

屬性 noweights

停用序列加權

此屬性控制 -noweights 開關的加入,請將此屬性視為布林值。

屬性 numiter

執行的最大疊代次數

此屬性控制 -numiter 參數及其關聯值的加入。請將此屬性設定為所需的參數值。

屬性 options

列出命令列參數

此屬性控制 -options 開關的加入,請將此屬性視為布林值。

屬性 outfile

輸出序列比對檔名

此屬性控制 -outfile 參數及其關聯值的加入。請將此屬性設定為所需的參數值。

屬性 outorder

輸出分類單元順序:INPUT 或 ALIGNED

此屬性控制 -outorder 參數及其關聯值的加入。請將此屬性設定為所需的參數值。

屬性 output

輸出格式:CLUSTAL(預設)、GCG、GDE、PHYLIP、PIR、NEXUS 和 FASTA

此屬性控制 -output 參數及其關聯值的加入。請將此屬性設定為所需的參數值。

屬性 outputtree

nj 或 phylip 或 dist 或 nexus

此屬性控制 -outputtree 參數及其關聯值的加入。請將此屬性設定為所需的參數值。

屬性 pairgap

間隙罰分

此屬性控制 -pairgap 參數及其關聯值的加入。請將此屬性設定為所需的參數值。

屬性 pim

輸出百分比一致性矩陣(在計算樹狀圖時)。

此屬性控制 -pim 開關的加入,請將此屬性視為布林值。

屬性 profile

透過概況比對合併兩個比對結果

此屬性控制是否加入 -profile 開關,請將此屬性視為布林值。

屬性 profile1

概況(舊的比對)。

此屬性控制 -profile1 參數及其關聯值的加入。請將此屬性設定為所需的參數值。

屬性 profile2

概況(舊的比對)。

此屬性控制 -profile2 參數及其關聯值的加入。請將此屬性設定為所需的參數值。

屬性 pwdnamatrix

DNA權重矩陣=IUB、CLUSTALW 或檔案名稱

此屬性控制 -pwdnamatrix 參數及其關聯值的加入。請將此屬性設定為所需的參數值。

屬性 pwgapext

間隙延伸懲罰

此屬性控制 -pwgapext 參數及其關聯值的加入。請將此屬性設定為所需的參數值。

屬性 pwgapopen

間隙開啟懲罰

此屬性控制 -pwgapopen 參數及其關聯值的加入。請將此屬性設定為所需的參數值。

屬性 pwmatrix

蛋白質權重矩陣=BLOSUM、PAM、GONNET、ID 或檔案名稱

此屬性控制 -pwmatrix 參數及其關聯值的加入。請將此屬性設定為所需的參數值。

屬性 quicktree

使用快速演算法進行比對導引樹

此屬性控制 -quicktree 開關的加入,請將此屬性視為布林值。

屬性 quiet

將主控台輸出降至最低

此屬性控制 -quiet 參數的添加,請將此屬性視為布林值。

屬性 range

要寫入的序列範圍,從 m 到 m+n。以字串形式輸入,例如 ‘24,200’

此屬性控制 -range 參數及其關聯值的加入。請將此屬性設定為所需的參數值。

屬性 score

可以是:PERCENT 或 ABSOLUTE

此屬性控制 -score 參數及其關聯值的加入。請將此屬性設定為所需的參數值。

屬性 secstrout

在比對檔案中輸出 STRUCTURE 或 MASK 或 BOTH 或 NONE

此屬性控制 -secstrout 參數及其關聯值的加入。請將此屬性設定為所需的參數值。

屬性 seed

用於自舉法的種子號碼。

此屬性控制 -seed 參數及其關聯值的加入。請將此屬性設定為所需的參數值。

屬性 seqno_range

OFF 或 ON(NEW - 用於所有輸出格式)

此屬性控制 -seqno_range 參數及其關聯值的加入。請將此屬性設定為所需的參數值。

屬性 seqnos

OFF 或 ON(僅限 Clustal 輸出)

此屬性控制 -seqnos 參數及其關聯值的加入。請將此屬性設定為所需的參數值。

屬性 sequences

將 profile2 序列依序新增至 profile1 比對結果

此屬性控制 -sequences 開關的加入,請將此屬性視為布林值。

屬性 stats

將一些比對統計資料記錄到檔案

此屬性控制 -stats 參數及其關聯值的加入。請將此屬性設定為所需的參數值。

屬性 strandendin

視為終端殘基的鏈內殘基數

此屬性控制 -strandendin 參數及其關聯值的加入。請將此屬性設定為所需的參數值。

屬性 strandendout

視為終端殘基的鏈外殘基數

此屬性控制 -strandendout 參數及其關聯值的加入。請將此屬性設定為所需的參數值。

屬性 strandgap

鏈核心殘基的間隙罰分

此屬性控制 -strandgap 參數及其關聯值的加入。請將此屬性設定為所需的參數值。

屬性 terminalgap

結構末端的間隙罰分

此屬性控制 -terminalgap 參數及其關聯值的加入。請將此屬性設定為所需的參數值。

屬性 topdiags

最佳對角線數量。

此屬性控制 -topdiags 參數及其關聯值的加入。請將此屬性設定為所需的參數值。

屬性 tossgaps

忽略有間隙的位置。

此屬性控制 -tossgaps 開關的加入,請將此屬性視為布林值。

屬性 transweight

轉換加權

此屬性控制 -transweight 參數及其關聯值的加入。請將此屬性設定為所需的參數值。

屬性 tree

計算 NJ 樹狀圖。

此屬性控制 -tree 開關的添加,將此屬性視為布林值。

property type

蛋白質或 DNA 序列

此屬性控制 -type 參數及其相關值的添加。將此屬性設定為所需參數值。

property usetree

引導樹的檔案名稱

此屬性控制 -usetree 參數及其相關值的添加。請將此屬性設定為所需參數值。

property usetree1

profile1 引導樹的檔案名稱

此屬性控制 -usetree1 參數及其相關值的添加。將此屬性設定為所需參數值。

property usetree2

profile2 引導樹的檔案名稱

此屬性控制 -usetree2 參數及其相關值的添加。將此屬性設定為所需參數值。

property window

最佳對角線周圍的窗口。

此屬性控制 -window 參數及其相關值的添加。將此屬性設定為所需參數值。

class Bio.Align.Applications.ClustalOmegaCommandline(cmd='clustalo', **kwargs)

基底類別: AbstractCommandline

clustal omega 的命令列包裝器。

http://www.clustal.org/omega

注意

最後檢查的版本:1.2.0

參考文獻

Sievers F, Wilm A, Dineen DG, Gibson TJ, Karplus K, Li W, Lopez R, McWilliam H, Remmert M, Söding J, Thompson JD, Higgins DG (2011). 使用 Clustal Omega 快速、可擴展地生成高品質蛋白質多序列比對。分子系統生物學 7:539 https://doi.org/10.1038/msb.2011.75

範例

>>> from Bio.Align.Applications import ClustalOmegaCommandline
>>> in_file = "unaligned.fasta"
>>> out_file = "aligned.fasta"
>>> clustalomega_cline = ClustalOmegaCommandline(infile=in_file, outfile=out_file, verbose=True, auto=True)
>>> print(clustalomega_cline)
clustalo -i unaligned.fasta -o aligned.fasta --auto -v

您通常會使用 clustalomega_cline() 或透過 Python subprocess 模組來執行命令列,如 Biopython 教學中所述。

__init__(cmd='clustalo', **kwargs)

初始化類別。

property auto

自動設定選項(可能會覆蓋您的一些選項)

此屬性控制 –auto 開關的添加,將此屬性視為布林值。

property clusteringout

群集輸出檔案

此屬性控制 –clustering-out 參數及其相關值的添加。將此屬性設定為所需參數值。

property clustersize

子群集中序列的軟性最大值

此屬性控制 –cluster-size 參數及其相關值的添加。將此屬性設定為所需參數值。

property dealign

取消對齊輸入序列

此屬性控制 –dealign 開關的添加,將此屬性視為布林值。

property distmat_full

使用完整距離矩陣計算引導樹(速度較慢;預設為 mBed)

此屬性控制 –full 開關的添加,將此屬性視為布林值。

property distmat_full_iter

在迭代期間使用完整距離矩陣計算引導樹(預設為 mBed)

此屬性控制 –full-iter 開關的添加,將此屬性視為布林值。

property distmat_in

成對距離矩陣輸入檔案(跳過距離計算)。

此屬性控制 –distmat-in 參數及其相關值的添加。將此屬性設定為所需參數值。

property distmat_out

成對距離矩陣輸出檔案。

此屬性控制 –distmat-out 參數及其相關值的添加。將此屬性設定為所需參數值。

property force

強制覆寫檔案。

此屬性控制 –force 開關的添加,將此屬性視為布林值。

property guidetree_in

引導樹輸入檔案(跳過距離計算和引導樹群集步驟)。

此屬性控制 –guidetree-in 參數及其相關值的添加。將此屬性設定為所需參數值。

property guidetree_out

引導樹輸出檔案。

此屬性控制 –guidetree-out 參數及其相關值的添加。將此屬性設定為所需參數值。

property help

列印說明並結束。

此屬性控制 -h 開關的添加,將此屬性視為布林值。

property hmm_input

HMM 輸入檔案

此屬性控制 –hmm-in 參數及其相關值的添加。將此屬性設定為所需參數值。

property infile

多序列輸入檔案

此屬性控制 -i 參數及其相關值的添加。將此屬性設定為所需參數值。

property infmt

強制序列輸入檔案格式(預設:自動)

允許的值:a2m, fa[sta], clu[stal], msf, phy[lip], selex, st[ockholm], vie[nna]

此屬性控制 –infmt 參數及其相關值的添加。將此屬性設定為所需參數值。

property isprofile

停用檢查是否為 profile,強制 profile(預設為否)

此屬性控制 –is-profile 開關的添加,將此屬性視為布林值。

property iterations

(組合引導樹/HMM)迭代次數

此屬性控制 –iterations 參數及其相關值的添加。將此屬性設定為所需參數值。

property log

將所有非必要輸出記錄到此檔案。

此屬性控制 -l 參數及其相關值的添加。將此屬性設定為所需參數值。

property long_version

列印長版本資訊並結束

此屬性控制 –long-version 開關的添加,將此屬性視為布林值。

property max_guidetree_iterations

最大導引樹迭代次數

此屬性控制 `--max-guidetree-iterations` 參數的加入及其關聯的值。將此屬性設定為所需的參數值。

property max_hmm_iterations

最大 HMM 迭代次數

此屬性控制 `--max-hmm-iterations` 參數的加入及其關聯的值。將此屬性設定為所需的參數值。

property maxnumseq

允許的最大序列數量

此屬性控制 `--maxnumseq` 參數的加入及其關聯的值。將此屬性設定為所需的參數值。

property maxseqlen

允許的最大序列長度

此屬性控制 `--maxseqlen` 參數的加入及其關聯的值。將此屬性設定為所需的參數值。

property outfile

多重序列比對輸出檔案 (預設:stdout)。

此屬性控制 `-o` 參數的加入及其關聯的值。將此屬性設定為所需的參數值。

property outfmt

MSA 輸出檔案格式:a2m=fa[sta],clu[stal],msf,phy[lip],selex,st[ockholm],vie[nna] (預設:fasta)。

此屬性控制 `--outfmt` 參數的加入及其關聯的值。將此屬性設定為所需的參數值。

property outputorder

MSA 輸出順序,如同輸入/導引樹

此屬性控制 `--output-order` 參數的加入及其關聯的值。將此屬性設定為所需的參數值。

property percentid

將距離轉換為百分比一致性 (預設:否)

此屬性控制 `--percent-id` 開關的加入,將此屬性視為布林值。

property profile1

預先比對的多重序列檔案 (比對的欄位將保持固定)。

此屬性控制 `--profile1` 參數的加入及其關聯的值。將此屬性設定為所需的參數值。

property profile2

預先比對的多重序列檔案 (比對的欄位將保持固定)。

此屬性控制 `--profile2` 參數的加入及其關聯的值。將此屬性設定為所需的參數值。

property residuenumber

在 Clustal 格式中列印殘基編號 (預設:否)

此屬性控制 `--residuenumber` 開關的加入,將此屬性視為布林值。

property seqtype

{蛋白質, RNA, DNA} 強制序列類型 (預設:自動)。

此屬性控制 `-t` 參數的加入及其關聯的值。將此屬性設定為所需的參數值。

property threads

要使用的處理器數量

此屬性控制 `--threads` 參數的加入及其關聯的值。將此屬性設定為所需的參數值。

property usekimura

對比對的序列使用 Kimura 距離校正 (預設:否)

此屬性控制 `--use-kimura` 開關的加入,將此屬性視為布林值。

property verbose

詳細輸出

此屬性控制 `-v` 開關的加入,將此屬性視為布林值。

property version

列印版本資訊並退出

此屬性控制 `--version` 開關的加入,將此屬性視為布林值。

property wrap

輸出中換行前的殘基數

此屬性控制 `--wrap` 參數的加入及其關聯的值。將此屬性設定為所需的參數值。

class Bio.Align.Applications.PrankCommandline(cmd='prank', **kwargs)

基底類別: AbstractCommandline

多重比對程式 PRANK 的命令列封裝。

http://www.ebi.ac.uk/goldman-srv/prank/prank/

注意

上次檢查的版本:081202

參考文獻

Loytynoja, A. and Goldman, N. 2005. An algorithm for progressive multiple alignment of sequences with insertions. Proceedings of the National Academy of Sciences, 102: 10557–10562.

Loytynoja, A. and Goldman, N. 2008. Phylogeny-aware gap placement prevents errors in sequence alignment and evolutionary analysis. Science, 320: 1632.

範例

要比對 FASTA 檔案 (unaligned.fasta),並以比對後的 FASTA 格式輸出,且輸出檔案名稱以「aligned」開頭 (您無法明確選擇檔案名稱),且沒有樹狀圖輸出和 XML 輸出,請使用

>>> from Bio.Align.Applications import PrankCommandline
>>> prank_cline = PrankCommandline(d="unaligned.fasta",
...                                o="aligned", # prefix only!
...                                f=8, # FASTA output
...                                notree=True, noxml=True)
>>> print(prank_cline)
prank -d=unaligned.fasta -o=aligned -f=8 -noxml -notree

您通常會使用 prank_cline() 或透過 Python subprocess 模組執行命令列,如 Biopython 教學中所述。

__init__(cmd='prank', **kwargs)

初始化類別。

property F

強制始終跳過插入:與 +F 相同

此屬性控制 `-F` 開關的加入,將此屬性視為布林值。

property codon

是否進行密碼子感知比對

此屬性控制 `-codon` 開關的加入,將此屬性視為布林值。

property convert

將輸入比對轉換為新格式。不執行比對

此屬性控制 -convert 開關的加入,將此屬性視為布林值。

property d

輸入檔案名稱

此屬性控制 `-d` 參數的加入及其關聯的值。將此屬性設定為所需的參數值。

property dnafreqs

DNA 頻率 - 'A,C,G,T'。例如,'25,25,25,25' 作為引號包圍的字串值。預設:經驗值

此屬性控制 `-dnafreqs` 參數的加入及其關聯的值。將此屬性設定為所需的參數值。

property dots

將插入間隙顯示為點

此屬性控制 `-dots` 開關的加入,將此屬性視為布林值。

property f

輸出比對格式。預設:8 FASTA 選項有:1. IG/Stanford 8. Pearson/Fasta 2. GenBank/GB 11. Phylip3.2 3. NBRF 12. Phylip 4. EMBL 14. PIR/CODATA 6. DNAStrider 15. MSF 7. Fitch 17. PAUP/NEXUS

此屬性控制 `-f` 參數的加入及其關聯的值。將此屬性設定為所需的參數值。

property fixedbranches

使用輸入值的固定分支長度

此屬性控制 `-fixedbranches` 參數的加入及其關聯的值。將此屬性設定為所需的參數值。

property gapext

間隙延伸機率。預設:dna 0.5 / prot 0.5

此屬性控制 -gapext 參數的加入及其關聯值。將此屬性設定為所需的參數值。

property gaprate

間隙開啟率。預設:dna 0.025 prot 0.0025

此屬性控制 `-gaprate` 參數的加入及其關聯的值。將此屬性設定為所需的參數值。

property kappa

轉變/橫越比率。預設:2

此屬性控制 `-kappa` 參數的加入及其關聯的值。將此屬性設定為所需的參數值。

property longseq

節省成對比對中的空間

此屬性控制 -longseq 開關的加入,請將此屬性視為布林值。

property m

使用者定義的比對模型檔案名稱。預設值:HKY2/WAG

此屬性控制 -m 參數及其相關值的加入。將此屬性設定為所需的參數值。

property matinitsize

矩陣初始大小乘數

此屬性控制 -matinitsize 參數及其相關值的加入。將此屬性設定為所需的參數值。

property matresize

矩陣調整大小乘數

此屬性控制 -matresize 參數及其相關值的加入。將此屬性設定為所需的參數值。

property maxbranches

使用輸入值的最大分支長度

此屬性控制 -maxbranches 參數及其相關值的加入。將此屬性設定為所需的參數值。

property mttranslate

使用 mt 表格翻譯為蛋白質

此屬性控制 -mttranslate 開關的加入,請將此屬性視為布林值。

property nopost

不計算後驗支持度。預設值:計算

此屬性控制 -nopost 開關的加入,請將此屬性視為布林值。

property notree

不輸出 dnd 樹狀檔案 (PRANK 版本早於 v.120626)

此屬性控制 -notree 開關的加入,請將此屬性視為布林值。

property noxml

不輸出 XML 檔案 (PRANK 版本早於 v.120626)

此屬性控制 -noxml 開關的加入,請將此屬性視為布林值。

property o
輸出檔案名稱前綴。預設值:'output'

將寫入:output.?.fas (取決於請求的格式)、output.?.xml 和 output.?.dnd

此屬性控制 `-o` 參數的加入及其關聯的值。將此屬性設定為所需的參數值。

property once

僅執行一次。預設值:如果沒有給定引導樹,則執行兩次

此屬性控制 -once 開關的加入,請將此屬性視為布林值。

property printnodes

輸出每個節點;主要用於除錯

此屬性控制 -printnodes 開關的加入,請將此屬性視為布林值。

property pwdist

計算引導樹的預期成對距離。預設值:dna 0.25 / prot 0.5

此屬性控制 -pwdist 參數及其相關值的加入。將此屬性設定為所需的參數值。

property pwgenomic

執行成對比對,不使用引導樹

此屬性控制 -pwgenomic 開關的加入,請將此屬性視為布林值。

property pwgenomicdist

成對比對的距離。預設值:0.3

此屬性控制 -pwgenomicdist 參數及其相關值的加入。將此屬性設定為所需的參數值。

property quiet

減少冗長訊息

此屬性控制 -quiet 參數的添加,請將此屬性視為布林值。

property realbranches

停用分支長度截斷

此屬性控制 -realbranches 開關的加入,請將此屬性視為布林值。

property rho

嘌呤/嘧啶比例。預設值:1

此屬性控制 -rho 參數及其相關值的加入。將此屬性設定為所需的參數值。

property scalebranches

縮放分支長度。預設值:dna 1 / prot 2

此屬性控制 -scalebranches 參數及其相關值的加入。將此屬性設定為所需的參數值。

property shortnames

在第一個空格處截斷名稱

此屬性控制 -shortnames 開關的加入,請將此屬性視為布林值。

property showtree

輸出 dnd 樹狀檔案 (PRANK v.120626 及更新版本)

此屬性控制 -showtree 開關的加入,請將此屬性視為布林值。

property showxml

輸出 XML 檔案 (PRANK v.120626 及更新版本)

此屬性控制 -showxml 開關的加入,請將此屬性視為布林值。

property skipins

在後驗支持度中略過插入

此屬性控制 -skipins 開關的加入,請將此屬性視為布林值。

property t

輸入引導樹檔案名稱

此屬性控制 `-t` 參數的加入及其關聯的值。將此屬性設定為所需的參數值。

property termgap

正常懲罰終端間隙

此屬性控制 -termgap 開關的加入,請將此屬性視為布林值。

property translate

翻譯為蛋白質

此屬性控制 -translate 開關的加入,請將此屬性視為布林值。

property tree

以 Newick 字串輸入引導樹

此屬性控制 -tree 參數及其相關值的加入。將此屬性設定為所需的參數值。

property twice

永遠執行兩次

此屬性控制 -twice 開關的加入,請將此屬性視為布林值。

property uselogs

速度較慢,但應適用於更多序列

此屬性控制 -uselogs 開關的加入,請將此屬性視為布林值。

property writeanc

輸出祖先序列

此屬性控制 -writeanc 開關的加入,請將此屬性視為布林值。

class Bio.Align.Applications.MafftCommandline(cmd='mafft', **kwargs)

基底類別: AbstractCommandline

多重比對程式 MAFFT 的命令列包裝器。

http://align.bmr.kyushu-u.ac.jp/mafft/software/

注意

上次檢查的版本:MAFFT v6.717b (2009/12/03)

參考文獻

Katoh, Toh (BMC Bioinformatics 9:212, 2008) Improved accuracy of multiple ncRNA alignment by incorporating structural information into a MAFFT-based framework (描述 RNA 結構比對方法)

Katoh, Toh (Briefings in Bioinformatics 9:286-298, 2008) Recent developments in the MAFFT multiple sequence alignment program (概述版本 6)

Katoh, Toh (Bioinformatics 23:372-374, 2007) Errata PartTree: an algorithm to build an approximate tree from a large number of unaligned sequences (描述 PartTree 演算法)

Katoh, Kuma, Toh, Miyata (Nucleic Acids Res. 33:511-518, 2005) MAFFT version 5: improvement in accuracy of multiple sequence alignment (描述 [祖先版本] 的 G-INS-i、L-INS-i 和 E-INS-i 策略)

Katoh, Misawa, Kuma, Miyata (Nucleic Acids Res. 30:3059-3066, 2002)

範例

>>> from Bio.Align.Applications import MafftCommandline
>>> mafft_exe = "/opt/local/mafft"
>>> in_file = "../Doc/examples/opuntia.fasta"
>>> mafft_cline = MafftCommandline(mafft_exe, input=in_file)
>>> print(mafft_cline)
/opt/local/mafft ../Doc/examples/opuntia.fasta

如果 mafft 二進制檔案位於路徑上 (通常在 Unix 樣式的作業系統上是這種情況),則您不需要提供可執行檔位置

>>> from Bio.Align.Applications import MafftCommandline
>>> in_file = "../Doc/examples/opuntia.fasta"
>>> mafft_cline = MafftCommandline(input=in_file)
>>> print(mafft_cline)
mafft ../Doc/examples/opuntia.fasta

您通常會使用 mafft_cline() 或透過 Python subprocess 模組執行命令列,如 Biopython 教學中所述。

請注意,MAFFT 會將比對結果寫入標準輸出 (stdout),您可能需要將其儲存到檔案中,然後再進行解析,例如:

stdout, stderr = mafft_cline()
with open("aligned.fasta", "w") as handle:
    handle.write(stdout)
from Bio import AlignIO
align = AlignIO.read("aligned.fasta", "fasta")

或者,若要使用 AlignIO 直接解析輸出,您可以使用 StringIO 將字串轉換為一個控制代碼。

stdout, stderr = mafft_cline()
from io import StringIO
from Bio import AlignIO
align = AlignIO.read(StringIO(stdout), "fasta")
__init__(cmd='mafft', **kwargs)

初始化類別。

屬性 LEXP

跳過比對的 gap 延伸懲罰值。預設值:0.00

此屬性控制 `–LEXP` 參數及其相關值的添加。請將此屬性設定為所需的參數值。

屬性 LOP

跳過比對的 gap 開啟懲罰值。預設值:-6.00

此屬性控制 `–LOP` 參數及其相關值的添加。請將此屬性設定為所需的參數值。

屬性 aamatrix

使用使用者定義的 AA 評分矩陣。預設值:BLOSUM62

此屬性控制 `–aamatrix` 參數及其相關值的添加。請將此屬性設定為所需的參數值。

屬性 adjustdirection

根據第一個序列調整方向。預設為關閉。

此屬性控制 `–adjustdirection` 開關的添加,請將此屬性視為布林值。

屬性 adjustdirectionaccurately

根據第一個序列調整方向,適用於高度發散的資料;速度非常慢。預設為關閉。

此屬性控制 `–adjustdirectionaccurately` 開關的添加,請將此屬性視為布林值。

屬性 amino

假設序列為胺基酸 (True/False)。預設值:自動

此屬性控制 `–amino` 開關的添加,請將此屬性視為布林值。

屬性 auto

自動選擇策略。預設為關閉。

此屬性控制 –auto 開關的添加,將此屬性視為布林值。

屬性 bl

使用 BLOSUM 數字矩陣。預設值:62

此屬性控制 `–bl` 參數及其相關值的添加。請將此屬性設定為所需的參數值。

屬性 clustalout

輸出格式:clustal (True) 或 fasta (False,預設)

此屬性控制 `–clustalout` 開關的添加,請將此屬性視為布林值。

屬性 dpparttree

使用基於 DP 距離的 PartTree 演算法。預設值:關閉

此屬性控制 `–dpparttree` 開關的添加,請將此屬性視為布林值。

屬性 ep

群組對群組比對的偏移值,其作用類似於 gap 延伸懲罰值。預設值:0.123

此屬性控制 `–ep` 參數及其相關值的添加。請將此屬性設定為所需的參數值。

屬性 fastapair

所有成對比對都使用 FASTA (Pearson 和 Lipman 1988) 計算。預設值:關閉

此屬性控制 `–fastapair` 開關的添加,請將此屬性視為布林值。

屬性 fastaparttree

使用基於 FASTA 距離的 PartTree 演算法。預設值:關閉

此屬性控制 `–fastaparttree` 開關的添加,請將此屬性視為布林值。

屬性 fft

在群組對群組比對中使用 FFT 近似。預設值:開啟

此屬性控制 `–fft` 開關的添加,請將此屬性視為布林值。

屬性 fmodel

將 AA/nuc 組成資訊納入評分矩陣 (True) 或不納入 (False,預設)

此屬性控制 `–fmodel` 開關的添加,請將此屬性視為布林值。

屬性 genafpair

所有成對比對都使用具有廣義仿射 gap 成本的局部演算法 (Altschul 1998) 計算。預設值:關閉

此屬性控制 `–genafpair` 開關的添加,請將此屬性視為布林值。

屬性 globalpair

所有成對比對都使用 Needleman-Wunsch 演算法計算。預設值:關閉

此屬性控制 `–globalpair` 開關的添加,請將此屬性視為布林值。

屬性 groupsize

不要使比對大於數字序列。預設值:輸入序列的數量

此屬性控制 `–groupsize` 開關的添加,請將此屬性視為布林值。

屬性 input

輸入檔案名稱

此屬性控制 `input` 參數及其相關值的添加。請將此屬性設定為所需的參數值。

屬性 input1

mafft-profile 命令的第二個輸入檔案名稱

此屬性控制 `input1` 參數及其相關值的添加。請將此屬性設定為所需的參數值。

屬性 inputorder

輸出順序:與輸入相同 (True,預設) 或基於比對 (False)

此屬性控制 `–inputorder` 開關的添加,請將此屬性視為布林值。

屬性 jtt

使用 JTT PAM 數字 (Jones et al. 1992) 矩陣。數字 > 0。預設值:BLOSUM62

此屬性控制 `–jtt` 參數及其相關值的添加。請將此屬性設定為所需的參數值。

屬性 lep

局部成對比對的偏移值。預設值:0.1

此屬性控制 `–lep` 參數及其相關值的添加。請將此屬性設定為所需的參數值。

屬性 lexp

局部成對比對的 gap 延伸懲罰值。預設值:-0.1

此屬性控制 `–lexp` 參數及其相關值的添加。請將此屬性設定為所需的參數值。

屬性 localpair

所有成對比對都使用 Smith-Waterman 演算法計算。預設值:關閉

此屬性控制 `–localpair` 開關的添加,請將此屬性視為布林值。

屬性 lop

局部成對比對的 gap 開啟懲罰值。預設值:0.123

此屬性控制 `–lop` 參數及其相關值的添加。請將此屬性設定為所需的參數值。

屬性 maxiterate

執行迭代精煉的次數。預設值:0

此屬性控制 `–maxiterate` 參數及其相關值的添加。請將此屬性設定為所需的參數值。

屬性 memsave

使用 Myers-Miller (1988) 演算法。預設值:當比對長度超過 10,000 (aa/nt) 時自動開啟。

此屬性控制 –memsave 開關的加入,請將此屬性視為布林值。

property namelength

CLUSTAL 和 PHYLIP 輸出中的名稱長度。

MAFFT v6.847 (2011) 新增了 –namelength,用於 CLUSTAL 輸出的 –clustalout 選項。

MAFFT v7.024 (2013) 新增了對 PHYLIP 輸出的 –phylipout 選項的支援(預設值為 10)。

這會控制 –namelength 參數及其相關值的加入。請將此屬性設定為所需的參數值。

property nofft

在群組對群組比對中不使用 FFT 近似。預設值:關閉

此屬性控制 –nofft 開關的加入,請將此屬性視為布林值。

property noscore

在迭代精煉階段不檢查比對分數。預設值:關閉(檢查分數)

此屬性控制 –noscore 開關的加入,請將此屬性視為布林值。

property nuc

假設序列為核苷酸 (True/False)。預設值:自動

此屬性控制 –nuc 開關的加入,請將此屬性視為布林值。

property op

群組對群組比對時的間隙開啟懲罰。預設值:1.53

這會控制 –op 參數及其相關值的加入。請將此屬性設定為所需的參數值。

property partsize

PartTree 演算法中的分割數量。預設值:50

這會控制 –partsize 參數及其相關值的加入。請將此屬性設定為所需的參數值。

property parttree

使用 6mer 距離的快速樹狀結構建立方法。預設值:關閉

此屬性控制 –parttree 開關的加入,請將此屬性視為布林值。

property phylipout

輸出格式:phylip (True),或 fasta (False,預設值)

此屬性控制 –phylipout 開關的加入,請將此屬性視為布林值。

property quiet

不報告進度 (True) 或報告進度 (False,預設值)。

此屬性控制 –quiet 開關的加入,請將此屬性視為布林值。

property reorder

輸出順序:比對後 (True) 或輸入順序 (False,預設值)

此屬性控制 –reorder 開關的加入,請將此屬性視為布林值。

property retree

在漸進式階段中,引導樹狀結構的建構次數。使用 6mer 距離時有效。預設值:2

這會控制 –retree 參數及其相關值的加入。請將此屬性設定為所需的參數值。

property seed

以 alignment_n (fasta 格式) 給定的種子比對會與輸入中的序列比對。

這會控制 –seed 參數及其相關值的加入。請將此屬性設定為所需的參數值。

property sixmerpair

距離是根據共用 6mers 的數量計算。預設值:開啟

此屬性控制 –6merpair 開關的加入,請將此屬性視為布林值。

property thread

要使用的執行緒數量。預設值:1

這會控制 –thread 參數及其相關值的加入。請將此屬性設定為所需的參數值。

property tm

使用跨膜 PAM 數字 (Jones 等人,1994) 矩陣。數字>0。預設值:BLOSUM62

這會控制 –tm 參數及其相關值的加入。請將此屬性設定為所需的參數值。

property treeout

將引導樹狀結構輸出到 input.tree 檔案 (True) 或不輸出 (False,預設值)

此屬性控制 –treeout 開關的加入,請將此屬性視為布林值。

property weighti

從成對比對計算的一致性項目的加權因子。預設值:2.7

這會控制 –weighti 參數及其相關值的加入。請將此屬性設定為所需的參數值。

class Bio.Align.Applications.DialignCommandline(cmd='dialign2-2', **kwargs)

基底類別: AbstractCommandline

多重比對程式 DIALIGN2-2 的命令列包裝函式。

http://bibiserv.techfak.uni-bielefeld.de/dialign/welcome.html

注意

上次針對版本:2.2 檢查

參考文獻

B. Morgenstern (2004)。DIALIGN:BiBiServ 上的多重 DNA 和蛋白質序列比對。核酸研究 32, W33-W36。

範例

要使用名稱為 aligned.* 的輸出檔案(包括 FASTA 輸出檔案 (aligned.fa))比對 FASTA 檔案 (unaligned.fasta),請使用

>>> from Bio.Align.Applications import DialignCommandline
>>> dialign_cline = DialignCommandline(input="unaligned.fasta",
...                                    fn="aligned", fa=True)
>>> print(dialign_cline)
dialign2-2 -fa -fn aligned unaligned.fasta

您通常會使用 dialign_cline() 或透過 Python subprocess 模組執行命令列,如 Biopython 教學課程中所述。

__init__(cmd='dialign2-2', **kwargs)

初始化類別。

property afc

建立額外的輸出檔案 ‘*.afc’,其中包含所有考慮用於比對的片段的資料 警告:此檔案可能非常龐大!

此屬性控制 -afc 開關的加入,請將此屬性視為布林值。

property afc_v

與 ‘-afc’ 類似,但更詳細:會明確列印片段。警告:此檔案可能更龐大!

此屬性控制 -afc_v 開關的加入,請將此屬性視為布林值。

property anc

錨定比對。需要包含錨點的 <seq_file>.anc 檔案。

此屬性控制 -anc 開關的加入,請將此屬性視為布林值。

property cs

如果轉換片段,不僅會查看「華生鏈」,還會查看「克里克鏈」。

此屬性控制 -cs 開關的加入,請將此屬性視為布林值。

property cw

以 CLUSTAL W 格式建立額外的輸出檔案。

此屬性控制 -cw 開關的加入,請將此屬性視為布林值。

property ds

「DNA 比對加速」- 只有以至少兩個比對開始的非轉換核酸片段才會被考慮。加速 DNA 比對,但會犧牲靈敏度。

此屬性控制 -ds 開關的加入,請將此屬性視為布林值。

property fa

以 FASTA 格式建立額外的輸出檔案。

此屬性控制 -fa 開關的加入,請將此屬性視為布林值。

property ff

建立檔案 *.frg,其中包含關於各最佳成對比對一部分的所有片段的資訊,以及關於多重比對中一致性的資訊

此屬性控制 -ff 開關的加入,請將此屬性視為布林值。

property fn

輸出檔案命名為 <out_file>.<extension>。

這會控制 -fn 參數及其相關值的加入。請將此屬性設定為所需的參數值。

property fop

建立檔案 *.fop,其中包含屬於各成對比對一部分的所有片段的座標。

此屬性控制 -fop 開關的加入,請將此屬性視為布林值。

property fsm

建立檔案 *.fsm,其中包含屬於最終比對一部分的所有片段的座標

此屬性控制 -fsm 開關的加入,請將此屬性視為布林值。

property input

輸入檔案名稱。必須為 FASTA 格式

此屬性控制 `input` 參數及其相關值的添加。請將此屬性設定為所需的參數值。

屬性 iw

關閉重疊權重 (預設情況下,如果對齊的序列最多為 35 個,則使用重疊權重)。此選項可加快對齊速度,但可能會降低對齊品質。

此屬性控制 -iw 開關的加入,請將此屬性視為布林值。

屬性 lgs

「長基因組序列」- 結合以下選項:-ma、-thr 2、-lmax 30、-smin 8、-nta、-ff、-fop、-ff、-cs、-ds、-pst

此屬性控制 -lgs 開關的加入,請將此屬性視為布林值。

屬性 lgs_t

與「-lgs」類似,但所有片段對都在胜肽水平上進行評估(而不是像「-lgs」選項那樣的「混合對齊」)。因此比 -lgs 快,但對於非編碼區域不太敏感。

此屬性控制 -lgs_t 開關的加入,請將此屬性視為布林值。

屬性 lmax

最大片段長度 = x (預設值:x = 40 或 x = 120 表示「翻譯」片段)。較短的 x 會加快程式速度,但可能會影響對齊品質。

這控制了 -lmax 參數及其關聯值的加入。將此屬性設定為所需的參數值。

屬性 lo

(長輸出) 額外檔案 *.log,其中包含有關選擇用於成對對齊的片段以及多重對齊程序中一致性的資訊。

此屬性控制 -lo 開關的加入,請將此屬性視為布林值。

屬性 ma

「混合對齊」,如果對齊核酸序列,則由 P 片段和 N 片段組成。

此屬性控制 -ma 開關的加入,請將此屬性視為布林值。

屬性 mask

不屬於所選片段的殘基在輸出對齊中以「*」字元取代(而不是以小寫字元列印)

此屬性控制 -mask 開關的加入,請將此屬性視為布林值。

屬性 mat

建立檔案 *mat,其中包含從已選擇用於對齊的片段衍生的取代計數。

此屬性控制 -mat 開關的加入,請將此屬性視為布林值。

屬性 mat_thr

與「-mat」類似,但僅考慮權重分數 > t 的片段

此屬性控制 -mat_thr 開關的加入,請將此屬性視為布林值。

用於建構序列樹的「最大連結」叢集(而不是 UPGMA)。

此屬性控制 -max_link 開關的加入,請將此屬性視為布林值。

使用「最小連結」叢集。

此屬性控制 -min_link 開關的加入,請將此屬性視為布林值。

屬性 mot

「動機」選項。

這控制了 -mot 參數及其關聯值的加入。將此屬性設定為所需的參數值。

屬性 msf

以 MSF 格式輸出單獨的檔案。

此屬性控制是否加入 -msf 開關,請將此屬性視為布林值。

屬性 n

輸入序列為核酸序列。不翻譯片段。

此屬性控制 -n 開關的加入,請將此屬性視為布林值。

屬性 nt

輸入序列為核酸序列,並且「核酸片段」被翻譯成「胜肽片段」。

此屬性控制 -nt 開關的加入,請將此屬性視為布林值。

屬性 nta

「無文字對齊」- 抑制文字對齊。如果對其他輸出檔案感興趣(例如,使用 -ff、-fop、-fsm 或 -lo 建立的片段檔案),此選項才有意義。

此屬性控制 -nta 開關的加入,請將此屬性視為布林值。

屬性 o

快速版本,產生的對齊可能會略有不同。

此屬性控制 -o 開關的加入,請將此屬性視為布林值。

屬性 ow

強制執行重疊權重 (預設情況下,僅在對齊最多 35 個序列時才使用重疊權重,因為計算重疊權重很耗時)。

此屬性控制 -ow 開關的加入,請將此屬性視為布林值。

屬性 pst

「列印狀態」。建立並更新檔案 *.sta,其中包含有關程式執行目前狀態的資訊。如果對齊大型資料集,建議使用此選項,因為它允許使用者估計剩餘執行時間。

此屬性控制 -pst 開關的加入,請將此屬性視為布林值。

屬性 smin

片段中第一個殘基對(或密碼子對)的最小相似值。以犧牲靈敏度為代價,加快蛋白質對齊或翻譯 DNA 片段的對齊速度。

此屬性控制 -smin 開關的加入,請將此屬性視為布林值。

屬性 stars

指示序列之間局部相似程度的最大「*」字元數。預設情況下,不使用星號,而是使用 0 到 9 之間的數字。

這控制了 -stars 參數及其關聯值的加入。將此屬性設定為所需的參數值。

屬性 stdo

結果寫入標準輸出。

此屬性控制 -stdo 開關的加入,請將此屬性視為布林值。

屬性 ta

列印標準文字對齊 (覆蓋特殊選項中對文字對齊的抑制,例如 -lgs)

此屬性控制 -ta 開關的加入,請將此屬性視為布林值。

屬性 thr

閾值 T = x。

這控制了 -thr 參數及其關聯值的加入。將此屬性設定為所需的參數值。

屬性 xfr

「排除片段」- 可以指定不考慮用於成對對齊的片段清單

此屬性控制 -xfr 開關的加入,請將此屬性視為布林值。

類別 Bio.Align.Applications.ProbconsCommandline(cmd='probcons', **kwargs)

基底類別: AbstractCommandline

多重對齊程式 PROBCONS 的命令列包裝器。

http://probcons.stanford.edu/

注意

上次檢查版本:1.12

參考文獻

Do, C.B., Mahabhashyam, M.S.P., Brudno, M., and Batzoglou, S. 2005. PROBCONS: Probabilistic Consistency-based Multiple Sequence Alignment. Genome Research 15: 330-340.

範例

若要使用 ClustalW 格式輸出並使用其他預設設定對齊 FASTA 檔案 (unaligned.fasta),請使用

>>> from Bio.Align.Applications import ProbconsCommandline
>>> probcons_cline = ProbconsCommandline(input="unaligned.fasta",
...                                      clustalw=True)
>>> print(probcons_cline)
probcons -clustalw unaligned.fasta

您通常會使用 probcons_cline() 或透過 Python 子程序模組執行命令列,如 Biopython 教學中所述。

請注意,PROBCONS 會將對齊寫入標準輸出,您可能需要將其儲存到檔案,然後進行剖析,例如

stdout, stderr = probcons_cline()
with open("aligned.aln", "w") as handle:
    handle.write(stdout)
from Bio import AlignIO
align = AlignIO.read("aligned.fasta", "clustalw")

或者,若要使用 AlignIO 直接解析輸出,您可以使用 StringIO 將字串轉換為一個控制代碼。

stdout, stderr = probcons_cline()
from io import StringIO
from Bio import AlignIO
align = AlignIO.read(StringIO(stdout), "clustalw")
__init__(cmd='probcons', **kwargs)

初始化類別。

屬性 a

以對齊順序而非輸入順序列印序列 (預設:關閉)

此屬性控制 -a 開關的加入,請將此屬性視為布林值。

屬性 annot

將多重對齊的註釋寫入 FILENAME

這控制了 -annot 參數及其關聯值的加入。將此屬性設定為所需的參數值。

屬性 clustalw

使用 CLUSTALW 輸出格式而非 MFA

此屬性控制 -clustalw 開關的加入,請將此屬性視為布林值。

屬性 consistency

使用 0 <= REPS <= 5 (預設:2) 次一致性轉換。

這控制了 -c 參數及其相關值的添加。將此屬性設定為所需的參數值。

屬性 emissions

也重新估計排放機率 (預設:關閉)

此屬性控制 -e 開關的添加,將此屬性視為布林值。

屬性 input

輸入檔案名稱。必須為多重 FASTA 比對 (MFA) 格式。

此屬性控制 `input` 參數及其相關值的添加。請將此屬性設定為所需的參數值。

屬性 ir

使用 0 <= REPS <= 1000 (預設:100) 次迭代改進。

這控制了 -ir 參數及其相關值的添加。將此屬性設定為所需的參數值。

屬性 pairs

產生所有配對的成對比對。

此屬性控制 -pairs 開關的添加,將此屬性視為布林值。

屬性 paramfile

從 FILENAME 讀取參數。

這控制了 -p 參數及其相關值的添加。將此屬性設定為所需的參數值。

屬性 pre

使用 0 <= REPS <= 20 (預設:0) 輪的預訓練。

這控制了 -pre 參數及其相關值的添加。將此屬性設定為所需的參數值。

屬性 train

計算 EM 轉移機率,儲存於 FILENAME (預設:不訓練)。

此屬性控制 `-t` 參數的加入及其關聯的值。將此屬性設定為所需的參數值。

屬性 verbose

在比對時回報進度 (預設:關閉)。

此屬性控制 -verbose 參數的添加,請將此屬性視為布林值。

屬性 viterbi

使用 Viterbi 演算法產生所有配對 (自動啟用 -pairs)。

此屬性控制 -viterbi 開關的添加,將此屬性視為布林值。

類別 Bio.Align.Applications.TCoffeeCommandline(cmd='t_coffee', **kwargs)

基底類別: AbstractCommandline

TCoffee 比對程式的命令列物件。

http://www.tcoffee.org/Projects_home_page/t_coffee_home_page.html

T-Coffee 命令列工具有許多開關和選項。此封裝實作了非常有限的選項 - 如果您想協助改進,請聯繫我們。

注意

上次檢查版本:Version_6.92

參考文獻

T-Coffee:一種用於多序列比對的新方法。Notredame, Higgins, Heringa, JMB,302(205-217) 2000

範例

若要使用 ClustalW 格式輸出 (檔案 aligned.aln) 比對 FASTA 檔案 (unaligned.fasta),並使用其他預設設定,請使用

>>> from Bio.Align.Applications import TCoffeeCommandline
>>> tcoffee_cline = TCoffeeCommandline(infile="unaligned.fasta",
...                                    output="clustalw",
...                                    outfile="aligned.aln")
>>> print(tcoffee_cline)
t_coffee -output clustalw -infile unaligned.fasta -outfile aligned.aln

您通常會使用 tcoffee_cline() 或透過 Python subprocess 模組執行命令列,如 Biopython 教學中所述。

SEQ_TYPES = ['dna', 'protein', 'dna_protein']
__init__(cmd='t_coffee', **kwargs)

初始化類別。

屬性 convert

指定您想要執行檔案轉換。

此屬性控制 -convert 開關的加入,將此屬性視為布林值。

屬性 gapext

表示延伸缺口的懲罰 (負整數)。

此屬性控制 -gapext 參數的加入及其關聯值。將此屬性設定為所需的參數值。

屬性 gapopen

表示開啟缺口的懲罰 (負整數)。

此屬性控制是否加入 -gapopen 參數及其相關聯的值。請將此屬性設定為所需的參數值。

屬性 infile

指定輸入檔案。

此屬性控制 -infile 參數的加入及其關聯值。將此屬性設定為所需的參數值。

屬性 matrix

指定要使用的取代矩陣的檔案名稱。預設值:blosum62mt

此屬性控制是否加入 -matrix 參數及其相關聯的值。請將此屬性設定為所需的參數值。

屬性 mode

指定特殊模式:genome、quickaln、dali、3dcoffee

這控制了 -mode 參數及其相關值的添加。將此屬性設定為所需的參數值。

屬性 outfile

指定輸出檔案。預設值:<您的序列>.aln

此屬性控制 -outfile 參數及其關聯值的加入。請將此屬性設定為所需的參數值。

屬性 outorder

指定輸出序列的順序。可以是 ‘input’、‘aligned’ 或具有序列順序的 Fasta 檔案的 <filename>

此屬性控制 -outorder 參數及其關聯值的加入。請將此屬性設定為所需的參數值。

屬性 output

指定輸出類型。

下列其中一個 (或多個以逗號分隔):‘clustalw_aln’、‘clustalw’、‘gcg’、‘msf_aln’、‘pir_aln’、‘fasta_aln’、‘phylip’、‘pir_seq’、‘fasta_seq’

此屬性控制 -output 參數及其關聯值的加入。請將此屬性設定為所需的參數值。

屬性 quiet

關閉記錄輸出。

此屬性控制 -quiet 參數的添加,請將此屬性視為布林值。

屬性 type

指定要比對的序列類型。

此屬性控制 -type 參數及其相關值的添加。將此屬性設定為所需參數值。

類別 Bio.Align.Applications.MSAProbsCommandline(cmd='msaprobs', **kwargs)

基底類別: AbstractCommandline

MSAProbs 的命令列封裝。

http://msaprobs.sourceforge.net

注意

上次檢查版本:0.9.7

參考文獻

Yongchao Liu, Bertil Schmidt, Douglas L. Maskell: “MSAProbs: multiple sequence alignment based on pair hidden Markov models and partition function posterior probabilities”. Bioinformatics, 2010, 26(16): 1958 -1964

範例

>>> from Bio.Align.Applications import MSAProbsCommandline
>>> in_file = "unaligned.fasta"
>>> out_file = "aligned.cla"
>>> cline = MSAProbsCommandline(infile=in_file, outfile=out_file, clustalw=True)
>>> print(cline)
msaprobs -o aligned.cla -clustalw unaligned.fasta

您通常會使用 cline() 或透過 Python subprocess 模組執行命令列,如 Biopython 教學中所述。

__init__(cmd='msaprobs', **kwargs)

初始化類別。

屬性 alignment_order

以比對順序而非輸入順序印出序列 (預設:關閉)。

此屬性控制 -a 開關的加入,請將此屬性視為布林值。

屬性 annot

將多重比對的註解寫入 FILENAME。

這控制了 -annot 參數及其關聯值的加入。將此屬性設定為所需的參數值。

屬性 clustalw

使用 CLUSTALW 輸出格式而非 FASTA 格式。

此屬性控制 -clustalw 開關的加入,請將此屬性視為布林值。

屬性 consistency

使用 0 <= REPS <= 5 (預設:2) 次一致性轉換。

這控制了 -c 參數及其相關值的添加。將此屬性設定為所需的參數值。

屬性 infile

多序列輸入檔案

這控制了 infile 參數及其相關值的添加。將此屬性設定為所需的參數值。

屬性 iterative_refinement

使用 0 <= REPS <= 1000 (預設:10) 次迭代改進。

這控制了 -ir 參數及其相關值的添加。將此屬性設定為所需的參數值。

屬性 numthreads

指定使用的執行緒數,否則自動偵測。

這控制了 -num_threads 參數及其相關值的添加。將此屬性設定為所需的參數值。

屬性 outfile

指定輸出檔案名稱 (預設為 STDOUT)。

此屬性控制 `-o` 參數的加入及其關聯的值。將此屬性設定為所需的參數值。

屬性 verbose

在比對時回報進度 (預設:關閉)。

此屬性控制 `-v` 開關的加入,將此屬性視為布林值。

屬性 version

印出 MSAPROBS 的版本。

這控制了 -version 參數及其相關值的添加。將此屬性設定為所需的參數值。