Bio.Phylo.Applications 套件

模組內容

系統發生學命令行工具包裝器 (已過時)。

我們已決定在未來移除此模組,並建議直接透過 subprocess 模組建立您的命令並調用它。

class Bio.Phylo.Applications.PhymlCommandline(cmd='phyml', **kwargs)

基底類別:AbstractCommandline

樹狀推論程式 PhyML 的命令列包裝器。

首頁:http://www.atgc-montpellier.fr/phyml

參考文獻

Guindon S, Gascuel O. A simple, fast, and accurate algorithm to estimate large phylogenies by maximum likelihood. Systematic Biology, 2003 Oct;52(5):696-704. PubMed PMID: 14530136.

Guindon S, Dufayard JF, Lefort V, Anisimova M, Hordijk W, Gascuel O. New Algorithms and Methods to Estimate Maximum-Likelihood Phylogenies: Assessing the Performance of PhyML 3.0. Systematic Biology, 2010 59(3):307-21.

__init__(cmd='phyml', **kwargs)

初始化類別。

property alpha

伽瑪分佈形狀參數的分佈。

可以是固定的正值,或是 ‘e’ 以取得最大概似估計值。

這會控制 -a 參數及其關聯值的加入。將此屬性設定為所需的引數值。

property bootstrap

bootstrap 複本的數量,如果值 > 0。

否則

0:不計算近似概似比檢定或 bootstrap 值。

-1:近似概似比檢定會傳回 aLRT 統計值。

-2:近似概似比檢定會傳回基於卡方值的參數分支支持度。

-4:僅 SH 類型的分支支持度。

這會控制 -b 參數及其關聯值的加入。將此屬性設定為所需的引數值。

property datatype

資料類型:核苷酸的 ‘nt’ (預設值) 或胺基酸的 ‘aa’。

這會控制 -d 參數及其關聯值的加入。將此屬性設定為所需的引數值。

property frequencies

字元頻率。

-f e, m 或 “fA fC fG fT”

e:經驗頻率,計算方式如下

  • 核苷酸序列:(經驗) 平衡鹼基頻率是透過計算比對中不同鹼基的出現次數來估計。

  • 胺基酸序列:(經驗) 平衡胺基酸頻率是透過計算比對中不同胺基酸的出現次數來估計。

m:ML/模型頻率,計算方式如下

  • 核苷酸序列:(ML) 平衡鹼基頻率是使用最大概似估計。

  • 胺基酸序列:(模型) 平衡胺基酸頻率是使用取代模型定義的頻率來估計。

“fA fC fG fT”:僅對以核苷酸為基礎的模型有效。fA、fC、fG 和 fT 是對應於 A、C、G 和 T 頻率的浮點數。

這會控制 -f 參數及其關聯值的加入。將此屬性設定為所需的引數值。

property input

PHYLIP 格式的輸入核苷酸或胺基酸序列檔名。

這會控制 -i 參數及其關聯值的加入。將此屬性設定為所需的引數值。

property input_tree

起始樹狀圖檔名。樹狀圖必須採用 Newick 格式。

這會控制 -u 參數及其關聯值的加入。將此屬性設定為所需的引數值。

property model

取代模型名稱。

以核苷酸為基礎的模型

HKY85 (預設值) | JC69 | K80 | F81 | F84 | TN93 | GTR | 自訂

對於自訂選項,一個六位數的字串會識別該模型。例如,000000 對應於 F81 (或 JC69,如果核苷酸頻率的分佈是均勻的)。012345 對應於 GTR。此選項可用於編碼任何嵌套在 GTR 中的模型。

以胺基酸為基礎的模型

LG (預設值) | WAG | JTT | MtREV | Dayhoff | DCMut | RtREV | CpREV | VT | Blosum62 | MtMam | MtArt | HIVw | HIVb | 自訂

這會控制 -m 參數及其關聯值的加入。將此屬性設定為所需的引數值。

property multiple

要分析的資料集數量 (整數)。

這會控制 -n 參數及其關聯值的加入。將此屬性設定為所需的引數值。

property n_rand_starts

要使用的初始隨機樹狀圖數量。

僅在要執行 SPR 搜尋時有效。

這會控制 –n_rand_starts 參數及其關聯值的加入。將此屬性設定為所需的引數值。

property nclasses

相對取代率類別的數量。

預設值為 1。必須是正整數。

這會控制 -c 參數及其關聯值的加入。將此屬性設定為所需的引數值。

property optimize

特定參數最佳化。

tlr:最佳化樹狀圖拓撲 (t)、分支長度 (l) 和速率參數 (r)。

tl:最佳化樹狀圖拓撲和分支長度。

lr:最佳化分支長度和速率參數。

l:最佳化分支長度。

r:最佳化速率參數。

n:不最佳化任何參數。

這會控制 -o 參數及其關聯值的加入。將此屬性設定為所需的引數值。

property pars

使用最小簡約起始樹狀圖。

當沒有 ‘-u’ 選項且要進行樹狀圖拓撲修改時,會考慮此選項。

此屬性會控制 -p 開關的加入,將此屬性視為布林值。

property print_site_lnl

在檔案 *_phyml_lk.txt 中列印每個位點的概似值。

此屬性會控制 –print_site_lnl 開關的加入,將此屬性視為布林值。

property print_trace

在檔案 *_phyml_trace.txt 中列印樹狀圖搜尋過程中探索的每個系統發生樹。

此屬性會控制 –print_trace 開關的加入,將此屬性視為布林值。

property prop_invar

不變位點的比例。

可以是 [0,1] 範圍內的固定值,或是 ‘e’ 以取得最大概似估計值。

這會控制 -v 參數及其關聯值的加入。將此屬性設定為所需的引數值。

屬性 quiet

不顯示互動式問題(用於批次模式)。

此屬性控制是否加入 –quiet 開關,請將此屬性視為布林值。

屬性 r_seed

用於初始化隨機數產生器的種子。

必須為整數。

此屬性控制是否加入 –r_seed 參數及其相關的值。請將此屬性設定為所需的參數值。

屬性 rand_start

將初始樹設定為隨機。

僅在要執行 SPR 搜尋時有效。

此屬性控制是否加入 –rand_start 開關,請將此屬性視為布林值。

屬性 run_id

將給定的字串附加到每個 PhyML 輸出檔的末尾。

當執行涉及 PhyML 的模擬時,此選項可能很有用。

此屬性控制是否加入 –run_id 參數及其相關的值。請將此屬性設定為所需的參數值。

屬性 search

樹狀拓樸搜尋操作選項。

可以是以下其中之一:

NNI:預設值,快速

SPR:比 NNI 稍慢

BEST:NNI 和 SPR 搜尋的最佳結果

此屬性控制是否加入 -s 參數及其相關的值。請將此屬性設定為所需的參數值。

屬性 sequential

將交錯格式(預設)更改為循序格式。

此屬性控制是否加入 -q 開關,請將此屬性視為布林值。

屬性 ts_tv_ratio

轉變/轉換比率。(僅適用於 DNA 序列。)

可以是固定的正值(例如:4.0)或 e,以取得最大概似估計。

此屬性控制是否加入 -t 參數及其相關的值。請將此屬性設定為所需的參數值。

類別 Bio.Phylo.Applications.RaxmlCommandline(cmd='raxmlHPC', **kwargs)

基底類別:AbstractCommandline

樹狀推論程式 RAxML 的命令列包裝函式。

必要的參數為 'sequences' (-s)、'model' (-m) 和 'name' (-n)。參數 'parsimony_seed' (-p) 也必須針對 RAxML 設定,但如果您未指定,此包裝函式會將種子設定為 10000。

參考文獻

Stamatakis A. RAxML-VI-HPC:使用數千個分類單元和混合模型的最大概似式系統發育分析。生物資訊學 2006,22(21):2688-2690。

首頁:http://sco.h-its.org/exelixis/software.html

範例

>>> from Bio.Phylo.Applications import RaxmlCommandline
>>> raxml_cline = RaxmlCommandline(sequences="Tests/Phylip/interlaced2.phy",
...                                model="PROTCATWAG", name="interlaced2")
>>> print(raxml_cline)
raxmlHPC -m PROTCATWAG -n interlaced2 -p 10000 -s Tests/Phylip/interlaced2.phy

您通常會使用 raxml_cline() 或透過 Python subprocess 模組執行命令列,如 Biopython 教學中所述。

__init__(cmd='raxmlHPC', **kwargs)

初始化類別。

屬性 parsimony_seed

簡約推論的隨機數種子。這可讓您重現結果,並有助於開發人員偵錯程式。此選項在平行 MPI 版本中無效。

此屬性控制是否加入 -p 參數及其相關的值。請將此屬性設定為所需的參數值。

屬性 algorithm

選取演算法

a:在一個程式執行中快速執行 Bootstrap 分析並搜尋最佳評分的 ML 樹。

b:根據檔案中由 '-z' 指定的多個樹狀圖(例如,形成 bootstrap),在以 '-t' 提供的樹狀圖上繪製二分區資訊。

c:檢查 RAxML 是否能正確讀取比對。

d:新的快速爬山演算法(預設)。

e:僅在 GAMMA/GAMMAI 下針對給定的輸入樹狀圖最佳化模型 + 分支長度。

g:計算透過 '-z' 傳遞的一個或多個樹狀圖的每個位置對數概似值,並將其寫入可由 CONSEL 讀取的檔案。

h:計算透過 '-t' 傳遞的最佳樹狀圖與透過 '-z' 傳遞的一組其他樹狀圖之間的對數概似檢定 (SH 檢定)。

i:執行非常徹底的 Bootstrap、在 GAMMA 下最終 Bootstrap 樹狀圖的精簡,以及更詳盡的演算法。

j:從原始比對檔案產生一組 Bootstrap 比對檔案。

m:比較透過 '-t' 和 '-z' 分別傳遞的兩組樹狀圖之間的二分區。這會傳回兩個樹狀圖檔案中找到的所有二分區之間的 Pearson 相關性。將列印名為 RAxML_bipartitionFrequencies.outputFileName 的檔案,其中包含兩組的成對二分區頻率。

n:計算在 GAMMA 或 GAMMA+P-Invar 下透過 '-z' 提供的樹狀圖檔案中所包含的所有樹狀圖的對數概似分數。

o:舊且較慢的快速爬山演算法。

p:對不完整的起始樹狀圖執行新序列的純逐步 MP 新增。

s:將多基因分割比對分割為各自的子比對。

t:在一個固定的起始樹狀圖上執行隨機化的樹狀圖搜尋。

w:計算透過 '-z' 傳遞的一組樹狀圖的 ELW 檢定。

x:計算成對 ML 距離,ML 模型參數會在 MP 起始樹狀圖或透過 '-t' 傳遞的使用者定義樹狀圖上進行估計,僅允許使用基於 GAMMA 的異質性速率模型。

這會控制 -f 參數及其關聯值的加入。將此屬性設定為所需的引數值。

屬性 binary_constraint

二元限制樹狀圖的檔案名稱。此樹狀圖不需要全面,也就是說,不需要包含所有分類單元。

此屬性控制是否加入 -r 參數及其相關的值。請將此屬性設定為所需的參數值。

屬性 bipartition_filename

包含多個樹狀圖的檔案名稱,例如,來自 Bootstrap 執行,該檔案將用於將二分區值繪製到透過 '-t' 提供的樹狀圖上。它也可以與 '-f g' 結合使用以計算每個位置的對數概似值,並讀取一組樹狀圖以用於其他幾個選項('-f h'、'-f m'、'-f n')。

此屬性控制是否加入 -z 參數及其相關的值。請將此屬性設定為所需的參數值。

屬性 bootstrap_branch_lengths

列印具有分支長度的 Bootstrap 樹狀圖。Bootstrap 執行時間會稍長,因為模型參數會在每次執行的結尾進行最佳化。與 CATMIX/PROTMIX 或 GAMMA/GAMMAI 搭配使用。

此屬性控制是否加入 -k 開關,請將此屬性視為布林值。

屬性 bootstrap_seed

Bootstrap 的隨機種子。

這會控制 -b 參數及其關聯值的加入。將此屬性設定為所需的引數值。

屬性 checkpoints

寫入檢查點(中間樹狀圖拓樸)。

此屬性控制是否加入 -j 開關,請將此屬性視為布林值。

屬性 cluster_threshold

序列相似性叢集化的臨界值。然後,RAxML 會將比對列印到名為 sequenceFileName.reducedBy.threshold 的檔案,其中僅包含 <= 指定臨界值的序列,該臨界值必須介於 0.0 和 1.0 之間。RAxML 使用 QT 叢集演算法來執行此任務。此外,會寫入名為 RAxML_reducedList.outputFileName 的檔案,其中包含叢集資訊。

此屬性控制是否加入 -l 參數及其相關的值。請將此屬性設定為所需的參數值。

屬性 cluster_threshold_fast

與 '-l' 相同的功能,但使用較少詳盡、因此更快的叢集演算法。這適用於超過 20,000-30,000 個序列的大型資料集。

此屬性控制是否加入 -L 參數及其相關的值。請將此屬性設定為所需的參數值。

屬性 epsilon

設定 MIX/MIXI 或 GAMMA/GAMMAI 模型下,在最終樹狀拓樸最佳化時,以對數概似單位表示的模型最佳化精確度。預設值:對於未使用不變位點比例估計的模型為 0.1;對於使用不變位點比例估計的模型為 0.001。

此選項控制 -e 參數及其關聯值的加入。將此屬性設定為所需的參數值。

property exclude_filename

排除檔案名稱,其中包含您要排除的比對位置規格。格式類似於 Nexus,檔案應包含如「100-200 300-400」之類的條目;若要排除單一欄位,請寫入「100-100」。如果您使用混合模型,將會寫入適當調整後的模型檔案。

此選項控制 -E 參數及其關聯值的加入。將此屬性設定為所需的參數值。

property grouping_constraint

多分支限制樹的檔案名稱。此樹不需要是全面的,即包含所有分類群。

此選項控制 -g 參數及其關聯值的加入。將此屬性設定為所需的參數值。

property model

核苷酸或胺基酸替換模型

核苷酸

GTRCAT:GTR + 替換率最佳化 + 位點特定演化速率最佳化,這些速率會分類為 numberOfCategories 個不同的速率類別,以便在您使用「-#」或「-N」執行多重分析但不進行自助法時,提高計算效率,程式會改用 GTRMIX

GTRGAMMA:GTR + 替換率最佳化 + 速率異質性的 GAMMA 模型(將會估計 alpha 參數)

GTRMIX:在 GTRCAT 下推斷樹狀圖,然後在 GTRGAMMA 下評估最終的樹狀拓樸

GTRCAT_GAMMA:使用位點特定演化速率推斷樹狀圖。但是,此處的速率使用 4 個離散的 GAMMA 速率進行分類。在 GTRGAMMA 下評估最終的樹狀拓樸

GTRGAMMAI:與 GTRGAMMA 相同,但會估計不變位點的比例

GTRMIXI:與 GTRMIX 相同,但會估計不變位點的比例

GTRCAT_GAMMAI:與 GTRCAT_GAMMA 相同,但會估計不變位點的比例

胺基酸

PROTCATmatrixName[F]:指定的 AA 矩陣 + 替換率最佳化 + 位點特定演化速率最佳化,這些速率會分類為 numberOfCategories 個不同的速率類別,以便在您使用「-#」或「-N」執行多重分析但不進行自助法時,提高計算效率,程式會改用 PROTMIX…

PROTGAMMAmatrixName[F]:指定的 AA 矩陣 + 替換率最佳化 + 速率異質性的 GAMMA 模型(將會估計 alpha 參數)

PROTMIXmatrixName[F]:在指定的 AA 矩陣 + CAT 下推斷樹狀圖,然後在指定的 AA 矩陣 + GAMMA 下評估最終的樹狀拓樸

PROTCAT_GAMMAmatrixName[F]:在指定的 AA 矩陣和位點特定演化速率下推斷樹狀圖。但是,此處的速率使用 4 個離散的 GAMMA 速率進行分類。在指定的 AA 矩陣 + GAMMA 下評估最終的樹狀拓樸

PROTGAMMAImatrixName[F]:與 PROTGAMMAmatrixName[F] 相同,但會估計不變位點的比例

PROTMIXImatrixName[F]:與 PROTMIXmatrixName[F] 相同,但會估計不變位點的比例

PROTCAT_GAMMAImatrixName[F]:與 PROTCAT_GAMMAmatrixName[F] 相同,但會估計不變位點的比例

可用的 AA 替換模型:DAYHOFF、DCMUT、JTT、MTREV、WAG、RTREV、CPREV、VT、BLOSUM62、MTMAM、GTR。使用可選的「F」附錄,您可以指定是否要使用經驗基本頻率。請注意,對於混合模型,您還可以額外在混合模型檔案中指定每個基因的 AA 模型(詳細資訊請參閱手冊)

這會控制 -m 參數及其關聯值的加入。將此屬性設定為所需的引數值。

property name

輸出檔案中使用的名稱。

這會控制 -n 參數及其關聯值的加入。將此屬性設定為所需的引數值。

property num_bootstrap_searches

每個重複的多次自助法搜尋次數。使用此選項可為每個重複取得更好的 ML 樹。預設值:每個自助法重複 1 次 ML 搜尋。

這會控制 -u 參數及其關聯值的加入。將此屬性設定為所需的引數值。

property num_categories

當演化模型設定為 GTRCAT 或 GTRMIX 時,RAxML 的不同速率類別數。個別的每個位點速率會分類為這麼多速率類別,以加速計算。預設值:25。

這會控制 -c 參數及其關聯值的加入。將此屬性設定為所需的引數值。

property num_replicates

在不同的起始樹上執行替代運算的次數。與「-b」選項結合使用,將會調用多重自助法分析。預設值:1 次單一分析。請注意,由於「-#」有時會導致某些 MPI 作業提交系統出現問題,因為「-#」通常用於開始註解,因此已新增「-N」作為替代選項。

此選項控制 -N 參數及其關聯值的加入。將此屬性設定為所需的參數值。

property outgroup

單一外群或以逗號分隔的外群清單的名稱,例如「-o Rat」或「-o Rat,Mouse」。如果多個外群不是單系的,則會選取清單中的第一個名稱作為外群。分類群名稱之間不要留空格!

這會控制 -o 參數及其關聯值的加入。將此屬性設定為所需的引數值。

property parsimony

僅計算簡約起始樹,然後結束。

此屬性控制 -y 開關的加入,將此屬性視為布林值。

property partition_branch_lengths

開啟每個分割區分支長度的個別估計。僅在與「partition_filename」(「-q」)組合使用時才有效。個別分割區的分支長度將會列印到不同的檔案。分支長度的加權平均值會使用各自的分割區長度來計算。

此屬性控制 -M 開關的加入,將此屬性視為布林值。

property partition_filename

包含替換的多個模型的模型分配給比對分割區的檔案名稱。有關此檔案的語法,請參閱 RAxML 手冊。

此選項控制 -q 參數及其關聯值的加入。將此屬性設定為所需的參數值。

property protein_model

使用者定義的 AA(蛋白質)替換模型的檔案名稱。此檔案必須包含 420 個條目,前 400 個是 AA 替換率(這必須是對稱矩陣),最後 20 個是經驗基本頻率。

此選項控制 -P 參數及其關聯值的加入。將此屬性設定為所需的參數值。

property random_starting_tree

從隨機起始樹開始 ML 最佳化。

此屬性控制 -d 開關的加入,將此屬性視為布林值。

property rapid_bootstrap_seed

快速自助法的隨機種子。

此選項控制 -x 參數及其關聯值的加入。將此屬性設定為所需的參數值。

property rearrangements

後續應用拓樸變更階段的初始重排設定。

這會控制 -i 參數及其關聯值的加入。將此屬性設定為所需的引數值。

property sequences

PHYLIP 格式的比對資料檔案名稱。

此屬性控制是否加入 -s 參數及其相關的值。請將此屬性設定為所需的參數值。

property starting_tree

Newick 格式的使用者起始樹的檔案名稱。

此屬性控制是否加入 -t 參數及其相關的值。請將此屬性設定為所需的參數值。

property threads

要執行的執行緒數。僅限 PTHREADS 版本!請確保將此設定為最多為您機器上的 CPU 數,否則效能將大幅降低!

此選項控制 -T 參數及其關聯值的加入。將此屬性設定為所需的參數值。

property version

顯示版本資訊。

此屬性控制 -v 開關的加入,將此屬性視為布林值。

property weight_filename

欄位權重檔案的名稱,可為比對的每個欄位指定個別的權重。這些權重必須是整數,以任何類型和數量的空格分隔在單獨的檔案中。

這會控制 -a 參數及其關聯值的加入。將此屬性設定為所需的引數值。

property working_dir

RAxML 將寫入其輸出檔案的工作目錄名稱。預設值:目前目錄。

此選項控制 -w 參數及其關聯值的加入。將此屬性設定為所需的參數值。

class Bio.Phylo.Applications.FastTreeCommandline(cmd='fasttree', **kwargs)

基底類別:AbstractCommandline

FastTree 的命令列包裝器。

只有 inputout 參數是必須的。

從終端機命令列使用 fasttree.exe -helpfasttree.exe -expert 來取得更多使用選項的說明。

首頁:http://www.microbesonline.org/fasttree/

參考文獻

Price, M.N., Dehal, P.S., 和 Arkin, A.P. (2010) FastTree 2 – Approximately Maximum-Likelihood Trees for Large Alignments. PLoS ONE, 5(3):e9490. https://doi.org/10.1371/journal.pone.0009490

範例

這是一個在 Windows 上的範例

import _Fasttree
fasttree_exe = r"C:\FasttreeWin32\fasttree.exe"
cmd = _Fasttree.FastTreeCommandline(fasttree_exe,
...                                     input=r'C:\Input\ExampleAlignment.fsa',
...                                     out=r'C:\Output\ExampleTree.tree')
print(cmd)
out, err = cmd()
print(out)
print(err)
__init__(cmd='fasttree', **kwargs)

初始化類別。

property bionj

加入選項:如同 BIONJ 中加權的加入。

FastTree 也會在 NNI 期間加權加入。

這個屬性控制 -bionj 開關的添加,將此屬性視為布林值。

property boot

指定支持值重新取樣的次數。

支持值選項:預設情況下,FastTree 通過對位點似然值進行 1,000 次重新取樣和 Shimodaira Hasegawa 檢定來計算局部支持值。如果您指定 -nome,它會改為計算最小進化自舉支持。無論哪種情況,支持值都是從 0 到 1 的比例。

使用 -nosupport 關閉支持值,或使用 -boot 100 僅使用 100 次重新取樣。

這控制了 -boot 參數及其相關值的添加。將此屬性設定為所需的參數值。

property cat

最大似然模型選項。

指定位點的速率類別數量(預設為 20)。

這控制了 -cat 參數及其相關值的添加。將此屬性設定為所需的參數值。

property close

修改頂級命中列表的關閉啟發式。

頂級命中啟發式:預設情況下,FastTree 使用頂級命中列表來加速搜尋 -close 0.75 – 修改關閉啟發式,較低的值更保守。

這控制了 -close 參數及其相關值的添加。將此屬性設定為所需的參數值。

property constraintWeight

在拓樸搜尋中約束強度的權重。

受約束的拓樸搜尋選項:-constraintWeight – 如何強力地權衡約束。值 1 表示違反約束的樹長度懲罰為 1。預設值:100.0

這控制了 -constraintWeight 參數及其相關值的添加。將此屬性設定為所需的參數值。

property constraints

指定一個對齊檔案,用於受約束的拓樸搜尋

受約束的拓樸搜尋選項:-constraints alignmentfile – 一個對齊,值為 0、1 和 -。並非所有序列都需要存在。0 和 1 的列定義了一個受約束的分割。一些約束可能會被違反(請參閱標準錯誤中的「違反約束:」)。

這控制了 -constraints 參數及其相關值的添加。將此屬性設定為所需的參數值。

property expert

顯示專家級別的說明。

這個屬性控制 -expert 開關的添加,將此屬性視為布林值。

property fastest

僅搜尋可見集合(每個節點的頂級命中)。

搜尋最佳加入:預設情況下,FastTree 將快速鄰接法的「可見集合」與局部爬坡相結合,如鬆弛的鄰接法 -fastest – 僅搜尋可見集合(每個節點的頂級命中)。與原始的快速鄰接法不同,如果 join(AB,C) 比 join(C,visible(C)) 更好,-fastest 會在加入 A 和 B 後更新 visible(C) 。-fastest 也會以非常惰性的方式更新輸出距離,-fastest 也會設定 -2nd,使用 -fastest -no2nd 來避免這種情況。

這個屬性控制 -fastest 開關的添加,將此屬性視為布林值。

property gamma

報告離散 gamma 模型下的似然值。

最大似然模型選項:-gamma – 在使用 CAT 模型優化分支長度的最後一輪之後,報告具有相同類別數量的離散 gamma 模型下的似然值。FastTree 使用相同的分支長度,但優化 gamma 形狀參數和長度的比例。最後的樹將會重新調整長度。與 -log 一起使用,這也會產生每個位點的似然值,以便與 CONSEL 一起使用,請參閱 GammaLogToPaup.pl 以及 FastTree 網站上的文件。

這個屬性控制 -gamma 開關的添加,將此屬性視為布林值。

property gtr

最大似然模型選項。

使用廣義時間可逆模型而不是(預設)Jukes-Cantor(僅限 nt)

這個屬性控制 -gtr 開關的添加,將此屬性視為布林值。

property gtrfreq

-gtrfreq A C G T

這控制了 -gtrfreq 參數及其相關值的添加。將此屬性設定為所需的參數值。

property gtrrates

-gtrrates ac ag at cg ct gt

這控制了 -gtrrates 參數及其相關值的添加。將此屬性設定為所需的參數值。

property help

顯示說明。

這個屬性控制 -help 開關的添加,將此屬性視為布林值。

property input

輸入 <輸入檔案>

需要 fasta 或 phylip 格式的序列比對輸入檔案。預設情況下,FastTree 預期為蛋白質比對,使用 -nt 來表示核苷酸。

這控制了 input 參數及其相關值的添加。將此屬性設定為所需的參數值。

property intree

-intree newickfile – 從 newickfile 讀取起始樹。

起始樹中的任何分支長度都會被忽略。具有 -n 的 -intree 將為每個比對讀取單獨的起始樹。

這控制了 -intree 參數及其相關值的添加。將此屬性設定為所需的參數值。

property intree1

intree1 newickfile – 為每個比對讀取相同的起始樹。

這控制了 -intree1 參數及其相關值的添加。將此屬性設定為所需的參數值。

property log

建立資料的日誌檔案,例如中間樹和每個位點的速率

-log logfile – 儲存中間樹,以便您可以提取樹並在崩潰時重新啟動長時間執行的作業 -log 也會報告每個位點的速率(1 表示最慢的類別)。

這控制了 -log 參數及其相關值的添加。將此屬性設定為所需的參數值。

property makematrix

-makematrix [對齊]

這控制了 -makematrix 參數及其相關值的添加。將此屬性設定為所需的參數值。

property matrix

指定核苷酸或胺基酸距離的矩陣

距離:預設值:對於蛋白質序列,對數校正的距離和從 BLOSUM45 導出的胺基酸不相似矩陣,或對於核苷酸序列,Jukes-Cantor 距離。若要指定不同的矩陣,請使用 -matrix FilePrefix 或 -nomatrix

這控制了 -matrix 參數及其相關值的添加。將此屬性設定為所需的參數值。

property mlacc

在每個 NNI 中優化分支的選項。

拓撲結構精煉:預設情況下,FastTree 會嘗試使用最多 4*log2(N) 輪的最小演化最近鄰交換 (NNI) 來改善樹狀結構,其中 N 是唯一序列的數量,以及 2 輪的子樹修剪再嫁接 (SPR) 移動(也是最小演化),以及最多 2*log(N) 輪的最大似然 NNI。使用 -nni 設定最小演化 NNI 的輪數,使用 -spr 設定 SPR 的輪數。使用 -mlacc 2 或 -mlacc 3 以在每次 NNI 時始終優化所有 5 個分支,並在 2 或 3 輪中優化所有 5 個分支。

這控制了 -mlacc 參數的添加及其相關值。將此屬性設定為所需的參數值。

property mllen

在固定的拓撲結構上優化分支長度。

拓撲結構精煉:預設情況下,FastTree 會嘗試使用最多 4*log2(N) 輪的最小演化最近鄰交換 (NNI) 來改善樹狀結構,其中 N 是唯一序列的數量,以及 2 輪的子樹修剪再嫁接 (SPR) 移動(也是最小演化),以及最多 2*log(N) 輪的最大似然 NNI。使用 -nni 設定最小演化 NNI 的輪數,使用 -spr 設定 SPR 的輪數。使用 -mllen 在沒有 ML NNI 的情況下優化分支長度。使用 -mllen -nome 和 -intree 在固定的拓撲結構上優化分支長度。

此屬性控制 -mllen 開關的添加,將此屬性視為布林值。

property mlnni

設定最大似然 NNI 的輪數。

拓撲結構精煉:預設情況下,FastTree 會嘗試使用最多 4*log2(N) 輪的最小演化最近鄰交換 (NNI) 來改善樹狀結構,其中 N 是唯一序列的數量,以及 2 輪的子樹修剪再嫁接 (SPR) 移動(也是最小演化),以及最多 2*log(N) 輪的最大似然 NNI。使用 -nni 設定最小演化 NNI 的輪數,使用 -spr 設定 SPR 的輪數。使用 -mlnni 設定最大似然 NNI 的輪數。

這控制了 -mlnni 參數的添加及其相關值。將此屬性設定為所需的參數值。

property n

-n – 讀取 N 個多重序列比對。

這僅適用於 phylip 交錯格式。例如,您可以將其與 phylip 的 seqboot 的輸出一起使用。如果您使用 -n,FastTree 將在標準輸出中每行寫入 1 個樹狀結構。

這會控制 -n 參數及其關聯值的加入。將此屬性設定為所需的引數值。

property nj

加入選項:常規(未加權)鄰居連接(預設)。

此屬性控制 -nj 開關的添加,將此屬性視為布林值。

property nni

設定最小演化最近鄰交換的輪數。

拓撲結構精煉:預設情況下,FastTree 會嘗試使用最多 4*log2(N) 輪的最小演化最近鄰交換 (NNI) 來改善樹狀結構,其中 N 是唯一序列的數量,以及 2 輪的子樹修剪再嫁接 (SPR) 移動(也是最小演化),以及最多 2*log(N) 輪的最大似然 NNI。使用 -nni 設定最小演化 NNI 的輪數。

這控制了 -nni 參數的添加及其相關值。將此屬性設定為所需的參數值。

property no2nd

關閉第二級熱門搜尋啟發式演算法。

熱門搜尋啟發式演算法:預設情況下,FastTree 使用熱門搜尋列表來加速搜尋。使用 -notop(或 -slow)關閉此功能,並比較所有葉子與彼此,以及所有新加入的節點與彼此。

-2nd 或 -no2nd 開啟或關閉第二級熱門搜尋啟發式演算法。這會減少記憶體使用量和執行時間,但可能會導致樹狀結構品質略有下降。(預設情況下,-fastest 會開啟 -2nd。)

此屬性控制 -no2nd 開關的添加,將此屬性視為布林值。

property nocat

最大似然模型選項:無 CAT 模型(僅 1 個類別)。

此屬性控制 -nocat 開關的添加,將此屬性視為布林值。

property nomatrix

指定不應將矩陣用於核苷酸或胺基酸距離。

距離:預設值:對於蛋白質序列,對數校正的距離和從 BLOSUM45 導出的胺基酸不相似矩陣,或對於核苷酸序列,Jukes-Cantor 距離。若要指定不同的矩陣,請使用 -matrix FilePrefix 或 -nomatrix

此屬性控制 -nomatrix 開關的添加,將此屬性視為布林值。

property nome

將支持值計算變更為最小演化自助法。

拓撲結構精煉:預設情況下,FastTree 會嘗試使用最多 4*log2(N) 輪的最小演化最近鄰交換 (NNI) 來改善樹狀結構,其中 N 是唯一序列的數量,以及 2 輪的子樹修剪再嫁接 (SPR) 移動(也是最小演化),以及最多 2*log(N) 輪的最大似然 NNI。使用 -nni 設定最小演化 NNI 的輪數,使用 -spr 設定 SPR 的輪數。使用 -mllen 在沒有 ML NNI 的情況下優化分支長度。使用 -mllen -nome 和 -intree 在固定的拓撲結構上優化分支長度。

支持值選項:預設情況下,FastTree 會透過對位點似然性進行 1,000 次重採樣以及 Shimodaira Hasegawa 測試來計算局部支持值。如果您指定 -nome,它將改為計算最小演化自助法支持。在任何一種情況下,支持值都是介於 0 到 1 之間的比例。

此屬性控制 -nome 開關的添加,將此屬性視為布林值。

property noml

停用最小演化 NNI 和 SPR。

拓撲結構精煉:預設情況下,FastTree 會嘗試使用最多 4*log2(N) 輪的最小演化最近鄰交換 (NNI) 來改善樹狀結構,其中 N 是唯一序列的數量,以及 2 輪的子樹修剪再嫁接 (SPR) 移動(也是最小演化),以及最多 2*log(N) 輪的最大似然 NNI。使用 -nni 設定最小演化 NNI 的輪數,使用 -spr 設定 SPR 的輪數。使用 -noml 關閉最小演化 NNI 和 SPR(如果使用進一步的 NNI 精煉近似最大似然樹狀結構,則很有用)。

此屬性控制 -noml 開關的添加,將此屬性視為布林值。

property nopr

-nopr – 請勿將進度指示器寫入 stderr。

此屬性控制 -nopr 開關的添加,將此屬性視為布林值。

property nosupport

關閉支持值。

支持值選項:預設情況下,FastTree 通過對位點似然值進行 1,000 次重新取樣和 Shimodaira Hasegawa 檢定來計算局部支持值。如果您指定 -nome,它會改為計算最小進化自舉支持。無論哪種情況,支持值都是從 0 到 1 的比例。

使用 -nosupport 關閉支持值,或使用 -boot 100 僅使用 100 次重新取樣。

此屬性控制 -nosupport 開關的添加,將此屬性視為布林值。

property notop

關閉熱門搜尋列表以加速搜尋。

熱門搜尋啟發式演算法:預設情況下,FastTree 使用熱門搜尋列表來加速搜尋。使用 -notop(或 -slow)關閉此功能,並比較所有葉子與彼此,以及所有新加入的節點與彼此。

此屬性控制 -notop 開關的添加,將此屬性視為布林值。

property nt

預設情況下,FastTree 預期為蛋白質比對,使用 -nt 表示核苷酸。

此屬性控制 -nt 開關的添加,將此屬性視為布林值。

property out

輸入 <輸出檔案>。

需要指定 Newick 樹狀結構輸出檔案的路徑。

這控制了 -out 參數的添加及其相關值。將此屬性設定為所需的參數值。

property pseudo

-pseudo [權重] – 假計數用於序列距離估計。

使用假計數來估計重疊很少或沒有重疊的序列之間的距離。(預設為關閉。)如果分析的比對具有很少或沒有重疊的序列,則建議使用。如果未指定權重,則為 1.0。

這控制了 -pseudo 參數的添加及其相關值。將此屬性設定為所需的參數值。

property quiet

-quiet – 在正常操作期間不要寫入標準錯誤。

(沒有進度指示器、沒有選項摘要、沒有似然值等)

此屬性控制 -quiet 開關的添加,將此屬性視為布林值。

property quote

-quote – 在輸出中新增序列名稱的引號。

在輸出中引用序列名稱,並允許其中包含空格、逗號、括號和冒號,但不允許使用「'」字元(僅限 fasta 檔案)。

此屬性控制 -quote 開關的添加,將此屬性視為布林值。

property rawdist

關閉或調整 AA 或 NT 距離中的對數校正。

使用 -rawdist 關閉對數校正,或在 AA 或 NT 距離中使用 %不同而非 Jukes-Cantor。

距離:預設值:對於蛋白質序列,對數校正的距離和從 BLOSUM45 導出的胺基酸不相似矩陣,或對於核苷酸序列,Jukes-Cantor 距離。若要指定不同的矩陣,請使用 -matrix FilePrefix 或 -nomatrix

此屬性控制 -rawdist 開關的添加,將此屬性視為布林值。

property refresh

用於比較加入節點與其他節點的條件的參數。

頂級命中啟發法:預設情況下,FastTree 使用頂級命中列表來加速搜尋 -refresh 0.8 – 如果連接節點的頂級命中列表小於所需長度的 80%,或頂級命中列表的時效等於或大於 log2(m),則將其與所有其他節點比較。

此設定控制 -refresh 參數的加入及其相關的值。將此屬性設定為所需參數值。

property second

開啟第二層頂級命中啟發法。

熱門搜尋啟發式演算法:預設情況下,FastTree 使用熱門搜尋列表來加速搜尋。使用 -notop(或 -slow)關閉此功能,並比較所有葉子與彼此,以及所有新加入的節點與彼此。

-2nd 或 -no2nd 開啟或關閉第二級熱門搜尋啟發式演算法。這會減少記憶體使用量和執行時間,但可能會導致樹狀結構品質略有下降。(預設情況下,-fastest 會開啟 -2nd。)

此屬性控制 -2nd 開關的加入,將此屬性視為布林值。

property seed

使用 -seed 初始化亂數產生器。

支持值選項:預設情況下,FastTree 會透過對位點似然性進行 1,000 次重採樣以及 Shimodaira Hasegawa 測試來計算局部支持值。如果您指定 -nome,它將改為計算最小演化自助法支持。在任何一種情況下,支持值都是介於 0 到 1 之間的比例。

此設定控制 -seed 參數的加入及其相關的值。將此屬性設定為所需參數值。

property slow

使用詳盡搜尋。

搜尋最佳連接:預設情況下,FastTree 將快速鄰近加入法的「可見集合」與局部爬山法結合,如同放鬆的鄰近加入法 -slow – 詳盡搜尋(類似 NJ 或 BIONJ,但間隙處理不同)-slow 對於 1,250 個蛋白質需要半小時,而不是 8 秒。

此屬性控制 -slow 開關的加入,將此屬性視為布林值。

property slownni

關閉啟發法以避免使用 NNI 的常數子樹。

拓撲精煉:預設情況下,FastTree 嘗試使用最多 4*log2(N) 輪的最小演化最近鄰交換 (NNI) 來改進樹狀結構,其中 N 是唯一序列的數量,2 輪子樹修剪-嫁接 (SPR) 移動(也是最小演化),以及最多 2*log(N) 輪的最大似然 NNI。使用 -nni 設定最小演化 NNI 的輪數,並使用 -spr 設定 SPR 的輪數。使用 -slownni 關閉啟發法以避免常數子樹(影響 ML 和 ME NNI)。

此屬性控制 -slownni 開關的加入,將此屬性視為布林值。

property spr

設定子樹修剪-嫁接移動的輪數

拓撲精煉:預設情況下,FastTree 嘗試使用最多 4*log2(N) 輪的最小演化最近鄰交換 (NNI) 來改進樹狀結構,其中 N 是唯一序列的數量,2 輪子樹修剪-嫁接 (SPR) 移動(也是最小演化),以及最多 2*log(N) 輪的最大似然 NNI。使用 -nni 設定最小演化 NNI 的輪數,並使用 -spr 設定 SPR 的輪數。

此設定控制 -spr 參數的加入及其相關的值。將此屬性設定為所需參數值。

property sprlength

在拓撲精煉中設定最大 SPR 移動長度(預設為 10)。

拓撲精煉:預設情況下,FastTree 嘗試使用最多 4*log2(N) 輪的最小演化最近鄰交換 (NNI) 來改進樹狀結構,其中 N 是唯一序列的數量,2 輪子樹修剪-嫁接 (SPR) 移動(也是最小演化),以及最多 2*log(N) 輪的最大似然 NNI。使用 -nni 設定最小演化 NNI 的輪數,並使用 -spr 設定 SPR 的輪數。

此設定控制 -sprlength 參數的加入及其相關的值。將此屬性設定為所需參數值。

property top

頂級命中列表以加速搜尋

熱門搜尋啟發式演算法:預設情況下,FastTree 使用熱門搜尋列表來加速搜尋。使用 -notop(或 -slow)關閉此功能,並比較所有葉子與彼此,以及所有新加入的節點與彼此。

此屬性控制 -top 開關的加入,將此屬性視為布林值。

property topm

變更頂級命中計算方法

頂級命中啟發法:預設情況下,FastTree 使用頂級命中列表來加速搜尋 -topm 1.0 – 將頂級命中列表大小設定為 parameter*sqrt(N) FastTree 從「接近」鄰居的前 2*m 個命中估計葉的頂級 m 個命中,其中「接近」定義為 d(seed,close) < 0.75 * d(seed, 等級 2*m 的命中),並在連接進行時更新頂級命中。

此設定控制 -topm 參數的加入及其相關的值。將此屬性設定為所需參數值。

property wag

最大似然模型選項。

使用 Whelan-And-Goldman 2001 模型,而非(預設)Jones-Taylor-Thorton 1992 模型(僅限氨基酸)

此屬性控制 -wag 開關的加入,將此屬性視為布林值。