Bio.Phylo.Applications 套件
模組內容
系統發生學命令行工具包裝器 (已過時)。
我們已決定在未來移除此模組,並建議直接透過 subprocess 模組建立您的命令並調用它。
- class Bio.Phylo.Applications.PhymlCommandline(cmd='phyml', **kwargs)
基底類別:
AbstractCommandline
樹狀推論程式 PhyML 的命令列包裝器。
首頁:http://www.atgc-montpellier.fr/phyml
參考文獻
Guindon S, Gascuel O. A simple, fast, and accurate algorithm to estimate large phylogenies by maximum likelihood. Systematic Biology, 2003 Oct;52(5):696-704. PubMed PMID: 14530136.
Guindon S, Dufayard JF, Lefort V, Anisimova M, Hordijk W, Gascuel O. New Algorithms and Methods to Estimate Maximum-Likelihood Phylogenies: Assessing the Performance of PhyML 3.0. Systematic Biology, 2010 59(3):307-21.
- __init__(cmd='phyml', **kwargs)
初始化類別。
- property alpha
伽瑪分佈形狀參數的分佈。
可以是固定的正值,或是 ‘e’ 以取得最大概似估計值。
這會控制 -a 參數及其關聯值的加入。將此屬性設定為所需的引數值。
- property bootstrap
bootstrap 複本的數量,如果值 > 0。
否則
0:不計算近似概似比檢定或 bootstrap 值。
-1:近似概似比檢定會傳回 aLRT 統計值。
-2:近似概似比檢定會傳回基於卡方值的參數分支支持度。
-4:僅 SH 類型的分支支持度。
這會控制 -b 參數及其關聯值的加入。將此屬性設定為所需的引數值。
- property datatype
資料類型:核苷酸的 ‘nt’ (預設值) 或胺基酸的 ‘aa’。
這會控制 -d 參數及其關聯值的加入。將此屬性設定為所需的引數值。
- property frequencies
字元頻率。
-f e, m 或 “fA fC fG fT”
e:經驗頻率,計算方式如下
核苷酸序列:(經驗) 平衡鹼基頻率是透過計算比對中不同鹼基的出現次數來估計。
胺基酸序列:(經驗) 平衡胺基酸頻率是透過計算比對中不同胺基酸的出現次數來估計。
m:ML/模型頻率,計算方式如下
核苷酸序列:(ML) 平衡鹼基頻率是使用最大概似估計。
胺基酸序列:(模型) 平衡胺基酸頻率是使用取代模型定義的頻率來估計。
“fA fC fG fT”:僅對以核苷酸為基礎的模型有效。fA、fC、fG 和 fT 是對應於 A、C、G 和 T 頻率的浮點數。
這會控制 -f 參數及其關聯值的加入。將此屬性設定為所需的引數值。
- property input
PHYLIP 格式的輸入核苷酸或胺基酸序列檔名。
這會控制 -i 參數及其關聯值的加入。將此屬性設定為所需的引數值。
- property input_tree
起始樹狀圖檔名。樹狀圖必須採用 Newick 格式。
這會控制 -u 參數及其關聯值的加入。將此屬性設定為所需的引數值。
- property model
取代模型名稱。
以核苷酸為基礎的模型
HKY85 (預設值) | JC69 | K80 | F81 | F84 | TN93 | GTR | 自訂
對於自訂選項,一個六位數的字串會識別該模型。例如,000000 對應於 F81 (或 JC69,如果核苷酸頻率的分佈是均勻的)。012345 對應於 GTR。此選項可用於編碼任何嵌套在 GTR 中的模型。
以胺基酸為基礎的模型
LG (預設值) | WAG | JTT | MtREV | Dayhoff | DCMut | RtREV | CpREV | VT | Blosum62 | MtMam | MtArt | HIVw | HIVb | 自訂
這會控制 -m 參數及其關聯值的加入。將此屬性設定為所需的引數值。
- property multiple
要分析的資料集數量 (整數)。
這會控制 -n 參數及其關聯值的加入。將此屬性設定為所需的引數值。
- property n_rand_starts
要使用的初始隨機樹狀圖數量。
僅在要執行 SPR 搜尋時有效。
這會控制 –n_rand_starts 參數及其關聯值的加入。將此屬性設定為所需的引數值。
- property nclasses
相對取代率類別的數量。
預設值為 1。必須是正整數。
這會控制 -c 參數及其關聯值的加入。將此屬性設定為所需的引數值。
- property optimize
特定參數最佳化。
tlr:最佳化樹狀圖拓撲 (t)、分支長度 (l) 和速率參數 (r)。
tl:最佳化樹狀圖拓撲和分支長度。
lr:最佳化分支長度和速率參數。
l:最佳化分支長度。
r:最佳化速率參數。
n:不最佳化任何參數。
這會控制 -o 參數及其關聯值的加入。將此屬性設定為所需的引數值。
- property pars
使用最小簡約起始樹狀圖。
當沒有 ‘-u’ 選項且要進行樹狀圖拓撲修改時,會考慮此選項。
此屬性會控制 -p 開關的加入,將此屬性視為布林值。
- property print_site_lnl
在檔案 *_phyml_lk.txt 中列印每個位點的概似值。
此屬性會控制 –print_site_lnl 開關的加入,將此屬性視為布林值。
- property print_trace
在檔案 *_phyml_trace.txt 中列印樹狀圖搜尋過程中探索的每個系統發生樹。
此屬性會控制 –print_trace 開關的加入,將此屬性視為布林值。
- property prop_invar
不變位點的比例。
可以是 [0,1] 範圍內的固定值,或是 ‘e’ 以取得最大概似估計值。
這會控制 -v 參數及其關聯值的加入。將此屬性設定為所需的引數值。
- 屬性 quiet
不顯示互動式問題(用於批次模式)。
此屬性控制是否加入 –quiet 開關,請將此屬性視為布林值。
- 屬性 r_seed
用於初始化隨機數產生器的種子。
必須為整數。
此屬性控制是否加入 –r_seed 參數及其相關的值。請將此屬性設定為所需的參數值。
- 屬性 rand_start
將初始樹設定為隨機。
僅在要執行 SPR 搜尋時有效。
此屬性控制是否加入 –rand_start 開關,請將此屬性視為布林值。
- 屬性 run_id
將給定的字串附加到每個 PhyML 輸出檔的末尾。
當執行涉及 PhyML 的模擬時,此選項可能很有用。
此屬性控制是否加入 –run_id 參數及其相關的值。請將此屬性設定為所需的參數值。
- 屬性 search
樹狀拓樸搜尋操作選項。
可以是以下其中之一:
NNI:預設值,快速
SPR:比 NNI 稍慢
BEST:NNI 和 SPR 搜尋的最佳結果
此屬性控制是否加入 -s 參數及其相關的值。請將此屬性設定為所需的參數值。
- 屬性 sequential
將交錯格式(預設)更改為循序格式。
此屬性控制是否加入 -q 開關,請將此屬性視為布林值。
- 屬性 ts_tv_ratio
轉變/轉換比率。(僅適用於 DNA 序列。)
可以是固定的正值(例如:4.0)或 e,以取得最大概似估計。
此屬性控制是否加入 -t 參數及其相關的值。請將此屬性設定為所需的參數值。
- 類別 Bio.Phylo.Applications.RaxmlCommandline(cmd='raxmlHPC', **kwargs)
基底類別:
AbstractCommandline
樹狀推論程式 RAxML 的命令列包裝函式。
必要的參數為 'sequences' (-s)、'model' (-m) 和 'name' (-n)。參數 'parsimony_seed' (-p) 也必須針對 RAxML 設定,但如果您未指定,此包裝函式會將種子設定為 10000。
參考文獻
Stamatakis A. RAxML-VI-HPC:使用數千個分類單元和混合模型的最大概似式系統發育分析。生物資訊學 2006,22(21):2688-2690。
首頁:http://sco.h-its.org/exelixis/software.html
範例
>>> from Bio.Phylo.Applications import RaxmlCommandline >>> raxml_cline = RaxmlCommandline(sequences="Tests/Phylip/interlaced2.phy", ... model="PROTCATWAG", name="interlaced2") >>> print(raxml_cline) raxmlHPC -m PROTCATWAG -n interlaced2 -p 10000 -s Tests/Phylip/interlaced2.phy
您通常會使用 raxml_cline() 或透過 Python subprocess 模組執行命令列,如 Biopython 教學中所述。
- __init__(cmd='raxmlHPC', **kwargs)
初始化類別。
- 屬性 parsimony_seed
簡約推論的隨機數種子。這可讓您重現結果,並有助於開發人員偵錯程式。此選項在平行 MPI 版本中無效。
此屬性控制是否加入 -p 參數及其相關的值。請將此屬性設定為所需的參數值。
- 屬性 algorithm
選取演算法
a:在一個程式執行中快速執行 Bootstrap 分析並搜尋最佳評分的 ML 樹。
b:根據檔案中由 '-z' 指定的多個樹狀圖(例如,形成 bootstrap),在以 '-t' 提供的樹狀圖上繪製二分區資訊。
c:檢查 RAxML 是否能正確讀取比對。
d:新的快速爬山演算法(預設)。
e:僅在 GAMMA/GAMMAI 下針對給定的輸入樹狀圖最佳化模型 + 分支長度。
g:計算透過 '-z' 傳遞的一個或多個樹狀圖的每個位置對數概似值,並將其寫入可由 CONSEL 讀取的檔案。
h:計算透過 '-t' 傳遞的最佳樹狀圖與透過 '-z' 傳遞的一組其他樹狀圖之間的對數概似檢定 (SH 檢定)。
i:執行非常徹底的 Bootstrap、在 GAMMA 下最終 Bootstrap 樹狀圖的精簡,以及更詳盡的演算法。
j:從原始比對檔案產生一組 Bootstrap 比對檔案。
m:比較透過 '-t' 和 '-z' 分別傳遞的兩組樹狀圖之間的二分區。這會傳回兩個樹狀圖檔案中找到的所有二分區之間的 Pearson 相關性。將列印名為 RAxML_bipartitionFrequencies.outputFileName 的檔案,其中包含兩組的成對二分區頻率。
n:計算在 GAMMA 或 GAMMA+P-Invar 下透過 '-z' 提供的樹狀圖檔案中所包含的所有樹狀圖的對數概似分數。
o:舊且較慢的快速爬山演算法。
p:對不完整的起始樹狀圖執行新序列的純逐步 MP 新增。
s:將多基因分割比對分割為各自的子比對。
t:在一個固定的起始樹狀圖上執行隨機化的樹狀圖搜尋。
w:計算透過 '-z' 傳遞的一組樹狀圖的 ELW 檢定。
x:計算成對 ML 距離,ML 模型參數會在 MP 起始樹狀圖或透過 '-t' 傳遞的使用者定義樹狀圖上進行估計,僅允許使用基於 GAMMA 的異質性速率模型。
這會控制 -f 參數及其關聯值的加入。將此屬性設定為所需的引數值。
- 屬性 binary_constraint
二元限制樹狀圖的檔案名稱。此樹狀圖不需要全面,也就是說,不需要包含所有分類單元。
此屬性控制是否加入 -r 參數及其相關的值。請將此屬性設定為所需的參數值。
- 屬性 bipartition_filename
包含多個樹狀圖的檔案名稱,例如,來自 Bootstrap 執行,該檔案將用於將二分區值繪製到透過 '-t' 提供的樹狀圖上。它也可以與 '-f g' 結合使用以計算每個位置的對數概似值,並讀取一組樹狀圖以用於其他幾個選項('-f h'、'-f m'、'-f n')。
此屬性控制是否加入 -z 參數及其相關的值。請將此屬性設定為所需的參數值。
- 屬性 bootstrap_branch_lengths
列印具有分支長度的 Bootstrap 樹狀圖。Bootstrap 執行時間會稍長,因為模型參數會在每次執行的結尾進行最佳化。與 CATMIX/PROTMIX 或 GAMMA/GAMMAI 搭配使用。
此屬性控制是否加入 -k 開關,請將此屬性視為布林值。
- 屬性 bootstrap_seed
Bootstrap 的隨機種子。
這會控制 -b 參數及其關聯值的加入。將此屬性設定為所需的引數值。
- 屬性 checkpoints
寫入檢查點(中間樹狀圖拓樸)。
此屬性控制是否加入 -j 開關,請將此屬性視為布林值。
- 屬性 cluster_threshold
序列相似性叢集化的臨界值。然後,RAxML 會將比對列印到名為 sequenceFileName.reducedBy.threshold 的檔案,其中僅包含 <= 指定臨界值的序列,該臨界值必須介於 0.0 和 1.0 之間。RAxML 使用 QT 叢集演算法來執行此任務。此外,會寫入名為 RAxML_reducedList.outputFileName 的檔案,其中包含叢集資訊。
此屬性控制是否加入 -l 參數及其相關的值。請將此屬性設定為所需的參數值。
- 屬性 cluster_threshold_fast
與 '-l' 相同的功能,但使用較少詳盡、因此更快的叢集演算法。這適用於超過 20,000-30,000 個序列的大型資料集。
此屬性控制是否加入 -L 參數及其相關的值。請將此屬性設定為所需的參數值。
- 屬性 epsilon
設定 MIX/MIXI 或 GAMMA/GAMMAI 模型下,在最終樹狀拓樸最佳化時,以對數概似單位表示的模型最佳化精確度。預設值:對於未使用不變位點比例估計的模型為 0.1;對於使用不變位點比例估計的模型為 0.001。
此選項控制 -e 參數及其關聯值的加入。將此屬性設定為所需的參數值。
- property exclude_filename
排除檔案名稱,其中包含您要排除的比對位置規格。格式類似於 Nexus,檔案應包含如「100-200 300-400」之類的條目;若要排除單一欄位,請寫入「100-100」。如果您使用混合模型,將會寫入適當調整後的模型檔案。
此選項控制 -E 參數及其關聯值的加入。將此屬性設定為所需的參數值。
- property grouping_constraint
多分支限制樹的檔案名稱。此樹不需要是全面的,即包含所有分類群。
此選項控制 -g 參數及其關聯值的加入。將此屬性設定為所需的參數值。
- property model
核苷酸或胺基酸替換模型
核苷酸
GTRCAT:GTR + 替換率最佳化 + 位點特定演化速率最佳化,這些速率會分類為 numberOfCategories 個不同的速率類別,以便在您使用「-#」或「-N」執行多重分析但不進行自助法時,提高計算效率,程式會改用 GTRMIX
GTRGAMMA:GTR + 替換率最佳化 + 速率異質性的 GAMMA 模型(將會估計 alpha 參數)
GTRMIX:在 GTRCAT 下推斷樹狀圖,然後在 GTRGAMMA 下評估最終的樹狀拓樸
GTRCAT_GAMMA:使用位點特定演化速率推斷樹狀圖。但是,此處的速率使用 4 個離散的 GAMMA 速率進行分類。在 GTRGAMMA 下評估最終的樹狀拓樸
GTRGAMMAI:與 GTRGAMMA 相同,但會估計不變位點的比例
GTRMIXI:與 GTRMIX 相同,但會估計不變位點的比例
GTRCAT_GAMMAI:與 GTRCAT_GAMMA 相同,但會估計不變位點的比例
胺基酸
PROTCATmatrixName[F]:指定的 AA 矩陣 + 替換率最佳化 + 位點特定演化速率最佳化,這些速率會分類為 numberOfCategories 個不同的速率類別,以便在您使用「-#」或「-N」執行多重分析但不進行自助法時,提高計算效率,程式會改用 PROTMIX…
PROTGAMMAmatrixName[F]:指定的 AA 矩陣 + 替換率最佳化 + 速率異質性的 GAMMA 模型(將會估計 alpha 參數)
PROTMIXmatrixName[F]:在指定的 AA 矩陣 + CAT 下推斷樹狀圖,然後在指定的 AA 矩陣 + GAMMA 下評估最終的樹狀拓樸
PROTCAT_GAMMAmatrixName[F]:在指定的 AA 矩陣和位點特定演化速率下推斷樹狀圖。但是,此處的速率使用 4 個離散的 GAMMA 速率進行分類。在指定的 AA 矩陣 + GAMMA 下評估最終的樹狀拓樸
PROTGAMMAImatrixName[F]:與 PROTGAMMAmatrixName[F] 相同,但會估計不變位點的比例
PROTMIXImatrixName[F]:與 PROTMIXmatrixName[F] 相同,但會估計不變位點的比例
PROTCAT_GAMMAImatrixName[F]:與 PROTCAT_GAMMAmatrixName[F] 相同,但會估計不變位點的比例
可用的 AA 替換模型:DAYHOFF、DCMUT、JTT、MTREV、WAG、RTREV、CPREV、VT、BLOSUM62、MTMAM、GTR。使用可選的「F」附錄,您可以指定是否要使用經驗基本頻率。請注意,對於混合模型,您還可以額外在混合模型檔案中指定每個基因的 AA 模型(詳細資訊請參閱手冊)
這會控制 -m 參數及其關聯值的加入。將此屬性設定為所需的引數值。
- property name
輸出檔案中使用的名稱。
這會控制 -n 參數及其關聯值的加入。將此屬性設定為所需的引數值。
- property num_bootstrap_searches
每個重複的多次自助法搜尋次數。使用此選項可為每個重複取得更好的 ML 樹。預設值:每個自助法重複 1 次 ML 搜尋。
這會控制 -u 參數及其關聯值的加入。將此屬性設定為所需的引數值。
- property num_categories
當演化模型設定為 GTRCAT 或 GTRMIX 時,RAxML 的不同速率類別數。個別的每個位點速率會分類為這麼多速率類別,以加速計算。預設值:25。
這會控制 -c 參數及其關聯值的加入。將此屬性設定為所需的引數值。
- property num_replicates
在不同的起始樹上執行替代運算的次數。與「-b」選項結合使用,將會調用多重自助法分析。預設值:1 次單一分析。請注意,由於「-#」有時會導致某些 MPI 作業提交系統出現問題,因為「-#」通常用於開始註解,因此已新增「-N」作為替代選項。
此選項控制 -N 參數及其關聯值的加入。將此屬性設定為所需的參數值。
- property outgroup
單一外群或以逗號分隔的外群清單的名稱,例如「-o Rat」或「-o Rat,Mouse」。如果多個外群不是單系的,則會選取清單中的第一個名稱作為外群。分類群名稱之間不要留空格!
這會控制 -o 參數及其關聯值的加入。將此屬性設定為所需的引數值。
- property parsimony
僅計算簡約起始樹,然後結束。
此屬性控制 -y 開關的加入,將此屬性視為布林值。
- property partition_branch_lengths
開啟每個分割區分支長度的個別估計。僅在與「partition_filename」(「-q」)組合使用時才有效。個別分割區的分支長度將會列印到不同的檔案。分支長度的加權平均值會使用各自的分割區長度來計算。
此屬性控制 -M 開關的加入,將此屬性視為布林值。
- property partition_filename
包含替換的多個模型的模型分配給比對分割區的檔案名稱。有關此檔案的語法,請參閱 RAxML 手冊。
此選項控制 -q 參數及其關聯值的加入。將此屬性設定為所需的參數值。
- property protein_model
使用者定義的 AA(蛋白質)替換模型的檔案名稱。此檔案必須包含 420 個條目,前 400 個是 AA 替換率(這必須是對稱矩陣),最後 20 個是經驗基本頻率。
此選項控制 -P 參數及其關聯值的加入。將此屬性設定為所需的參數值。
- property random_starting_tree
從隨機起始樹開始 ML 最佳化。
此屬性控制 -d 開關的加入,將此屬性視為布林值。
- property rapid_bootstrap_seed
快速自助法的隨機種子。
此選項控制 -x 參數及其關聯值的加入。將此屬性設定為所需的參數值。
- property rearrangements
後續應用拓樸變更階段的初始重排設定。
這會控制 -i 參數及其關聯值的加入。將此屬性設定為所需的引數值。
- property sequences
PHYLIP 格式的比對資料檔案名稱。
此屬性控制是否加入 -s 參數及其相關的值。請將此屬性設定為所需的參數值。
- property starting_tree
Newick 格式的使用者起始樹的檔案名稱。
此屬性控制是否加入 -t 參數及其相關的值。請將此屬性設定為所需的參數值。
- property threads
要執行的執行緒數。僅限 PTHREADS 版本!請確保將此設定為最多為您機器上的 CPU 數,否則效能將大幅降低!
此選項控制 -T 參數及其關聯值的加入。將此屬性設定為所需的參數值。
- property version
顯示版本資訊。
此屬性控制 -v 開關的加入,將此屬性視為布林值。
- property weight_filename
欄位權重檔案的名稱,可為比對的每個欄位指定個別的權重。這些權重必須是整數,以任何類型和數量的空格分隔在單獨的檔案中。
這會控制 -a 參數及其關聯值的加入。將此屬性設定為所需的引數值。
- property working_dir
RAxML 將寫入其輸出檔案的工作目錄名稱。預設值:目前目錄。
此選項控制 -w 參數及其關聯值的加入。將此屬性設定為所需的參數值。
- class Bio.Phylo.Applications.FastTreeCommandline(cmd='fasttree', **kwargs)
基底類別:
AbstractCommandline
FastTree 的命令列包裝器。
只有
input
和out
參數是必須的。從終端機命令列使用
fasttree.exe -help
或fasttree.exe -expert
來取得更多使用選項的說明。首頁:http://www.microbesonline.org/fasttree/
參考文獻
Price, M.N., Dehal, P.S., 和 Arkin, A.P. (2010) FastTree 2 – Approximately Maximum-Likelihood Trees for Large Alignments. PLoS ONE, 5(3):e9490. https://doi.org/10.1371/journal.pone.0009490。
範例
這是一個在 Windows 上的範例
import _Fasttree fasttree_exe = r"C:\FasttreeWin32\fasttree.exe" cmd = _Fasttree.FastTreeCommandline(fasttree_exe, ... input=r'C:\Input\ExampleAlignment.fsa', ... out=r'C:\Output\ExampleTree.tree') print(cmd) out, err = cmd() print(out) print(err)
- __init__(cmd='fasttree', **kwargs)
初始化類別。
- property bionj
加入選項:如同 BIONJ 中加權的加入。
FastTree 也會在 NNI 期間加權加入。
這個屬性控制 -bionj 開關的添加,將此屬性視為布林值。
- property boot
指定支持值重新取樣的次數。
支持值選項:預設情況下,FastTree 通過對位點似然值進行 1,000 次重新取樣和 Shimodaira Hasegawa 檢定來計算局部支持值。如果您指定 -nome,它會改為計算最小進化自舉支持。無論哪種情況,支持值都是從 0 到 1 的比例。
使用 -nosupport 關閉支持值,或使用 -boot 100 僅使用 100 次重新取樣。
這控制了 -boot 參數及其相關值的添加。將此屬性設定為所需的參數值。
- property cat
最大似然模型選項。
指定位點的速率類別數量(預設為 20)。
這控制了 -cat 參數及其相關值的添加。將此屬性設定為所需的參數值。
- property close
修改頂級命中列表的關閉啟發式。
頂級命中啟發式:預設情況下,FastTree 使用頂級命中列表來加速搜尋 -close 0.75 – 修改關閉啟發式,較低的值更保守。
這控制了 -close 參數及其相關值的添加。將此屬性設定為所需的參數值。
- property constraintWeight
在拓樸搜尋中約束強度的權重。
受約束的拓樸搜尋選項:-constraintWeight – 如何強力地權衡約束。值 1 表示違反約束的樹長度懲罰為 1。預設值:100.0
這控制了 -constraintWeight 參數及其相關值的添加。將此屬性設定為所需的參數值。
- property constraints
指定一個對齊檔案,用於受約束的拓樸搜尋
受約束的拓樸搜尋選項:-constraints alignmentfile – 一個對齊,值為 0、1 和 -。並非所有序列都需要存在。0 和 1 的列定義了一個受約束的分割。一些約束可能會被違反(請參閱標準錯誤中的「違反約束:」)。
這控制了 -constraints 參數及其相關值的添加。將此屬性設定為所需的參數值。
- property expert
顯示專家級別的說明。
這個屬性控制 -expert 開關的添加,將此屬性視為布林值。
- property fastest
僅搜尋可見集合(每個節點的頂級命中)。
搜尋最佳加入:預設情況下,FastTree 將快速鄰接法的「可見集合」與局部爬坡相結合,如鬆弛的鄰接法 -fastest – 僅搜尋可見集合(每個節點的頂級命中)。與原始的快速鄰接法不同,如果 join(AB,C) 比 join(C,visible(C)) 更好,-fastest 會在加入 A 和 B 後更新 visible(C) 。-fastest 也會以非常惰性的方式更新輸出距離,-fastest 也會設定 -2nd,使用 -fastest -no2nd 來避免這種情況。
這個屬性控制 -fastest 開關的添加,將此屬性視為布林值。
- property gamma
報告離散 gamma 模型下的似然值。
最大似然模型選項:-gamma – 在使用 CAT 模型優化分支長度的最後一輪之後,報告具有相同類別數量的離散 gamma 模型下的似然值。FastTree 使用相同的分支長度,但優化 gamma 形狀參數和長度的比例。最後的樹將會重新調整長度。與 -log 一起使用,這也會產生每個位點的似然值,以便與 CONSEL 一起使用,請參閱 GammaLogToPaup.pl 以及 FastTree 網站上的文件。
這個屬性控制 -gamma 開關的添加,將此屬性視為布林值。
- property gtr
最大似然模型選項。
使用廣義時間可逆模型而不是(預設)Jukes-Cantor(僅限 nt)
這個屬性控制 -gtr 開關的添加,將此屬性視為布林值。
- property gtrfreq
-gtrfreq A C G T
這控制了 -gtrfreq 參數及其相關值的添加。將此屬性設定為所需的參數值。
- property gtrrates
-gtrrates ac ag at cg ct gt
這控制了 -gtrrates 參數及其相關值的添加。將此屬性設定為所需的參數值。
- property help
顯示說明。
這個屬性控制 -help 開關的添加,將此屬性視為布林值。
- property input
輸入 <輸入檔案>
需要 fasta 或 phylip 格式的序列比對輸入檔案。預設情況下,FastTree 預期為蛋白質比對,使用 -nt 來表示核苷酸。
這控制了 input 參數及其相關值的添加。將此屬性設定為所需的參數值。
- property intree
-intree newickfile – 從 newickfile 讀取起始樹。
起始樹中的任何分支長度都會被忽略。具有 -n 的 -intree 將為每個比對讀取單獨的起始樹。
這控制了 -intree 參數及其相關值的添加。將此屬性設定為所需的參數值。
- property intree1
intree1 newickfile – 為每個比對讀取相同的起始樹。
這控制了 -intree1 參數及其相關值的添加。將此屬性設定為所需的參數值。
- property log
建立資料的日誌檔案,例如中間樹和每個位點的速率
-log logfile – 儲存中間樹,以便您可以提取樹並在崩潰時重新啟動長時間執行的作業 -log 也會報告每個位點的速率(1 表示最慢的類別)。
這控制了 -log 參數及其相關值的添加。將此屬性設定為所需的參數值。
- property makematrix
-makematrix [對齊]
這控制了 -makematrix 參數及其相關值的添加。將此屬性設定為所需的參數值。
- property matrix
指定核苷酸或胺基酸距離的矩陣
距離:預設值:對於蛋白質序列,對數校正的距離和從 BLOSUM45 導出的胺基酸不相似矩陣,或對於核苷酸序列,Jukes-Cantor 距離。若要指定不同的矩陣,請使用 -matrix FilePrefix 或 -nomatrix
這控制了 -matrix 參數及其相關值的添加。將此屬性設定為所需的參數值。
- property mlacc
在每個 NNI 中優化分支的選項。
拓撲結構精煉:預設情況下,FastTree 會嘗試使用最多 4*log2(N) 輪的最小演化最近鄰交換 (NNI) 來改善樹狀結構,其中 N 是唯一序列的數量,以及 2 輪的子樹修剪再嫁接 (SPR) 移動(也是最小演化),以及最多 2*log(N) 輪的最大似然 NNI。使用 -nni 設定最小演化 NNI 的輪數,使用 -spr 設定 SPR 的輪數。使用 -mlacc 2 或 -mlacc 3 以在每次 NNI 時始終優化所有 5 個分支,並在 2 或 3 輪中優化所有 5 個分支。
這控制了 -mlacc 參數的添加及其相關值。將此屬性設定為所需的參數值。
- property mllen
在固定的拓撲結構上優化分支長度。
拓撲結構精煉:預設情況下,FastTree 會嘗試使用最多 4*log2(N) 輪的最小演化最近鄰交換 (NNI) 來改善樹狀結構,其中 N 是唯一序列的數量,以及 2 輪的子樹修剪再嫁接 (SPR) 移動(也是最小演化),以及最多 2*log(N) 輪的最大似然 NNI。使用 -nni 設定最小演化 NNI 的輪數,使用 -spr 設定 SPR 的輪數。使用 -mllen 在沒有 ML NNI 的情況下優化分支長度。使用 -mllen -nome 和 -intree 在固定的拓撲結構上優化分支長度。
此屬性控制 -mllen 開關的添加,將此屬性視為布林值。
- property mlnni
設定最大似然 NNI 的輪數。
拓撲結構精煉:預設情況下,FastTree 會嘗試使用最多 4*log2(N) 輪的最小演化最近鄰交換 (NNI) 來改善樹狀結構,其中 N 是唯一序列的數量,以及 2 輪的子樹修剪再嫁接 (SPR) 移動(也是最小演化),以及最多 2*log(N) 輪的最大似然 NNI。使用 -nni 設定最小演化 NNI 的輪數,使用 -spr 設定 SPR 的輪數。使用 -mlnni 設定最大似然 NNI 的輪數。
這控制了 -mlnni 參數的添加及其相關值。將此屬性設定為所需的參數值。
- property n
-n – 讀取 N 個多重序列比對。
這僅適用於 phylip 交錯格式。例如,您可以將其與 phylip 的 seqboot 的輸出一起使用。如果您使用 -n,FastTree 將在標準輸出中每行寫入 1 個樹狀結構。
這會控制 -n 參數及其關聯值的加入。將此屬性設定為所需的引數值。
- property nj
加入選項:常規(未加權)鄰居連接(預設)。
此屬性控制 -nj 開關的添加,將此屬性視為布林值。
- property nni
設定最小演化最近鄰交換的輪數。
拓撲結構精煉:預設情況下,FastTree 會嘗試使用最多 4*log2(N) 輪的最小演化最近鄰交換 (NNI) 來改善樹狀結構,其中 N 是唯一序列的數量,以及 2 輪的子樹修剪再嫁接 (SPR) 移動(也是最小演化),以及最多 2*log(N) 輪的最大似然 NNI。使用 -nni 設定最小演化 NNI 的輪數。
這控制了 -nni 參數的添加及其相關值。將此屬性設定為所需的參數值。
- property no2nd
關閉第二級熱門搜尋啟發式演算法。
熱門搜尋啟發式演算法:預設情況下,FastTree 使用熱門搜尋列表來加速搜尋。使用 -notop(或 -slow)關閉此功能,並比較所有葉子與彼此,以及所有新加入的節點與彼此。
-2nd 或 -no2nd 開啟或關閉第二級熱門搜尋啟發式演算法。這會減少記憶體使用量和執行時間,但可能會導致樹狀結構品質略有下降。(預設情況下,-fastest 會開啟 -2nd。)
此屬性控制 -no2nd 開關的添加,將此屬性視為布林值。
- property nocat
最大似然模型選項:無 CAT 模型(僅 1 個類別)。
此屬性控制 -nocat 開關的添加,將此屬性視為布林值。
- property nomatrix
指定不應將矩陣用於核苷酸或胺基酸距離。
距離:預設值:對於蛋白質序列,對數校正的距離和從 BLOSUM45 導出的胺基酸不相似矩陣,或對於核苷酸序列,Jukes-Cantor 距離。若要指定不同的矩陣,請使用 -matrix FilePrefix 或 -nomatrix
此屬性控制 -nomatrix 開關的添加,將此屬性視為布林值。
- property nome
將支持值計算變更為最小演化自助法。
拓撲結構精煉:預設情況下,FastTree 會嘗試使用最多 4*log2(N) 輪的最小演化最近鄰交換 (NNI) 來改善樹狀結構,其中 N 是唯一序列的數量,以及 2 輪的子樹修剪再嫁接 (SPR) 移動(也是最小演化),以及最多 2*log(N) 輪的最大似然 NNI。使用 -nni 設定最小演化 NNI 的輪數,使用 -spr 設定 SPR 的輪數。使用 -mllen 在沒有 ML NNI 的情況下優化分支長度。使用 -mllen -nome 和 -intree 在固定的拓撲結構上優化分支長度。
支持值選項:預設情況下,FastTree 會透過對位點似然性進行 1,000 次重採樣以及 Shimodaira Hasegawa 測試來計算局部支持值。如果您指定 -nome,它將改為計算最小演化自助法支持。在任何一種情況下,支持值都是介於 0 到 1 之間的比例。
此屬性控制 -nome 開關的添加,將此屬性視為布林值。
- property noml
停用最小演化 NNI 和 SPR。
拓撲結構精煉:預設情況下,FastTree 會嘗試使用最多 4*log2(N) 輪的最小演化最近鄰交換 (NNI) 來改善樹狀結構,其中 N 是唯一序列的數量,以及 2 輪的子樹修剪再嫁接 (SPR) 移動(也是最小演化),以及最多 2*log(N) 輪的最大似然 NNI。使用 -nni 設定最小演化 NNI 的輪數,使用 -spr 設定 SPR 的輪數。使用 -noml 關閉最小演化 NNI 和 SPR(如果使用進一步的 NNI 精煉近似最大似然樹狀結構,則很有用)。
此屬性控制 -noml 開關的添加,將此屬性視為布林值。
- property nopr
-nopr – 請勿將進度指示器寫入 stderr。
此屬性控制 -nopr 開關的添加,將此屬性視為布林值。
- property nosupport
關閉支持值。
支持值選項:預設情況下,FastTree 通過對位點似然值進行 1,000 次重新取樣和 Shimodaira Hasegawa 檢定來計算局部支持值。如果您指定 -nome,它會改為計算最小進化自舉支持。無論哪種情況,支持值都是從 0 到 1 的比例。
使用 -nosupport 關閉支持值,或使用 -boot 100 僅使用 100 次重新取樣。
此屬性控制 -nosupport 開關的添加,將此屬性視為布林值。
- property notop
關閉熱門搜尋列表以加速搜尋。
熱門搜尋啟發式演算法:預設情況下,FastTree 使用熱門搜尋列表來加速搜尋。使用 -notop(或 -slow)關閉此功能,並比較所有葉子與彼此,以及所有新加入的節點與彼此。
此屬性控制 -notop 開關的添加,將此屬性視為布林值。
- property nt
預設情況下,FastTree 預期為蛋白質比對,使用 -nt 表示核苷酸。
此屬性控制 -nt 開關的添加,將此屬性視為布林值。
- property out
輸入 <輸出檔案>。
需要指定 Newick 樹狀結構輸出檔案的路徑。
這控制了 -out 參數的添加及其相關值。將此屬性設定為所需的參數值。
- property pseudo
-pseudo [權重] – 假計數用於序列距離估計。
使用假計數來估計重疊很少或沒有重疊的序列之間的距離。(預設為關閉。)如果分析的比對具有很少或沒有重疊的序列,則建議使用。如果未指定權重,則為 1.0。
這控制了 -pseudo 參數的添加及其相關值。將此屬性設定為所需的參數值。
- property quiet
-quiet – 在正常操作期間不要寫入標準錯誤。
(沒有進度指示器、沒有選項摘要、沒有似然值等)
此屬性控制 -quiet 開關的添加,將此屬性視為布林值。
- property quote
-quote – 在輸出中新增序列名稱的引號。
在輸出中引用序列名稱,並允許其中包含空格、逗號、括號和冒號,但不允許使用「'」字元(僅限 fasta 檔案)。
此屬性控制 -quote 開關的添加,將此屬性視為布林值。
- property rawdist
關閉或調整 AA 或 NT 距離中的對數校正。
使用 -rawdist 關閉對數校正,或在 AA 或 NT 距離中使用 %不同而非 Jukes-Cantor。
距離:預設值:對於蛋白質序列,對數校正的距離和從 BLOSUM45 導出的胺基酸不相似矩陣,或對於核苷酸序列,Jukes-Cantor 距離。若要指定不同的矩陣,請使用 -matrix FilePrefix 或 -nomatrix
此屬性控制 -rawdist 開關的添加,將此屬性視為布林值。
- property refresh
用於比較加入節點與其他節點的條件的參數。
頂級命中啟發法:預設情況下,FastTree 使用頂級命中列表來加速搜尋 -refresh 0.8 – 如果連接節點的頂級命中列表小於所需長度的 80%,或頂級命中列表的時效等於或大於 log2(m),則將其與所有其他節點比較。
此設定控制 -refresh 參數的加入及其相關的值。將此屬性設定為所需參數值。
- property second
開啟第二層頂級命中啟發法。
熱門搜尋啟發式演算法:預設情況下,FastTree 使用熱門搜尋列表來加速搜尋。使用 -notop(或 -slow)關閉此功能,並比較所有葉子與彼此,以及所有新加入的節點與彼此。
-2nd 或 -no2nd 開啟或關閉第二級熱門搜尋啟發式演算法。這會減少記憶體使用量和執行時間,但可能會導致樹狀結構品質略有下降。(預設情況下,-fastest 會開啟 -2nd。)
此屬性控制 -2nd 開關的加入,將此屬性視為布林值。
- property seed
使用 -seed 初始化亂數產生器。
支持值選項:預設情況下,FastTree 會透過對位點似然性進行 1,000 次重採樣以及 Shimodaira Hasegawa 測試來計算局部支持值。如果您指定 -nome,它將改為計算最小演化自助法支持。在任何一種情況下,支持值都是介於 0 到 1 之間的比例。
此設定控制 -seed 參數的加入及其相關的值。將此屬性設定為所需參數值。
- property slow
使用詳盡搜尋。
搜尋最佳連接:預設情況下,FastTree 將快速鄰近加入法的「可見集合」與局部爬山法結合,如同放鬆的鄰近加入法 -slow – 詳盡搜尋(類似 NJ 或 BIONJ,但間隙處理不同)-slow 對於 1,250 個蛋白質需要半小時,而不是 8 秒。
此屬性控制 -slow 開關的加入,將此屬性視為布林值。
- property slownni
關閉啟發法以避免使用 NNI 的常數子樹。
拓撲精煉:預設情況下,FastTree 嘗試使用最多 4*log2(N) 輪的最小演化最近鄰交換 (NNI) 來改進樹狀結構,其中 N 是唯一序列的數量,2 輪子樹修剪-嫁接 (SPR) 移動(也是最小演化),以及最多 2*log(N) 輪的最大似然 NNI。使用 -nni 設定最小演化 NNI 的輪數,並使用 -spr 設定 SPR 的輪數。使用 -slownni 關閉啟發法以避免常數子樹(影響 ML 和 ME NNI)。
此屬性控制 -slownni 開關的加入,將此屬性視為布林值。
- property spr
設定子樹修剪-嫁接移動的輪數
拓撲精煉:預設情況下,FastTree 嘗試使用最多 4*log2(N) 輪的最小演化最近鄰交換 (NNI) 來改進樹狀結構,其中 N 是唯一序列的數量,2 輪子樹修剪-嫁接 (SPR) 移動(也是最小演化),以及最多 2*log(N) 輪的最大似然 NNI。使用 -nni 設定最小演化 NNI 的輪數,並使用 -spr 設定 SPR 的輪數。
此設定控制 -spr 參數的加入及其相關的值。將此屬性設定為所需參數值。
- property sprlength
在拓撲精煉中設定最大 SPR 移動長度(預設為 10)。
拓撲精煉:預設情況下,FastTree 嘗試使用最多 4*log2(N) 輪的最小演化最近鄰交換 (NNI) 來改進樹狀結構,其中 N 是唯一序列的數量,2 輪子樹修剪-嫁接 (SPR) 移動(也是最小演化),以及最多 2*log(N) 輪的最大似然 NNI。使用 -nni 設定最小演化 NNI 的輪數,並使用 -spr 設定 SPR 的輪數。
此設定控制 -sprlength 參數的加入及其相關的值。將此屬性設定為所需參數值。
- property top
頂級命中列表以加速搜尋
熱門搜尋啟發式演算法:預設情況下,FastTree 使用熱門搜尋列表來加速搜尋。使用 -notop(或 -slow)關閉此功能,並比較所有葉子與彼此,以及所有新加入的節點與彼此。
此屬性控制 -top 開關的加入,將此屬性視為布林值。
- property topm
變更頂級命中計算方法
頂級命中啟發法:預設情況下,FastTree 使用頂級命中列表來加速搜尋 -topm 1.0 – 將頂級命中列表大小設定為 parameter*sqrt(N) FastTree 從「接近」鄰居的前 2*m 個命中估計葉的頂級 m 個命中,其中「接近」定義為 d(seed,close) < 0.75 * d(seed, 等級 2*m 的命中),並在連接進行時更新頂級命中。
此設定控制 -topm 參數的加入及其相關的值。將此屬性設定為所需參數值。
- property wag
最大似然模型選項。
使用 Whelan-And-Goldman 2001 模型,而非(預設)Jones-Taylor-Thorton 1992 模型(僅限氨基酸)
此屬性控制 -wag 開關的加入,將此屬性視為布林值。