Bio.Sequencing.Applications 套件

模組內容

定序相關的命令列應用程式包裝器(已過時)。

我們已決定在未來移除此模組,並建議您直接建構命令並透過 subprocess 模組調用它。

class Bio.Sequencing.Applications.BwaIndexCommandline(cmd='bwa', **kwargs)

基底類別: AbstractCommandline

Burrows Wheeler Aligner (BWA) 索引的命令列包裝器。

索引 FASTA 格式的資料庫序列,相當於

$ bwa index [-p prefix] [-a algoType] [-c] <in.db.fasta>

詳情請參閱 http://bio-bwa.sourceforge.net/bwa.shtml

範例

>>> from Bio.Sequencing.Applications import BwaIndexCommandline
>>> reference_genome = "/path/to/reference_genome.fasta"
>>> index_cmd = BwaIndexCommandline(infile=reference_genome, algorithm="bwtsw")
>>> print(index_cmd)
bwa index -a bwtsw /path/to/reference_genome.fasta

您通常會使用 index_cmd() 或透過 Python subprocess 模組執行命令,如 Biopython 教學中所述。

__init__(cmd='bwa', **kwargs)

初始化類別。

property algorithm

建構 BWT 索引的演算法。

可用選項為
  • is:用於建構字尾陣列的 IS 線性時間演算法。它需要 5.37N 的記憶體,其中 N 是資料庫的大小。IS 速度適中,但不適用於大於 2GB 的資料庫。IS 由於其簡單性而成為預設演算法。

  • bwtsw:在 BWT-SW 中實作的演算法。此方法適用於整個人類基因組,但不適用於小於 10MB 的資料庫,且通常比 IS 慢。

這會控制 -a 參數及其相關值的添加。將此屬性設定為所需的引數值。

property c

建構顏色空間索引。輸入的 fasta 應位於核苷酸空間中。

此屬性控制 -c 開關的添加,將此屬性視為布林值。

property infile

輸入檔案名稱

這會控制 infile 參數及其相關值的添加。將此屬性設定為所需的引數值。

property prefix

輸出資料庫的前綴 [與資料庫檔案名稱相同]

這會控制 -p 參數及其相關值的添加。將此屬性設定為所需的引數值。

class Bio.Sequencing.Applications.BwaAlignCommandline(cmd='bwa', **kwargs)

基底類別: AbstractCommandline

Burrows Wheeler Aligner (BWA) aln 的命令列包裝器。

執行 BWA 比對,相當於

$ bwa aln [...] <in.db.fasta> <in.query.fq> > <out.sai>

詳情請參閱 http://bio-bwa.sourceforge.net/bwa.shtml

範例

>>> from Bio.Sequencing.Applications import BwaAlignCommandline
>>> reference_genome = "/path/to/reference_genome.fasta"
>>> read_file = "/path/to/read_1.fq"
>>> output_sai_file = "/path/to/read_1.sai"
>>> align_cmd = BwaAlignCommandline(reference=reference_genome, read_file=read_file)
>>> print(align_cmd)
bwa aln /path/to/reference_genome.fasta /path/to/read_1.fq

您通常會使用 align_cmd(stdout=output_sai_file) 或透過 Python subprocess 模組執行命令列,如 Biopython 教學中所述。

__init__(cmd='bwa', **kwargs)

初始化類別。

property B

從 5' 端開始的條碼長度。當 INT 為正數時,將在比對之前修剪每個讀取的條碼,並將其寫入 BC SAM 標籤。對於配對末端讀取,會串連來自兩端的條碼。[0]

這會控制 -B 參數及其相關值的添加。將此屬性設定為所需的引數值。

property E

間隙延伸懲罰 [4]

這會控制 -E 參數及其相關值的添加。將此屬性設定為所需的引數值。

property I

輸入採用 Illumina 1.3+ 讀取格式(品質等於 ASCII-64)。

此屬性控制 -I 開關的添加,將此屬性視為布林值。

property M

不匹配懲罰。BWA 不會搜尋分數低於 (bestScore-misMsc) 的次優比對。[3]

這會控制 -M 參數及其相關值的添加。將此屬性設定為所需的引數值。

property N

停用反覆搜尋。將找到差異不超過 maxDiff 的所有比對。此模式比預設模式慢得多。

此屬性控制 -N 開關的添加,將此屬性視為布林值。

property O

間隙開放懲罰 [11]

這會控制 -O 參數及其相關值的添加。將此屬性設定為所需的引數值。

property R

如果沒有多於 INT 個相等最佳比對,則繼續進行次優比對。

此選項僅影響配對末端比對。增加此閾值有助於提高配對準確性,但會以速度為代價,特別是對於短讀取 (~32bp)。

這會控制 -R 參數及其相關值的添加。將此屬性設定為所需的引數值。

property b

指定輸入讀取序列檔案為 BAM 格式

此屬性控制 -b 開關的添加,將此屬性視為布林值。

property b1

當指定 -b 時,僅在比對中使用讀取對中的第一個讀取(跳過單端讀取和第二個讀取)。

此屬性控制 -b1 開關的添加,將此屬性視為布林值。

property b2

當指定 -b 時,僅在比對中使用讀取對中的第二個讀取。

此屬性控制 -b2 開關的添加,將此屬性視為布林值。

property c

反向查詢但不互補,這是顏色空間中比對所必需的。

此屬性控制 -c 開關的添加,將此屬性視為布林值。

property d

不允許在 3' 端 INT bp 內出現長刪除 [16]

這會控制 -d 參數及其相關值的添加。將此屬性設定為所需的引數值。

property e

間隙延伸的最大數量,-1 表示 k 差異模式(不允許長間隙)[-1]

這會控制 -e 參數及其相關值的添加。將此屬性設定為所需的引數值。

property i

不允許在末端 INT bp 內出現插入缺失 [5]

此設定控制 -i 參數及其相關值的添加。請將此屬性設定為所需參數值。

property k

種子中的最大編輯距離 [2]

此設定控制 -k 參數及其相關值的添加。請將此屬性設定為所需參數值。

property l

取前 INT 個子序列作為種子。

如果 INT 大於查詢序列,則將禁用播種。對於長讀取,此選項通常在 -k 2 時範圍為 25 到 35。[inf]

此設定控制 -l 參數及其相關值的添加。請將此屬性設定為所需參數值。

property n

如果值為 INT,則為最大編輯距離;如果為 FLOAT,則為給定 2% 均勻鹼基錯誤率的缺失比對分數。在後一種情況下,會針對不同的讀取長度自動選擇最大編輯距離。[0.04]

此設定控制 -n 參數及其相關值的添加。請將此屬性設定為所需參數值。

property o

如果值為 INT,則為最大編輯距離;如果為 FLOAT,則為給定 2% 均勻鹼基錯誤率的缺失比對分數。在後一種情況下,會針對不同的讀取長度自動選擇最大編輯距離。[0.04]

此設定控制 -o 參數及其相關值的添加。請將此屬性設定為所需參數值。

property q

讀取修剪參數 [0]。

如果 q_l<INT,其中 l 是原始讀取長度,則 BWA 將讀取修剪為 argmax_x{sum_{i=x+1}^l(INT-q_i)}。

此設定控制 -q 參數及其相關值的添加。請將此屬性設定為所需參數值。

property read_file

讀取檔案名稱

此設定控制 read_file 參數及其相關值的添加。請將此屬性設定為所需參數值。

property reference

參考檔案名稱

此設定控制 reference 參數及其相關值的添加。請將此屬性設定為所需參數值。

property t

執行緒數量(多執行緒模式)[1]

此設定控制 -t 參數及其相關值的添加。請將此屬性設定為所需參數值。

class Bio.Sequencing.Applications.BwaSamseCommandline(cmd='bwa', **kwargs)

基底類別: AbstractCommandline

Burrows Wheeler Aligner (BWA) samse 的命令列包裝器。

產生 SAM 格式的單端讀取比對。相當於

$ bwa samse [-n maxOcc] <in.db.fasta> <in.sai> <in.fq> > <out.sam>

詳情請參閱 http://bio-bwa.sourceforge.net/bwa.shtml

範例

>>> from Bio.Sequencing.Applications import BwaSamseCommandline
>>> reference_genome = "/path/to/reference_genome.fasta"
>>> read_file = "/path/to/read_1.fq"
>>> sai_file = "/path/to/read_1.sai"
>>> output_sam_file = "/path/to/read_1.sam"
>>> samse_cmd = BwaSamseCommandline(reference=reference_genome,
...                                 read_file=read_file, sai_file=sai_file)
>>> print(samse_cmd)
bwa samse /path/to/reference_genome.fasta /path/to/read_1.sai /path/to/read_1.fq

您通常會使用 samse_cmd(stdout=output_sam_file) 或透過 Biopython 教學中描述的 Python subprocess 模組執行命令列。

__init__(cmd='bwa', **kwargs)

初始化類別。

property n

針對正確配對的讀取,在 XA 標籤中輸出的最大比對次數。

如果讀取次數超過 INT,則不會寫入 XA 標籤。[3]

此設定控制 -n 參數及其相關值的添加。請將此屬性設定為所需參數值。

property r

以 ‘@RG ID:foo SM:bar’ 之類的格式指定讀取群組。[null]

此設定控制 -r 參數及其相關值的添加。請將此屬性設定為所需參數值。

property read_file

讀取檔案名稱

此設定控制 read_file 參數及其相關值的添加。請將此屬性設定為所需參數值。

property reference

參考檔案名稱

此設定控制 reference 參數及其相關值的添加。請將此屬性設定為所需參數值。

property sai_file

Sai 檔案名稱

此設定控制 sai_file 參數及其相關值的添加。請將此屬性設定為所需參數值。

class Bio.Sequencing.Applications.BwaSampeCommandline(cmd='bwa', **kwargs)

基底類別: AbstractCommandline

Burrows Wheeler Aligner (BWA) sampe 的命令列包裝器。

產生 SAM 格式的配對末端讀取比對。相當於

$ bwa sampe [...] <in.db.fasta> <in1.sai> <in2.sai> <in1.fq> <in2.fq> > <out.sam>

詳情請參閱 http://bio-bwa.sourceforge.net/bwa.shtml

範例

>>> from Bio.Sequencing.Applications import BwaSampeCommandline
>>> reference_genome = "/path/to/reference_genome.fasta"
>>> read_file1 = "/path/to/read_1.fq"
>>> read_file2 = "/path/to/read_2.fq"
>>> sai_file1 = "/path/to/read_1.sai"
>>> sai_file2 = "/path/to/read_2.sai"
>>> output_sam_file = "/path/to/output.sam"
>>> read_group = r"@RG\tID:foo\tSM:bar"  # BWA will turn backslash-t into tab
>>> sampe_cmd = BwaSampeCommandline(reference=reference_genome,
...                                 sai_file1=sai_file1, sai_file2=sai_file2,
...                                 read_file1=read_file1, read_file2=read_file2,
...                                 r=read_group)
>>> print(sampe_cmd)
bwa sampe /path/to/reference_genome.fasta /path/to/read_1.sai /path/to/read_2.sai /path/to/read_1.fq /path/to/read_2.fq -r @RG\tID:foo\tSM:bar

您通常會使用 sampe_cmd(stdout=output_sam_file) 或透過 Biopython 教學中描述的 Python subprocess 模組執行命令列。

__init__(cmd='bwa', **kwargs)

初始化類別。

property N

針對不一致的讀取配對(不包括單例),在 XA 標籤中輸出的最大比對次數 [10]。

如果讀取次數超過 INT,則不會寫入 XA 標籤。

此設定控制 -N 參數及其相關值的添加。請將此屬性設定為所需參數值。

property a

讀取配對被視為正確映射的最大插入大小 [500]。

自 0.4.5 版起,此選項僅在沒有足夠的良好比對來推斷插入大小分佈時使用。

這會控制 -a 參數及其相關值的添加。將此屬性設定為所需的引數值。

property n

針對正確配對的讀取,在 XA 標籤中輸出的最大比對次數 [3]。

如果讀取次數超過 INT,則不會寫入 XA 標籤。

此設定控制 -n 參數及其相關值的添加。請將此屬性設定為所需參數值。

property o

讀取配對的最大出現次數 [100000]。

出現次數較多的讀取將被視為單端讀取。減少此參數有助於加快配對速度。

此設定控制 -o 參數及其相關值的添加。請將此屬性設定為所需參數值。

property r

以 ‘@RG ID:foo SM:bar’ 之類的格式指定讀取群組。[null]

此設定控制 -r 參數及其相關值的添加。請將此屬性設定為所需參數值。

property read_file1

讀取檔案 1

此設定控制 read_file1 參數及其相關值的添加。請將此屬性設定為所需參數值。

property read_file2

讀取檔案 2

此設定控制 read_file2 參數及其相關值的添加。請將此屬性設定為所需參數值。

property reference

參考檔案名稱

此設定控制 reference 參數及其相關值的添加。請將此屬性設定為所需參數值。

property sai_file1

Sai 檔案 1

此設定控制 sai_file1 參數及其相關值的添加。請將此屬性設定為所需參數值。

屬性 sai_file2

Sai 檔案 2

這控制了 sai_file2 參數及其相關值的添加。將此屬性設定為所需的參數值。

類別 Bio.Sequencing.Applications.BwaBwaswCommandline(cmd='bwa', **kwargs)

基底類別: AbstractCommandline

Burrows Wheeler Aligner (BWA) bwasw 的命令列封裝器。

從 FASTQ 檔案比對查詢序列。等同於

$ bwa bwasw [...] <in.db.fasta> <in.fq>

詳情請參閱 http://bio-bwa.sourceforge.net/bwa.shtml

範例

>>> from Bio.Sequencing.Applications import BwaBwaswCommandline
>>> reference_genome = "/path/to/reference_genome.fasta"
>>> read_file = "/path/to/read_1.fq"
>>> bwasw_cmd = BwaBwaswCommandline(reference=reference_genome, read_file=read_file)
>>> print(bwasw_cmd)
bwa bwasw /path/to/reference_genome.fasta /path/to/read_1.fq

您通常會使用 bwasw_cmd() 或透過 Python subprocess 模組執行命令列,如 Biopython 教學中所述。

__init__(cmd='bwa', **kwargs)

初始化類別。

屬性 N

支援跳過反向比對的結果比對的最小種子數量。[5]

此設定控制 -N 參數及其相關值的添加。請將此屬性設定為所需參數值。

屬性 T

最小分數閾值除以 a [37]

這控制了 -T 參數及其相關值的添加。將此屬性設定為所需的參數值。

屬性 a

匹配的分數 [1]

這會控制 -a 參數及其相關值的添加。將此屬性設定為所需的引數值。

屬性 b

不匹配的懲罰 [3]

這控制了 -b 參數及其相關值的添加。將此屬性設定為所需的參數值。

屬性 c

根據查詢長度調整閾值的係數 [5.5]。

給定一個長度為 l 的查詢,保留命中所需的閾值為 a*max{T,c*log(l)}。

這控制了 -c 參數及其相關值的添加。將此屬性設定為所需的參數值。

屬性 mate_file

配對檔案

這控制了 mate_file 參數及其相關值的添加。將此屬性設定為所需的參數值。

屬性 q

間隙開啟懲罰 [5]

此設定控制 -q 參數及其相關值的添加。請將此屬性設定為所需參數值。

屬性 r

間隙延伸懲罰。大小為 k 的連續間隙的懲罰為 q+k*r。[2]

此設定控制 -r 參數及其相關值的添加。請將此屬性設定為所需參數值。

屬性 read_file

讀取檔案

此設定控制 read_file 參數及其相關值的添加。請將此屬性設定為所需參數值。

屬性 reference

參考檔案名稱

此設定控制 reference 參數及其相關值的添加。請將此屬性設定為所需參數值。

屬性 s

初始化種子的最大 SA 間隔大小 [3]。

較高的 -s 會提高準確度,但會犧牲速度。

這控制了 -s 參數及其相關值的添加。將此屬性設定為所需的參數值。

屬性 t

多執行緒模式中的執行緒數量 [1]

此設定控制 -t 參數及其相關值的添加。請將此屬性設定為所需參數值。

屬性 w

帶狀比對中的頻寬 [33]

這控制了 -w 參數及其相關值的添加。將此屬性設定為所需的參數值。

屬性 z

Z-best 啟發式方法。較高的 -z 會提高準確度,但會犧牲速度。[1]

這控制了 -z 參數及其相關值的添加。將此屬性設定為所需的參數值。

類別 Bio.Sequencing.Applications.BwaMemCommandline(cmd='bwa', **kwargs)

基底類別: AbstractCommandline

Burrows Wheeler Aligner (BWA) mem 的命令列封裝器。

執行 BWA-MEM 比對,使用單端或雙端讀取,等同於

$ bwa mem [...] <in.db.fasta> <in1.fq> <in2.fq> > <out.sam>

詳情請參閱 http://bio-bwa.sourceforge.net/bwa.shtml

範例

>>> from Bio.Sequencing.Applications import BwaMemCommandline
>>> reference_genome = "/path/to/reference_genome.fasta"
>>> read_file = "/path/to/read_1.fq"
>>> output_sam_file = "/path/to/output.sam"
>>> align_cmd = BwaMemCommandline(reference=reference_genome, read_file1=read_file)
>>> print(align_cmd)
bwa mem /path/to/reference_genome.fasta /path/to/read_1.fq

您通常會使用 align_cmd(stdout=output_sam_file) 或透過 Python subprocess 模組執行命令列,如 Biopython 教學中所述。

__init__(cmd='bwa', **kwargs)

初始化類別。

屬性 A

匹配分數。[1]

這控制了 -A 參數及其相關值的添加。將此屬性設定為所需的參數值。

屬性 B

不匹配的懲罰。序列錯誤率約為:{.75 * exp[-log(4) * B/A]}。[4]

這會控制 -B 參數及其相關值的添加。將此屬性設定為所需的引數值。

屬性 C

將 FASTA/Q 註解附加到 SAM 輸出。此選項可用於將讀取元資訊 (例如,條碼) 傳輸到 SAM 輸出。請注意,FASTA/Q 註解 (標頭行中空格後的字串) 必須符合 SAM 規範 (例如,BC:Z:CGTAC)。格式不正確的註解會導致不正確的 SAM 輸出。

此屬性控制 -C 開關的添加,將此屬性視為布林值。

屬性 E

間隙延伸懲罰。長度為 k 的間隙代價為 O + k*E (即,-O 用於開啟零長度間隙)。[1]

這會控制 -E 參數及其相關值的添加。將此屬性設定為所需的引數值。

屬性 H

在 SAM 輸出中使用硬剪切 'H'。當映射長重疊群或 BAC 序列時,此選項可以顯著減少輸出的冗餘。

此屬性控制 -H 開關的添加,將此屬性視為布林值。

屬性 L

剪切懲罰。執行 SW 延伸時,BWA-MEM 會追蹤達到查詢結尾的最佳分數。如果此分數大於最佳 SW 分數減去剪切懲罰,則不會應用剪切。請注意,在這種情況下,SAM AS 標籤會報告最佳 SW 分數;不會扣除剪切懲罰。[5]

這控制了 -L 參數及其相關值的添加。將此屬性設定為所需的參數值。

屬性 M

將較短的分割命中標記為次要 (為了與 Picard 相容)。

此屬性控制 -M 開關的添加,將此屬性視為布林值。

屬性 O

間隙開啟懲罰。[6]

這會控制 -O 參數及其相關值的添加。將此屬性設定為所需的引數值。

屬性 P

在雙端模式下,只執行 SW 以搶救遺失的命中,但不嘗試尋找符合正確配對的命中。

此屬性控制 -P 開關的添加,將此屬性視為布林值。

屬性 R

完整的讀取群組標頭行。't' 可以在 STR 中使用,並在輸出 SAM 中轉換為 TAB。讀取群組 ID 將附加到輸出中的每個讀取。範例為 @RG ID:foo SM:bar’。[null]

這會控制 -R 參數及其相關值的添加。將此屬性設定為所需的引數值。

屬性 T

不要輸出分數低於 INT 的比對結果。此選項僅影響輸出。[30]

這控制了 -T 參數及其相關值的添加。將此屬性設定為所需的參數值。

屬性 U

不成對讀取片段的懲罰值。BWA-MEM 將不成對的讀取片段評分為 scoreRead1+scoreRead2-INT,而將成對的評分為 scoreRead1+scoreRead2-insertPenalty。它會比較這兩個分數,以判斷是否應強制配對。[9]

此選項控制 -U 參數的添加及其相關值。將此屬性設定為所需的參數值。

屬性 a

輸出單端或不成對雙端讀取的所有找到的比對結果。這些比對結果將被標記為次要比對。

此屬性控制 -a 開關的添加,將此屬性視為布林值。

屬性 c

如果一個 MEM 在基因組中出現次數超過 INT,則將其丟棄。這是一個不敏感的參數。[10000]

這控制了 -c 參數及其相關值的添加。將此屬性設定為所需的參數值。

屬性 d

非對角 X-dropoff (Z-dropoff)。當最佳分數和當前延伸分數之間的差異大於 |i-j|*A+INT 時停止延伸,其中 i 和 j 分別是查詢和參考的當前位置,A 是匹配分數。Z-dropoff 類似於 BLAST 的 X-dropoff,但它不會懲罰比對中其中一個序列的間隙。Z-dropoff 不僅避免了不必要的延伸,還減少了長良好比對內部的不良比對。[100]

這會控制 -d 參數及其相關值的添加。將此屬性設定為所需的引數值。

屬性 k

最小種子長度。短於 INT 的匹配將會遺漏。除非顯著偏離 20,否則比對速度通常對此值不敏感。[19]

此設定控制 -k 參數及其相關值的添加。請將此屬性設定為所需參數值。

屬性 p

假設第一個輸入查詢文件是交錯的雙端 FASTA/Q。有關詳細資訊,請參閱命令描述。

此屬性控制 -p 開關的添加,將此屬性視為布林值。

屬性 r

觸發重新植種以產生長度大於 minSeedLen*FLOAT 的 MEM。這是調整效能的關鍵啟發式參數。較大的值會產生較少的種子,這會導致更快的比對速度但較低的準確性。[1.5]

此設定控制 -r 參數及其相關值的添加。請將此屬性設定為所需參數值。

屬性 read_file1

讀取 1 檔案名稱

此設定控制 read_file1 參數及其相關值的添加。請將此屬性設定為所需參數值。

屬性 read_file2

讀取 2 檔案名稱

此設定控制 read_file2 參數及其相關值的添加。請將此屬性設定為所需參數值。

屬性 reference

參考檔案名稱

此設定控制 reference 參數及其相關值的添加。請將此屬性設定為所需參數值。

屬性 t

執行緒數目 [1]

此設定控制 -t 參數及其相關值的添加。請將此屬性設定為所需參數值。

屬性 v

控制輸出的詳細程度。此選項在整個 BWA 中尚未完全支援。理想情況下,值 0 表示停用所有 stderr 輸出;1 表示僅輸出錯誤;2 表示警告和錯誤;3 表示所有正常訊息;4 或更高表示偵錯。當此選項的值為 4 時,輸出不是 SAM。[3]

此選項控制 -v 參數的添加及其相關值。將此屬性設定為所需的參數值。

屬性 w

頻寬。基本上,找不到長於 INT 的間隙。請注意,最大間隙長度也受評分矩陣和命中長度影響,而不僅僅由此選項決定。[100]

這控制了 -w 參數及其相關值的添加。將此屬性設定為所需的參數值。

類別 Bio.Sequencing.Applications.NovoalignCommandline(cmd='novoalign', **kwargs)

基底類別: AbstractCommandline

用於 Novocraft 的 novoalign 的命令列封裝器。

請參閱 www.novocraft.com - novoalign 是一個短讀取比對程式。

範例

>>> from Bio.Sequencing.Applications import NovoalignCommandline
>>> novoalign_cline = NovoalignCommandline(database='some_db',
...                                        readfile='some_seq.txt')
>>> print(novoalign_cline)
novoalign -d some_db -f some_seq.txt

與所有 Biopython 應用程式封裝器一樣,您也可以在建立物件後新增或變更選項。

>>> novoalign_cline.format = 'PRBnSEQ'
>>> novoalign_cline.r_method='0.99' # limited valid values
>>> novoalign_cline.fragment = '250 20' # must be given as a string
>>> novoalign_cline.miRNA = 100
>>> print(novoalign_cline)
novoalign -d some_db -f some_seq.txt -F PRBnSEQ -r 0.99 -i 250 20 -m 100

您通常會使用 novoalign_cline() 或透過 Python subprocess 模組執行命令列,如 Biopython 教學課程中所述。

上次檢查的版本:2.05.04

__init__(cmd='novoalign', **kwargs)

初始化類別。

屬性 adapter3

在比對之前移除 3' 接頭序列。

對於雙端讀取,可以指定兩個接頭

這會控制 -a 參數及其相關值的添加。將此屬性設定為所需的引數值。

屬性 adapter5

移除 5' 接頭序列。

與 -a (adaptor3) 類似,但位於 5' 端。

此選項控制 -5 參數的添加及其相關值。將此屬性設定為所需的參數值。

屬性 cores

執行緒數目,在免費版本上停用 [預設:核心數目]

這控制了 -c 參數及其相關值的添加。將此屬性設定為所需的參數值。

屬性 database

資料庫檔案名稱

這會控制 -d 參數及其相關值的添加。將此屬性設定為所需的引數值。

屬性 format

讀取檔案的格式。

允許的值:FA、SLXFQ、STDFQ、ILMFQ、PRB、PRBnSEQ

此選項控制 -F 參數的添加及其相關值。將此屬性設定為所需的參數值。

屬性 fragment

片段長度 (2 個讀取 + 插入) 和標準差 [預設:250 30]

此設定控制 -i 參數及其相關值的添加。請將此屬性設定為所需參數值。

屬性 gap_extend

間隙延伸懲罰 [預設:15]

此選項控制 -x 參數的添加及其相關值。將此屬性設定為所需的參數值。

屬性 gap_open

間隙開啟懲罰 [預設:40]

此選項控制 -g 參數的添加及其相關值。將此屬性設定為所需的參數值。

屬性 good_bases

最小良好品質鹼基數 [預設:log(N_g, 4) + 5]

此設定控制 -l 參數及其相關值的添加。請將此屬性設定為所需參數值。

屬性 homopolymer

同聚物讀取篩選器 [預設:20;停用:負值]

此選項控制 -h 參數的添加及其相關值。將此屬性設定為所需的參數值。

屬性 miRNA

設定 miRNA 模式並可選擇設定掃描區域的值 [預設:關閉]

此選項控制 -m 參數的添加及其相關值。將此屬性設定為所需的參數值。

屬性 qual_digits

品質分數的小數位數 [預設:0]

此設定控制 -q 參數及其相關值的添加。請將此屬性設定為所需參數值。

屬性 quality

回報比對的下限 [預設:0]

此選項控制 -Q 參數的添加及其相關值。將此屬性設定為所需的參數值。

屬性 r_method

回報具有多個匹配項的讀取的方法。

允許的值:None、Random、All、Exhaustive、0.99 'All' 和 'Exhaustive' 接受限制。

此設定控制 -r 參數及其相關值的添加。請將此屬性設定為所需參數值。

屬性 read_cal

從檔案 (不匹配計數) 校正讀取品質

此設定控制 -k 參數及其相關值的添加。請將此屬性設定為所需參數值。

屬性 readfile

讀取檔案

此屬性控制 -f 參數及其關聯值的加入。將此屬性設定為所需的參數值。

property recorded

記錄與最佳分數相等之比對結果。

預設值:在預設讀取方法中為 1000,否則無限制。

這會控制 -e 參數及其相關值的添加。將此屬性設定為所需的引數值。

property repeats

如果分數差異較高,則回報重複比對。

否則應用 -r 讀取方法 [預設值:5]

這會控制 -R 參數及其相關值的添加。將此屬性設定為所需的引數值。

property report

指定報告格式。

允許的值:Native、Pairwise、SAM。預設值:Native

此設定控制 -o 參數及其相關值的添加。請將此屬性設定為所需參數值。

property threshold

比對分數的閾值

此設定控制 -t 參數及其相關值的添加。請將此屬性設定為所需參數值。

property trimming

如果比對失敗,則修剪 s 個鹼基,直到它們比對上或變得比 l 短。

預設值:2

這控制了 -s 參數及其相關值的添加。將此屬性設定為所需的參數值。

property truncate

在比對之前截斷到特定長度

此設定控制 -n 參數及其相關值的添加。請將此屬性設定為所需參數值。

property unconverted

實驗性:亞硫酸氫鹽模式中未轉換的胞嘧啶懲罰

預設值:無懲罰

此屬性控制 -u 參數及其關聯值的加入。將此屬性設定為所需的參數值。

property variation

結構變異懲罰 [預設值:70]

此選項控制 -v 參數的添加及其相關值。將此屬性設定為所需的參數值。

property write_cal

累積錯配計數並寫入檔案

此屬性控制 -K 參數及其關聯值的加入。將此屬性設定為所需的參數值。

class Bio.Sequencing.Applications.SamtoolsViewCommandline(cmd='samtools', **kwargs)

基底類別: AbstractCommandline

samtools view 的命令列包裝器。

以 SAM 或 BAM 格式提取/列印所有或子比對結果,相當於

$ samtools view [-bchuHS] [-t in.refList] [-o output] [-f reqFlag]
                [-F skipFlag] [-q minMapQ] [-l library] [-r readGroup]
                [-R rgFile] <in.bam>|<in.sam> [region1 [...]]

詳情請參閱 http://samtools.sourceforge.net/samtools.shtml

範例

>>> from Bio.Sequencing.Applications import SamtoolsViewCommandline
>>> input_file = "/path/to/sam_or_bam_file"
>>> samtools_view_cmd = SamtoolsViewCommandline(input_file=input_file)
>>> print(samtools_view_cmd)
samtools view /path/to/sam_or_bam_file
__init__(cmd='samtools', **kwargs)

初始化類別。

property F

跳過 INT 中存在位元的比對結果

此選項控制 -F 參數的添加及其相關值。將此屬性設定為所需的參數值。

property H

僅輸出標頭

此屬性控制 -H 開關的添加,將此屬性視為布林值。

property R

輸出 FILE 中列出的讀取群組中的讀取

這會控制 -R 參數及其相關值的添加。將此屬性設定為所需的引數值。

property S
輸入為 SAM 格式。

如果缺少 @SQ 標頭行,則需要 ‘-t’ 選項。

此屬性控制 -S 開關的加入,將此屬性視為布林值。

property b

以 BAM 格式輸出

此屬性控制 -b 開關的添加,將此屬性視為布林值。

property c
不要列印比對結果,而只計算它們的數量

並列印總數。

所有篩選選項,例如 ‘-f’、‘-F’ 和 ‘-q’ 都會被考慮在內

此屬性控制 -c 開關的添加,將此屬性視為布林值。

property f
僅輸出 FLAG 欄位中存在 INT 中所有位元的比對結果

INT 中存在的位元

此屬性控制 -f 參數及其關聯值的加入。將此屬性設定為所需的參數值。

property fast_bam

使用 zlib 壓縮等級 1 來壓縮輸出

此屬性控制 -1 開關的加入,將此屬性視為布林值。

property h

在輸出中包含標頭

此屬性控制 -h 開關的加入,將此屬性視為布林值。

property input_file

輸入檔案名稱

此屬性控制輸入參數及其關聯值的加入。將此屬性設定為所需的參數值。

property l

僅輸出 STR 庫中的讀取

此設定控制 -l 參數及其相關值的添加。請將此屬性設定為所需參數值。

property o

輸出檔案

此設定控制 -o 參數及其相關值的添加。請將此屬性設定為所需參數值。

property q

跳過 MAPQ 小於 INT 的比對結果

此設定控制 -q 參數及其相關值的添加。請將此屬性設定為所需參數值。

property r

僅輸出 STR 讀取群組中的讀取

此設定控制 -r 參數及其相關值的添加。請將此屬性設定為所需參數值。

property region

區域

此屬性控制 region 參數及其關聯值的加入。將此屬性設定為所需的參數值。

property t
此檔案為 TAB 分隔。

每一行都必須包含參考名稱和參考長度,每個不同的參考一行;其他欄位會被忽略。

此檔案還定義了排序中參考序列的順序。如果您執行 ‘samtools faidx <ref.fa>’,則產生的索引檔案 <ref.fa>.fai 可以用作此 <in.ref_list> 檔案。

此設定控制 -t 參數及其相關值的添加。請將此屬性設定為所需參數值。

property u

輸出未壓縮的 BAM。

此選項可節省壓縮/解壓縮所花費的時間,因此當輸出通過管道傳送到另一個 samtools 命令時,最好使用此選項

此屬性控制 -u 開關的加入,將此屬性視為布林值。

class Bio.Sequencing.Applications.SamtoolsCalmdCommandline(cmd='samtools', **kwargs)

基底類別: AbstractCommandline

samtools calmd 的命令列包裝器。

產生 MD 標籤,相當於

$ samtools calmd [-EeubSr] [-C capQcoef] <aln.bam> <ref.fasta>

詳情請參閱 http://samtools.sourceforge.net/samtools.shtml

範例

>>> from Bio.Sequencing.Applications import SamtoolsCalmdCommandline
>>> input_bam = "/path/to/aln.bam"
>>> reference_fasta = "/path/to/reference.fasta"
>>> calmd_cmd = SamtoolsCalmdCommandline(input_bam=input_bam,
...                                      reference=reference_fasta)
>>> print(calmd_cmd)
samtools calmd /path/to/aln.bam /path/to/reference.fasta
__init__(cmd='samtools', **kwargs)

初始化類別。

property A
與 -r 一起使用時,此選項會覆寫

原始鹼基品質

此屬性控制 -A 開關的加入,將此屬性視為布林值。

property C
用於上限映射品質的係數

的低品質映射讀取。

詳情請參閱 pileup 命令。

此屬性控制 -C 參數及其關聯值的加入。將此屬性設定為所需的參數值。

property E
擴展的 BAQ 計算。

此選項以靈敏度換取特異性,儘管效果很小。

此屬性控制 -E 開關的加入,將此屬性視為布林值。

property S

輸入為帶有標頭行的 SAM 格式

此屬性控制 -S 開關的加入,將此屬性視為布林值。

property b

輸出壓縮的 BAM

此屬性控制 -b 開關的添加,將此屬性視為布林值。

property e
如果讀取鹼基與

比對的參考鹼基相同,則將其轉換為 =。

Indel 呼叫器目前不支援 = 鹼基。

此屬性控制 -e 開關的添加,請將此屬性視為布林值。

property input_bam

輸入 BAM

此屬性控制輸入參數及其關聯值的加入。將此屬性設定為所需的參數值。

property r
計算 BQ 標籤 (不使用 -A)

或使用 BAQ 來限制鹼基品質 (使用 -A)。

此屬性控制 -r 開關的添加,請將此屬性視為布林值。

property ref

要建立索引的參考 FASTA

此設定控制 reference 參數及其相關值的添加。請將此屬性設定為所需參數值。

property u

輸出未壓縮的 BAM

此屬性控制 -u 開關的加入,將此屬性視為布林值。

class Bio.Sequencing.Applications.SamtoolsCatCommandline(cmd='samtools', **kwargs)

基底類別: AbstractCommandline

samtools cat 的命令列包裝器。

串連 BAM 檔案,等同於

$ samtools cat [-h header.sam] [-o out.bam] <in1.bam> <in2.bam> [ ... ]

詳情請參閱 http://samtools.sourceforge.net/samtools.shtml

範例

>>> from Bio.Sequencing.Applications import SamtoolsCatCommandline
>>> input_bam1 = "/path/to/input_bam1"
>>> input_bam2 = "/path/to/input_bam2"
>>> input_bams = [input_bam1, input_bam2]
>>> samtools_cat_cmd = SamtoolsCatCommandline(input_bam=input_bams)
>>> print(samtools_cat_cmd)
samtools cat /path/to/input_bam1 /path/to/input_bam2
__init__(cmd='samtools', **kwargs)

初始化類別。

property bams

輸入 BAM 檔案

此屬性控制輸入參數及其關聯值的加入。將此屬性設定為所需的參數值。

property h

標頭 SAM 檔案

此選項控制 -h 參數的添加及其相關值。將此屬性設定為所需的參數值。

property o

輸出 SAM 檔案

此設定控制 -o 參數及其相關值的添加。請將此屬性設定為所需參數值。

class Bio.Sequencing.Applications.SamtoolsFaidxCommandline(cmd='samtools', **kwargs)

基底類別: AbstractCommandline

samtools faidx 的命令列包裝器。

檢索並列印索引檔案中的統計資料,等同於

$ samtools faidx <ref.fasta> [region1 [...]]

詳情請參閱 http://samtools.sourceforge.net/samtools.shtml

範例

>>> from Bio.Sequencing.Applications import SamtoolsFaidxCommandline
>>> reference = "/path/to/reference.fasta"
>>> samtools_faidx_cmd = SamtoolsFaidxCommandline(reference=reference)
>>> print(samtools_faidx_cmd)
samtools faidx /path/to/reference.fasta
__init__(cmd='samtools', **kwargs)

初始化類別。

property ref

要建立索引的參考 FASTA

此設定控制 reference 參數及其相關值的添加。請將此屬性設定為所需參數值。

class Bio.Sequencing.Applications.SamtoolsFixmateCommandline(cmd='samtools', **kwargs)

基底類別: AbstractCommandline

samtools fixmate 的命令列包裝器。

從名稱排序的比對中填入配對坐標、ISIZE 和配對相關標誌,等同於

$ samtools fixmate <in.nameSrt.bam> <out.bam>

詳情請參閱 http://samtools.sourceforge.net/samtools.shtml

範例

>>> from Bio.Sequencing.Applications import SamtoolsFixmateCommandline
>>> in_bam = "/path/to/in.nameSrt.bam"
>>> out_bam = "/path/to/out.bam"
>>> fixmate_cmd = SamtoolsFixmateCommandline(input_bam=in_bam,
...                                          out_bam=out_bam)
>>> print(fixmate_cmd)
samtools fixmate /path/to/in.nameSrt.bam /path/to/out.bam
__init__(cmd='samtools', **kwargs)

初始化類別。

property input_file

名稱排序的比對檔案

這控制 in_bam 參數及其相關值的添加。將此屬性設定為所需的引數值。

property output_file

輸出檔案

這控制 out_bam 參數及其相關值的添加。將此屬性設定為所需的引數值。

class Bio.Sequencing.Applications.SamtoolsIdxstatsCommandline(cmd='samtools', **kwargs)

基底類別: AbstractCommandline

samtools idxstats 的命令列包裝器。

檢索並列印索引檔案中的統計資料,等同於

$ samtools idxstats <aln.bam>

詳情請參閱 http://samtools.sourceforge.net/samtools.shtml

範例

>>> from Bio.Sequencing.Applications import SamtoolsIdxstatsCommandline
>>> input = "/path/to/aln_bam"
>>> samtools_idxstats_cmd = SamtoolsIdxstatsCommandline(input_bam=input)
>>> print(samtools_idxstats_cmd)
samtools idxstats /path/to/aln_bam
__init__(cmd='samtools', **kwargs)

初始化類別。

property input_bam

要建立索引的 BAM 檔案

此屬性控制輸入參數及其關聯值的加入。將此屬性設定為所需的參數值。

class Bio.Sequencing.Applications.SamtoolsIndexCommandline(cmd='samtools', **kwargs)

基底類別: AbstractCommandline

samtools index 的命令列包裝器。

為快速隨機存取建立排序的比對索引,等同於

$ samtools index <aln.bam>

詳情請參閱 http://samtools.sourceforge.net/samtools.shtml

範例

>>> from Bio.Sequencing.Applications import SamtoolsIndexCommandline
>>> input = "/path/to/aln_bam"
>>> samtools_index_cmd = SamtoolsIndexCommandline(input_bam=input)
>>> print(samtools_index_cmd)
samtools index /path/to/aln_bam
__init__(cmd='samtools', **kwargs)

初始化類別。

property input_bam

要建立索引的 BAM 檔案

此屬性控制輸入參數及其關聯值的加入。將此屬性設定為所需的參數值。

class Bio.Sequencing.Applications.SamtoolsMergeCommandline(cmd='samtools', **kwargs)

基底類別: AbstractCommandline

samtools merge 的命令列包裝器。

合併多個排序的比對,等同於

$ samtools merge [-nur1f] [-h inh.sam] [-R reg]
                 <out.bam> <in1.bam> <in2.bam> [...]

詳情請參閱 http://samtools.sourceforge.net/samtools.shtml

範例

>>> from Bio.Sequencing.Applications import SamtoolsMergeCommandline
>>> out_bam = "/path/to/out_bam"
>>> in_bam = ["/path/to/input_bam1", "/path/to/input_bam2"]
>>> merge_cmd = SamtoolsMergeCommandline(out_bam=out_bam,
...                                      input_bam=in_bam)
>>> print(merge_cmd)
samtools merge /path/to/out_bam /path/to/input_bam1 /path/to/input_bam2
__init__(cmd='samtools', **kwargs)

初始化類別。

property R

合併 STR 指示的指定區域中的檔案

這會控制 -R 參數及其相關值的添加。將此屬性設定為所需的引數值。

property bam

輸入 BAM

這控制 input_bam 參數及其相關值的添加。將此屬性設定為所需的引數值。

property f
強制覆寫

輸出檔案 (如果存在)

此屬性控制 -f 開關的添加,請將此屬性視為布林值。

property fast_bam
使用 zlib 壓縮等級 1

來壓縮輸出

此屬性控制 -1 開關的加入,將此屬性視為布林值。

property h
使用 FILE 的行作為「@」

標頭以複製到 out.bam

此選項控制 -h 參數的添加及其相關值。將此屬性設定為所需的參數值。

property n
輸入比對依讀取名稱排序

而不是依染色體坐標排序

此屬性控制 -n 開關的添加,請將此屬性視為布林值。

property output

輸出 BAM 檔案

這控制 output_bam 參數及其相關值的添加。將此屬性設定為所需的引數值。

property r
將 RG 標籤附加到每個比對。

標籤值從檔案名稱推斷而來

此屬性控制 -r 開關的添加,請將此屬性視為布林值。

property u

未壓縮的 BAM 輸出

此屬性控制 -u 開關的加入,將此屬性視為布林值。

class Bio.Sequencing.Applications.SamtoolsMpileupCommandline(cmd='samtools', **kwargs)

基底類別: AbstractCommandline

samtools mpileup 的命令列封裝器。

為一個或多個 BAM 檔案產生 BCF 或 pileup,等同於

$ samtools mpileup [-EBug] [-C capQcoef] [-r reg] [-f in.fa]
                   [-l list] [-M capMapQ] [-Q minBaseQ]
                   [-q minMapQ] in.bam [in2.bam [...]]

詳情請參閱 http://samtools.sourceforge.net/samtools.shtml

範例

>>> from Bio.Sequencing.Applications import SamtoolsMpileupCommandline
>>> input = ["/path/to/sam_or_bam_file"]
>>> samtools_mpileup_cmd = SamtoolsMpileupCommandline(input_file=input)
>>> print(samtools_mpileup_cmd)
samtools mpileup /path/to/sam_or_bam_file
__init__(cmd='samtools', **kwargs)

初始化類別。

property A

在變異偵測中,不要跳過異常的成對讀取。

此屬性控制 -A 開關的加入,將此屬性視為布林值。

property B
停用機率重對齊以用於

計算鹼基對齊品質 (BAQ)。

BAQ 是讀取鹼基錯誤對齊的 Phred 尺度機率。 應用此選項有助於大大減少因錯誤對齊而導致的假 SNP

此屬性控制 -B 開關的添加,請將此屬性視為布林值。

property C
用於降級包含過多錯配的讀取的

比對品質的係數。

給定一個讀取,其 phred 尺度機率 q 是從對應位置產生,新的對應品質大約是 sqrt((INT-q)/INT)*INT。零值會停用此功能;如果啟用,BWA 的建議值為 50

此屬性控制 -C 參數及其關聯值的加入。將此屬性設定為所需的參數值。

property D

輸出每個樣本的讀取深度

此屬性控制 -D 開關的添加,請將此屬性視為布林值。

property E
延伸 BAQ 計算。

此選項有助於提高靈敏度,尤其適用於 MNPs,但可能會稍微損害特異性

此屬性控制 -E 開關的加入,將此屬性視為布林值。

property I

不執行 INDEL 偵測

此屬性控制 -I 開關的添加,將此屬性視為布林值。

property L
如果每個樣本的平均

深度高於 INT,則跳過 INDEL 偵測

這控制了 -L 參數及其相關值的添加。將此屬性設定為所需的參數值。

property M

將對應品質上限設定為 M

這會控制 -M 參數及其相關值的添加。將此屬性設定為所需的引數值。

property Q

要被視為鹼基的最低鹼基品質

此選項控制 -Q 參數的添加及其相關值。將此屬性設定為所需的參數值。

property S
輸出每個樣本的 Phred 尺度

鏈偏差 P 值

此屬性控制 -S 開關的加入,將此屬性視為布林值。

property b

輸入 BAM 檔案清單,每行一個檔案

這控制了 -b 參數及其相關值的添加。將此屬性設定為所需的參數值。

property d

在一個位置,每個輸入 BAM 最多讀取 INT 個讀取

這會控制 -d 參數及其相關值的添加。將此屬性設定為所需的引數值。

property e

Phred 尺度的間隙延伸定序錯誤機率。

降低 INT 會導致更長的插入缺失

這會控制 -e 參數及其相關值的添加。將此屬性設定為所需的引數值。

property f

FASTA 格式的 faidx 索引參考檔案。

該檔案可以選擇使用 razip 壓縮

此屬性控制 -f 參數及其關聯值的加入。將此屬性設定為所需的參數值。

property g
計算基因型概似值,並以

二進制呼叫格式 (BCF) 輸出

此屬性控制 -g 開關的添加,請將此屬性視為布林值。

property h

用於建立同聚物錯誤模型的係數。

給定一個長度為 l 的同聚物運行,大小為 s 的插入缺失的定序錯誤被建模為 INT*s/l

此選項控制 -h 參數的添加及其相關值。將此屬性設定為所需的參數值。

property illumina_13

假設品質是使用 Illumina 1.3+ 編碼

此屬性控制 -6 開關的添加,請將此屬性視為布林值。

property input_file

用於產生 mpileup 的輸入檔案

這會控制 input_file 參數及其相關值的添加。 將此屬性設定為所需的引數值。

property l
包含應產生 pileup 或 BCF 的區域或位置列表的 BED 或位置列表檔案

或位點

此設定控制 -l 參數及其相關值的添加。請將此屬性設定為所需參數值。

property o

Phred 尺度的間隙開啟定序錯誤機率。

降低 INT 會導致更多的插入缺失呼叫。

此設定控制 -o 參數及其相關值的添加。請將此屬性設定為所需參數值。

property p
從中取得插入缺失候選項的平台逗號分隔列表 (由 @RG-PL 決定)。

建議從具有低插入缺失錯誤率的定序技術(例如 ILLUMINA)收集插入缺失候選項

例如 ILLUMINA

這會控制 -p 參數及其相關值的添加。將此屬性設定為所需的引數值。

property q

要使用的對齊最低對應品質

此設定控制 -q 參數及其相關值的添加。請將此屬性設定為所需參數值。

property r

僅在 STR 區域中產生 pileup

此設定控制 -r 參數及其相關值的添加。請將此屬性設定為所需參數值。

property u
與 -g 類似,但輸出是

未壓縮的 BCF,這是管道傳輸的首選

此屬性控制 -u 開關的加入,將此屬性視為布林值。

class Bio.Sequencing.Applications.SamtoolsPhaseCommandline(cmd='samtools', **kwargs)

基底類別: AbstractCommandline

samtools phase 的命令列封裝器。

呼叫並定相雜合 SNP,等同於

$ samtools phase [-AF] [-k len] [-b prefix]
                 [-q minLOD] [-Q minBaseQ] <in.bam>

詳情請參閱 http://samtools.sourceforge.net/samtools.shtml

範例

>>> from Bio.Sequencing.Applications import SamtoolsPhaseCommandline
>>> input_bam = "/path/to/in.bam"
>>> samtools_phase_cmd = SamtoolsPhaseCommandline(input_bam=input_bam)
>>> print(samtools_phase_cmd)
samtools phase /path/to/in.bam
__init__(cmd='samtools', **kwargs)

初始化類別。

property A

丟棄具有模糊相位的讀取

此屬性控制 -A 開關的加入,將此屬性視為布林值。

property F

不嘗試修復嵌合讀取

此屬性控制 -F 開關的添加,請將此屬性視為布林值。

property Q
在雜合呼叫中要

使用的最低鹼基品質

此選項控制 -Q 參數的添加及其相關值。將此屬性設定為所需的參數值。

property b

BAM 輸出的前綴

這控制了 -b 參數及其相關值的添加。將此屬性設定為所需的參數值。

property in_bam

輸入檔案

此屬性控制輸入參數及其關聯值的加入。將此屬性設定為所需的參數值。

property k

局部定相的最大長度

此設定控制 -k 參數及其相關值的添加。請將此屬性設定為所需參數值。

property q
用於呼叫雜合子的

最低 Phred 尺度 LOD

此設定控制 -q 參數及其相關值的添加。請將此屬性設定為所需參數值。

class Bio.Sequencing.Applications.SamtoolsReheaderCommandline(cmd='samtools', **kwargs)

基底類別: AbstractCommandline

samtools reheader 的命令行包裝器。

將 in.bam 中的 header 替換為 in.header.sam 中的 header,等同於

$ samtools reheader <in.header.sam> <in.bam>

詳情請參閱 http://samtools.sourceforge.net/samtools.shtml

範例

>>> from Bio.Sequencing.Applications import SamtoolsReheaderCommandline
>>> input_header = "/path/to/header_sam_file"
>>> input_bam = "/path/to/input_bam_file"
>>> reheader_cmd = SamtoolsReheaderCommandline(input_header=input_header,
...                                            input_bam=input_bam)
>>> print(reheader_cmd)
samtools reheader /path/to/header_sam_file /path/to/input_bam_file
__init__(cmd='samtools', **kwargs)

初始化類別。

property bam_file

要寫入 header 的 BAM 檔案

這控制 input_bam 參數及其相關值的添加。將此屬性設定為所需的引數值。

property sam_file

帶有 header 的 Sam 檔案

此屬性控制 input_header 參數及其相關值的加入。將此屬性設定為所需的參數值。

class Bio.Sequencing.Applications.SamtoolsRmdupCommandline(cmd='samtools', **kwargs)

基底類別: AbstractCommandline

samtools rmdup 的命令行包裝器。

移除潛在的 PCR 重複序列,等同於

$ samtools rmdup [-sS] <input.srt.bam> <out.bam>

詳情請參閱 http://samtools.sourceforge.net/samtools.shtml

範例

>>> from Bio.Sequencing.Applications import SamtoolsRmdupCommandline
>>> input_sorted_bam = "/path/to/input.srt.bam"
>>> out_bam = "/path/to/out.bam"
>>> rmdup_cmd = SamtoolsRmdupCommandline(input_bam=input_sorted_bam,
...                                      out_bam=out_bam)
>>> print(rmdup_cmd)
samtools rmdup /path/to/input.srt.bam /path/to/out.bam
__init__(cmd='samtools', **kwargs)

初始化類別。

property S
將成對末端讀取視為單末端讀取

此屬性控制 -S 開關的加入,將此屬性視為布林值。

property input_file

名稱排序的比對檔案

這控制 in_bam 參數及其相關值的添加。將此屬性設定為所需的引數值。

property output_file

輸出檔案

這控制 out_bam 參數及其相關值的添加。將此屬性設定為所需的引數值。

property s

移除單末端讀取的重複序列。

預設情況下,該命令僅適用於成對末端讀取

此屬性控制 -s 切換的添加,將此屬性視為布林值。

Bio.Sequencing.Applications.SamtoolsSortCommandline

SamtoolsVersion0xSortCommandline 的別名

class Bio.Sequencing.Applications.SamtoolsVersion0xSortCommandline(cmd='samtools', **kwargs)

基底類別: AbstractCommandline

samtools 0.1.x 版本排序的命令行包裝器。

串連 BAM 檔案,等同於

$ samtools sort [-no] [-m maxMem] <in.bam> <out.prefix>

詳情請參閱 http://samtools.sourceforge.net/samtools.shtml

範例

>>> from Bio.Sequencing.Applications import SamtoolsVersion0xSortCommandline
>>> input_bam = "/path/to/input_bam"
>>> out_prefix = "/path/to/out_prefix"
>>> samtools_sort_cmd = SamtoolsVersion0xSortCommandline(input=input_bam, out_prefix=out_prefix)
>>> print(samtools_sort_cmd)
samtools sort /path/to/input_bam /path/to/out_prefix
__init__(cmd='samtools', **kwargs)

初始化類別。

property input

輸入 BAM 檔案

此屬性控制輸入參數及其關聯值的加入。將此屬性設定為所需的參數值。

property m

約略的最大所需記憶體

此選項控制 -m 參數的添加及其相關值。將此屬性設定為所需的參數值。

property n
依讀取名稱排序,而不是

依染色體座標排序

此屬性控制 -n 開關的添加,請將此屬性視為布林值。

property o
將最終對齊結果

輸出到標準輸出

此屬性控制 -o 切換的添加,將此屬性視為布林值。

property out_prefix

輸出前綴

此屬性控制 out_prefix 參數及其相關值的加入。將此屬性設定為所需的參數值。

class Bio.Sequencing.Applications.SamtoolsVersion1xSortCommandline(cmd='samtools', **kwargs)

基底類別: AbstractCommandline

samtools 1.3.x 版本排序的命令行包裝器。

串連 BAM 檔案,等同於

$ samtools sort [-n] [-T FREFIX] [-o file] [-I INT] [-m maxMem] <in.bam>

詳情請參閱 http://samtools.sourceforge.net/samtools.shtml

範例

>>> from Bio.Sequencing.Applications import SamtoolsVersion1xSortCommandline
>>> input_bam = "/path/to/input_bam"
>>> FREFIX = "/path/to/out_prefix"
>>> file_name = "/path/to/out_file"
>>> samtools_sort_cmd = SamtoolsVersion1xSortCommandline(input=input_bam, T=FREFIX, o=file_name)
>>> print(samtools_sort_cmd)
samtools sort -o /path/to/out_file -T /path/to/out_prefix /path/to/input_bam
__init__(cmd='samtools', **kwargs)

初始化類別。

property I
(INT) 設定最終輸出檔案的所需壓縮等級,

範圍從 0 (未壓縮) 或 1 (最快但最小壓縮) 到 9 (最佳壓縮但寫入速度最慢),類似於 gzip(1) 的壓縮等級設定。

此屬性控制 -I 參數及其相關值的添加。將此屬性設定為所需的參數值。

property O

(FORMAT) 將最終輸出寫入為 sam、bam 或 cram

這會控制 -O 參數及其相關值的添加。將此屬性設定為所需的引數值。

property T
(PREFIX) 將臨時檔案寫入到 PREFIX.nnnn.bam,或者如果指定的 PREFIX

是現有目錄,則寫入到 PREFIX/samtools.mmm.mmm.tmp.nnnn.bam,其中 mmm 是此排序命令調用獨有的。

這控制了 -T 參數及其相關值的添加。將此屬性設定為所需的參數值。

property input

輸入 SAM/BAM/CRAM 檔案

此屬性控制輸入參數及其關聯值的加入。將此屬性設定為所需的參數值。

property m

約略的最大所需記憶體

此選項控制 -m 參數的添加及其相關值。將此屬性設定為所需的參數值。

property n
依讀取名稱排序,而不是

依染色體座標排序

此屬性控制 -n 開關的添加,請將此屬性視為布林值。

property o
(file) 將最終排序的輸出寫入到 FILE,

而不是標準輸出

此設定控制 -o 參數及其相關值的添加。請將此屬性設定為所需參數值。

class Bio.Sequencing.Applications.SamtoolsTargetcutCommandline(cmd='samtools', **kwargs)

基底類別: AbstractCommandline

samtools targetcut 的命令行包裝器。

此命令透過檢視讀取深度的連續性來識別目標區域,計算目標的單倍體一致序列,並輸出一個 SAM,其中每個序列對應於一個目標,等同於

$ samtools targetcut [-Q minBaseQ] [-i inPenalty] [-0 em0]
                     [-1 em1] [-2 em2] [-f ref] <in.bam>

詳情請參閱 http://samtools.sourceforge.net/samtools.shtml

範例

>>> from Bio.Sequencing.Applications import SamtoolsTargetcutCommandline
>>> input_bam = "/path/to/aln.bam"
>>> samtools_targetcut_cmd = SamtoolsTargetcutCommandline(input_bam=input_bam)
>>> print(samtools_targetcut_cmd)
samtools targetcut /path/to/aln.bam
__init__(cmd='samtools', **kwargs)

初始化類別。

property Q

最低鹼基品質

此選項控制 -Q 參數的添加及其相關值。將此屬性設定為所需的參數值。

property em0

此屬性控制 -0 參數及其相關值的加入。將此屬性設定為所需的參數值。

property em1

此屬性控制 -1 參數及其相關值的加入。將此屬性設定為所需的參數值。

property em2

此設定控制是否加入 -2 參數及其相關值。請將此屬性設定為所需的參數值。

屬性 f

參考檔名

此屬性控制 -f 參數及其關聯值的加入。將此屬性設定為所需的參數值。

屬性 i

插入懲罰值

此設定控制 -i 參數及其相關值的添加。請將此屬性設定為所需參數值。

屬性 in_bam

輸入檔案

此屬性控制輸入參數及其關聯值的加入。將此屬性設定為所需的參數值。