Bio.PopGen.GenePop.Controller 模組

控制 GenePop 的模組。

class Bio.PopGen.GenePop.Controller.GenePopController(genepop_dir=None)

基底類別：object

定義一個與 GenePop 程式介面的類別。

__init__(genepop_dir=None)

初始化控制器。

genepop_dir 是 GenePop 所在的目錄。

二進位檔應命名為 Genepop (大寫 G)

test_pop_hz_deficiency(fname, enum_test=True, dememorization=10000, batches=20, iterations=5000)

使用 Hardy-Weinberg 檢定來檢測異型合子缺失。

返回一個包含字典的族群迭代器，其中 dictionary[locus]=(P-val, SE, Fis-WC, Fis-RH, steps)。

如果某些基因座的資訊不可用，則會傳回 None。SE 可能是 None（對於枚舉）。

test_pop_hz_excess(fname, enum_test=True, dememorization=10000, batches=20, iterations=5000)

使用 Hardy-Weinberg 檢定來檢測異型合子缺失。

返回一個包含字典的族群迭代器，其中 dictionary[locus]=(P-val, SE, Fis-WC, Fis-RH, steps)。

如果某些基因座的資訊不可用，則會傳回 None。SE 可能是 None（對於枚舉）。

test_pop_hz_prob(fname, ext, enum_test=False, dememorization=10000, batches=20, iterations=5000)

使用基於機率的 Hardy-Weinberg 檢定。

返回 2 個迭代器和一個最終元組

返回一個包含下列內容的基因座迭代器

一個字典[pop_pos]=(P-val, SE, Fis-WC, Fis-RH, steps)。如果某些族群的資訊不可用，則會傳回 None。SE 可能是 None（對於枚舉）。

費雪精確檢定的結果 (卡方值、自由度、機率)。

返回一個包含下列內容的族群迭代器

一個字典[locus]=(P-val, SE, Fis-WC, Fis-RH, steps)。如果某些基因座的資訊不可用，則會傳回 None。SE 可能是 None（對於枚舉）。

費雪精確檢定的結果 (卡方值、自由度、機率)。

最終元組 (卡方值、自由度、機率)。

test_global_hz_deficiency(fname, enum_test=True, dememorization=10000, batches=20, iterations=5000)

使用全域 Hardy-Weinberg 檢定來檢測異型合子缺失。

返回一個三元組，其中包含

每個族群的清單，包含 (族群名稱、P-val、SE、切換次數)。如果某些族群的資訊不可用，則會傳回 None。SE 可能是 None（對於枚舉）。
每個基因座的清單，包含 (基因座名稱、P-val、SE、切換次數)。如果某些基因座的資訊不可用，則會傳回 None。SE 可能是 None（對於枚舉）。
整體結果 (P-val、SE、切換次數)。

test_global_hz_excess(fname, enum_test=True, dememorization=10000, batches=20, iterations=5000)

使用全域 Hardy-Weinberg 檢定來檢測異型合子過多。

返回一個三元組，其中包含

每個族群的清單，包含 (族群名稱、P-val、SE、切換次數)。如果某些族群的資訊不可用，則會傳回 None。SE 可能是 None（對於枚舉）。
每個基因座的清單，包含 (基因座名稱、P-val、SE、切換次數)。如果某些基因座的資訊不可用，則會傳回 None。SE 可能是 None（對於枚舉）。
整體結果 (P-val、SE、切換次數)

test_ld(fname, dememorization=10000, batches=20, iterations=5000): 檢測每個族群中每對基因座的連鎖不平衡。

create_contingency_tables(fname): 提供建立基因型列聯表的機制。

test_genic_diff_all(fname, dememorization=10000, batches=20, iterations=5000): 提供所有族群的基因差異檢定機制。

test_genic_diff_pair(fname, dememorization=10000, batches=20, iterations=5000): 提供所有族群配對的基因差異檢定機制。

test_genotypic_diff_all(fname, dememorization=10000, batches=20, iterations=5000): 提供所有族群的基因型分化檢定。

test_genotypic_diff_pair(fname, dememorization=10000, batches=20, iterations=5000): 提供所有族群對的基因型分化檢定。

estimate_nm(fname)

估計遷移個體數。

參數

fname - 檔案名稱

回傳值

平均樣本大小
私有等位基因的平均頻率
Ne=10 時的遷移個體數
Ne=25 時的遷移個體數
Ne=50 時的遷移個體數
校正預期大小後的遷移個體數

calc_allele_genotype_freqs(fname)

計算每個基因座和每個樣本的等位基因和基因型頻率。

參數

fname - 檔案名稱

回傳包含 2 個元素的元組

族群迭代器，包含
- 族群名稱
- 基因座字典，鍵值 = 基因座名稱，內容為元組，包含基因型列表，其中包含 (等位基因 1, 等位基因 2, 觀察值, 期望值) (期望的同型合子, 觀察到的同型合子, 期望的異型合子, 觀察到的異型合子)，等位基因頻率/Fis 字典，鍵值為等位基因，包含 (計數, 頻率, Fis Weir & Cockerham)
- 總計為一對
- 計數
- Fis Weir & Cockerham,
- Fis Robertson & Hill
基因座迭代器，包含
- 基因座名稱
- 等位基因列表
- 族群列表，包含一個三元組
  - 族群名稱
  - 等位基因頻率列表，順序與上述等位基因列表相同
  - 基因數

將建立一個名為 fname.INF 的檔案

calc_diversities_fis_with_identity(fname): 計算基於一致性的基因多樣性和 Fis。

calc_diversities_fis_with_size(fname): 提供計算基於等位基因大小的基因多樣性和 Fis。

calc_fst_all(fname)

執行 GenePop 並取得 Fst/Fis/Fit（所有族群）。

參數

fname - 檔案名稱

回傳值

(multiLocusFis, multiLocusFst, multiLocus Fit),
元組迭代器（基因座名稱、Fis、Fst、Fit、Qintra、Qinter）

將建立一個名為 fname.FST 的檔案。

這不會回傳基因型頻率。

calc_fst_pair(fname): 估計所有族群對基於等位基因一致性的空間結構。

calc_rho_all(fname): 提供估計所有族群基於等位基因大小的空間結構。

calc_rho_pair(fname): 提供估計所有族群對基於等位基因大小的空間結構。

calc_ibd_diplo(fname, stat='a', scale='Log', min_dist=0.00001)

計算雙倍體數據的距離隔離統計。

有關參數詳細資訊，請參閱 _calc_ibd。

請注意，每個族群只能有一個個體，且個體名稱必須為樣本坐標。

calc_ibd_haplo(fname, stat='a', scale='Log', min_dist=0.00001)

計算單倍體數據的距離隔離統計。

有關參數詳細資訊，請參閱 _calc_ibd。

請注意，每個族群只能有一個個體，且個體名稱必須為樣本坐標。