Bio.PopGen.GenePop.Controller 模組

控制 GenePop 的模組。

class Bio.PopGen.GenePop.Controller.GenePopController(genepop_dir=None)

基底類別:object

定義一個與 GenePop 程式介面的類別。

__init__(genepop_dir=None)

初始化控制器。

genepop_dir 是 GenePop 所在的目錄。

二進位檔應命名為 Genepop (大寫 G)

test_pop_hz_deficiency(fname, enum_test=True, dememorization=10000, batches=20, iterations=5000)

使用 Hardy-Weinberg 檢定來檢測異型合子缺失。

返回一個包含字典的族群迭代器,其中 dictionary[locus]=(P-val, SE, Fis-WC, Fis-RH, steps)。

如果某些基因座的資訊不可用,則會傳回 None。SE 可能是 None(對於枚舉)。

test_pop_hz_excess(fname, enum_test=True, dememorization=10000, batches=20, iterations=5000)

使用 Hardy-Weinberg 檢定來檢測異型合子缺失。

返回一個包含字典的族群迭代器,其中 dictionary[locus]=(P-val, SE, Fis-WC, Fis-RH, steps)。

如果某些基因座的資訊不可用,則會傳回 None。SE 可能是 None(對於枚舉)。

test_pop_hz_prob(fname, ext, enum_test=False, dememorization=10000, batches=20, iterations=5000)

使用基於機率的 Hardy-Weinberg 檢定。

返回 2 個迭代器和一個最終元組

  1. 返回一個包含下列內容的基因座迭代器
    • 一個字典[pop_pos]=(P-val, SE, Fis-WC, Fis-RH, steps)。如果某些族群的資訊不可用,則會傳回 None。SE 可能是 None(對於枚舉)。

    • 費雪精確檢定的結果 (卡方值、自由度、機率)。

  2. 返回一個包含下列內容的族群迭代器
    • 一個字典[locus]=(P-val, SE, Fis-WC, Fis-RH, steps)。如果某些基因座的資訊不可用,則會傳回 None。SE 可能是 None(對於枚舉)。

    • 費雪精確檢定的結果 (卡方值、自由度、機率)。

  3. 最終元組 (卡方值、自由度、機率)。

test_global_hz_deficiency(fname, enum_test=True, dememorization=10000, batches=20, iterations=5000)

使用全域 Hardy-Weinberg 檢定來檢測異型合子缺失。

返回一個三元組,其中包含
  • 每個族群的清單,包含 (族群名稱、P-val、SE、切換次數)。如果某些族群的資訊不可用,則會傳回 None。SE 可能是 None(對於枚舉)。

  • 每個基因座的清單,包含 (基因座名稱、P-val、SE、切換次數)。如果某些基因座的資訊不可用,則會傳回 None。SE 可能是 None(對於枚舉)。

  • 整體結果 (P-val、SE、切換次數)。

test_global_hz_excess(fname, enum_test=True, dememorization=10000, batches=20, iterations=5000)

使用全域 Hardy-Weinberg 檢定來檢測異型合子過多。

返回一個三元組,其中包含
  • 每個族群的清單,包含 (族群名稱、P-val、SE、切換次數)。如果某些族群的資訊不可用,則會傳回 None。SE 可能是 None(對於枚舉)。

  • 每個基因座的清單,包含 (基因座名稱、P-val、SE、切換次數)。如果某些基因座的資訊不可用,則會傳回 None。SE 可能是 None(對於枚舉)。

  • 整體結果 (P-val、SE、切換次數)

test_ld(fname, dememorization=10000, batches=20, iterations=5000)

檢測每個族群中每對基因座的連鎖不平衡。

create_contingency_tables(fname)

提供建立基因型列聯表的機制。

test_genic_diff_all(fname, dememorization=10000, batches=20, iterations=5000)

提供所有族群的基因差異檢定機制。

test_genic_diff_pair(fname, dememorization=10000, batches=20, iterations=5000)

提供所有族群配對的基因差異檢定機制。

test_genotypic_diff_all(fname, dememorization=10000, batches=20, iterations=5000)

提供所有族群的基因型分化檢定。

test_genotypic_diff_pair(fname, dememorization=10000, batches=20, iterations=5000)

提供所有族群對的基因型分化檢定。

estimate_nm(fname)

估計遷移個體數。

參數
  • fname - 檔案名稱

回傳值
  • 平均樣本大小

  • 私有等位基因的平均頻率

  • Ne=10 時的遷移個體數

  • Ne=25 時的遷移個體數

  • Ne=50 時的遷移個體數

  • 校正預期大小後的遷移個體數

calc_allele_genotype_freqs(fname)

計算每個基因座和每個樣本的等位基因和基因型頻率。

參數
  • fname - 檔案名稱

回傳包含 2 個元素的元組
  • 族群迭代器,包含

    • 族群名稱

    • 基因座字典,鍵值 = 基因座名稱,內容為元組,包含基因型列表,其中包含 (等位基因 1, 等位基因 2, 觀察值, 期望值) (期望的同型合子, 觀察到的同型合子, 期望的異型合子, 觀察到的異型合子),等位基因頻率/Fis 字典,鍵值為等位基因,包含 (計數, 頻率, Fis Weir & Cockerham)

    • 總計為一對

    • 計數

    • Fis Weir & Cockerham,

    • Fis Robertson & Hill

  • 基因座迭代器,包含

    • 基因座名稱

    • 等位基因列表

    • 族群列表,包含一個三元組

      • 族群名稱

      • 等位基因頻率列表,順序與上述等位基因列表相同

      • 基因數

將建立一個名為 fname.INF 的檔案

calc_diversities_fis_with_identity(fname)

計算基於一致性的基因多樣性和 Fis。

calc_diversities_fis_with_size(fname)

提供計算基於等位基因大小的基因多樣性和 Fis。

calc_fst_all(fname)

執行 GenePop 並取得 Fst/Fis/Fit(所有族群)。

參數
  • fname - 檔案名稱

回傳值
  • (multiLocusFis, multiLocusFst, multiLocus Fit),

  • 元組迭代器(基因座名稱、Fis、Fst、Fit、Qintra、Qinter)

將建立一個名為 fname.FST 的檔案。

這不會回傳基因型頻率。

calc_fst_pair(fname)

估計所有族群對基於等位基因一致性的空間結構。

calc_rho_all(fname)

提供估計所有族群基於等位基因大小的空間結構。

calc_rho_pair(fname)

提供估計所有族群對基於等位基因大小的空間結構。

calc_ibd_diplo(fname, stat='a', scale='Log', min_dist=0.00001)

計算雙倍體數據的距離隔離統計。

有關參數詳細資訊,請參閱 _calc_ibd。

請注意,每個族群只能有一個個體,且個體名稱必須為樣本坐標。

calc_ibd_haplo(fname, stat='a', scale='Log', min_dist=0.00001)

計算單倍體數據的距離隔離統計。

有關參數詳細資訊,請參閱 _calc_ibd。

請注意,每個族群只能有一個個體,且個體名稱必須為樣本坐標。