Bio.NaiveBayes 模組

通用樸素貝氏學習器(已棄用)。

樸素貝氏是一種監督式分類演算法,它使用貝氏規則來計算新的觀測值與一些先前觀察到的資料之間的擬合度。觀測值是離散特徵向量,並假設特徵是獨立的,這是貝氏假設。儘管這幾乎從來都不是真的,但分類器在實踐中效果仍然相當不錯。

詞彙表
  • 觀測值 - 離散資料的特徵向量。

  • 類別 - 觀測值可能的分級。

類別
  • NaiveBayes - 保存樸素貝氏分類器的資訊。

函數
  • train - 訓練一個新的樸素貝氏分類器。

  • calculate - 計算給定觀測值的每個類別的機率。

  • classify - 將觀測值分類到一個類別中。

class Bio.NaiveBayes.NaiveBayes

基底:object

保存樸素貝氏分類器的資訊。

屬性
  • classes - 可能的資料類別列表。

  • p_conditional - CLASS x DIM 的字典陣列,值 -> P(value|class,dim)

  • p_prior - 每個類別的先驗機率列表。

  • dimensionality - 資料的維度。

__init__()

初始化類別。

Bio.NaiveBayes.calculate(nb, observation, scale=False)

計算每個類別的對數條件機率。

參數
  • nb - 一個已訓練的 NaiveBayes 分類器。

  • observation - 代表觀察到的資料的列表。

  • scale - 布林值,指示是否應按 P(observation) 縮放機率。預設情況下,不進行縮放。

將返回一個字典,其中鍵是類別,值是類別的對數機率。

Bio.NaiveBayes.classify(nb, observation)

將觀測值分類到一個類別中。

Bio.NaiveBayes.train(training_set, results, priors=None, typecode=None)

在訓練集上訓練一個 NaiveBayes 分類器。

參數
  • training_set - 觀測值列表。

  • results - 每個觀測值的類別分配列表。因此,training_set 和 results 的長度必須相同。

  • priors - 可選的字典,指定每種結果類型的先驗機率。如果未指定,則將根據訓練結果估計先驗機率。