Bio.UniProt.GOA 模組

用於解析 UniProt-GOA 的 GAF、GPA 和 GPI 格式的解析器。

Uniprot-GOA README + GAF 格式描述:ftp://ftp.ebi.ac.uk/pub/databases/GO/goa/UNIPROT/README

基因關聯檔案 (GAF) 格式:http://geneontology.org/docs/go-annotation-file-gaf-format-2.2/ http://geneontology.org/docs/go-annotation-file-gaf-format-2.1/ http://geneontology.org/docs/go-annotation-file-gaf-format-2.0/

基因產物關聯資料 (GPA 格式) README:http://geneontology.org/docs/gene-product-association-data-gpad-format/

基因產物資訊 (GPI 格式) README:http://geneontology.org/docs/gene-product-information-gpi-format/

Go 註解檔案位於此處:ftp://ftp.ebi.ac.uk/pub/databases/GO/goa/

Bio.UniProt.GOA.gpi_iterator(handle)

讀取 GPI 格式檔案。

應呼叫此函數以讀取 gp_information.goa_uniprot 檔案。目前只有一種格式,但這可能會改變,因此此函數是未來包裝函式的佔位符。

Bio.UniProt.GOA.gpa_iterator(handle)

讀取 GPA 格式檔案。

應呼叫此函數以讀取 gene_association.goa_uniprot 檔案。讀取第一個記錄並根據需要傳回 gpa 1.1 或 gpa 1.0 迭代器

Bio.UniProt.GOA.gafbyproteiniterator(handle)

迭代基因關聯檔案中的記錄。

傳回具有相同 DB_Object_ID 的所有連續記錄的清單。應呼叫此函數以讀取 gene_association.goa_uniprot 檔案。讀取第一個記錄並根據需要傳回 gaf 2.0 或 gaf 1.0 迭代器。2016-04-09:新增 GAF 2.1 迭代器 & 修正迭代器指派中的錯誤。同時,GAF 2.1 使用 GAF 2.0 迭代器

Bio.UniProt.GOA.gafiterator(handle)

迭代 GAF 1.0 或 2.x 檔案。

應呼叫此函數以讀取 gene_association.goa_uniprot 檔案。讀取第一個記錄並根據需要傳回 gaf 2.x 或 gaf 1.0 迭代器

範例:開啟、讀取、迭代和篩選結果。

原始資料檔案已修剪為約 600 列。

原始來源 ftp://ftp.ebi.ac.uk/pub/databases/GO/goa/YEAST/goa_yeast.gaf.gz

>>> from Bio.UniProt.GOA import gafiterator, record_has
>>> Evidence = {'Evidence': set(['ND'])}
>>> Synonym = {'Synonym': set(['YA19A_YEAST', 'YAL019W-A'])}
>>> Taxon_ID = {'Taxon_ID': set(['taxon:559292'])}
>>> with open('UniProt/goa_yeast.gaf', 'r') as handle:
...     for rec in gafiterator(handle):
...         if record_has(rec, Taxon_ID) and record_has(rec, Evidence) and record_has(rec, Synonym):
...             for key in ('DB_Object_Name', 'Evidence', 'Synonym', 'Taxon_ID'):
...                 print(rec[key])
...
Putative uncharacterized protein YAL019W-A
ND
['YA19A_YEAST', 'YAL019W-A']
['taxon:559292']
Putative uncharacterized protein YAL019W-A
ND
['YA19A_YEAST', 'YAL019W-A']
['taxon:559292']
Putative uncharacterized protein YAL019W-A
ND
['YA19A_YEAST', 'YAL019W-A']
['taxon:559292']
Bio.UniProt.GOA.writerec(outrec, handle, fields=GAF20FIELDS)

將單個 UniProt-GOA 記錄寫入輸出流。

呼叫者應知道格式版本。預設值:gaf-2.0。如果標頭具有值,則假定這是第一個記錄,會寫入標頭。

Bio.UniProt.GOA.writebyproteinrec(outprotrec, handle, fields=GAF20FIELDS)

將 GAF 記錄清單寫入輸出流。

呼叫者應知道格式版本。預設值:gaf-2.0。如果標頭具有值,則假定這是第一個記錄,會寫入標頭。通常,該清單是由 fafbyproteinrec 讀取的,其中包含所有具有相同 DB_Object_ID 的連續行

Bio.UniProt.GOA.record_has(inrec, fieldvals)

接受記錄和欄位值的字典。

格式為 {'field_name':set([val1, val2])}。如果記錄中的任何欄位具有相符的值,則此函數傳回 True。否則,傳回 False。