Bio.UniProt.GOA 模組
用於解析 UniProt-GOA 的 GAF、GPA 和 GPI 格式的解析器。
Uniprot-GOA README + GAF 格式描述:ftp://ftp.ebi.ac.uk/pub/databases/GO/goa/UNIPROT/README
基因關聯檔案 (GAF) 格式:http://geneontology.org/docs/go-annotation-file-gaf-format-2.2/ http://geneontology.org/docs/go-annotation-file-gaf-format-2.1/ http://geneontology.org/docs/go-annotation-file-gaf-format-2.0/
基因產物關聯資料 (GPA 格式) README:http://geneontology.org/docs/gene-product-association-data-gpad-format/
基因產物資訊 (GPI 格式) README:http://geneontology.org/docs/gene-product-information-gpi-format/
Go 註解檔案位於此處:ftp://ftp.ebi.ac.uk/pub/databases/GO/goa/
- Bio.UniProt.GOA.gpi_iterator(handle)
讀取 GPI 格式檔案。
應呼叫此函數以讀取 gp_information.goa_uniprot 檔案。目前只有一種格式,但這可能會改變,因此此函數是未來包裝函式的佔位符。
- Bio.UniProt.GOA.gpa_iterator(handle)
讀取 GPA 格式檔案。
應呼叫此函數以讀取 gene_association.goa_uniprot 檔案。讀取第一個記錄並根據需要傳回 gpa 1.1 或 gpa 1.0 迭代器
- Bio.UniProt.GOA.gafbyproteiniterator(handle)
迭代基因關聯檔案中的記錄。
傳回具有相同 DB_Object_ID 的所有連續記錄的清單。應呼叫此函數以讀取 gene_association.goa_uniprot 檔案。讀取第一個記錄並根據需要傳回 gaf 2.0 或 gaf 1.0 迭代器。2016-04-09:新增 GAF 2.1 迭代器 & 修正迭代器指派中的錯誤。同時,GAF 2.1 使用 GAF 2.0 迭代器
- Bio.UniProt.GOA.gafiterator(handle)
迭代 GAF 1.0 或 2.x 檔案。
應呼叫此函數以讀取 gene_association.goa_uniprot 檔案。讀取第一個記錄並根據需要傳回 gaf 2.x 或 gaf 1.0 迭代器
範例:開啟、讀取、迭代和篩選結果。
原始資料檔案已修剪為約 600 列。
原始來源 ftp://ftp.ebi.ac.uk/pub/databases/GO/goa/YEAST/goa_yeast.gaf.gz
>>> from Bio.UniProt.GOA import gafiterator, record_has >>> Evidence = {'Evidence': set(['ND'])} >>> Synonym = {'Synonym': set(['YA19A_YEAST', 'YAL019W-A'])} >>> Taxon_ID = {'Taxon_ID': set(['taxon:559292'])} >>> with open('UniProt/goa_yeast.gaf', 'r') as handle: ... for rec in gafiterator(handle): ... if record_has(rec, Taxon_ID) and record_has(rec, Evidence) and record_has(rec, Synonym): ... for key in ('DB_Object_Name', 'Evidence', 'Synonym', 'Taxon_ID'): ... print(rec[key]) ... Putative uncharacterized protein YAL019W-A ND ['YA19A_YEAST', 'YAL019W-A'] ['taxon:559292'] Putative uncharacterized protein YAL019W-A ND ['YA19A_YEAST', 'YAL019W-A'] ['taxon:559292'] Putative uncharacterized protein YAL019W-A ND ['YA19A_YEAST', 'YAL019W-A'] ['taxon:559292']
- Bio.UniProt.GOA.writerec(outrec, handle, fields=GAF20FIELDS)
將單個 UniProt-GOA 記錄寫入輸出流。
呼叫者應知道格式版本。預設值:gaf-2.0。如果標頭具有值,則假定這是第一個記錄,會寫入標頭。
- Bio.UniProt.GOA.writebyproteinrec(outprotrec, handle, fields=GAF20FIELDS)
將 GAF 記錄清單寫入輸出流。
呼叫者應知道格式版本。預設值:gaf-2.0。如果標頭具有值,則假定這是第一個記錄,會寫入標頭。通常,該清單是由 fafbyproteinrec 讀取的,其中包含所有具有相同 DB_Object_ID 的連續行
- Bio.UniProt.GOA.record_has(inrec, fieldvals)
接受記錄和欄位值的字典。
格式為 {'field_name':set([val1, val2])}。如果記錄中的任何欄位具有相符的值,則此函數傳回 True。否則,傳回 False。