Bio.SCOP 套件
子模組
模組內容
SCOP:蛋白質結構分類。
SCOP 資料庫旨在提供手動構建的分類,將所有已知的蛋白質結構分類成一個層次結構,其主要層級為家族、超家族和摺疊。
「SCOP 可解析檔案」:http://scop.mrc-lmb.cam.ac.uk/legacy/parse/
此模組中的 Scop 物件代表整個 SCOP 分類。它可以從三個 SCOP 可解析檔案建立,修改後可以轉換回相同的檔案格式。單一 SCOP 結構域(由 Domain 類別表示)可以使用結構域的 SCOP 識別符 (sid) 從 Scop 取得。
- nodeCodeDict – 已知的 2 個字母節點代碼與較長描述之間的映射。
已知的節點類型為 'cl' (類別)、'cf' (摺疊)、'sf' (超家族)、'fa' (家族)、'dm' (結構域)、'sp' (物種)、'px' (結構域)。未來可能會新增其他節點類型。
此模組也提供透過 WWW 存取 SCOP 的程式碼。
- 函式
search – 存取主要的 CGI 指令碼(已棄用,不再可用)。
_open – 內部使用的函式。
- Bio.SCOP.cmp_sccs(sccs1, sccs2)
排序 SCOP 簡潔分類字串 (sccs)。
a.4.5.1 < a.4.5.11 < b.1.1.1
sccs (例如 a.4.5.11) 緊湊地表示結構域的分類。字母表示類別,數字分別表示摺疊、超家族和家族。
- Bio.SCOP.parse_domain(term)
將 ASTRAL 標頭字串轉換為 Scop 結構域。
ASTRAL (http://astral.stanford.edu/) 標頭包含 SCOP 結構域的簡潔描述。當 Domain 物件轉換為字串時,會使用非常相似的格式。此方法傳回的 Domain 包含大部分 SCOP 資訊,但它不會位於 SCOP 層次結構內(即父節點將為 None)。描述由 SCOP 蛋白質和物種描述組成。
典型的 ASTRAL 標頭如下所示 – >d1tpt_1 a.46.2.1 (1-70) 胸腺嘧啶核苷磷酸化酶 {大腸桿菌}
- class Bio.SCOP.Scop(cla_handle=None, des_handle=None, hie_handle=None, dir_path=None, db_handle=None, version=None)
基底:
object
整個 SCOP 層次結構。
root – 層次結構的根節點
- __init__(cla_handle=None, des_handle=None, hie_handle=None, dir_path=None, db_handle=None, version=None)
從 SCOP 可解析檔案或 SQL 後端建立 SCOP 層次結構。
如果未提供任何檔案控制代碼,則會傳回具有單一空白根節點的 Scop 物件。
如果給定目錄和版本(使用 dir_path=..,version=…)或每個檔案的檔案控制代碼,則整個 scop 樹狀結構將在記憶體中建立。
如果給定 MySQLdb 資料庫控制代碼,則將根據需要建立樹狀結構,最大限度地減少建構時間。要建立 SQL 資料庫到方法 write_xxx_sql 以建立表格。
- getRoot()
取得根節點。
- getDomainBySid(sid)
從其 sid 傳回結構域。
- getNodeBySunid(sunid)
從其 sunid 傳回節點。
- getDomains()
傳回所有 SCOP 結構域的排序元組。
- write_hie(handle)
從此物件建立 HIE SCOP 可解析檔案。
- write_des(handle)
從此物件建立 DES SCOP 可解析檔案。
- write_cla(handle)
從此物件建立 CLA SCOP 可解析檔案。
- getDomainFromSQL(sunid=None, sid=None)
使用 sunid 或 sid 從 SQL 後端載入節點。
- getAscendentFromSQL(node, type)
使用 SQL 後端取得上層節點。
- getDescendentsFromSQL(node, type)
使用資料庫後端取得節點的下層節點。
這避免重複迭代 SQL 呼叫,因此比重複呼叫 node.getChildren() 快得多。
- write_hie_sql(handle)
將 HIE 資料寫入 SQL 資料庫。
- write_cla_sql(handle)
將 CLA 資料寫入 SQL 資料庫。
- write_des_sql(handle)
將 DES 資料寫入 SQL 資料庫。
- class Bio.SCOP.Node(scop=None)
基底:
object
SCOP 層級結構中的節點。
- 屬性
sunid – SCOP 唯一識別碼。例如 ‘14986’
parent – 父節點
children – 子節點的列表
sccs – SCOP 簡潔分類字串。例如 ‘a.1.1.2’
type – 雙字母節點類型代碼。例如,用於結構域的 ‘px’
description – 描述文字。
- __init__(scop=None)
初始化 SCOP 層級結構中的節點。
如果建構函式提供了 Scop 實例,則將使用它透過 SQL 方法查詢相關參考。如果沒有提供實例,則假設整個樹狀結構存在並且已連接。
- __str__()
將節點表示為字串。
- toHieRecord()
回傳 Hie.Record。
- toDesRecord()
回傳 Des.Record。
- getChildren()
回傳此節點的子節點列表。
- getParent()
回傳此節點的父節點。
- getDescendents(node_type)
回傳指定類型之所有後代節點的列表。
節點類型可以是雙字母代碼或較長的描述,例如 ‘fa’ 或 ‘family’。
- getAscendent(node_type)
回傳指定類型的祖先節點,如果沒有則回傳 None。
節點類型可以是雙字母代碼或較長的描述,例如 ‘fa’ 或 ‘family’。
- class Bio.SCOP.Domain(scop=None)
基底類別:
Node
一個 SCOP 結構域。SCOP 層級結構中的葉節點。
- 屬性
sid - SCOP 結構域識別碼。例如
"d5hbib_"
residues - Residue 物件。它定義了組成此結構域的 PDB 原子集合。
- __init__(scop=None)
初始化一個 SCOP 結構域物件。
- __str__()
將 SCOP 結構域表示為字串。
- toDesRecord()
回傳 Des.Record。
- toClaRecord()
回傳 Cla.Record。
- class Bio.SCOP.Astral(dir_path=None, version=None, scop=None, astral_file=None, db_handle=None)
基底:
object
ASTRAL 資料庫的表示。
ASTRAL 資料庫的抽象化,它具有所有 SCOP 結構域的序列,以及按百分比 ID 或 E 值進行的聚類。
- __init__(dir_path=None, version=None, scop=None, astral_file=None, db_handle=None)
初始化 astral 資料庫。
- 您必須提供 SCOP 檔案的目錄
- dir_path - 字串,scopseq-x.xx 目錄所在位置的路徑
(不是目錄本身),以及
version - 版本號碼。
- 或者,一個 FASTA 檔案
astral_file - 字串,fasta 檔案的路徑(將載入記憶體)
- 或者,一個 MYSQL 資料庫
db_handle - MYSQL 資料庫的資料庫控制代碼,其中包含一個具有 astral 資料的 ‘astral’ 表格。可以使用 writeToSQL 建立此資料庫。
- domainsClusteredByEv(id)
取得按 E 值聚類的結構域。
- domainsClusteredById(id)
取得按百分比一致性聚類的結構域。
- getAstralDomainsFromFile(filename=None, file_handle=None)
從包含 sid 列表的檔案中取得 scop 結構域。
- getAstralDomainsFromSQL(column)
從 MySQL 資料庫載入 ASTRAL 結構域。
從 MYSQL 資料庫的 astral 表格中的資料行載入一組 astral 結構域 (可以使用 writeToSQL(...) 建立)。
- getSeqBySid(domain)
從其 sid 取得給定結構域的 seq 記錄。
- getSeq(domain)
回傳與結構域相關的 seq。
- hashedDomainsById(id)
取得以字典形式按序列一致性聚類的結構域。
- hashedDomainsByEv(id)
取得以字典形式按 E 值聚類的結構域。
- isDomainInId(dom, id)
如果結構域位於百分比 ID 的星際叢集中,則返回 true。
- isDomainInEv(dom, id)
如果結構域位於 e-value 的 ASTRAL 叢集中,則返回 true。
- writeToSQL(db_handle)
將 ASTRAL 資料庫寫入 MYSQL 資料庫。
- Bio.SCOP.search(pdb=None, key=None, sid=None, disp=None, dir=None, loc=None, cgi='http://scop.mrc-lmb.cam.ac.uk/legacy/search.cgi', **keywds)
存取 SCOP 搜尋並傳回結果的句柄 (已棄用)。
存取 search.cgi 並傳回結果的句柄。有關參數的說明,請參閱線上說明檔案:http://scop.mrc-lmb.cam.ac.uk/legacy/help.html
如果發生網路錯誤,則引發 IOError。
此函數現在已棄用,將在 Biopython 的未來版本中移除,因為此 search.cgi API 不再可用,SCOP 現在託管在 EBI 上。