Bio.ExPASy.cellosaurus 模組
用於解析來自 ExPASy 的 cellosaurus.txt 檔案的解析器。
請參閱 https://web.expasy.org/cellosaurus/
已使用第 18 版(2016 年 7 月)的發行版進行測試。
- 函式
read 讀取包含一個細胞系條目的檔案
parse 讀取包含多個細胞系條目的檔案
- 類別
Record 保存細胞系資料。
範例
此範例會下載 Cellosaurus 資料庫並進行解析。請注意,urlopen 會傳回位元組串流,而解析器需要純文字字串串流,因此我們使用 TextIOWrapper 將位元組轉換為使用 UTF-8 編碼的字串。如果您預先下載 cellosaurus.txt 檔案並開啟它,則不需要這樣做(請參閱下面的註解)。
>>> from urllib.request import urlopen
>>> from io import TextIOWrapper
>>> from Bio.ExPASy import cellosaurus
>>> url = "ftp://ftp.expasy.org/databases/cellosaurus/cellosaurus.txt"
>>> bytestream = urlopen(url)
>>> textstream = TextIOWrapper(bytestream, "UTF-8")
>>> # alternatively, use
>>> # textstream = open("cellosaurus.txt")
>>> # if you downloaded the cellosaurus.txt file in advance.
>>> records = cellosaurus.parse(textstream)
>>> for record in records:
... if 'Homo sapiens' in record['OX'][0]:
... print(record['ID'])
...
#15310-LN
#W7079
(L)PC6
0.5alpha
...
- Bio.ExPASy.cellosaurus.parse(handle)
解析細胞系記錄。
此函式用於解析包含多個記錄的細胞系檔案。
- 引數
handle - 檔案的控制代碼。
- Bio.ExPASy.cellosaurus.read(handle)
讀取一個細胞系記錄。
此函式用於解析僅包含一個記錄的細胞系檔案。
- 引數
handle - 檔案的控制代碼。
- class Bio.ExPASy.cellosaurus.Record
基底類別:
dict
將來自 ExPASy Cellosaurus 記錄的資訊保存為 Python 字典。
每個記錄都包含以下鍵
行代碼
內容
條目中的出現次數
ID
識別碼(細胞系名稱)
一次;開始一個條目
AC
登錄號(CVCL_xxxx)
一次
AS
次要登錄號
選用;一次
SY
同義詞
選用;一次
DR
交叉參照
選用;一次或多次
RX
參考文獻識別碼
選用:一次或多次
WW
網頁
選用;一次或多次
CC
註解
選用;一次或多次
ST
STR 分析資料
選用;兩次或多次
DI
疾病
選用;一次或多次
OX
來源物種
一次或多次
HI
階層
選用;一次或多次
OI
源自同一個人
選用;一次或多次
SX
細胞性別
選用;一次
AG
取樣時捐贈者的年齡
選用;一次
CA
類別
一次
DT
日期(條目歷程記錄)
一次
//
終止符
一次;結束一個條目
- __init__()
初始化類別。
- __repr__()
傳回 Record 物件的標準字串表示法。
- __str__()
傳回 Record 物件的可讀字串表示法。