Bio.ExPASy.cellosaurus 模組

用於解析來自 ExPASy 的 cellosaurus.txt 檔案的解析器。

請參閱 https://web.expasy.org/cellosaurus/

已使用第 18 版(2016 年 7 月)的發行版進行測試。

函式
  • read 讀取包含一個細胞系條目的檔案

  • parse 讀取包含多個細胞系條目的檔案

類別
  • Record 保存細胞系資料。

範例

此範例會下載 Cellosaurus 資料庫並進行解析。請注意,urlopen 會傳回位元組串流,而解析器需要純文字字串串流,因此我們使用 TextIOWrapper 將位元組轉換為使用 UTF-8 編碼的字串。如果您預先下載 cellosaurus.txt 檔案並開啟它,則不需要這樣做(請參閱下面的註解)。

>>> from urllib.request import urlopen
>>> from io import TextIOWrapper
>>> from Bio.ExPASy import cellosaurus
>>> url = "ftp://ftp.expasy.org/databases/cellosaurus/cellosaurus.txt"
>>> bytestream = urlopen(url)
>>> textstream = TextIOWrapper(bytestream, "UTF-8")
>>> # alternatively, use
>>> # textstream = open("cellosaurus.txt")
>>> # if you downloaded the cellosaurus.txt file in advance.
>>> records = cellosaurus.parse(textstream)
>>> for record in records:
...     if 'Homo sapiens' in record['OX'][0]:
...         print(record['ID'])  
...
#15310-LN
#W7079
(L)PC6
0.5alpha
...
Bio.ExPASy.cellosaurus.parse(handle)

解析細胞系記錄。

此函式用於解析包含多個記錄的細胞系檔案。

引數
  • handle - 檔案的控制代碼。

Bio.ExPASy.cellosaurus.read(handle)

讀取一個細胞系記錄。

此函式用於解析僅包含一個記錄的細胞系檔案。

引數
  • handle - 檔案的控制代碼。

class Bio.ExPASy.cellosaurus.Record

基底類別:dict

將來自 ExPASy Cellosaurus 記錄的資訊保存為 Python 字典。

每個記錄都包含以下鍵

行代碼

內容

條目中的出現次數

ID

識別碼(細胞系名稱)

一次;開始一個條目

AC

登錄號(CVCL_xxxx)

一次

AS

次要登錄號

選用;一次

SY

同義詞

選用;一次

DR

交叉參照

選用;一次或多次

RX

參考文獻識別碼

選用:一次或多次

WW

網頁

選用;一次或多次

CC

註解

選用;一次或多次

ST

STR 分析資料

選用;兩次或多次

DI

疾病

選用;一次或多次

OX

來源物種

一次或多次

HI

階層

選用;一次或多次

OI

源自同一個人

選用;一次或多次

SX

細胞性別

選用;一次

AG

取樣時捐贈者的年齡

選用;一次

CA

類別

一次

DT

日期(條目歷程記錄)

一次

//

終止符

一次;結束一個條目

__init__()

初始化類別。

__repr__()

傳回 Record 物件的標準字串表示法。

__str__()

傳回 Record 物件的可讀字串表示法。