生物数据库
专用数据库 文献数据库PubMed
三大核酸信息库
NCB I(GenBank)美国
ENA 欧洲
DDBJ 日本
数据库联盟 INSDC
基因组数据库:Ensemble 是由欧洲生物信息学研究所和英国桑格研究院合作开发的
微生物宏基因组数据库:jcvi
二级核酸数据库
RefSeq :参考序列数据库
dbEST :表达序列标签数据库
Gene : 为用户提供基因序列注释和检索服务
ncRNAdb : 非编码RNA数据库,提供非编码RNA序列和功能信息
miRBase : 主要存放已发表的micro RNA序列和注释。
蛋白质数据库
一级蛋白质序列数据库
swissprot :人工注释的蛋白质序列数据库 可信度高 冗余度小
TrEMBL : 由计算机完成的注释 可信度低 冗余度大
PIR : 蛋白质信息资源库 共同组成:UniProt 分三层
UniParc : 收录所有的UniProt数据库子库中的蛋白质序列,量大,粗糙
UniRef :归纳UniProt几个主要数据库并将重复序列去除后的数据库
UniProtKB : 有详细注释并与其他数据库有链接的数据库
非标注残基包括以下索引词
HET : 非标准残基及位置
HETNAM:非标准残基的化学名称
FORMUL:非标准残基的化学式
LINK : 残基间化学键
ATOM : 原子坐标
二级蛋白质数据库
Pfam : 蛋白质结构域家族的结合
CATH: 四种结构的首字母
SCOP2 :蛋白质结构类数据库
专项数据库
KEGC:关于基因、蛋白质、生化反应以及通路的综合生物信息数据库,由多个子库组成
OMIM:遗传病基因库