常用的查询蛋白质结构以及序列的数据库主要有哪些?
发布网友
发布时间:2022-04-23 02:50
我来回答
共3个回答
懂视网
时间:2022-04-08 11:13
PDB欧洲分站
PDB日本分站
PDB美国分站
生物核磁共振数据库(美国)
蛋白质数据库
标签:
热心网友
时间:2022-04-08 08:21
1. PIR和PSD
PIR国际蛋白质序列数据库(PSD)是由蛋白质信息资源(PIR)、慕尼黑蛋白质序列信息中心(MIPS)和日本国际蛋白质序列数据库(JIPID)共同维护的国际上最大的公共蛋白质序列数据库,可在这里下载。这是一个全面的、经过注释的、非冗余的蛋白质序列数据库,其中包括来自几十个完整基因组的蛋白质序列。所有序列数据都经过整理,超过99%的序列已按蛋白质家族分类,一半以上还按蛋白质超家族进行了分类。PSD的注释中还包括对许多序列、结构、基因组和文献数据库的交叉索引,以及数据库内部条目之间的索引,这些内部索引帮助用户在包括复合物、酶-底物相互作用、活化和*级联和具有共同特征的条目之间方便的检索。每季度都发行一次完整的数据库,每周可以得到更新部分。
PSD数据库有几个辅助数据库,如基于超家族的非冗余库等。PIR提供三类序列搜索服务:基于文本的交互式检索;标准的序列相似性搜索,包括BLAST、FASTA等;结合序列相似性、注释信息和蛋白质家族信息的高级搜索,包括按注释分类的相似性搜索、结构域搜索GeneFIND等。
2. SWISS-PROT
SWISS-PROT是经过注释的蛋白质序列数据库,由欧洲生物信息学研究所(EBI)维护。数据库由蛋白质序列条目构成,每个条目包含蛋白质序列、引用文献信息、分类学信息、注释等,注释中包括蛋白质的功能、转录后修饰、特殊位点和区域、二级结构、四级结构、与其它序列的相似性、序列残缺与疾病的关系、序列变异体和冲突等信息。SWISS-PROT中尽可能减少了冗余序列,并与其它30多个数据建立了交叉引用,其中包括核酸序列库、蛋白质序列库和蛋白质结构库等。
利用序列提取系统(SRS)可以方便地检索SWISS-PROT和其它EBI的数据库。SWISS-PROT只接受直接测序获得的蛋白质序列,序列提交可以在其Web页面上完成。
3. PROSITE
PROSITE数据库收集了生物学有显著意义的蛋白质位点和序列模式,并能根据这些位点和模式快速和可靠地鉴别一个未知功能的蛋白质序列应该属于哪一个蛋白质家族。有的情况下,某个蛋白质与已知功能蛋白质的整体序列相似性很低,但由于功能的需要保留了与功能密切相关的序列模式,这样就可能通过PROSITE的搜索找到隐含的功能motif,因此是序列分析的有效工具。PROSITE中涉及的序列模式包括酶的催化位点、配体结合位点、与金属离子结合的残基、二硫键的半胱氨酸、与小分子或其它蛋白质结合的区域等;除了序列模式之外,PROSITE还包括由多序列比对构建的profile,能更敏感地发现序列与profile的相似性。PROSITE的主页上提供各种相关检索服务。
4. PDB
蛋白质数据仓库(PDB)是国际上唯一的生物大分子结构数据档案库,由美国Brookhaven国家实验室建立。PDB收集的数据来源于X光晶体衍射和核磁共振(NMR)的数据,经过整理和确认后存档而成。目前PDB数据库的维护由结构生物信息学研究合作组织(RCSB)负责。RCSB的主服务器和世界各地的镜像服务器提供数据库的检索和下载服务,以及关于PDB数据文件格式和其它文档的说明,PDB数据还可以从发行的光盘获得。使用Rasmol等软件可以在计算机上按PDB文件显示生物大分子的三维结构。
5. SCOP
蛋白质结构分类(SCOP)数据库详细描述了已知的蛋白质结构之间的关系。分类基于若干层次:家族,描述相近的进化关系;超家族,描述远源的进化关系;折叠子(fold),描述空间几何结构的关系;折叠类,所有折叠子被归于全α、全β、α/β、α+β和多结构域等几个大类。SCOP还提供一个非冗余的ASTRAIL序列库,这个库通常被用来评估各种序列比对算法。此外,SCOP还提供一个PDB-ISL中介序列库,通过与这个库中序列的两两比对,可以找到与未知结构序列远缘的已知结构序列。
6. COG
蛋白质直系同源簇(COGs)数据库是对细菌、藻类和真核生物的21个完整基因组的编码蛋白,根据系统进化关系分类构建而成。COG库对于预测单个蛋白质的功能和整个新基因组中蛋白质的功能都很有用。利用COGNITOR程序,可以把某个蛋白质与所有COGs中的蛋白质进行比对,并把它归入适当的COG簇。COG库提供了对COG分类数据的检索和查询,基于Web的COGNITOR服务,系统进化模式的查询服务等。
热心网友
时间:2022-04-08 09:39
蛋白质结构数据库,一般用PDB,还有其他衍生出来的数据库,比如DSSP,HSSP等等。
如果要差序列结构,在NCBI中也可以差,EMBL中也都有,不过建议在PDB中查看,将文件下载下来,用一些常用的软件进行查看,并且可以看到一级,二级等高级结构,或者模拟结构。
常用的查询蛋白质结构以及序列的数据库主要有哪些?
PIR国际蛋白质序列数据库(PSD)是由蛋白质信息资源(PIR)、慕尼黑蛋白质序列信息中心(MIPS)和日本国际蛋白质序列数据库(JIPID)共同维护的国际上最大的公共蛋白质序列数据库,可在这里下载。这是一个全面的、经过注释的、非冗余的蛋白质序列数据库,其中包括来自几十个完整基因组的蛋白质序列。所有序列数据...
蛋白质数据库有哪些
1. PDB蛋白质数据库 PDB(Protein Data Bank)是全世界最大的蛋白质结构数据库。它包含了大量的蛋白质三维结构信息,这些结构信息是基于X射线晶体学和核磁共振等实验手段得到的。科研人员可以通过该数据库查询蛋白质的结构、功能以及其他相关信息。2. UniProt蛋白质数据库 UniProt是一个综合性蛋白质数据库...
蛋白质数据库有哪些
PDB是蛋白质结构数据库,它包含了来自不同生物物种的蛋白质结构信息。PDB数据库的数据来源主要是X射线晶体学、核磁共振等实验技术,数据质量较高,被广泛应用于生物信息学、生物学、医学等领域的研究。4. STRING STRING是蛋白质相互作用数据库,它包含了来自不同生物物种的蛋白质相互作用信息。STRING数据库...
国际著名的三大蛋白质数据库
国际著名的三大蛋白质数据库有UniProt数据库、The Human Protein Atlas数据库、PhosphoSitePlus数据库。1、UniProt数据库 蛋白组学常用数据库UniProt(全称UniProt Protein Resource),建立于1986年,由Swiss-Protein、TrEMBL、PIR-PSD三大蛋白质数据库联合成立的,其信息量丰富、资源广泛,是目前公认的首选免费...
这几个蛋白质数据库,你想要的几乎都有!
01. Uniprot 网址:uniprot.org 数据:包含各物种基因组测序得到的全基因蛋白质序列,以及文献中的蛋白及其功能信息。由Swiss-Prot、TrEMBL和PIR-PSD三大子数据库构成,尤其是Swiss-Prot子数据库,库中蛋白质信息都是手工核对过的,非冗余,有详细注释信息。02. Proteinatlas 网址:proteinatlas.org 数据...
推荐几个常用蛋白质的序列分析网站
蛋白质数据库(Protein databank, PD)由美国自然科学基金会、能源部和国立卫生研究院共同投资建立,主要由 X-射线晶体衍射和核磁共振(NMR) 测得的生物大分子三维结构所组成,用户可直接查询、调用和观察库中所收录的任何大分子三维结构。该数据库同时提供蛋白质序列及其三维空间晶体学原子坐标.其中受体-...
国际上最主要的三大生物信息学数据库
DDBJ(DNA Data Bank of Japan):DDBJ是日本的国家生物信息学中心,成立于1986年。DDBJ的主要职责是收集、存储、分析和发布日本的生物数据,包括DNA序列、蛋白质序列、基因组数据等。DDBJ的数据库不仅包含了日本本土的数据,还包含了来自全球各地的数据,其中包括许多重要的科研成果。这三大数据库各自具有不...
蛋白质序列数据库数据库分类
与TrEMBL相似,GenPept是由GenBank翻译得到的蛋白质序列数据库。由于TrEMBL和GenPept均是由核酸序列通过计算机程序翻译生成,这两个数据库中的序列错误率较大,冗余度较高。另一个常用的蛋白质序列数据库是NRL-3D,专门收集已知三维结构蛋白质的一级结构序列。这些序列是从三维结构数据库PDB中提取的。
蛋白质数据库包括哪四种
PIR:蛋白质信息资源 SWISS-PROT:蛋白质序列和注解 PDB:国家实验室蛋白质数据库 MMDB:蛋白质分子模型数据库
生物信息学的数据库有哪些类型各有何特点
1、基因组数据库:这些数据库存储了各种生物体的基因组序列信息,包括DNA序列、RNA序列和蛋白质序列等。这些数据库的特点是数据量大、复杂度高,需要使用专业的生物信息学工具进行分析和解释。2、蛋白质数据库:这些数据库存储了各种生物体的蛋白质序列信息,包括氨基酸序列、结构信息和功能注释等。这些数据...