发布网友 发布时间:2022-05-01 18:15
共1个回答
热心网友 时间:2022-06-21 00:03
pfam数据库是一个蛋白质家族大集合,依赖于由多序列比对和隐马尔可夫模型(HMMs的)。蛋白质中,一般由一个或多个功能区构成,这些区通常被称为域。结构域的不同组合方式产生的蛋白质在自然界中各种不同。因此蛋白结构域的鉴别对分析蛋白质的功能来说尤其重要。Pfam有两个组成部分:Pfam - A和Pfam - B。 Pfam -A的质量比较高,是人工筛选的。虽然这些Pfam -A的数据涵盖了在许多基础序列数据库中很大的比例,为了让更多的全面了解已知蛋白质,我们也支持使用ADDA数据库。另外一些些自动生成的被称为Pfam - B。虽然质量较低,Pfam - B可以被用来鉴别功能保守区域,尤其是没有Pfam -A的时。Pfam也产生了相关的家族称为家庭,更高层次的分组。Pfam家族,这是一个相似的序列,结构或HMM的相关收集。一般考虑相似序列或结构域的蛋白具有相似的功能,因此很多寻找相似功能蛋白的时候可能会用到这个数据库,尽管找没关系蛋白的时候也肯能会用到这个的否命题,既结构不相似推出没有相似的结构,但这仅在某些特定的情况下使用,一般来是不一定成立的。