我把你最近收集到的关于蛋白质结构预测的新闻稍微改一下,跟你说说情况。2021年的时候,谷歌旗下的“深度思维”公司发布了个叫“阿尔法折叠”的AI工具,特别火。这个工具主要是用来预测单个蛋白质的结构的,现在这个数据集已经收集了2亿个预测结果了。不过,蛋白质通常不是单独工作的,它们会和其他蛋白质结合形成复合物,这样才能发挥作用。所以这次他们搞了个大动作,把蛋白质复合物结构的预测也给做了。这个数据集是由欧洲分子生物学实验室的欧洲生物信息学研究所、深度思维公司、英伟达还有韩国首尔大学一起合作弄出来的。3月22日,他们在北京发布了这个成果。这次新增了170万个高置信度的同源二聚体结构,就是两个相同的蛋白质结合在一起的样子。这个数据集里还重点收录了和人类健康有关的蛋白质。其实之前的工具只能预测单个蛋白质,现在加入复合物结构后,科学家们就能更好地理解它们是怎么相互作用的了。不过这个预测难度挺大,对算力要求特别高。研究团队就给20种研究得比较透彻的物种做了系统分析,比如人类、小鼠、酵母还有结核分枝杆菌这些。他们一共生成了约3000万个同源二聚体预测结果,最后筛选出170万个质量好的放进数据库里。现在科学界觉得这个数据库从单个分子结构走向分子相互作用网络是很关键的一步。但是大家也要小心用这些结果,毕竟有时候AI预测的东西和真实情况还是有差别的,还得靠实验来验证一下。以后这个数据集还会继续扩展,计划加入两个不同蛋白质组成的异源二聚体结构预测呢。