tpami影响因子（tip 影响因子）

加星标，再也不怕错过更新！方法见文末动图。

酶在生物过程中通过催化多种反应发挥关键作用，识别其功能对代谢和疾病研究至关重要。酶委员会（EC）编号是定义酶功能的常用方法。然而，当前的EC编号预测技术既耗时又昂贵，现有的一些计算方法又存在依赖序列相似性和缺乏高质量模板的限制。

为了突破现有挑战，9月的nature communications上介绍了一种基于几何图学习的EC编号预测器（GraphEC），使用ESMFold预测的结构和预训练蛋白质语言模型。通过构建预测酶活性位点的模型预测EC编号，并利用标签扩散算法结合同源信息提高准确性并预测酶的最适pH值。实验表明，GraphEC在预测活性位点、EC编号和最适pH方面优于现有最先进方法。

GraphEC模型

GraphEC是一种基于几何图学习的准确EC编号预测器（图1），整合酶活性位点和预测的蛋白质结构进行功能预测。给定蛋白质序列，ESMFold预测其结构并构建蛋白质图，提取几何特征并通过预训练语言模型（ProtTrans）增强。这些特征输入几何图学习网络进行几何嵌入学习，用于预测活性位点、EC编号和最适pH值。

图1 | GraphEC概述

酶活性位点预测（GraphEC-AS）

GraphEC-AS在基于残基的酶活性位点预测中表现出色（图2），相较于六种竞争方法，GraphEC-AS在MCC、召回率和精确度等指标上均表现最佳，显著优于第二好的方法PREvaIL_RF。此外，GraphEC-AS在TS124上的F1得分远高于PREvaIL_RF。

GraphEC-AS通过几何图学习生成的嵌入能够清晰区分活性位点和非活性位点，而ProtTrans嵌入则较为分散。ESMFold预测结构的高质量进一步验证了高质量预测结构的重要性。在三维结构预测中，GraphEC-AS成功识别了所有活性位点，而BiLSTM仅检测到一个，突显了GraphEC-AS在捕捉局部结构信息方面的优势。

图2 | 酶活性位点预测

酶EC编号识别（GraphEC）

GraphEC在酶EC编号预测中表现卓越(图3)，其AUC、召回率、精确度和F1等指标均显著优于四种最先进的EC编号预测器。GraphEC在不同频率和级别的EC编号上均展现出更高的精确度和召回率，尤其是在低频和高级别EC编号上表现尤为突出。此外，活性位点突变实验表明，突变后真实EC编号的预测分数下降，进一步验证了活性位点在EC编号预测中的重要性。GraphEC的推理速度也显著快于CLEAN等方法，结合ESMFold的结构计算时间，满足高通量分析的需求。

GraphEC的消融研究

GraphEC的消融研究表明（图3），每个模块对模型性能均有显著贡献。移除标签扩散、活性位点指导、结构信息和ProtTrans嵌入分别导致AUC值下降，突显了这些模块的重要性。几何无关基线（BiLSTM）的AUC下降表明结构信息的关键作用。尽管整合理化性质未能进一步提升性能，但GraphEC嵌入在区分不同EC编号方面表现出色，优于ProtTrans和one-hot嵌入。使用AlphaFold2替代ESMFold预测结构略微提升了性能，表明ESMFold在更短时间内提供了可比精度的结构。不同截止距离的实验显示，距离为10 Å时性能最佳，过小或过大的距离均会导致信息丢失或过度聚合。

图3 | 酶EC编号预测

GraphEC捕捉酶的功能区域

GraphEC通过研究预测的酶活性位点、多头注意力分数和真实活性位点之间的联系，验证了其识别功能区域的能力（图3）。例如，酰基蛋白硫酯酶2和脯氨酸消旋酶的真实活性位点均被GraphEC-AS准确预测，并且多头注意力分数在真实活性位点附近显著提高，表明模型能够有效关注功能区域。这些结果进一步证实了GraphEC在捕捉酶功能区域方面的有效性。

酶最适pH值的预测

GraphEC-pH在酶最适pH值预测中表现出色（图4），其在Brenda数据库整理的新数据集上的五折交叉验证和独立测试集中显示出高度的稳健性。移除结构信息后，而GraphEC-pH在F1、召回率和精确度等指标上显著优于最新的EpHod和EpHod_SVR方法。此外，GraphEC-pH在区分同源酶对的差异方面也表现优异。这些结果充分展示了GraphEC-pH在酶最适pH值预测中的优越性能。

图4 | 酶最适pH值的预测

GraphEC从酶结构中学习功能信息

GraphEC在发现新酶功能方面表现出色(图5)，通过对Swiss-Prot数据库中未注释EC编号的蛋白质进行注释，发现其预测的EC编号与训练集中共享相同EC编号的蛋白质具有更高的TM分数，显著优于CLEAN。GraphEC在不同TM分数阈值下发现的酶数量均大幅超过CLEAN，展示了其从结构相似性高的酶中学习功能信息的能力。即使TM分数较低，酶活性位点周围的酶口袋仍能对齐，进一步验证了GraphEC从酶结构中学习关键功能信息的能力。此外，GraphE C还能识别无序蛋白质的功能，表明其在功能预测方面的广泛应用潜力。

图5 | GraphEC可以从蛋白质结构中提取功能信息

总结

GraphEC是一种基于几何图学习和预测结构的EC编号预测器，通过利用酶活性位点和预测结构，显著提升了酶功能预测的准确性。得益于ESMFold的快速精确结构预测，GraphEC能够高效提取结构信息，即使在缺乏同源信息的情况下也能表现出色。实验证明，GraphEC在预测活性位点、EC编号和最适pH方面均有效，并能在缺乏同源信息时从酶结构中提取功能信息。

原文链接

https://www.nature.com/articles/s41467-024-52533-w

供稿 | 徐艺然

责编 | 囡囡

设计 / 排版 | 可洲

微信号：FRCBS-THU

因扫码入群人员已满，可扫码添加中心官方微信号，管理员邀请入群

精彩回顾

特别提示

微信公众号又双叒叕更改推送机制了，不是星标的订阅号，收到推送内容的时间会有延迟，甚至根本无法收到最新推送！不想错过FRCBS最新资讯，快来设为星标吧！

方法超简单，只需3秒钟！

点击上方卡片

关注我们吧

THE END

我知道你“在看”哟

到此这篇tpami影响因子（tip 影响因子）的文章就介绍到这了,更多相关内容请继续浏览下面的相关推荐文章，希望大家都能在编程的领域有一番成就！

上一篇： .exe文件反编译（exe文件反编译）

下一篇：打印提示控件未安装（打印机显示控件未安装）

版权声明：
本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如若内容造成侵权、违法违规、事实不符，请将相关资料发送至xkadmin@xkablog.com进行投诉反馈，一经查实，立即处理！

转载请注明出处，原文链接：https://www.xkablog.com/bcyy/73400.html

相关文章：