AI驱动从头设计多样化小分子结合蛋白,韩国团队发现能选择性识别压力激素的蛋白质

张开发
2026/4/18 14:51:53 15 分钟阅读

分享文章

AI驱动从头设计多样化小分子结合蛋白,韩国团队发现能选择性识别压力激素的蛋白质
在生命科学与合成生物学领域如何设计既具有高亲和力又具有高特异性的小分子结合蛋白一直是实现生物传感与分子开关的关键挑战。过去这一方向主要依赖对天然蛋白的筛选与改造或基于既有蛋白骨架的物理建模设计通用性与可扩展性始终受限。针对于此来自韩国科学技术院KAIST生物科学系的研究团队借助深度学习驱动的蛋白结构生成与序列设计方法以 NTF2 样折叠NTF2-like fold为核心「通用 backbone」从头设计de novo多样化的小分子结合蛋白并进一步将其转化为类似化学诱导二聚化CID的传感器。研究人员成功设计了一种能够选择性识别压力激素皮质醇的蛋白质并基于此开发了一种人工智能生物传感器。该案例超越了蛋白质设计本身迈向了可实际测量的传感器技术解决了蛋白质设计领域长期存在的小分子识别难题。相关研究成果以「Small-molecule binding and sensing with a designed protein family」为题已刊登 Nature Communications。研究亮点* 利用人工智能从头设计de novo识别特定化合物的蛋白质并将其应用于功能性生物传感器* 传统方法主要涉及寻找天然蛋白质或修改其某些功能而本研究则通过基于人工智能的设计「定制」了具有所需功能的蛋白质* 研究成果可广泛应用于疾病诊断、新药研发和环境监测等领域论文地址https://www.nature.com/articles/s41467-026-70953-8更多 AI 前沿论文https://hyper.ai/papers数据集构建 NTF2 backbone为实现设计目标研究人员首先通过家族级「幻觉hallucination」方法生成了一组 NTF2 结构集合 11,615 个 backbones随后利用 ProteinMPNN 对这些骨架进行序列重新设计并通过 AlphaFold 筛选出能够折叠成设计结构的蛋白集合 23,230 个 backbones。此外其还利用 Rosetta 参数化生成骨架结构并同样通过 ProteinMPNN 进行序列设计再使用 AlphaFold 进行结构验证集合 36,838 个 backbones见下图NTF2 backbone 生成最终经过筛选后研究人员还获得了用于实验表征的编码寡核苷酸其中包括630 个 HCY 结合蛋白、1,661 个 ROC 结合蛋白、16,276 个 WRF 结合蛋白、9,024 个 APX 结合蛋白、19,390 个 IRI 结合蛋白以及 7,573 个 OHP 结合蛋白。设计具有多样化口袋几何结构的 NTF2 蛋白家族NTF2 折叠由 3 条 α 螺旋和一张弯曲的 6 股 β 折叠片构成这些结构共同形成了该折叠家族所特有的大型内部结合口袋如下图NTF2 折叠具有可设计的结构框架这种折叠在自然界中的多样性主要来源于较长且不规则的环区以及独特的四级结构这两者都会影响结合口袋的几何形态和功能。本研究的目标是设计一类具有多样化口袋几何结构的 NTF2 蛋白家族以容纳广泛的小分子同时尽量减少环区以保持其模块化特性和可设计性整体设计流程如下图所示基于 NTF2 折叠的小分子结合蛋白设计流程示意图在获得超过 10,000 个具有多样口袋几何结构的 NTF2 设计蛋白后研究人员使用 RIFdock 将 6 种在化学性质和结构上各不相同的小分子放置到这些骨架的中心口袋中。这些小分子包括应激激素皮质醇HCY、抗凝药华法林WRF、肌肉松弛剂罗库溴铵ROC、抗凝药阿哌沙班APX、来源于抗癌药伊立替康的抗肿瘤活性分子SN-38IRI以及激素17-α-羟基孕酮OHP。在蛋白设计中极性界面的构建是一项重要挑战尤其对于小分子结合蛋白而言需要在内部口袋中引入极性残基以与配体的极性官能团相互作用同时又不能破坏蛋白的整体稳定性。为此研究人员采用两种策略方法1RIFdock to HBNets研究人员将 HCY、WRF、ROC、APX 和 IRI 对接到集合 1 backbone 中并要求至少存在一个由 HBNet 残基介导的蛋白–小分子相互作用随后采用基于天然序列引导的 Rosetta 设计进行优化其中利用来源于 NTF2 家族蛋白的位置特异性评分矩阵对序列设计进行偏置。方法 2unrestricted RIFdock使用无约束的 RIFdock 将 OHP、APX 和 IRI 放置到集合 2 和集合 3 的 backbone 中并利用 LigandMPNN 进行序列设计。LigandMPNN 是 ProteinMPNN 的一个变体专门在蛋白–小分子复合物数据上训练能够在设计过程中显式考虑配体的存在。在筛选设计结果时研究人员使用 Rosetta 计算蛋白–配体之间的氢键数量、结合能ddG以及接触分子表面积CMS对于方法 2还结合单序列 AlphaFold 预测结果筛选能够同时再现目标折叠结构及结合位点的设计见下图。设计评估指标成果展示基于 NTF2 的小分子结合蛋白可应用于生物传感器研究人员设计了系列试验来验证本研究提出的设计策略的有效性设计结合蛋白的结构表征为验证设计的小分子结合蛋白的准确性研究解析了两种蛋白–配体复合物的晶体结构皮质醇结合蛋白 hcy129 与阿哌沙班结合蛋白 apx1049。其中通过 ProteinMPNN 对 hcy129 进行表面重设计以提升结晶性成功获得其与皮质醇复合物的 1.5 Å 高分辨率结构。结构比对显示其整体折叠与设计模型高度一致Cα RMSD 为 1.1 Å下图 A关键氢键残基及配体构象也精确匹配下图 B表明预构建的氢键网络HBNet有效实现了极性相互作用的精准设计。设计的皮质醇与阿哌沙班结合蛋白的结构分析另一方面apx1049 与阿哌沙班复合物的晶体结构分辨率为 2.1 Å与设计模型一致性更高在 113 个残基范围内的 Cα RMSD 仅为 0.6 Å下图 C。其蛋白–配体相互作用几乎完全复现设计包括关键氢键及芳香残基间的 π–π堆积作用下图 D从而稳定配体构象并形成高度形状互补的结合口袋。这些结果证明了该设计策略在原子尺度上实现了高精度的蛋白–配体界面构建。设计的皮质醇与阿哌沙班结合蛋白的结构分析设计结合蛋白的特异性评估为评估设计蛋白的特异性研究对六种结合蛋白与六种配体进行了系统测试并以具有非特异性结合能力的白蛋白作为对照。结果显示hcy129.1、iri807.1 和 apx1049 等高亲和力蛋白在与各自靶标结合时同时表现出良好的特异性而白蛋白对多数配体几乎不发生结合验证了设计策略的有效性。此外在华法林WRF体系中白蛋白与其结合亲和力KD 约 5.0 μM与设计蛋白 wrf1071KD 约 1.1 μM相近说明对于疏水性较强的配体非特异性结合仍具挑战。总体而言该方法已能实现一定程度的高特异性识别但在区分结构相似分子及提升对疏水性配体的选择性方面仍有进一步优化空间。生物传感器构建皮质醇诱导异源二聚体的设计与表征皮质醇在生理样本中通常以低纳摩尔浓度存在而当血浆皮质醇水平高于 38 nM 时可作为库欣综合征等疾病的诊断依据。为提高 hcy129 对皮质醇的结合亲和力以用于生物传感研究人员基于其单点饱和突变SSM实验中筛选出的有利突变构建了组合突变体文库并通过酵母展示进行筛选观察到结合亲和力显著提升如下图所示皮质醇结合蛋白 hcy129 的优化随后研究人员从该文库中筛选出最佳变体在大肠杆菌中表达并通过等温滴定量热ITC进行表征。该变体 hcy129.1 的 KD 为 68 nM相较原始设计提高了 31 倍如下图 C结构分析表明亲和力增强主要源于与皮质醇之间更强的疏水相互作用下图 D。用于皮质醇感知的化学诱导异源二聚体设计与表征在此基础上研究进一步设计皮质醇依赖的异源二聚体系。通过对 hcy129.1 结构进行改造并引入小型蛋白骨架结合 RIFdock、Rosetta 与 ProteinMPNN 等方法进行计算设计与筛选最终获得可与 hcy129.1 及皮质醇形成三元复合物的小型蛋白 miniH11。实验表明该体系仅在皮质醇存在时形成稳定复合物。进一步地研究将该体系与 NanoBiT 荧光素酶系统融合实现皮质醇传感功能检测到 EC50 约为 72 nM下图 H与结合亲和力一致验证了设计的有效性。同时体系在无皮质醇条件下亲和力显著降低表明二聚作用具有良好的配体依赖性。在等摩尔200 nMhcy129.1_CID-SmBiT 与 miniH11-LgBiT体系中皮质醇依赖的发光响应曲线整体而言该工作证明了基于 NTF2 的小分子结合蛋白可进一步工程化为功能性生物传感器。结语总体来看这项研究为小分子结合蛋白的从头设计提供了一条全新路径通过人工智能模型在原子层面精确刻画蛋白质–配体相互作用实现了从「发现或改造天然蛋白」向「按需定制功能蛋白」的转变并完成了实验层面的有效验证。这不仅标志着蛋白质设计能力的跃迁也显著拓展了其应用边界——从疾病早期诊断中的生物标志物精准检测到新药研发中的靶向分子识别再到环境监测中对污染物的实时感知。随着这一技术体系的不断成熟具备高度特异性与可编程性的定制化生物传感器有望成为连接生命科学与现实世界应用的重要桥梁。参考文献https://www.nature.com/articles/s41467-026-70953-8https://phys.org/news/2026-04-ai-proteins-built-specific-compounds.html

更多文章