UCSD大学称AI有助于发现超紧密结合抗体

时间:2023-02-08 17:56:48浏览:2373

高亲和力抗体通常通过定向进化来鉴定，这可能需要多次诱变和选择迭代才能找到最佳候选者。深度学习技术有可能加速这一过程，但现有方法无法提供评估预测可靠性所需的置信区间或不确定性。

　　在这里，加州大学圣地亚哥分校的研究团队提出了一个名为 RESP 的管线，用于有效识别高亲和力抗体。研究人员研发了一种在超过 300 万个人类 B 细胞受体序列上训练的学习表征来编码抗体序列。然后，他们开发了一个变分贝叶斯神经网络，对一组按解离率分箱的定向进化序列执行序数回归，并量化它们成为抗原紧密结合剂的可能性。

加州大学圣地亚哥分校.png

　　重要的是，该模型可以评估定向进化库中不存在的序列，从而大大扩展搜索空间以发现用于实验评估的最佳序列。该团队通过将 PD-L1 抗体 Atezolizumab 的 KD 提高 17 倍来展示这条管线的力量，这一成功说明了 RESP 在促进一般抗体开发方面的潜力。

　　该研究以「The RESP AI model accelerates the identification of tight-binding antibodies」为题，于 2023 年 1 月 28 日发布在《Nature Communications》。

　　单克隆抗体是最成功的生物疗法之一。尽管它们具有令人印象深刻的多功能性和特异性，但治疗性抗体的开发仍然面临着各种复杂的挑战。通常，初始命中的亲和力不足，必须首先通过体外亲和力成熟来改进它们的结合，从而进行反复的诱变和选择具有改进的亲和力的抗体。这个过程通常是时间密集型的，可能需要几个月才能完成，并且不能同时优化其他理想的特性，如良好的溶解性和低免疫原性。可以帮助更快地识别具有理想特性的高亲和力抗体的计算技术可能会加速这一过程。

　　抗体结合亲和力的传统计算方法依赖于自由能的估计。这些通常受到高计算成本、低吞吐量和这些方法生成的自由能估计的有限可靠性的限制。或者，机器学习技术已应用于蛋白质工程和抗体设计中的各种任务。

　　基于机器学习的方法至少面临两个主要挑战。第一个是结合亲和力或其他属性的预测缺乏估计的不确定性。由于训练数据只能覆盖序列空间的一小部分，因此机器学习模型在被要求进行远远超出其训练集范围的推断时通常表现不佳。深度学习模型虽然灵活而强大，但通常(在特定架构之外)不提供置信区间或预测不确定性的估计。高斯过程模型已被建议作为一种替代方案，它确实提供了经过良好校准的置信区间，但它们在不使用近似值的情况下很难扩展到大型数据集，并且对于大于 5000 个序列的数据集通常是不可行的。

　　第二个关键挑战是为输入选择合适的表示。文献中描述了许多不同的蛋白质编码方案，包括最近采用语言模型的编码方案;其中一些是抗体特异性的，一些是蛋白质序列通用的。然而，对于其中哪一个最适合给定的问题，几乎没有达成共识。经典的 one-hot 编码方案实施起来很简单，但不必要的高维和无信息，因为每个氨基酸都被视为彼此完全不同。

　　尽管这个过程漫长而昂贵，但许多由此产生的抗体在临床试验中仍然无效。在最新的研究中，加州大学圣地亚哥分校的科学家们设计了一种最先进的机器学习算法来加速和简化这些工作。

　　有效开发抗体的新管线 RESP

　　加州大学圣地亚哥分校的研究人员在这里展示了一条有效开发抗体的新管线，RESP 管线。首先，他们开发了一种特定于抗体的简单学习编码。这里的编码不仅包含易于恢复形式的原始序列中的信息，还包含描述将人类抗体与周围序列空间区分开来的关键序列特征的附加编码信息。

　　实验证明，当在抗原特异性实验数据上训练模型以捕捉结合亲和力的趋势时，如果使用他们的自动编码器生成的表示对输入序列进行编码，则同一模型比使用流行的最先进编码(如UniRep、ESM-1b、AntiBertY和AbLang)对输入序列编码更准确。

　　值得注意的是，对于这项特定任务，使用加州大学团队考虑的所有模型，UniRep、ESM-1b、AntiBertY 和 AbLang 表现出不如单热编码的性能。这与之前 Makowski 团队报告的结果一致，即，与简单的单热编码相比，UniRep 或物理化学特性并未提高抗体亲和力预测的性能。

　　然后，加州大学的研究人员使用旨在提供直接且易于解释的序列排名以及不确定性量化的模型来拟合训练集。他们展示了序列读取跨类别的分布可以以一种有原则和直接的方式作为数据点权重纳入模型拟合。他们的贝叶斯有序回归模型产生预测后验估计，从而提供传统深度学习分类器无法获得的额外信息，其跨类别的预测概率分布并不表明给定预测的可靠性。

　　最后，加州大学团队设计了一种算法来探索训练集跨越的序列空间。通过估计每个预测的可靠性，并将搜索限制在训练集所跨越的空间内，该团队最大限度地减少了评估不良候选序列所浪费的时间和费用。

　　「使用我们的机器学习工具，这些后续轮次的序列突变和选择可以在计算机上而不是在实验室中快速有效地进行。」加州大学圣地亚哥分校医学院细胞与分子医学教授、资深作者 Wei Wang 博士说。了解更多详细内容，添加顾问老师VXX：Tops6868

　　总结：

　　当前，研究人员现在正在使用这种方法来鉴定针对其他抗原(例如 SARS-CoV-2)的有前途的抗体。他们还在开发额外的 AI 模型，分析氨基酸序列以获得对临床试验成功至关重要的其他抗体特性，例如稳定性、溶解度和选择性。

　　「通过结合这些人工智能工具，科学家们可能能够在计算机上，而不是在实验台上进行越来越多的抗体发现工作。这可能会导致发现过程更快、更不易出错。」 Wei Wang 说，「这条管线有很多应用，而这些发现实际上只是一个开始。」

　　以上就是UCSD大学称AI有助于发现超紧密结合抗体的相关内容。如果您对美国留学感兴趣，欢迎您在线咨询托普仕留学老师，托普仕留学专注美国前30高校申请，助力国内学子顺利获得美国藤校入读资格。