撰文:钱洁

编辑:羽晓欣

今天介绍一篇2024年09月在食品领域权威期刊《Food Chemisty》(IF=8.5,中科院大类一区,Top期刊)上发表题为“ChemSweet: An AI-driven computational platform for next-gen sweetener discovery”的原创研究成果,该平台旨在通过人工智能加速健康、安全甜味剂的筛选和发现。论文通讯作者为中南大学湘雅药学院董界副教授,硕士研究生钱洁、王雪洁和宋方亮为论文共同第一作者。

研究背景

随着人们对甜味的需求不断增长和科技的进步,甜味剂的研究近年来越来越受到关注,特别是如何找到安全、健康、低热量的甜味剂替代糖,避免由糖引发的肥胖和代谢性疾病等问题。

从合成化合物或天然产物中偶然发现和基于构效关系通过结构修饰来重现和放大甜味是传统开发新型甜味剂的主要手段。然而,这些方法往往依赖于持续的反复试验,效率低下,无法探索足够的化学空间。且许多发现的分子未能满足食品和药品使用所必需的安全性和稳定性标准,造成资源和时间的极大浪费。

近年来,化学信息学和食品信息学的快速发展为味觉预测和味觉感知的计算机模拟提供了有用的工具和数据库。与传统方法相比,机器学习预测模型可以快速识别与甜/不甜和苦/不苦的化合物并预测其与蔗糖相比的相对甜度,从而加速甜味剂的开发。

然而,现有的机器学习模型在提供物理化学性质和稳定性的全面分析方面仍存在局限性,尽管可以预测甜度,但难以预测甜味剂在复杂食品系统、专门的加工技术以及储存和运输过程中的安全性和稳定性。因此,迫切需要一种新的方法,能够在甜味剂开发的早期阶段预测各种关键特性,满足日益严格的毒理学安全标准,以降低与新甜味剂创新相关的高成本和漫长的时间。

成果简介

在当前人工甜味剂过度消费以及不断增加的健康风险大背景下,本研究针对性开发一个基于人工智能的甜味剂快速筛选平台——ChemSweet(http://chemsweet.ddai.tech)。该平台建立了对开发新品种甜味剂有用的十个关键特性的机器学习预测模型,包括四个重要的理化性质(水溶性、熔点、沸点和热稳定性)、两个甜味特性(甜味和相对甜度)以及四个安全指标(NOAEL、LD50、Ames和BCF)。通过整合这些模型,ChemSweet能够对候选甜味剂进行全周期、多维度的评估,预判候选分子在加工过程中的生物安全性和稳定性。为验证平台实用性,研究团队从SuperNatural数据库,成功鉴定出294种同时满足多个预期标准的潜在甜味分子。ChemSweet将成为识别安全健康甜味剂的有力工具,节约候选分子筛选和开发的时间和成本,加速安全健康甜味剂的发现。

研究亮点

1. 建立了基于人工智能的快速发现甜味分子的新型平台。

2. 提出同时考虑甜味剂的甜度和生物安全性的新视角。

3. 十五种模型评估甜度、安全性和物理化学特性。

4. 十五种模型的组合适合不同的应用场景。

5. 通过筛选大型数据库验证了其有效性和实用性。

图文赏析

图1. ChemSweet数据集概况和化学空间分析。(A-B)ChemSweet的数据整理流程(A)和数据集组成(B)。(C) ChemSweet数据集与食品数据库之间基于Tanimoto系数的分子结构相似性分布。(D-F)食品数据库和ChemSweet理化性质(D)、甜味(E)和安全性(F)数据集的分子多样性评分。(G)使用MOE 2D描述符对ChemSweet数据集化学空间的UMAP投影。

图2. ChemSweet中部署的最佳模型的性能。六种甜味分类模型(A)和LD50、Ames和热稳定性模型(E)的ROC曲线。相对甜度(B)、NOAEL(C)、BCF(D)、水溶性(F)、沸点(G)和熔点(H)模型的预测误差图。

图3. 基于SHAP分析的模型解释。(A)不同分子描述符类别基于Shapley值在预测模型中的特征重要性热图。(B)相对甜度预测模型的SHAP图。(C)人工甜味剂甜味分类模型的SHAP图。(D)人工甜味剂、非营养性甜味剂和非碳水化合物甜味剂甜味分类模型共同识别出的十个最重要的MACCS指纹键。

图4. 使用ChemSweet平台的使用截图。

图5. 使用ChemSweet对天然产物数据库进行虚拟筛选。(A)数据处理流程图。(B) ChemSweet模型预测的化合物及根据评分规则计算的总分桑基图。(C)总分分布(蓝色柱状图)以及通过不同筛选阈值的化合物百分比(带三角形的折线)。(D)天然甜味剂甜味分类模型预测结果的分布。(E)天然甜味剂开发场景下ChemSweet虚拟筛选过程后的结果分布。“通过筛选”表示被天然甜味剂甜味分类模型识别且总分≥10的甜味化合物。

研究结论

本研究提出了一种新的甜味剂筛选方法,并成功构建了首个多层次甜味剂虚拟筛选平台ChemSweet。ChemSweet是基于人工智能与化学信息学的天然甜味剂分析平台,涵盖了甜味剂开发过程中十个重要的理化性质、甜度性质和安全性指标,构建的人工智能模型在测试集中取得了优良表现。与现有工具仅限于单一风味分析不同,ChemSweet能够在甜味剂开发过程的早期快速评估多个关键性质,不仅评估甜度,还综合考虑特定甜味剂类别的安全性和稳定性。ChemSweet能帮助发现优秀的甜味分子骨架,开发出健康、安全、品质优良的甜味剂,从而加速食品和制药界甜味分子的开发进程。

原文链接

https://doi.org/10.1016/j.foodchem.2024.141362