News Release

Q&A|英矽智能Pharma.AI 秋季发布会回顾,解读最新医疗健康AI进展

Meeting Announcement

InSilico Medicine

Q&A|英矽智能Pharma.AI 秋季发布会回顾,解读最新医疗健康AI进展

image: 获取关于Pharma.AI药物发现和创新研究生成式AI解决方案的系统性见解,请参考下方英矽智能人工智能团队提供的专业问答 view more 

Credit: 英矽智能

10月2日,由生成式人工智能驱动的临床阶段生物医药科技公司英矽智能(Insilico Medicine)成功举办Pharma.AI季度更新系列第三次网络研讨会,本次线上会议以“迈向制药超级智能(Pharmaceutical Super Intelligence)”为主题吸引了来自高校、医疗机构、跨国药企和创新生物技术行业的三百余位专业注册观众。英矽智能人工智能团队分享了Pharma.AI平台的最新功能进展,并通过现场演示和案例分享展现了其无限可能性。

此次发布会的主要亮点简要梳理如下:

 

在生物学探索方面,基于云的组学与文本数据分析引擎 PandaOmics 实现了全面性能提升,完成了从数据集、排序逻辑,到结果处理流程的多维度更新。在算法维度,新增了四种基于大型语言模型(LLM)的评估打分,涉及包括可信度、商业可行性、药物可及性以及作用机制清晰度等方面,帮助用户更全面地做出优先排序决策。

基于PandaOmics在靶点发现与适应症探索领域的经验,英矽智能近期在预印本网站提交了系统化的模型性能评估框架研究论文,提出了一个结合机器学习靶点识别与全面基准评估的平台TID-Pro,及靶点识别基准评测系统TargetBench 1.0,该集成方法为靶点发现模型的评估提供了一条高效途径,有助于基于人工智能的多组学和计算建模方法,优化和提升靶点发现这一药物发现关键环节的质量和效率。

此外,用于抗体和多肽等生物大分子的生成平台Generative Biologics进一步优化了模型训练、分子筛选及验证流程,提高结构理解和模型预判的能力,让AI设计的新分子性质更加平衡。产品经理进一步分享了将该平台用于快速设计靶向GLP1R多肽分子的内部测试案例,在72小时内Generative Biologics生成了超过5000种新型多肽分子,团队根据预测亲和力评分和计算结合能筛选出20种高潜力候选分子,有14种分子显示出生物活性,其中3种更是展现出个位数纳摩尔级的高效活性

在化学领域,英矽智能自有的Chemistry42平台现已集成7大应用模块,包括分子生成、自由能结合预测、ADMET性质预测、激酶选择性预测、逆合成路线筛选等多个方面,可在数十小时内生成超过2400个候选分子,兼顾了生成式AI的灵活性与基于物理方法的精准度。此次,Chemistry42平台中新推出了分子动力学模拟工具 MDFlow,同时用于处理自然语言和化学结构信息的化学基础模型 Nach01 已上架AWS云市场,便于企业直接获取和部署。

在专业的药物研发模型之外,英矽智能也在持续拓展Pharma.AI科学领域的助理模型。其中,Science42: DORA 通过集成多个AI智能体实现自动化文档生成,并在近期对其进行AI核心模型升级,带来更强的推理能力和实时内容校验功能,使之可以支持并实现与更多AI工具互联互通英矽智能自研生命模型PreciousGPT系列近期登上《衰老》期刊的两篇同行评议论文,探索了衰老相关的生物学机制。

获取关于Pharma.AI药物发现和创新研究生成式AI解决方案的系统性见解,请参考下方英矽智能人工智能团队提供的专业问答

 

基于云的组学与文本数据分析引擎 PandaOmics

Q1 为什么推荐研究人员使用 PandaOmics?

PandaOmics集成了多组学数据、文献挖掘、疾病背景与生物标志物洞见,所有内容均由真实世界与实验数据训练的AI模型进行综合打分和优先级排序,极大缩短了前期研发周期,无需深入生信知识也能高效提出创新假设并验证。

Q2 PandaOmics如何用AI赋能?

面对海量生物医学数据,仅凭人工难以完成分析,AI则可以快速筛选最重要的信息,让科学家专注于最有潜力的药物靶点,减少研发盲猜。PandaOmics的AI涵盖四大领域:

  • 文献自动解读,智能识别基因、疾病及其关系;
  • 靶点排序,图谱AI模型根据生物网络关系打分;
  • 趋势发现,及时捕捉目标与疾病配对的早期信号与热点动向;
  • 智能摘要,生成专家级基因药物潜力的总结报告。

Q3 PandaOmics的突出优势有哪些?

多组学深度整合:结合转录组、蛋白组、表观遗传、临床和真实世界证据,输出关注特定疾病的可信度分数;

疾病专注知识图谱:内置基因-通路-疾病关联,仅需“一键点击”即可生成疾病假说;

文献与专利分析:同步跟踪研究新颖性、竞争格局,提供业内少有的深入IP数据挖掘;

AI结果可解释性:通过热力图展示各数据层贡献,提升研究人员对模型推荐的信任;

云端极速输出:几分钟生成排序清单,和手工流程相比效率大幅提高。

Q4 PandaOmics未来如何发展?

平台将有望升级为从靶点到候选分子全流程赋能的AI系统,同时深度联动化学分子设计和患者分层分析。随着更多真实数据加入,PandaOmics未来可为药物研发提供更个性化、疾病专属的洞察,为新药发现节约时间、降低成本并提升精准度。

 

生物大分子工程平台 Generative Biologics

Q1 为什么推荐研究人员使用 Generative Biologics?

它不仅仅是蛋白质序列生成工具,更可以通过通过多模型AI工作流实现候选生物分子的一站式生成、筛选、优化,甚至支持用户用自有数据进行个性化再训练。平台响应现实应用需求,快速、灵活且高度定制化。

Q2 Generative Biologics如何用AI赋能?

Generative Biologics 采用多个AI模型整合的系统,每个模型各具专长:

  • 大型语言模型(LLM)可通过海量蛋白序列理解,生成并优化新分子序列;
  • 图神经网络(GNN)学习三维结构关系,助力分子间相互作用建模;
  • 扩散模型用于还原蛋白空间结构,设计定向结合的骨架;
  • AI预测器针对亲和力、可开发性等具体问题做出高度专属预测;
  • 支持持续训练,即通过实验数据反馈不断提升模型表现。

Q3 Generative Biologics的突出优势有哪些?

与许多仅仅生成序列的工具不同,Generative Biologics 更进一步。它同时使用经典的基于物理的方法和AI驱动的方法对生成的分子进行打分和排序。它允许您使用自己的专有数据重新训练模型,从而为您的项目获得更强的预测能力。它支持多种生物制剂类型,提供多参数优化,并且不需要每个使用场景都有结构数据。此外,它的设计注重灵活性和可扩展性,使不同经验水平的团队都能使用。

Q4 Generative Biologics未来如何发展?

目前,它支持肽、抗体和纳米抗体。很快,它将扩展到更复杂的模式,如双特异性抗体、抗体药物偶联物、酶和通用蛋白质治疗药物,进一步扩大其在药物发现领域的影响力。

我们还在构建需要最少输入数据的基础模型,允许用户跳过预训练阶段,从单个序列开始优化。整合表位作图、聚类和多样化候选物选择将进一步加速早期发现阶段。

长期来看,Generative Biologics有可能成为生物制剂研发的核心AI助手,不仅生成和排序候选物,还能持续从用户数据中学习,与湿实验室系统集成,并以创纪录的时间引导团队从苗头化合物发现到临床前开发。

 

小分子从头生成与优化平台Chemistry42

Q1 为什么推荐研究人员使用 Chemistry42?

它超越了基础分子生成,提供了一套全面的AI套件,包含强大的生成模型用于从头设计、多参数优化、ADMET分析、逆合成和基于物理的模拟。您还可以基于专有数据训练模型以实现定制化工作流程。它已取得显著成功,实现了仅用18个月就将TNIK抑制剂推进到临床阶段的应用案例,对于旨在缩短时间线并增强创新的制药或生物技术团队来说适配性极高。

Q2 Chemistry42如何用AI赋能?

Chemistry42通过针对小分子药物发现定制的多模型系统实施AI,其中每个组件都针对分子设计和优化的特定方面。

  • 生成模型经过预训练,在多元化的化学类型均有出色表现,可基于用户定义的标准创建可靠的新分子。
  • 逆合成模型基于专家注释的反应模板进行训练,预测合成路线时考虑化学选择性、区域选择性和立体选择性,并与大量构建模块库集成。
  • 利用AI预测器来预测和优化DMPK参数、毒性特征和药效相关性质,可作为独立工具使用,也可集成到生成工作流程中。
  • Golden Cubes利用自组织图来估计脱靶激酶组选择性,可处理2D和3D结构
  • 该平台支持自定义训练,允许用户基于体外活性或模拟等专有数据微调模型,以实现性能定制化
  • Chemistry42 GPT是一个基于LLM的助手,可以引导用户使用平台、协助工作流程配置和处理问询

Q3 Chemistry42的突出优势有哪些?

AI优先的生成集成:Chemistry42拥有广泛的生成AI模型集成,结合强化学习根据预定义的用户标准改进设计,实现分子从头设计的同时,确保较高的可信度。

整合基于物理的算法:将AI与基于物理的核心方法无缝结合,实现卓越的准确性和速度,解决纯AI系统在数据依赖性和处理无限化学多样性方面的局限性。

基于用户数据的自定义模型训练:允许用户使用自己的专有数据训练预测模型,创建高度定制的解决方案,适应特定项目、数据集和治疗目标,提高相关性和准确性。

逆合成:使用专家注释的反应模板和AI驱动的路线规划器,为上传或生成的分子预测可靠的合成路线。基于精心策划的药物化学反应库和30万个商业可用构建模块,支持化学选择性、区域选择性和立体选择性预测。该模块提供完整的合成路径和报告示例,可利用自定义构建模块集合来简化合成规划。

先进的过滤和评分机制:包含超过460个药物化学过滤器(MCF)以排除不良结构(如PAINS或反应性基团),以及独特的药物化学进化(MCE-18)评分,基于sp³复杂性评估分子新颖性。此外,逆合成相关的合成可及性(ReRSA)评分通过纳入商业可用构建模块改善可行性估计,解决其他工具在合成路线预测中常见的局限性。

灵活的部署和可扩展性:作为SaaS解决方案提供,或可部署在AWS或Azure等云平台上,支持外部集成(如QSAR模型),与更封闭的竞争对手相比,为企业工作流程提供更大的可扩展性和互操作性。

强调实验验证:通过体外、体内和临床研究充分验证能力,成功案例包括在短至30个月内推进多个AI设计的候选药物完成1期临床,远快于传统的3-6年。

Q4 Chemistry42未来如何发展?

目前专注于分子从头设计和优化的Chemistry42将拓展到混合模式,涵盖PROTACs、降解剂,乃至较大分子量的分子;其AI基础模型更新更有望通过少量输入数据达成快速优化。此外,平台合作预计将扩展到农业化学、材料科学及其他领域。

长期来看,到2028年,Chemistry42有望成为制药研发中的基础AI助手,与湿实验室机器人无缝集成,实现闭环"设计-制造-测试-分析"循环,持续从真实世界和专有数据中学习,进而更早预测临床结果,以更高的成功率(可能高达现在的三倍)推动更多候选药物进入临床试验阶段,同时大幅削减个性化创新疗法的开发时间和成本。

 

多模态自然语言与化学信息处理基础模型 Nach01

Q1 为什么推荐研究人员使用Nach01?

它将自然语言处理(NLP)模型与先进的分子2D信息(如SMILES)和3D点云信息处理相结合,涵盖分子de novo生成、ADMET预测到苗头化合物发现和先导化合物优化的所有任务,同时支持基于专有数据集的模型微调,实现更加定制化的准确预测。作为强化学习工作流程中的"预言机",它提高了实验成功率,并且可通过AWS Marketplace轻松部署以实现无缝集成。改模行以经过验证的Nach0系列为基础,打破了任务类型对于AI模型的限制,有望助力药物研发或生物技术团队加速工作流程。

Q2 Nach01如何用AI赋能?

Nach01以多模态大语言模型(LLM)基础搭建编码器-解码器结构的AI框架,在包含科学文献、专利和分子表示的大规模数据集上进行预训练,以获得化学和语言文本的深刻见解。

  • 多模态编码器:采用领域特定编码器处理包括自然语言、SMILES等化学字符串等文本数据,并采用分子点云编码器处理空间3D数据,使模型能够理解原子排列信息,克服基于字符串表示的局限性。
  • 生成和预测能力利用生成技术创建新分子或文本输出,预测模块则预测ADMET或活性等性质,支持从头设计、苗头化合物发现和先导化合物优化等任务。
  • 指令和多任务微调:支持通过指令微调改进模型,以处理生物医学问答、命名实体识别等多样化任务。模型经过多任务微调,在多个领域均有出色表现,确保在单一领域或跨领域应用中的灵活性。
  • 用户驱动的定制化:允许用户基于专有数据集开展微调,使模型适应特定项目需求。模型还可作为强化学习工作流程中的"预言机"嵌入,支持迭代优化。

Q3 Nach01的突出优势有哪些?

获取途径便捷:Nach01于2025年6月登陆AWS Marketplace,无需内部基础设施搭建,易于部署、推理和微调。

多模态处理:在单个编码器-解码器LLM框架中无缝集成文本、结构和空间数据,解决了基于字符串的模型忽略3D原子排列,或需要单独设置以处理空间任务的局限性。

多功能多任务能力:仅需Nach01一个模型,即可处理从分子de novo生成到ADMET、活性等性质预测的多元化任务,灵活性大大提升。

用户驱动的模型微调:通过基于专有数据集的微调实现轻松定制,为特定项目(如苗头化合物发现或先导化合物优化)创建定制模型。

可扩展部署:通过AWS Marketplace实现按需订阅,可与企业工作流程无缝集成。

Q4 Nach01未来如何发展?

未来,AI智能体有望实现完全自主自主、步骤多样的智能化工作流,如假说生成、分子迭代优化和实验验证,而Nach01将可以深度集成到其中,在Pharma.AI和自定义流程中端到端赋能药物发现项目。

 

多模态大型语言生命模型系列PreciousGPT

Q1 为什么推荐研究人员使用PreciousGPT?

如果已有的科研假说设计大规模化合物筛选等高成本验证过程,PreciousGPT系列模型有望提供组织或细胞对实验的潜在响应结果,进而为实验的实际执行提供有价值的指导和规划参考。

Q2 PreciousGPT如何用AI赋能?

PreciousGPT系列在不断的更新换代中融入深度学习领域的最新进展,基于当前大语言模型广泛使用的Transformer架构,用基因和分子的语言和用户"对话",其背后是对于生物分子的创新表征方式。

Q3 PreciousGPT的突出优势有哪些?

PreciousGPT系列基于实际研究数据,旨在真正赋能科研流程。与常规大语言模型相比,PreciousGPT专注模拟药物发现流程中的特定步骤,且不局限于已发表的研究成果,有望提出人类研究者可能遗漏的分子机制。

Q4 PreciousGPT未来如何发展?

我们致力于持续发展Precious模型系列,通过整合更多类型的生物数据,甚至与化学等其他领域的AI技术相结合,不断提升其能力。我们的愿景是让这些模型最终发展成为真正的生命模型,从细胞到组织再到生物体水平,为不同层次的生命系统提供高保真数字孪生。

 

关于英矽智能

英矽智能是一家由生成式人工智能驱动的全球先锋生物科技公司,利用其专有的 Pharma.AI 平台和先进的自动化实验室,加速药物发现并推动生命科学领域的创新。通过整合人工智能和自动化技术,英矽智能正在为纤维化、肿瘤学、免疫学、疼痛、肥胖和代谢紊乱等未满足的疾病领域提供创新药物解决方案。英矽智能由人工智能驱动发现的产品管线中,已有10个分子获得临床试验许可,其中进展最为领先的Rentosertib(原名ISM001-055)是一种潜在全球首创用于治疗特发性肺纤维化的候选药物,已完成2a期临床研究并获得令人鼓舞的积极结果。此外,英矽智能还在探索前沿领域,包括老龄化研究、可持续化学和农业创新方面的突破。

更多信息,请访问网站www.insilico.com

商务合作,请联系 bd@insilico.ai

媒体垂询,请联系 pr@insilico.ai


Disclaimer: AAAS and EurekAlert! are not responsible for the accuracy of news releases posted to EurekAlert! by contributing institutions or for the use of any information through the EurekAlert system.