马德里卡洛斯三世大学 (UC3M) 的科学家们联合爱立信及瑞典皇家理工学院 (KTH) 研究团队共同研发了一款基于人工智能的计算机程序,可搜索信息并提供生物医学图像分析建议。这一进展为使用大型生物成像数据库的生命科学研究人员、工作流开发人员、生物技术人员和制药公司的相关人员们提供了巨大便利。
这款亮相于《自然方法》杂志上的 BioImage.IO 聊天机器人新助手,其诞生是为了解决相关研究人员备受困扰的过度饱和问题。 “我们意识到,许多科学家必须处理大量技术文档,而这可能会成为一项非常乏味且艰巨的任务,”该项研究作者之一、马德里卡洛斯三世大学 (UC3M) 生物工程系研究员卡特琳娜·福斯特·巴塞罗( Caterina Fuster Barceló) 解释道。 “事实上,我们的目标是促进数据信息访问,同时推出一款可让科学家们将时间集中在生物图像分析,而无需在编程上花费过多时间的简易界面,”她补充道。
聊天机器人可以通过这一方式成为一款非常有用的工具,允许研究人员以简单直观的方式执行复杂的分析任务。例如,当研究人员需要使用分割模型处理显微镜图像时,聊天机器人可以帮助他们选择并运行合适的模型。
该助手以广泛的语言模型为基础,应用一款可实时访问数据库的“检索增强生成” (RAG) 技术。 “其主要优点是,无需利用特定信息来训练模型,可从更新来源中提取资讯,从而最大限度地减少其他人工智能模型中常见的不准确响应——ChatGPT的常见错误即“幻觉”类错误。”该项研究的另一位作者、UC3M 生物工程系教授阿拉特·穆尼奥斯·巴鲁蒂亚 (Arrate Muñoz Barrutia) 补充道。 “对我们而言,保证用户收到真实的情境化信息是最为重要的。”
BioImage.IO 聊天机器人还具备其他优点。优化后的程序可以通过扩展系统直接与显微镜和其他实验室设备联合作业。该扩展系统允许研究人员使用直接聊天机器人界面,发送简单指令管控设备。“该助手的另一个优势为开源,” 穆尼奥斯·巴鲁蒂亚 (Muñoz Barrutia)表示,“允许其他开发人员继续创建新模块,改进工具。”
该模型由 UC3M与爱立信公司以及 KTH 的研究人员联合优化打造,主要成员分别是来自智能系统系和应用物理系的 Wanlu Lei、Gabriel Reder 和 Wei Oyang。团队成员最近在意大利米兰举办的 I2K (From Images to Knowledge) 2024 大会上展示了它。该团队成功将聊天机器人集成至云端和浏览器运行平台上,从而调用在线数据库进行实时图像分析。 福斯特·巴塞罗( Fuster Barceló)表示,“这种可扩展性是聊天机器人的一大优势,有助于集成至包含第三方网站和其他研究系统的多样工作系统中”。
针对下一步研究方向,科研人员计划通过更通用的人工智能模型拓展聊天机器人的功能。该模型能够阅读科学文章并协助开展实验规划。相关人员总结道,“这可能为研究环境中的先进自动化、获取复杂科学工具的更大民主化铺平道路”。
参考文献:
Lei, W., Fuster-Barceló, C., Reder, G. et al (2024). BioImage.IO Chatbot: a community-driven AI assistant for integrative computational bioimaging. Nat Methods 21, 1368–1370. https://doi.org/10.1038/s41592-024-02370-y
Arrate Muñoz-Barrutia, A (2024). BioImage.IO chatbot: A community-driven AI assistant for integrative computational bioimaging. I2K (From Images to Knowledge). October 23-25 2024. Milan, Italy. https://www.i2kconference.org/
视频: https://youtu.be/k-LFfXh-emE