盛大和天桥脑科学研究院的OMNE长效记忆框架在GAIA排行榜中位居榜首

红木城,2024年10月23日。 凭借对大脑和记忆的深刻理解,天桥脑科学研究院的内部AI团队在人工智能领域取得重大突破,其自主研发的 OMNE 多智能体框架在 Hugging Face 发布的 GAIA(通用 AI 助手)基准排行榜(https://huggingface.co/spaces/gaia-benchmark/leaderboard)中位居榜首。OMNE 超越了包括微软研究院在内的多家全球领先机构。这一成就建立在 TCCI 多年的脑科学研究基础之上,使智能体具备了长效记忆(LTM)能力,从而能够进行更深入、更缓慢的思考,并增强大语言模型(LLM)在复杂问题解决中的决策能力。
 

自从研究院创始人、前中国科技企业家陈天桥于去年宣布“全力投入 AI 战略”以来,这一成果成为 TCCI AI 团队的重要里程碑。

 

 

OMNE 当前的总体成功率为 40.53%,超越了包括 Meta、微软、Hugging Face、普林斯顿大学、香港大学、英国 AI 安全研究院以及百川等知名机构的提交结果。相比之下,配备插件的 GPT-4 成功率仅为 15%。

 

由 Meta AI、Hugging Face 和 AutoGPT 共同推出的 GAIA 是一项用于严格测试 AI 助手在现实世界挑战中表现的基准系统。它评估的核心能力包括推理、多智能体协作、网页浏览与工具使用。作为目前对多智能体智能要求最高的数据集之一,登顶 GAIA 榜单展示了盛大在 AI 领域的深厚技术积累和不断突破创新边界的能力。

 

OMNE 是一个基于长效记忆(LTM)的多智能体协作框架。每个智能体都拥有相同且独立的系统结构,能够自主学习和理解完整的世界模型,从而独立认知环境。基于 LTM 的多智能体系统可以实时适应个体行为的变化,优化任务规划与执行,并促进个性化、高效的自我进化。

 

这一重大突破在于集成了长效记忆机制,显著减少了蒙特卡洛树搜索(MCTS)的搜索空间,并提升了系统在复杂问题中的决策能力。通过引入更高效的逻辑推理,OMNE 不仅提高了单一智能体的智能水平,还通过优化协作机制,显著增强了整个多智能体系统的能力。这一增强机制的灵感来自于对人类大脑皮层柱状结构的研究。作为大脑认知与行为功能的基本单元,皮层柱通过复杂的协作机制实现信息处理。通过加强单智能体与其他智能体之间的协作,AI 模型有望逐步产生认知能力的涌现,构建内部表征模型,进而推动系统整体智能的跃升。

 

“看到 OMNE 登顶 GAIA 榜单,我们深感自豪,”TCCI AI 团队负责人表示,“这一成就展示了长效记忆在推动 AI 自我进化和解决现实问题中的巨大潜力。我们相信,推进长效记忆与 AI 自我进化的研究,对于 AI 技术的持续发展与实际应用至关重要。”

 

AI 团队关于人工智能长效记忆的论文《Long Term Memory: The Foundation of AI Self-Evolution》已在 arXiv 上发表:https://arxiv.org/abs/2410.15665

 

你可能也感兴趣的