微软CLIO:重塑AI科学发现的可控与可解释性新范式
微软研究团队引入了一种名为CLIO(Cognitive Loop via In-situ Optimization)的新型AI代理开发范式,旨在解决当前大型语言模型(LLM)在科学发现领域中可控性与可解释性不足的核心痛点。CLIO通过在运行时(in-situ)进行内部自我反思和优化,而非依赖训练后的强化学习,实现了可控且可定制的认知行为。
CLIO通过持续反思、生成假设并评估多种发现策略来驱动推理过程。其关键创新在于,它能够生成自身所需的数据,通过运行时反射循环来管理记忆、探索想法和控制行为,并能利用先前的推断来调整未来行为,有效处理不确定性并标记潜在错误。此方法显著提升了模型在科学领域的表现,例如在“人类最后考试”(HLE)的生物和医学领域,将GPT-4.1的基础准确率从8.55%提升至22.37%,超越了现有先进模型。
CLIO的战略价值在于其“可控性”和“可解释性”。它允许用户通过简单的“控制旋钮”来调整不确定性标记的阈值,甚至在推理过程中编辑模型信念。这种透明度与可控性对于建立科学家对AI系统的信任至关重要,尤其是在科学研究这种强调可复现性和严谨性的领域。CLIO的设计支持模型无关性,能够提升多种基础模型(如GPT-4o)的性能,并为微软的Discovery平台奠定基础,预示着AI在科学发现中的未来方向。
A self-evolving reasoning system for science
Microsoft is pioneering a vision for a self-adapting AI system that can adapt to the dynamic nature of scientific discovery, promoting deeper, more refined reasoning in complex scientific domains.

网友讨论