AI模型竞速:开源、交互与代理能力的全面升级
OpenAI已发布两款开源权重模型 gpt-oss-20b 和 gpt-oss-120b,采用混合专家(MoE)架构,专为工具调用和代理工作流设计。尽管其推理能力不及 o3-mini 和 o4-mini,但其开放性允许企业进行特定任务的微调。然而,该模型在消费级硬件上的运行效率低下,限制了其在“本地优先”应用中的潜力。
Google 推出了 Genie 3,一个能够生成逼真、可交互游戏环境的模型,并具备长达一分钟的活动记忆能力,标志着其在世界模型领域取得了显著进展,与 Sora 异曲同工。此外,Google 为 Gemini 引入了指导学习和故事书创建等新功能,在探索新交互格式上表现突出。Anthropic 发布了 Claude Opus 4.1,在终端编码能力上实现了显著提升。
BMC Helix 推出了自主 IT 代理团队,能够执行文件工单、解决问题等操作。Shopify 发布了三款利用代理构建购物体验的新工具。Stripe 的支付数据分析揭示了 AI 公司的增长趋势。此外,AssemblyAI、Eleven Labs Music、Lilac、Endex、Maybe、Kombai 和 Notion AI 等公司也在各自领域推出了创新工具或服务,涵盖语音应用、音乐生成、GPU 连接、金融建模、数据分析及内容管理等。
open, world models
how i made an archive for ben’s bites

网友讨论