AI前沿情报:多模型巨头竞速,应用场景加速拓展
AI领域近期动态频发,OpenAI预计将推出200亿和1200亿参数的开源模型,同时GPT-5和Opus 4.1的更新也蓄势待发。谷歌方面,Gemini 2.5 Deep Think版本已上线,但需订阅价值250美元/月的Gemini Ultra计划方可体验,据称其性能提升显著优于早期版本。谷歌还通过Kaggle推出了Game Arena,允许AI模型在棋类游戏中通过文本交互进行逻辑推理的比拼,旨在测试模型的泛化能力。
Grok 4的订阅用户现已获得视频和图像生成功能的内测权限。Sōkosumi提供了一种规避AI订阅陷阱的解决方案,通过按任务付费的代理服务,支持DeepSeek和VEO3等模型,并强调其欧洲基地和GDPR合规性。Claude Artifacts现已支持文件上传,允许用户基于文档创建图表或学习指南,为构建最小可行产品(MVP)提供了新途径。
此外,IMG.LY AI Editor为开发者提供AI驱动的视觉编辑功能;Cloudy允许用户租用可断点续用的GPU;Groq的OpenBench提供了MIT许可的基准测试实现;Riffusion团队的Producer为个人AI音乐代理;Writer的Action Agent和Lindy的Autopilot、Agent Builder则分别提供了通用的任务执行代理和自动化工作流构建能力;Manus的Wide Research支持并行化研究以提高效率。Anthropic的研究揭示了LLM中的“Persona vectors”,可用于调控模型行为。ChatGPT开始引入休息提醒机制,而Cloudflare指控Perplexity规避网站爬取限制。
why is it so calm?
new models are around the corner

网友讨论