21 Aug 2025 2 min read 手机数码

Gemini Live迎来多模态交互与情感化升级，重塑AI助手体验

Google正将其AI助手Gemini Live的功能进行重大升级，旨在提供更直观、更智能的交互体验。新功能包括实时屏幕高亮、跨应用集成以及对人类语音细微差别的深度模拟。

Gemini Live将新增屏幕共享高亮能力，允许AI直接在用户镜头画面中指出具体对象，如识别工具或物品。此功能将与Pixel 10设备同步上线（8月28日），并随后扩展至其他Android设备及iOS平台。此外，Gemini Live将深度集成Messages、Phone、Clock等应用，用户可直接通过对话指令完成发消息、设置提醒等操作，无需切换应用。

升级后的Gemini Live音频模型显著提升了对语调、节奏和音高的理解与运用能力。AI将能根据对话内容调整语气，例如在处理压力话题时采用更舒缓的语调。用户还能自定义Gemini的语速，甚至在故事复述时模仿特定角色的口音，以提供更丰富、更具沉浸感的叙事体验。这些更新标志着AI助手在理解和模拟人类沟通方面迈出了重要一步。

订阅情报

推荐情报

Webull进军澳大利亚加密市场，低成本策略剑指本土交易所

AssemblyAI语音转文本API升级，说话人分离功能强化驱动智能语音应用精细化

AssemblyAI语音转文本API集成说话人分离，革新音频数据分析效率

Macrowave：点对点技术赋能实时音频分享，重塑个人电台体验

AI增长进入消化期，市场情绪转向谨慎但未失乐观