2 min read

Gemini Live迎来多模态交互与情感化升级,重塑AI助手体验

Google正将其AI助手Gemini Live的功能进行重大升级,旨在提供更直观、更智能的交互体验。新功能包括实时屏幕高亮、跨应用集成以及对人类语音细微差别的深度模拟。

Gemini Live将新增屏幕共享高亮能力,允许AI直接在用户镜头画面中指出具体对象,如识别工具或物品。此功能将与Pixel 10设备同步上线(8月28日),并随后扩展至其他Android设备及iOS平台。此外,Gemini Live将深度集成Messages、Phone、Clock等应用,用户可直接通过对话指令完成发消息、设置提醒等操作,无需切换应用。

升级后的Gemini Live音频模型显著提升了对语调、节奏和音高的理解与运用能力。AI将能根据对话内容调整语气,例如在处理压力话题时采用更舒缓的语调。用户还能自定义Gemini的语速,甚至在故事复述时模仿特定角色的口音,以提供更丰富、更具沉浸感的叙事体验。这些更新标志着AI助手在理解和模拟人类沟通方面迈出了重要一步。

Google’s Gemini Live AI assistant will show you what it’s talking about
Gemini is about to sound different, too.
订阅情报