Google Gemini Nano驱动Pixel生态:AI声纹翻译、智能日记与无感交互成未来焦点
Google正将其AI能力深度整合至Pixel设备及服务,通过设备端Gemini Nano模型,实现更安全、个性化的用户体验。
Google的实时通话翻译功能已迈入新阶段,利用Gemini Nano生成用户自身声音的近似版本,使跨语言通话中的翻译听起来更自然,如同原声。此技术虽在口音上尚待完善,但已能捕捉通话者的语气,且强调数据处理全程在设备端完成,不收集或存储音频,仅需用户发言的短暂片段进行处理,目前支持英、德、日、西等少数语言。
此外,Google还推出了借鉴Apple模式的Journal应用,提供AI驱动的日记提示与反思,通过表情符号标记情绪基调,辅助用户洞察身心健康变化,并支持密码锁定。每日摘要功能(Daily Hub)则集成于At a Glance widget或Google Discover,聚合日程、提醒并基于搜索历史推荐活动,旨在提供更便捷的信息获取方式。
在可穿戴设备方面,Pixel Watch 4引入了“Raise to Talk to Gemini”功能,用户抬腕即可激活Gemini,无需语音指令或按键,极大地提升了交互效率。Gemini在Wear OS上的应用,以其卓越的自然语言处理能力,使用户能以更灵活的方式获取信息、设置提醒或寻求建议,标志着智能助手交互的进一步进化。
10 Crazy New Features Powering Google’s Pixel 10 Phones (and Watch)
Google’s latest AI features include real-time translated phone calls in your own AI-generated voice, an AI camera coach that makes you a better Instagram husband, and a voicemail replacement.

网友讨论