科金社2025年08月21日 14:22消息,谷歌Pixel 10首发Gemini黑科技,圈重点、模仿语音,AI随叫随到,智能体验全面升级。
8 月 21 日消息,谷歌宣布为其人工智能助手 Gemini Live 推出多项创新功能,旨在进一步提升用户在实时对话中的交互体验。此次更新的核心亮点之一是新增的屏幕高亮功能,该功能将允许 Gemini Live 在用户共享摄像头画面时,直接在屏幕上标出特定物品。例如,当用户面对一堆工具却不确定该使用哪一个时,只需将 Pixel 手机的摄像头对准工具堆,Gemini Live 即可在屏幕上高亮显示推荐的工具,极大提升操作的直观性与效率。
这一视觉引导功能将率先搭载于 8 月 28 日正式发布的 Pixel 10 系列手机,标志着谷歌在端侧 AI 与现实世界交互融合方面迈出关键一步。值得注意的是,谷歌并未将此功能局限于自家硬件,计划在接下来几周内逐步向其他安卓设备推广,并进一步扩展至 iOS 平台。此举显示出谷歌正致力于打破设备壁垒,推动 Gemini 成为跨平台、跨生态的通用 AI 助手,其野心已不仅限于智能手机市场,而是瞄准更广泛的用户场景。
更值得关注的是,Gemini Live 正在深化与系统级应用的整合。现在,用户可以在与 AI 讨论路线规划时,随时中断对话并发出复合指令,例如:“这条路线看起来不错。现在,给亚历克斯发一条消息,告诉他我大概会迟到 10 分钟。” Gemini 将自动调用短信应用,草拟并发送信息。这种无缝衔接的多任务处理能力,意味着 AI 助手正从“被动应答”向“主动协同”演进,逐渐扮演起用户数字生活中的“智能中枢”角色。
此外,谷歌还推出了全新的音频模型,显著优化了 Gemini Live 对人类语音语调、节奏与音高的模拟能力。这意味着 AI 的语音输出将更加自然、富有情感。例如,在用户讨论压力较大的话题时,Gemini 可能会主动调整为更温和、舒缓的语气,体现出某种程度的“共情”能力。这种情感化语音设计不仅是技术进步,更是人机交互理念的升级——AI 不再只是工具,而逐渐具备“陪伴者”的潜质。
用户还可自定义 Gemini 的语速,或要求其以特定历史人物或角色的口吻讲述故事,甚至模拟相应口音,营造更具沉浸感的叙事体验。这一功能在教育、娱乐等场景中潜力巨大。例如,让孩子通过“爱因斯坦”讲解相对论,或将历史事件以莎士比亚风格娓娓道来,AI 正在重新定义知识传播的方式。然而,这也引发了一些伦理思考:当 AI 能够高度模仿人类情感与身份时,我们如何确保用户,尤其是未成年人,能够清晰区分虚拟与现实?技术的温度不应以模糊边界为代价。
留言评论
(已有 0 条评论)暂无评论,成为第一个评论者吧!