谷歌近日在美国正式推出了一项名为“搜索直播”(Search Live)的创新功能,该功能深度整合了人工智能技术,允许用户通过实时语音和摄像头与谷歌搜索进行动态、情境感知的对话。这项新功能现已通过谷歌应用在 Android 和 iOS 设备上提供英文服务,标志着人机信息交互方式的一次重大飞跃。
“搜索直播”的核心在于其强大的多模态交互能力。用户只需在谷歌应用中点击搜索栏下方的“直播”图标,即可激活人工智能模式,开始与谷歌进行语音对话。更进一步的是,用户还可以选择启用摄像头,将现实世界的视觉信息实时分享给谷歌,从而围绕用户所处的环境展开深入的交流。对于已经熟悉谷歌 Lens 的用户而言,选择“直播”选项将无缝衔接至摄像头共享功能,实现即时的视觉内容对话。这项功能由谷歌的 Gemini AI 提供强大支持,能够理解并回应用户的语音指令,同时还能解析摄像头捕捉到的画面信息,提供相关的网络链接以供深入探索。
这项技术不仅提升了搜索的直观性和相关性,更预示着一种全新的信息获取方式。例如,用户可以对着一堆杂乱的电线提问,询问哪一根是 HDMI 2.1;或者在看到不认识的植物时,直接通过摄像头询问其名称和特性。在旅行途中,用户可以无需打字,通过语音询问当地的景点信息;在学习新技能时,例如制作抹茶,用户可以展示工具并询问用途,甚至获取食材的替代建议。这种“指点即搜”的模式,极大地简化了信息查找的流程,尤其适用于需要解放双手的场景,如烹饪、通勤或运动时。
“搜索直播”的推出,是谷歌在人工智能搜索领域持续发力的重要一步。它将传统的文本查询模式,转变为一种更自然、更具互动性的对话体验。谷歌通过“查询扩展”(query fan-out)技术,能够同时发出多个查询以提供更全面的响应,并确保用户在获得即时语音回答的同时,也能方便地访问相关的网页链接,从而在便捷性与深度探索之间取得平衡。
目前,“搜索直播”已在美国地区全面上线,支持英文。谷歌表示,未来将逐步扩展到更多语言和地区。这项功能的推出,不仅为用户带来了前所未有的便捷搜索体验,也为内容创作者和企业提供了新的优化方向,以适应日益增长的对话式和视觉化搜索趋势。谷歌正通过这项创新,不断重塑人们与信息互动的方式,开启一个更加智能、直观的搜索新纪元。