

要跟上所有新人工智能工具的步伐可能很困难。您甚至可能拥有许多尚未注意到的人工智能功能和资源。
例如,Copilot Vision 现在 Microsoft Edge中对所有人免费开放。如果您不经常使用 Edge 作为浏览器,或者从未听说过 Copilot Vision,您可能还没意识到这一点。
它是 Microsoft CopilotAI 的一个扩展,基本上可以“看到”您在网上看到的内容。现在,这可能已经在您脑海中敲响了隐私警钟:您真的想让 AI 跟踪您在线上的每一个动作吗?
嗯,也许吧,如果您觉得它有用。这意味着您可以向 Copilot 提问您正在查看的内容并获得建议——无论您是想找到最好的滴滤咖啡机还是为您的下一次公路旅行制定完美的行程。
Microsoft 表示,您与 Copilot Vision 聊天的任何内容都不会被永久存储,并且您会话中的数据将在您完成后立即删除。如果您对这些保障措施满意,可以按照以下步骤开始使用该功能。
如何启动 Copilot Vision
通过启动 WIndows 上的浏览器,然后点击三个点(右上角),选择“帮助和反馈 > 关于 Microsoft Edge”来确保您使用的是最新版本的 Microsoft Edge。您还需要通过工具栏上三个点左侧的个人资料头像按钮登录到您的 Microsoft 帐户。
然后,您需要导航到一个您想与 Copilot Vision 聊天的网站、视频或 PDF 文件。 (请注意,AI 将拒绝与包含有害或成人内容的网站进行交互。)通过点击工具栏最右侧(三个点右侧)的 Copilot 图标来启动 Copilot。

接下来,点击 Copilot 侧边栏右下角的麦克风图标。如果 Copilot Vision 可用,您需要点击“接受”,然后会有一个简短的语音介绍,解释该功能的工作原理。Copilot Vision 面板位于浏览器中央,周围框架的颜色会改变,以显示 AI 功能已激活。
这里有四个按钮:点击 **X** 退出 Copilot Vision,点击麦克风按钮静音和取消静音您的麦克风,点击眼镜图标打开或关闭 Copilot Vision,点击齿轮图标访问该工具的设置(目前只有一个设置——您可以选择 AI 的语音风格)。

启动 Copilot Vision 后,您只需开始交谈即可。您可以像平常与 Copilot 交谈一样,聊任何您喜欢的内容,也可以聊页面上的任何内容。但是,您无法让 AI 为您执行操作——它不会滚动页面或点击链接,只会通过语音与您聊天。
目前,Copilot Vision 仍处于实验阶段,我自己的测试也证实了这一点。它在很多时候都很准确,但它并不总是能完美理解您所说的一切,或 100% 给出可靠的答案——和往常一样,使用这些 AI 机器人,您需要仔细检查任何重要的事情。
如何使用 Copilot Vision
现在您知道如何打开 Copilot Vision 了,您实际上该如何使用它呢?假设您正在浏览一个有很多不同新闻报道的网页:您可以让 AI 总结所有标题并读给您听,这样就省去了滚动和阅读的麻烦。然后 Copilot Vision 会询问您是否对某个故事特别感兴趣,这样您就可以继续对话。
也许您正在查看某个场所、企业或组织的网页——总结工具在这里也会很有用。您可能想询问该地方是否适合儿童,或查看营业时间,或查看是否有任何您可以利用的特别优惠。当然,您可以通过阅读页面来完成所有这些,但当有大量文本和信息需要吸收时,Copilot Vision 可以为您节省一些时间。

另一种使用方式是识别图像,AI 在这方面已经做得很好很长时间了。例如,您可以询问它正在在线查看的植物的种类,或者著名地标位于世界何处(假设这些没有正确标注,那样您就已经知道了)。您甚至可以要求 Copilot Vision 对艺术、建筑或您正在查看的任何其他内容给出您的看法。
购物是另一个用例。如果您在屏幕上浏览大量选项,您可以让 Copilot Vision 根据其外观、规格或您的个人品味推荐一些东西(如有需要,AI 会就此提示您)。但同样,它无法为您完成点击和滚动操作——所有这些您都需要自己完成。

如果您在网页浏览器中玩一些轻量级游戏,Copilot Vision 甚至可以帮助您玩网页游戏。您可以询问技巧和策略,或者游戏说明,AI 会帮助您。对于某些网页游戏,例如GeoGuessr,Copilot Vision 可以引导您找到正确的答案。
从我使用 Copilot Vision 进行的测试来看,它的答案通常可以将页面上的内容与来自网络的更普遍知识和其训练数据结合起来——因此,您可以脱离出来询问屏幕上没有的内容。当您关闭 Copilot 时,您将返回到 Edge 侧边的标准 Copilot 面板。