AI重塑浏览器:Atlas来袭,OpenAI定义未来浏览方式?

AI前沿2个月前发布 yizz
12,129 0 0

OpenAI 发布 Atlas 浏览器:用 AI 重新定义浏览器体验?

为什么 OpenAI 要推出 Atlas 浏览器?

Sam Altman 的十年一遇机会论

OpenAI 的 Sam Altman 认为,AI 代表了十年一遇的机会,可以让我们重新思考浏览器应该是什么样子。这个逻辑其实很简单:你的工作主要在浏览器里完成,而不是在 ChatGPT 里。与其让你在浏览器和 ChatGPT 之间来回复制粘贴,不如让 ChatGPT 直接进入浏览器,为你提供更便捷的服务。

Atlas 浏览器的核心目标:与浏览器对话

围绕着“如果你可以和浏览器对话会怎样”这个问题,Atlas 浏览器应运而生。它旨在通过 AI 技术,让你与浏览器进行更智能的交互,从而提升工作效率和浏览体验。

, ,

Atlas 浏览器的三大核心能力是什么?

Atlas 浏览器目前仅支持 macOS,包含三大核心能力:

  1. Chat Anywhere(随处聊天): 任何网页都能调出 ChatGPT 侧边栏,方便你随时进行提问和交流。
  2. Browser Memory(浏览器记忆): 记住你的浏览历史,并在需要时主动调出,帮你快速找回之前浏览过的信息。
  3. Agent Mode(智能代理): ChatGPT 可以帮你操作浏览器,比如自动填写表单、下单买菜等,实现自动化任务

, , ,

1. Chat Anywhere:在任何网页上都能与 ChatGPT 聊天

功能介绍

在任何网页上,点击右上角的 Ask ChatGPT 按钮,就能打开一个侧边栏。ChatGPT 能看到当前页面的内容,你不需要截图、不需要复制粘贴。

应用场景

  • 代码审查GitHub 看一个代码 Commit,问 ChatGPT:“这个改动安全吗,可以合并到 RC 版本吗?” ChatGPT 看了代码,说:“这是一个低风险的改动,主要是视觉调整,应该可以安全合并。”
  • Cursor Chat(光标聊天): 在任何文本框里,ChatGPT 会自动出现在光标旁边,提供编辑建议。例如,你在写邮件,选中一段文字,ChatGPT 会弹出“让这段话听起来更专业”。

优势

AtlasCursor Chat 功能以悬浮窗的形式呈现,但默认隐藏,鼠标移过去之前看不出来,这一点很好。而且,AtlasCursor Chat 是原生的,不是插件,速度更快。

, , ,

2. Browser Memory:让浏览器记住你的浏览历史

功能介绍

Browser MemoryAtlas 和传统浏览器最大的区别。它会记住你浏览过的内容,并在需要时主动调出。

应用场景

  • “找出我上周看的所有职位发布”
  • “搜索我之前看过的关于 Atlas 核心设计的文档”
  • “打开我昨天看到过的那双鞋”

隐私问题

虽然 OpenAI 表示:Browser Memory 是完全可选的,你可以随时关闭、查看、删除。但是,浏览器记录这个东西吧…懂得都懂…

主页推荐:个性化任务建议

Atlas 的主页不是传统的搜索框,而是一个 ChatGPT 对话界面。下面会有一些个性化建议,比如”查找节日食谱”、”研究节日礼物”。这些建议是基于你的浏览历史生成的。

, , ,

3. Agent Mode:让 ChatGPT 帮你操作浏览器

功能介绍

Agent ModeAtlas 最有意思的功能。Atlas 可以自己操作一个鼠标,像人一样点击、输入、导航,帮你操作浏览器。

应用场景:跨应用协作

假设你和团队在筹备一个万圣节鬼屋活动,他们在 Google Docs 里有个任务列表。但有些人没填本周的任务,你想给这些人留言提醒。同时,你想把已经填好的任务都同步到 Linear(他们用的任务管理工具)。

你可以对 ChatGPT 说:“麻烦帮我给没填任务的人留言提醒,然后把本周的任务都同步到 Linear”。

然后,ChatGPT 开始行动:

  1. Google Docs 里找到没填任务的人,逐个 @ 他们留言。
  2. 跳转到 Linear,创建新任务,把内容从 Google Docs 复制过去,分配负责人。

整个过程大概两分钟,完全自动完成。

限制和安全

对于 Agent 来说,安全和效率是很难兼得的,至少目前是。对于这个浏览器,目前有以下限制:

  • 不能自主:运行代码、下载文件、安装扩展
  • 不能自主:访问你电脑上的其他应用或文件系统
  • 在敏感网站(比如银行)操作时,它会暂停,确保你在看着

OpenAI 的安全负责人 Pranav 特别强调:尽管有很多内置保护措施,Agent 仍然可能犯错,也容易受到隐藏恶意指令的攻击。用户需要权衡风险,监控 Agent 的行为。

Agent Mode 目前只对 PlusPro 用户开放,还是预览版。

, , ,

我的实测体验

拿到 Atlas 后,我立刻测试了几个场景。

  • Chat Anywhere: 常规,但有用。
  • Browser Memory: 有点用处。
  • Agent Mode: 很有意思,但不太聪明。

Chat Anywhere

我打开了 Atlas 的发布页面,点击 Ask ChatGPT,问:“这里讲了啥?” 很快,总结就给到了。

对于悬浮窗…我干了个比较邪道的…打开小红书后台,「去写篇文章」…

Browser Memory

在写这篇文章的时候,我有去查找 Perplexity Comet 的最新材料,于是问它:“重新打开刚刚看过的 Comet 的文章”。ChatGPT 很快找到了,并问我要打开哪一篇。

Agent Mode

Agent Mode 非常好玩。就比如…我上面干的那个非常 NTR 的事情:去 Claude 上对话,让 Claude 搜集有关 OpenAI Atlas 的信息,并制作一份好看的可视化网站,然后发布。

不过吧,依然还是那个问题:简单任务能做,复杂任务还不太稳定(比如…帮我在网上赚 1 万美刀)。

, , ,

隐私和安全:OpenAI 的承诺

在发布会上,Pranav 花了不少时间讲隐私和安全。

  • 关于 Browser Memory: 完全可选,你可以随时关闭,你可以在设置里查看所有记忆、删除不想要的。
  • 关于数据训练: 默认不用你的浏览内容训练模型,除非你主动开启相关选项。
  • 关于 Agent Mode: 它只能操作浏览器标签页,不能访问你的文件系统或其他应用,在敏感网站(比如银行)操作时会暂停并提示你。

OpenAI 还发布了一份 System Card,详细说明了 Agent 的安全测试。他们做了数千小时的红队测试,专门测试对抗隐藏恶意指令的攻击。但他们也承认:保护措施不能阻止所有攻击,用户需要自己权衡风险。

, , ,

总结

Atlas 今天上线,完全可用,不需要邀请码,也不需要额外付费。OpenAI 的入场,确实让这场 AI 浏览器之战更有趣了,接下来几个月,值得继续观察。

我认为: OpenAIAtlas 浏览器,看似是对传统浏览器的颠覆,实则是对自身 AI 能力的延伸。它试图将 AI 融入到用户的日常浏览行为中,提供更智能、更便捷的服务。然而,隐私安全、Agent 的可靠性以及用户习惯的改变,都将是 Atlas 需要面对的挑战。正如 Sam Altman 所言,这代表了十年一遇的机会,但能否抓住这个机会,还需拭目以待。

© 版权声明

相关文章