OpenAI 发布 Atlas 浏览器:用 AI 重新定义浏览器体验?
为什么 OpenAI 要推出 Atlas 浏览器?
Sam Altman 的十年一遇机会论
OpenAI 的 Sam Altman 认为,AI 代表了十年一遇的机会,可以让我们重新思考浏览器应该是什么样子。这个逻辑其实很简单:你的工作主要在浏览器里完成,而不是在 ChatGPT 里。与其让你在浏览器和 ChatGPT 之间来回复制粘贴,不如让 ChatGPT 直接进入浏览器,为你提供更便捷的服务。
Atlas 浏览器的核心目标:与浏览器对话
围绕着“如果你可以和浏览器对话会怎样”这个问题,Atlas 浏览器应运而生。它旨在通过 AI 技术,让你与浏览器进行更智能的交互,从而提升工作效率和浏览体验。
, ,
Atlas 浏览器的三大核心能力是什么?
Atlas 浏览器目前仅支持 macOS,包含三大核心能力:
- Chat Anywhere(随处聊天): 任何网页都能调出 ChatGPT 侧边栏,方便你随时进行提问和交流。
- Browser Memory(浏览器记忆): 记住你的浏览历史,并在需要时主动调出,帮你快速找回之前浏览过的信息。
- Agent Mode(智能代理): ChatGPT 可以帮你操作浏览器,比如自动填写表单、下单买菜等,实现自动化任务。
, , ,
1. Chat Anywhere:在任何网页上都能与 ChatGPT 聊天
功能介绍
在任何网页上,点击右上角的 Ask ChatGPT 按钮,就能打开一个侧边栏。ChatGPT 能看到当前页面的内容,你不需要截图、不需要复制粘贴。
应用场景
- 代码审查: 在 GitHub 看一个代码 Commit,问 ChatGPT:“这个改动安全吗,可以合并到 RC 版本吗?” ChatGPT 看了代码,说:“这是一个低风险的改动,主要是视觉调整,应该可以安全合并。”
- Cursor Chat(光标聊天): 在任何文本框里,ChatGPT 会自动出现在光标旁边,提供编辑建议。例如,你在写邮件,选中一段文字,ChatGPT 会弹出“让这段话听起来更专业”。
优势
Atlas 的 Cursor Chat 功能以悬浮窗的形式呈现,但默认隐藏,鼠标移过去之前看不出来,这一点很好。而且,Atlas 的 Cursor Chat 是原生的,不是插件,速度更快。
, , ,
2. Browser Memory:让浏览器记住你的浏览历史
功能介绍
Browser Memory 是 Atlas 和传统浏览器最大的区别。它会记住你浏览过的内容,并在需要时主动调出。
应用场景
- “找出我上周看的所有职位发布”
- “搜索我之前看过的关于 Atlas 核心设计的文档”
- “打开我昨天看到过的那双鞋”
隐私问题
虽然 OpenAI 表示:Browser Memory 是完全可选的,你可以随时关闭、查看、删除。但是,浏览器记录这个东西吧…懂得都懂…
主页推荐:个性化任务建议
Atlas 的主页不是传统的搜索框,而是一个 ChatGPT 对话界面。下面会有一些个性化建议,比如”查找节日食谱”、”研究节日礼物”。这些建议是基于你的浏览历史生成的。
, , ,
3. Agent Mode:让 ChatGPT 帮你操作浏览器
功能介绍
Agent Mode 是 Atlas 最有意思的功能。Atlas 可以自己操作一个鼠标,像人一样点击、输入、导航,帮你操作浏览器。
应用场景:跨应用协作
假设你和团队在筹备一个万圣节鬼屋活动,他们在 Google Docs 里有个任务列表。但有些人没填本周的任务,你想给这些人留言提醒。同时,你想把已经填好的任务都同步到 Linear(他们用的任务管理工具)。
你可以对 ChatGPT 说:“麻烦帮我给没填任务的人留言提醒,然后把本周的任务都同步到 Linear”。
然后,ChatGPT 开始行动:
- 在 Google Docs 里找到没填任务的人,逐个 @ 他们留言。
- 跳转到 Linear,创建新任务,把内容从 Google Docs 复制过去,分配负责人。
整个过程大概两分钟,完全自动完成。
限制和安全
对于 Agent 来说,安全和效率是很难兼得的,至少目前是。对于这个浏览器,目前有以下限制:
- 不能自主:运行代码、下载文件、安装扩展
- 不能自主:访问你电脑上的其他应用或文件系统
- 在敏感网站(比如银行)操作时,它会暂停,确保你在看着
OpenAI 的安全负责人 Pranav 特别强调:尽管有很多内置保护措施,Agent 仍然可能犯错,也容易受到隐藏恶意指令的攻击。用户需要权衡风险,监控 Agent 的行为。
Agent Mode 目前只对 Plus 和 Pro 用户开放,还是预览版。
, , ,
我的实测体验
拿到 Atlas 后,我立刻测试了几个场景。
- Chat Anywhere: 常规,但有用。
- Browser Memory: 有点用处。
- Agent Mode: 很有意思,但不太聪明。
Chat Anywhere
我打开了 Atlas 的发布页面,点击 Ask ChatGPT,问:“这里讲了啥?” 很快,总结就给到了。
对于悬浮窗…我干了个比较邪道的…打开小红书后台,「去写篇文章」…
Browser Memory
在写这篇文章的时候,我有去查找 Perplexity Comet 的最新材料,于是问它:“重新打开刚刚看过的 Comet 的文章”。ChatGPT 很快找到了,并问我要打开哪一篇。
Agent Mode
Agent Mode 非常好玩。就比如…我上面干的那个非常 NTR 的事情:去 Claude 上对话,让 Claude 搜集有关 OpenAI Atlas 的信息,并制作一份好看的可视化网站,然后发布。
不过吧,依然还是那个问题:简单任务能做,复杂任务还不太稳定(比如…帮我在网上赚 1 万美刀)。
, , ,
隐私和安全:OpenAI 的承诺
在发布会上,Pranav 花了不少时间讲隐私和安全。
- 关于 Browser Memory: 完全可选,你可以随时关闭,你可以在设置里查看所有记忆、删除不想要的。
- 关于数据训练: 默认不用你的浏览内容训练模型,除非你主动开启相关选项。
- 关于 Agent Mode: 它只能操作浏览器标签页,不能访问你的文件系统或其他应用,在敏感网站(比如银行)操作时会暂停并提示你。
OpenAI 还发布了一份 System Card,详细说明了 Agent 的安全测试。他们做了数千小时的红队测试,专门测试对抗隐藏恶意指令的攻击。但他们也承认:保护措施不能阻止所有攻击,用户需要自己权衡风险。
, , ,
总结
Atlas 今天上线,完全可用,不需要邀请码,也不需要额外付费。OpenAI 的入场,确实让这场 AI 浏览器之战更有趣了,接下来几个月,值得继续观察。
我认为: OpenAI 的 Atlas 浏览器,看似是对传统浏览器的颠覆,实则是对自身 AI 能力的延伸。它试图将 AI 融入到用户的日常浏览行为中,提供更智能、更便捷的服务。然而,隐私安全、Agent 的可靠性以及用户习惯的改变,都将是 Atlas 需要面对的挑战。正如 Sam Altman 所言,这代表了十年一遇的机会,但能否抓住这个机会,还需拭目以待。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
