教程 04 — 浏览器自动化:让 AI 帮你操控网页
目标:使用 OpenClaw 内置的浏览器工具,让 AI 自动浏览网页、截图、提取信息、填写表单。
原理
OpenClaw 集成了一个专用的 Chrome/Chromium 实例,AI 可以通过工具调用来:
- 导航到指定 URL
- 截图并分析页面
- 点击元素、填写表单
- 提取结构化数据
你的指令 → AI → browser_navigate / browser_action → Chrome → 截图/结果 → AI 分析 → 回复
前置条件
确保 Chrome 或 Chromium 已安装:
# macOS
brew install --cask google-chrome
# 或者使用 Chromium
brew install --cask chromium
基础用法:让 AI 抓取网页信息
在 WebChat 或 Telegram 中直接描述任务:
示例 1:查看天气
帮我打开 https://wttr.in/Shanghai 截图,告诉我上海今天天气
示例 2:抓取 GitHub 仓库信息
帮我打开 https://github.com/trending,列出今天 GitHub 上最热门的 5 个项目,包括语言和 star 数
示例 3:读取在线文档
打开 https://docs.python.org/3/library/asyncio.html,给我总结 asyncio 最常用的 5 个函数
进阶:表单自动填写
帮我打开 https://httpbin.org/forms/post
填写以下信息:
- custname: 张三
- custtel: 13800138000
- custemail: zhangsan@example.com
- comments: 这是一个测试订单
然后截图给我看结果
进阶:批量数据提取
结合自定义 Skill,创建一个数据采集技能:
~/.openclaw/workspace/skills/数据采集/SKILL.md:
# 网页数据采集专家
用户会提供一个网址和需要提取的数据字段。你需要:
1. 使用 browser_navigate 打开页面
2. 使用 browser_snapshot 获取页面内容
3. 按用户要求提取结构化数据
4. 以 JSON 或 Markdown 表格格式输出
注意:
- 如果页面需要滚动,分多次截图
- 如果有分页,询问用户是否需要翻页采集
- 遇到登录墙时告知用户
使用:
/数据采集
网址:https://news.ycombinator.com
需要提取:标题、链接、分数、评论数(前 10 条)
进阶:监控网页变化
结合 Cron 定时任务(需配置 cron 频道),可以定期检查网页:
{
"channels": {
"cron": {
"enabled": true,
"jobs": [
{
"cron": "0 9 * * 1-5",
"message": "打开 https://github.com/trending 截图,总结今日热门项目并发给我",
"channel": "telegram"
}
]
}
}
}
这样每个工作日早上 9 点,AI 会自动爬取 GitHub Trending 并通过 Telegram 发给你。
工具一览
AI 在浏览器任务中可以使用的工具:
| 工具 | 功能 |
|---|---|
browser_navigate | 打开 URL |
browser_snapshot | 截图当前页面 |
browser_action | 点击、输入、滚动等操作 |
browser_upload | 上传文件到页面 |
注意事项
- 浏览器工具在沙盒模式下运行,不会影响你日常使用的浏览器
- 不要用于登录涉及敏感账户的网站(AI 会看到截图内容)
- 复杂 SPA 页面(如 React/Vue 应用)可能需要等待加载,可以在指令里说明
下一步
- 教程 05 — 配置多个模型,Claude 贵了自动切 MiniMax