核心概念理解
在开始之前,先理解几个关键概念:

- 任务:一个最小的、不可再分的自动化操作单元。“打开网址”、“点击元素”、“输入文本”、“获取文本”。
- 任务链:由多个“任务”按特定顺序连接起来的流程,一个任务的输出(例如抓取到的文本、URL)可以作为下一个任务的输入。
- 变量:用于存储和传递数据的容器,在任务链中至关重要,你可以将第一步抓取到的商品标题存入变量
product_title,然后在第三步的评论中输入它。 - 条件分支:根据不同的情况(如某个元素是否存在、某个文本是否包含特定内容)决定任务链下一步该走哪条路,这是实现智能自动化的关键。
- 循环:对一组相似的元素(如列表中的每条结果)重复执行相同的任务序列。
第二部分:任务链设置分步教程
我们以一个经典的“搜索商品并抓取信息”为例,构建一个任务链。
目标:打开淘宝,搜索“蓝牙耳机”,翻到第2页,抓取前5个商品的标题和价格。
规划与设计(最重要的一步)
在动手前,用纸笔或思维导图画出流程:
- 打开淘宝首页。
- 在搜索框输入“蓝牙耳机”并点击搜索。
- 等待搜索结果加载完成。
- (可选) 点击“下一页”跳转到第2页。
- 循环处理前5个商品:
- 抓取商品标题。
- 抓取商品价格。
- 和价格保存到变量或本地文件。
- 移动到下一个商品。
录制与创建基础任务
- 打开 OpenClaw,新建任务链:在任务链列表页面,点击“新建任务链”,给它起个名字,如“淘宝商品抓取”。
- 录制第一个任务:
- 点击“添加任务” -> 选择“打开网页”。
- 在“操作目标”中输入
https://www.taobao.com。 - 保存任务,命名为“打开淘宝”。
- 录制搜索任务:
- 在“打开淘宝”任务下,点击“添加后续任务”。
- 选择“录制任务”,OpenClaw会打开一个浏览器窗口。
- 在地址栏输入淘宝网址并回车(如果还没打开)。
- 将鼠标移动到搜索框,按
Ctrl并点击,OpenClaw会识别此元素。 - 在右侧操作面板,选择“输入文本”,内容填“蓝牙耳机”。
- 继续将鼠标移动到“搜索按钮”,按
Ctrl并点击。 - 在操作面板选择“点击元素”。
- 停止录制,这个任务会自动包含“输入”和“点击”两个子操作,可以命名为“搜索关键词”。
添加关键操作(等待、抓取、循环)
- 添加等待:在点击搜索后,页面需要加载,在“搜索关键词”任务后,添加一个“等待”任务,选择“等待元素出现”,并去页面上用
Ctrl+点击选择一个只有搜索结果页才有的元素(如“筛选栏”或第一个商品卡片),设置一个合理的超时时间(如10秒),这能确保后续操作在页面加载完成后才执行。 - (可选)添加翻页:添加一个“点击元素”任务,去点击页码“2”,同样,点击后最好加一个“等待”任务,等待第二页的特征元素出现。
- 设置循环:
- 在翻页后的等待任务后,添加一个“循环”任务。
- 在循环设置中,选择“元素列表”,然后用
Ctrl+点击去选中一个商品卡片的根元素(注意:要选能代表单个商品的最小外围容器,通常有重复的CSS类名)。 - OpenClaw会自动识别并选中所有同类元素,设置最大循环次数为5。
- 在循环内抓取数据:
- 进入循环内部,现在你的操作会针对当前循环项(即第N个商品卡片)进行。
- 添加抓取任务1:选择“获取元素文本”,在商品卡片内,用
Ctrl+点击选中标题元素,在“保存到变量”中,新建一个变量,如item_title。 - 添加抓取任务2:同上,添加另一个“获取元素文本”任务,选中价格元素,保存到变量
item_price。
- 处理抓取到的数据:
- 你可以在循环内添加“输出日志”任务,将两个变量打印出来,方便调试。
- 更常用的是保存到文件:添加一个“执行JavaScript”任务,编写代码将
item_title和item_price追加到一个数组或直接写入一个CSV格式的字符串,最后通过“写文件”任务保存到本地。 - OpenClaw可能提供更直接的“保存数据”任务,请参考其最新文档。
设置条件分支(进阶)
假设我们想只抓取价格低于100元的商品。
- 在抓取
item_price之后,添加一个“条件判断”任务。 - 在条件设置中,选择“变量值判断”。
- 左侧选择变量
item_price,中间选择“小于”,右侧填写100。 - 在 “是”分支 下,添加数据保存任务。
- 在 “否”分支 下,可以什么都不做,或者添加日志“价格过高,跳过”。
调试与运行
- 单步调试:利用OpenClaw的“单步运行”功能,逐个任务执行,观察浏览器行为和变量变化,这是排查问题的利器。
- 调整速度:在任务设置中,可以添加“延迟”任务,或设置每个操作前后的固定延迟,让操作更模拟真人,避免被反爬。
- 运行整个任务链:调试无误后,点击“运行任务链”,观察其自动完成全部流程。
第三部分:最佳实践与技巧
- 多用等待:网络不稳定时,等待元素出现、可点击、消失比固定延时更可靠。
- 变量命名清晰:使用
page_title,product_list,current_price等有意义的名称。 - 任务模块化:如果一个任务链非常长,可以将其拆分成几个子任务链,然后使用“执行任务链”任务来调用,使结构更清晰。
- 异常处理:关键步骤后可以添加“条件判断”,检查是否成功(如某个元素是否存在),如果失败则跳转到清理或报警任务。
- 元素选择器:除了录制,学习手动编写或修改XPath或CSS选择器,通常更精确、更稳定。
- 定期维护:网站改版后,元素选择器可能失效,需要定期检查和更新任务链。
第四部分:常见任务链场景示例
- 同步:任务链1(知乎抓取) -> 任务链2(微信公众号发布)。
- 竞品监控:每日定时运行,抓取竞品价格、活动信息,保存并邮件通知。
- 数据填报:从本地Excel读取数据,自动登录内部系统,逐条填写表单。
- RPA流程:自动登录邮箱下载附件,处理数据,再上传到另一个系统。
设置OpenClaw任务链的核心思路是:“化整为零,串联有序,数据驱动,灵活判断”。
- 分解你的大目标为单个操作。
- 串联这些操作,并用“等待”确保节奏。
- 用变量在不同的任务间传递关键数据。
- 用条件和循环让流程具备逻辑判断和重复处理能力。
多练习、多调试,从简单的链开始,逐渐增加复杂度,OpenClaw的官方文档和“生财有术”社群内的案例是绝佳的学习资源,遇到具体问题可以多去搜索和提问,祝你自动化顺利!
版权声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。