基于Cursor和Coze的多媒体自动发布工具:AI编程实践与应用
1. 为什么要做多媒体自动发布工具?
1.1 背景:从开源项目到自动化工作流
最初,我受到开源项目“social-auto-upload”的启发,开始关注多媒体自动发布领域。随着Coze工作流开发的深入,我发现Coze在选题、脚本创作、配音、视频生成、视频剪辑等方面已经非常成熟,唯独缺少一个环节:自动发布。
1.2 需求:一键实现多平台矩阵发布
为了补齐Coze工作流的最后一块拼图,我决定开发一个工具,能够一键实现多平台自动分发、矩阵发布。这个工具需要具备以下特点:
- 无缝对接:与Coze、Dify、N8N等自动化工作流无缝对接。
- 多平台支持:支持小红书、抖音、视频号、B站、快手、百家号,以及国外的TikTok等平台。
- 易用性:操作简单,用户只需输入关键词即可完成整个视频制作到发布的全流程。
2. 如何用AI编程实现多媒体自动发布工具?
2.1 整体架构:桌面客户端 + 服务端 + COZE插件
多媒体自动发布工具的整体架构如下:
- COZE工作流:利用COZE工作流一键生成视频、标题、标签等信息。
- COZE视频发布任务插件:完成发布任务创建,将任务信息传递给服务端。
- 服务端:接收COZE插件传递的任务信息,进行任务调度和管理。
- 客户端:监听视频发布任务,驱动本地浏览器完成自动发布。
2.2 AI编程心得:拆解任务、多平台切换、附带完整日志
在AI编程过程中,我总结出以下几点心得:
- 明确需求:清晰地说明自己需要什么样的功能,让AI帮你理清思路。
- 拆解任务:将项目拆分为多个结构,再单个分结构让AI提供编程设计方案。
- 多平台切换:在不同的AI编程平台(如Cursor、GPT、Claude、DeepSeek)之间切换,以获得最佳效果。
- 附带完整日志:在修改BUG时,附上完整日志,帮助AI更好地理解问题。
2.3 技术方案:Playwright驱动本地浏览器
我选择使用Playwright驱动本地浏览器完成自动发布。这样做的好处是:
- 完全本地化:0风险,不会被风控。
- 可扩展性:可以延伸开发出启动比特浏览器的版本,实现多矩阵发布。
什么是Playwright?
Playwright 是一个现代化、高性能的浏览器自动化工具,你可以在现在流行的MCP中看到很多这种MCP服务。
2.4 开发难点:本地客户端GUI设计和打包
在整个开发过程中,最费时间的是本地客户端。虽然包装了开源项目的自动发布流程,但是本地客户端GUI的设计和各种接口数据的处理方式都比较费时。此外,本地程序打包也是一个难点,我尝试了几种方案,勉强能打包好一个mac的一键启用app程序,win的打包方式就比较简单。
2.5 用户注册统一鉴权系统:GPT助力快速搭建
用户注册统一鉴权系统一开始我没有思路,于是我向GPT提问,GPT给出了很多建议,最终我只提问了两三次,GPT就把所有程序帮我设计好了,并且给我生成了打包文件。我直接上传到宝塔,安装好依赖项,启动服务,做反向代理,不到一个小时就完成了一个用户登录鉴权的系统。
3. 如何使用多媒体自动发布工具?
3.1 多媒体自动发布客户端安装
- 下载客户端程序:在公众号后台回复“自动发布”获取安装包(目前只打包了MAC版本的,win的可以关注下我,后面给大家更新)。
- 解压并拖入应用程序:下载完成后,解压就可以看到应用图标,然后将这个应用拖入到应用程序中。
- 打开应用:如果包打不开,进入mac的隐私与安全性,选择“仍要打开”。
- 初始化环境:第一次启用会有环境初始化的步骤,稍等两分钟就可以安装完成。
- 进入主界面:安装完成后,就进入到自动发布程序的主界面。
3.2 客户端配置
- 用户Token:必填,获取地址:https://agent.uaisir.com/,复制token填入这里即可。
- 浏览器路径:选择本地google浏览器的地址。
- 账号管理:支持添加多平台账号,目前小红书测试流畅,后续会逐渐开放各个平台。
- CK名:账号添加好之后,需要复制这里对应的CK名,备用。
3.3 COZE工作流配置
- 选择工作流:在COZE上选择一个视频类工作流,例如“爆款书单视频模版”。
- 添加插件:在工作流快结束的节点添加已经开发好的插件,coze商店可以直接搜索到:https://www.coze.cn/store/plugin/7522533012677050368?from=plugin_card
- 配置插件参数:
- Authorization:对应https://agent.uaisir.com/的token,注意需要在token前加一个Bearer。
- accountList:对应客户端的CK名,多个按
["c425a9ec-5722-11f0-8b36-163a4dc34d92.json","c425a9ec-5722-11f0-8b36-163a4dc34d92.json"]
这种json格式输入。 - fileList:生成的视频地址。
- tags:标签。
- title:标题。
- enableTimer:是否定时,默认是false,如果填入true,则下面参数为必填。
- dailyTimes:每日发布时间。
- startDays:延迟天数。
- videosPerDay:每日发布数。
3.4 注意事项
- 桌面客户端可能有一些小BUG,但是不影响正常使用。
- 若要完成自动发布,必须保证客户端处于开启和任务监听状态。
- 账号登录有可能会失效。
4. 后续计划
- 完整打通抖音、视频号、B站、快手、百家号平台的自动发布功能。
- 支持客户端素材管理和配置自动发布。
- 支持比特浏览器多矩阵发布。
- 封装MCP服务。
5. 感悟
我认为:这工具,看似简单,实则凝聚了AI编程的智慧与实践的汗水。它像一柄利剑,斩断了重复劳动的枷锁,释放了创造力的火花。然而,它也像一面镜子,映照出我们在技术道路上的不足与挑战。未来,我们仍需精益求精,方能不负时代之期望。
,,,
© 版权声明
文章版权归作者所有,未经允许请勿转载。