AI编程实践:多媒体自动发布工具,Coze工作流对接,Playwright驱动多平台发布

AI前沿7小时前发布 yizz
2,265 0 0
广告也精彩

基于Cursor和Coze的多媒体自动发布工具:AI编程实践与应用

1. 为什么要做多媒体自动发布工具?

1.1 背景:从开源项目到自动化工作流

最初,我受到开源项目“social-auto-upload”的启发,开始关注多媒体自动发布领域。随着Coze工作流开发的深入,我发现Coze在选题脚本创作配音视频生成视频剪辑等方面已经非常成熟,唯独缺少一个环节:自动发布

1.2 需求:一键实现多平台矩阵发布

为了补齐Coze工作流的最后一块拼图,我决定开发一个工具,能够一键实现多平台自动分发、矩阵发布。这个工具需要具备以下特点:

  • 无缝对接:与Coze、Dify、N8N等自动化工作流无缝对接。
  • 多平台支持:支持小红书、抖音、视频号、B站、快手、百家号,以及国外的TikTok等平台。
  • 易用性:操作简单,用户只需输入关键词即可完成整个视频制作到发布的全流程。

2. 如何用AI编程实现多媒体自动发布工具?

2.1 整体架构:桌面客户端 + 服务端 + COZE插件

多媒体自动发布工具的整体架构如下:

  1. COZE工作流:利用COZE工作流一键生成视频、标题、标签等信息。
  2. COZE视频发布任务插件:完成发布任务创建,将任务信息传递给服务端。
  3. 服务端:接收COZE插件传递的任务信息,进行任务调度和管理。
  4. 客户端:监听视频发布任务,驱动本地浏览器完成自动发布。

2.2 AI编程心得:拆解任务、多平台切换、附带完整日志

在AI编程过程中,我总结出以下几点心得:

  1. 明确需求:清晰地说明自己需要什么样的功能,让AI帮你理清思路。
  2. 拆解任务:将项目拆分为多个结构,再单个分结构让AI提供编程设计方案。
  3. 多平台切换:在不同的AI编程平台(如Cursor、GPT、ClaudeDeepSeek)之间切换,以获得最佳效果。
  4. 附带完整日志:在修改BUG时,附上完整日志,帮助AI更好地理解问题。

2.3 技术方案:Playwright驱动本地浏览器

我选择使用Playwright驱动本地浏览器完成自动发布。这样做的好处是:

  • 完全本地化:0风险,不会被风控。
  • 可扩展性:可以延伸开发出启动比特浏览器的版本,实现多矩阵发布。

什么是Playwright?

Playwright 是一个现代化、高性能的浏览器自动化工具,你可以在现在流行的MCP中看到很多这种MCP服务。

2.4 开发难点:本地客户端GUI设计和打包

在整个开发过程中,最费时间的是本地客户端。虽然包装了开源项目的自动发布流程,但是本地客户端GUI的设计和各种接口数据的处理方式都比较费时。此外,本地程序打包也是一个难点,我尝试了几种方案,勉强能打包好一个mac的一键启用app程序,win的打包方式就比较简单。

2.5 用户注册统一鉴权系统:GPT助力快速搭建

用户注册统一鉴权系统一开始我没有思路,于是我向GPT提问,GPT给出了很多建议,最终我只提问了两三次,GPT就把所有程序帮我设计好了,并且给我生成了打包文件。我直接上传到宝塔,安装好依赖项,启动服务,做反向代理,不到一个小时就完成了一个用户登录鉴权的系统。

3. 如何使用多媒体自动发布工具?

3.1 多媒体自动发布客户端安装

  1. 下载客户端程序:在公众号后台回复“自动发布”获取安装包(目前只打包了MAC版本的,win的可以关注下我,后面给大家更新)。
  2. 解压并拖入应用程序:下载完成后,解压就可以看到应用图标,然后将这个应用拖入到应用程序中。
  3. 打开应用:如果包打不开,进入mac的隐私与安全性,选择“仍要打开”。
  4. 初始化环境:第一次启用会有环境初始化的步骤,稍等两分钟就可以安装完成。
  5. 进入主界面:安装完成后,就进入到自动发布程序的主界面。

3.2 客户端配置

  1. 用户Token:必填,获取地址:https://agent.uaisir.com/,复制token填入这里即可。
  2. 浏览器路径:选择本地google浏览器的地址。
  3. 账号管理:支持添加多平台账号,目前小红书测试流畅,后续会逐渐开放各个平台。
  4. CK名:账号添加好之后,需要复制这里对应的CK名,备用。

3.3 COZE工作流配置

  1. 选择工作流:在COZE上选择一个视频类工作流,例如“爆款书单视频模版”。
  2. 添加插件:在工作流快结束的节点添加已经开发好的插件,coze商店可以直接搜索到:https://www.coze.cn/store/plugin/7522533012677050368?from=plugin_card
  3. 配置插件参数
    • Authorization:对应https://agent.uaisir.com/的token,注意需要在token前加一个Bearer。
    • accountList:对应客户端的CK名,多个按["c425a9ec-5722-11f0-8b36-163a4dc34d92.json","c425a9ec-5722-11f0-8b36-163a4dc34d92.json"]这种json格式输入。
    • fileList:生成的视频地址。
    • tags:标签。
    • title:标题。
    • enableTimer:是否定时,默认是false,如果填入true,则下面参数为必填。
    • dailyTimes:每日发布时间。
    • startDays:延迟天数。
    • videosPerDay:每日发布数。

3.4 注意事项

  • 桌面客户端可能有一些小BUG,但是不影响正常使用。
  • 若要完成自动发布,必须保证客户端处于开启和任务监听状态。
  • 账号登录有可能会失效。

4. 后续计划

  • 完整打通抖音、视频号、B站、快手、百家号平台的自动发布功能。
  • 支持客户端素材管理和配置自动发布。
  • 支持比特浏览器多矩阵发布。
  • 封装MCP服务。

5. 感悟

我认为:这工具,看似简单,实则凝聚了AI编程的智慧与实践的汗水。它像一柄利剑,斩断了重复劳动的枷锁,释放了创造力的火花。然而,它也像一面镜子,映照出我们在技术道路上的不足与挑战。未来,我们仍需精益求精,方能不负时代之期望。

,,,

© 版权声明
chatgpt4.0

相关文章

error: Content is protected !!