Gemini CLI:免费AI命令行工具,无需编程玩转AI,效率神器终极指南

AI前沿7小时前发布 yizz
947 0 0
广告也精彩

Gemini CLI:不写代码也能玩转AI的终极指南

1. 什么是Gemini CLI?它与Cursor等工具有什么区别?

Gemini CLI 是谷歌推出的一个命令行AI代码工具,类似于 Claude Code。它最大的特点是完全免费,并且功能强大。

Cursor 等带有界面的IDE不同,Gemini CLI 的所有操作都在终端中以命令行的方式进行。它是一个 Agents,可以自动执行任务并处理本地文件。内置了多种工具,例如谷歌搜索文件读写文本搜索记忆保存等。你可以通过输入 /tools 并回车来查看所有支持的工具。

此外,Gemini CLI 还支持 MCP (Model Control Program),你可以安装其他的 MCP 工具来扩展模型的上下文。

2. 我不会编程,能用Gemini CLI吗?

完全可以!很多人觉得命令行很复杂,不会编程就很难使用。但实际上,只要你的网络环境正常,能够正常登录 Gemini CLI,它的使用体验与 Cursor 没有本质区别。

核心交互仍然是提示词输入,而具体的命令行代码则由 Gemini 自动生成。

3. 如何安装和使用Gemini CLI?

3.1 安装步骤(基于Mac OS):

  1. 打开启动台,搜索“终端”并打开。
  2. 新建文件夹,将需要处理的任务素材放入其中。按住 option 键,鼠标右键点击文件夹,选择“将 XXXX 文件夹拷贝为路径名称”,获取文件夹路径。
  3. 终端中输入 cd + 空格 + 你刚才复制的路径,将终端的工作目录切换到该文件夹。
  4. 输入以下命令并回车:
    bash
    npx https://github.com/google-gemini/gemini-cli

  5. 安装成功后,会让你选择命令行颜色主题登录方式。使用上下左右方向键选择,回车键确认。

  6. 选择一个喜欢的主题,然后使用你的 Google 账号登录。网页拉起登录后关闭即可。
  7. 登录成功后,你就可以看到提示词输入框了。

3.2 启动方式:

由于使用 NPX 安装,每次关闭终端后重新使用 Gemini CLI,都需要输入之前的命令:

bash
npx https://github.com/google-gemini/gemini-cli

另一种方式是使用 NPM 安装,虽然步骤稍显复杂,但启动时只需输入 gemini 即可:

bash
npm install -g @google/gemini-cli

3.3 解决英文界面问题:

如果觉得命令行界面都是英文难以理解,可以安装 Bob 翻译软件,支持划词翻译

4. Gemini CLI有哪些基础用法?

Gemini CLI 可以看到你的文件并进行操作,并且具备生成能力和多模态特性。即使只使用其内置工具,也能实现很多功能。

4.1 查找和生成本地文档:

Gemini CLI 支持谷歌搜索,可以搜索指定内容并生成文档,也可以对本地文档进行编辑。

例如:

请使用 Google 搜索功能,查找关于‘量子计算最新突破’的资料,阅读我本地 /research/papers 目录下的相关文档,然后为我生成一份 Markdown 格式的综合报告,并存为 quantum_computing_report.md。

你也可以让它分析本地文章并改写成新的文章。

例如:

读取我刚才录音转写的会议纪要 meeting_notes.txt,总结出关键决策点,并识别出分配给我的所有待办事项,将它们以任务列表的形式添加到我的 todo.md 文件中。

根据Andrej Karpathy 软件 3.0 分享的文章,将其改写成一篇约 800字的博客文章,风格要轻松有趣。然后,为这篇文章生成 3 个适合在 Twitter 上发布的推文版本,并附上 标签

4.2 分析和整理Obsidian笔记:

Gemini CLI 可以像 Cursor 一样分析 Obsidian 笔记,甚至更加强大。

例如:

这是我的 obsidian 剪藏文章文件夹帮我检索所有有关 MCP 相关的讨论文章,写一篇内容为是用无序列表总结所有相关文章,并在每条总结后用反向链接加上原来的标题方便我跳转。

还可以为 Obsidian 笔记添加反向链接,方便生成知识图谱:

这是我的obsidian剪藏文件夹,帮我读取每个文章的标题和开头内容为相关的文件加上反向链接,确保 Obsidian 可以生成知识图谱,你需要分析标题和文档开始的部分,搜索对应的关键词,可以搜两到三个,同时都搜到的再进行反向连接的添加。

4.3 图片分析和处理:

Gemini CLI 是多模态的,可以处理图片。

例如,根据图片内容批量重命名图片:

分析我当前文件夹下的所有图片内容,基于图片内容批量对图片进行重新命名。

还可以生成图像的详细描述,用于训练图像模型或 Lora

分析图像内容,生成对图像的详细描述,除了内容还有风格,然后将这些描述放在跟图像名称一样的文本文件中。

4.4 修改系统设置和整理文件:

Gemini CLI 可以控制系统设置,例如一键切换工作模式:

Gemini,帮我创建一个名为 deep_work.sh 的脚本。这个脚本需要:1. 打开 Obsidian。 2. 关闭所有浏览器和通讯软件。 3. 开启系统的‘勿扰模式’。 4. 播放我本地 /music/focus 文件夹里的白噪音。

还可以整理桌面或文件,将文件分类整理到新建的文件夹中:

帮我将这个文件夹下的图像和文本文档通过新建的文件夹进行分类

5. Gemini CLI的高级用法:结合本地软件实现更强大的功能

Gemini CLI 结合一些本地软件,可以实现对各种文件更加高级的处理,例如视频转 GIFYouTube 视频下载、加水印、文档格式转换等。

5.1 为本地文档生成PPT:

可以使用 Slidev 项目,将 Markdown 文档转换为带有丰富样式的 PPT

帮我基于刚才总结的那个 MCP剪藏内容索引文章用 Slidev 这个专门用来用 Markdown 格式生成幻灯片的工具语法写一个对应的 PPT,用 Slidev 的语法美化一下

5.2 使用ffmpeg处理视频:

ffmpeg 是一个强大的视频编辑工具,可以实现视频拼接、剪辑、增加文字、转换格式、转换分辨率、增加音乐等功能。

首先安装 Homebrew

帮我安装 Homebrew 并配置环境变量

然后使用 Homebrew 安装 ffmpeg

帮我用 Homebrew 安装 ffmpeg

安装完成后,就可以使用 Gemini CLI 控制 ffmpeg 进行各种视频处理操作。

例如,给视频添加水印:

帮我将 Cute Cat Holding Item_watermarked 这个视频用 ffmpeg 打上一个 10% 透明度的水印在右上角,水印内容为“guizang”然后存储为新视频。

给视频配乐:

帮我将 XXX 这个视频用 ffmpeg 将它和 XXX 音频合并为一个新的视频,音频的长度需要跟视频一样长并且加上淡入淡出。

将视频转换为序列帧:

帮我将 XXXX 这个视频用 ffmpeg 转换为 png 序列帧放在一个新的文件夹里面。

将视频转换为 GIF

帮我将文件夹中的第一个视频用 ffmpeg 转换为一个高品质 gif

5.3 使用yt-dlp下载视频:

yt-dlp 可以下载几乎所有视频平台的视频。

使用 Homebrew 安装 yt-dlp

帮我用 Homebrew 安装 yt-dlp

然后提供视频链接即可下载:

帮我用 yt-dlp 和 ffmpeg 下载这个 liblib 的视频和它的封面:XXX 链接

5.4 使用ImageMagick处理图片:

ImageMagick 是一个强大的图片处理工具集,可以转换格式、缩放、裁剪、旋转、添加滤镜、组合图片等。

使用 Homebrew 安装 ImageMagick

帮我用 Homebrew 安装 ImageMagick

例如,批量添加水印并调整图片尺寸:

帮我用ImageMagick把文件夹下的所有图片的宽边尺寸统一调整为宽度 800 像素,并给它们加上一个10%透明度的灰色水印,水印文字是‘内部资料’,放在新的文件夹里面

将图片拼接成四宫格图片:

将加过水印的图片用ImageMagick拼合成一张四宫格图片,中间有白色分隔

5.5 使用Pandoc进行文档转换:

Pandoc 可以进行各种文档格式之间的互相转换。

使用 Homebrew 安装 Pandoc

帮我用Homebrew 安装 Pandoc

Markdown 文档转换为 Word 文档:

将Andrej Karpathy 软件 3.0 分享这个 Markdown 文档用Pandoc转换为 word 文档

6. 总结

Gemini CLI 结合各种命令行工具,可以实现非常强大的功能。它降低了专业工具的使用门槛,让每个人都可以轻松地完成各种任务。

7. 感悟

我认为:技术本应是隐形的,Gemini CLI 的出现,让那些强大的命令行工具变得触手可及。它不仅仅是效率的提升,更是创作门槛的彻底消失。不要让“我不会编程”成为你探索新世界的借口,因为在这个新世界里,你需要的不是编程能力,而是想象力。

,,,

© 版权声明
chatgpt4.0

相关文章

error: Content is protected !!