Gemini CLI 完全指南:从安装到实战的保姆级教程

上周在终端里敲命令时,突然想:要是能直接在命令行里问 AI 该多好。搜了一圈,发现 Google 推出了 Gemini CLI,一个开源的命令行 AI 助手。装上试了试,确实好用。今天把我踩过的坑和使用心得整理出来,写一篇保姆级教程。
Gemini CLI 是什么
Gemini CLI 是 Google 推出的开源 AI 命令行工具,让你可以直接在终端里使用 Gemini 模型。
它不是简单的”问答机器人”,而是一个真正的 AI 代理(Agent)。它能:
- 读写本地文件
- 执行 shell 命令
- 搜索网页内容
- 理解和生成代码
- 多步骤推理和规划
想象一下这些场景:
- 你在看一个陌生项目的代码,直接问”这个函数是干什么的”
- 你忘了某个 git 命令,问”怎么撤销上一次提交”
- 你要写个脚本,说”帮我写个批量重命名文件的脚本”
这些 Gemini CLI 都能搞定。
为什么要用 Gemini CLI
市面上 AI 编程工具不少,为什么要用 Gemini CLI?
1. 完全开源
代码托管在 GitHub,Apache 2.0 协议。你可以看源码,可以贡献代码,可以自己改。
2. 免费配额够用
用个人 Google 账号登录,每天有 1000 次请求额度,每分钟 60 次。对个人开发者来说完全够用。
3. 强大的 Gemini 3 模型
支持最新的 Gemini 3 系列模型,推理能力强,支持 100 万 token 的超大上下文窗口。
4. 扩展能力强
支持 MCP(Model Context Protocol)服务器,可以接入 GitHub、Slack、数据库等各种外部服务。
5. 终端原生体验
不用切换窗口,不用打开浏览器,在你熟悉的终端里就能用。
安装 Gemini CLI
Gemini CLI 支持多种安装方式,选一个适合你的就行。
方式一:npm 安装(推荐)
这是最常用的方式,前提是你装了 Node.js 20+。
1 | npm install -g @google/gemini-cli |
装完后直接运行:
1 | gemini |
方式二:Homebrew(macOS/Linux)
如果你用 Homebrew 管理软件:
1 | brew install gemini-cli |
方式三:MacPorts(macOS)
1 | sudo port install gemini-cli |
方式四:npx 临时运行
不想全局安装,可以用 npx 临时运行:
1 | npx @google/gemini-cli |
每次都会下载最新版本,适合偶尔用一次的场景。
方式五:Docker 容器(安全隔离)
如果你担心安全问题,可以在容器里运行:
1 | docker run --rm -it us-docker.pkg.dev/gemini-code-dev/gemini-cli/sandbox:0.1.1 |
方式六:Cloud Shell(零配置)
如果你用 Google Cloud,Cloud Shell 里已经预装了 Gemini CLI,直接用就行。
系统要求
- 操作系统:macOS 15+、Windows 11 24H2+、Ubuntu 20.04+
- 内存:日常使用 4GB+,重度使用 16GB+
- Node.js:20.0.0+
- Shell:Bash、Zsh 或 PowerShell
- 需要网络连接
首次配置
装好后第一次运行 gemini,会提示你选择认证方式。
认证步骤
- 运行
gemini - 看到提示”How would you like to authenticate for this project?”
- 选择 “1. Sign in with Google”
- 浏览器会自动打开 Google 登录页面
- 选择你的 Google 账号
- 点击”Sign in”授权
- 回到终端,认证完成
选择主题
首次运行还会让你选择界面主题,有多种配色方案可选。我个人喜欢暗色主题,看着舒服。
配置文件位置
Gemini CLI 的配置文件在 ~/.gemini/settings.json。你可以手动编辑,也可以用 /settings 命令在交互界面里改。
基本使用
认证完成后,你就进入了 Gemini CLI 的交互界面。
直接提问
最简单的用法就是直接问问题:
1 | > 什么是 Docker? |
Gemini 会给你详细解释。
让它写代码
1 | > 写一个 Python 函数,判断一个数是否为质数 |
它会生成代码并解释。
让它解释代码
1 | > 解释这段代码在做什么: |
操作本地文件
1 | > 读取 README.md 文件并总结主要内容 |
1 | > 在 src/ 目录下创建一个新的 utils.js 文件 |
执行 shell 命令
1 | > 列出当前目录下所有 .js 文件 |
Gemini 会帮你执行 ls *.js 或类似命令。
多轮对话
Gemini CLI 会记住上下文,你可以连续提问:
1 | > 什么是 React Hooks? |
常用命令
Gemini CLI 有一套斜杠命令(slash commands),用来控制行为。
/help - 查看帮助
1 | /help |
显示所有可用命令。
/quit - 退出
1 | /quit |
或者按两次 Ctrl+C。
/clear - 清空对话
1 | /clear |
清空当前会话的历史记录。
/stats - 查看统计
1 | /stats |
显示当前会话的 token 使用情况、配额等信息。
/settings - 打开设置
1 | /settings |
打开交互式设置编辑器,可以修改各种配置。
/tools - 查看可用工具
1 | /tools |
显示 Gemini CLI 当前可以使用的所有工具(读文件、写文件、执行命令等)。
/model - 切换模型
1 | /model |
切换使用的 Gemini 模型版本。
实用技巧
技巧 1:使用 GEMINI.md 提供项目上下文
在项目根目录创建一个 GEMINI.md 文件,写入项目的背景信息、编码规范、架构说明等。
Gemini CLI 会自动读取这个文件,让它更了解你的项目。
示例 GEMINI.md:
1 | # 项目说明 |
技巧 2:非交互模式(脚本化)
你可以用 -p 参数直接传入提示词,不进入交互界面:
1 | gemini -p "列出当前目录的所有文件" |
这在写脚本时很有用。
技巧 3:使用 @ 引用文件
在提问时可以用 @ 引用文件:
1 | > @src/App.tsx 这个组件有什么问题? |
Gemini 会读取文件内容并分析。
技巧 4:使用 ! 执行 shell 命令
在交互界面里,用 ! 前缀可以直接执行 shell 命令:
1 | > !ls -la |
技巧 5:查看配额使用情况
定期运行 /stats model 查看你的配额使用情况,避免超限。
扩展能力:MCP 服务器
Gemini CLI 最强大的地方是支持 MCP(Model Context Protocol)服务器。
MCP 让你可以给 Gemini CLI 接入各种外部服务。比如:
- GitHub MCP:查询 PR、Issue、提交历史
- Slack MCP:发送消息、查看频道
- 数据库 MCP:执行 SQL 查询
- Google Docs MCP:读写 Google 文档
安装 MCP 扩展
Gemini CLI 有个扩展市场,可以一键安装:
1 | gemini extensions install @google/cloudrun |
配置 MCP 服务器
编辑 ~/.gemini/settings.json,添加 MCP 服务器配置:
1 | { |
配置好后,你就可以这样用:
1 | > @github 列出我的所有开放 PR |
常见问题
Q: 免费配额用完了怎么办?
A: 可以升级到 Gemini Code Assist 付费版,或者使用 Gemini API Key 按量付费。
Q: 支持哪些编程语言?
A: 支持所有主流编程语言,包括 Python、JavaScript、TypeScript、Go、Rust、Java 等。
Q: 可以在企业环境使用吗?
A: 可以。Gemini CLI 支持企业部署,可以配置私有化部署和权限管理。
Q: 数据安全吗?
A: 使用 Gemini Code Assist 企业版时,数据受到企业级保护。个人版遵循 Google 的隐私政策。
Q: 可以离线使用吗?
A: 不可以,Gemini CLI 需要网络连接来调用 Gemini 模型。
写在最后
Gemini CLI 是一个真正实用的 AI 命令行工具。它不是噱头,而是能实实在在提升开发效率的助手。
我现在的工作流是:
- 遇到不熟悉的代码,直接在终端里问 Gemini
- 忘记命令,让 Gemini 帮我生成
- 写脚本时,让 Gemini 帮我起草初版
- 调试问题时,让 Gemini 帮我分析日志
它不会替代你的工作,但会让你的工作更轻松。
如果你还没试过,强烈建议装一个玩玩。反正免费配额够用,不用白不用。
你在用什么 AI 命令行工具?或者你觉得 Gemini CLI 还缺少什么功能?欢迎在评论区分享。