Gemini CLI 完全指南:从安装到实战的保姆级教程

cover

上周在终端里敲命令时,突然想:要是能直接在命令行里问 AI 该多好。搜了一圈,发现 Google 推出了 Gemini CLI,一个开源的命令行 AI 助手。装上试了试,确实好用。今天把我踩过的坑和使用心得整理出来,写一篇保姆级教程。

Gemini CLI 是什么

Gemini CLI 是 Google 推出的开源 AI 命令行工具,让你可以直接在终端里使用 Gemini 模型。

它不是简单的”问答机器人”,而是一个真正的 AI 代理(Agent)。它能:

  • 读写本地文件
  • 执行 shell 命令
  • 搜索网页内容
  • 理解和生成代码
  • 多步骤推理和规划

想象一下这些场景:

  • 你在看一个陌生项目的代码,直接问”这个函数是干什么的”
  • 你忘了某个 git 命令,问”怎么撤销上一次提交”
  • 你要写个脚本,说”帮我写个批量重命名文件的脚本”

这些 Gemini CLI 都能搞定。

为什么要用 Gemini CLI

市面上 AI 编程工具不少,为什么要用 Gemini CLI?

1. 完全开源

代码托管在 GitHub,Apache 2.0 协议。你可以看源码,可以贡献代码,可以自己改。

2. 免费配额够用

用个人 Google 账号登录,每天有 1000 次请求额度,每分钟 60 次。对个人开发者来说完全够用。

3. 强大的 Gemini 3 模型

支持最新的 Gemini 3 系列模型,推理能力强,支持 100 万 token 的超大上下文窗口。

4. 扩展能力强

支持 MCP(Model Context Protocol)服务器,可以接入 GitHub、Slack、数据库等各种外部服务。

5. 终端原生体验

不用切换窗口,不用打开浏览器,在你熟悉的终端里就能用。

安装 Gemini CLI

Gemini CLI 支持多种安装方式,选一个适合你的就行。

方式一:npm 安装(推荐)

这是最常用的方式,前提是你装了 Node.js 20+。

1
npm install -g @google/gemini-cli

装完后直接运行:

1
gemini

方式二:Homebrew(macOS/Linux)

如果你用 Homebrew 管理软件:

1
brew install gemini-cli

方式三:MacPorts(macOS)

1
sudo port install gemini-cli

方式四:npx 临时运行

不想全局安装,可以用 npx 临时运行:

1
npx @google/gemini-cli

每次都会下载最新版本,适合偶尔用一次的场景。

方式五:Docker 容器(安全隔离)

如果你担心安全问题,可以在容器里运行:

1
docker run --rm -it us-docker.pkg.dev/gemini-code-dev/gemini-cli/sandbox:0.1.1

方式六:Cloud Shell(零配置)

如果你用 Google Cloud,Cloud Shell 里已经预装了 Gemini CLI,直接用就行。

系统要求

  • 操作系统:macOS 15+、Windows 11 24H2+、Ubuntu 20.04+
  • 内存:日常使用 4GB+,重度使用 16GB+
  • Node.js:20.0.0+
  • Shell:Bash、Zsh 或 PowerShell
  • 需要网络连接

首次配置

装好后第一次运行 gemini,会提示你选择认证方式。

认证步骤

  1. 运行 gemini
  2. 看到提示”How would you like to authenticate for this project?”
  3. 选择 “1. Sign in with Google”
  4. 浏览器会自动打开 Google 登录页面
  5. 选择你的 Google 账号
  6. 点击”Sign in”授权
  7. 回到终端,认证完成

选择主题

首次运行还会让你选择界面主题,有多种配色方案可选。我个人喜欢暗色主题,看着舒服。

配置文件位置

Gemini CLI 的配置文件在 ~/.gemini/settings.json。你可以手动编辑,也可以用 /settings 命令在交互界面里改。

基本使用

认证完成后,你就进入了 Gemini CLI 的交互界面。

直接提问

最简单的用法就是直接问问题:

1
> 什么是 Docker?

Gemini 会给你详细解释。

让它写代码

1
> 写一个 Python 函数,判断一个数是否为质数

它会生成代码并解释。

让它解释代码

1
2
3
> 解释这段代码在做什么:
> def fib(n):
> return n if n < 2 else fib(n-1) + fib(n-2)

操作本地文件

1
> 读取 README.md 文件并总结主要内容
1
> 在 src/ 目录下创建一个新的 utils.js 文件

执行 shell 命令

1
> 列出当前目录下所有 .js 文件

Gemini 会帮你执行 ls *.js 或类似命令。

多轮对话

Gemini CLI 会记住上下文,你可以连续提问:

1
2
3
> 什么是 React Hooks?
> 给我举个 useState 的例子
> 这个例子有什么问题吗?

常用命令

Gemini CLI 有一套斜杠命令(slash commands),用来控制行为。

/help - 查看帮助

1
/help

显示所有可用命令。

/quit - 退出

1
/quit

或者按两次 Ctrl+C

/clear - 清空对话

1
/clear

清空当前会话的历史记录。

/stats - 查看统计

1
/stats

显示当前会话的 token 使用情况、配额等信息。

/settings - 打开设置

1
/settings

打开交互式设置编辑器,可以修改各种配置。

/tools - 查看可用工具

1
/tools

显示 Gemini CLI 当前可以使用的所有工具(读文件、写文件、执行命令等)。

/model - 切换模型

1
/model

切换使用的 Gemini 模型版本。

实用技巧

技巧 1:使用 GEMINI.md 提供项目上下文

在项目根目录创建一个 GEMINI.md 文件,写入项目的背景信息、编码规范、架构说明等。

Gemini CLI 会自动读取这个文件,让它更了解你的项目。

示例 GEMINI.md

1
2
3
4
5
6
7
8
9
10
11
12
13
14
# 项目说明

这是一个 React + TypeScript 的前端项目。

## 技术栈
- React 18
- TypeScript 5
- Vite
- TailwindCSS

## 编码规范
- 使用函数组件,不用类组件
- 优先使用 TypeScript 类型而不是 any
- 组件文件名用 PascalCase

技巧 2:非交互模式(脚本化)

你可以用 -p 参数直接传入提示词,不进入交互界面:

1
gemini -p "列出当前目录的所有文件"

这在写脚本时很有用。

技巧 3:使用 @ 引用文件

在提问时可以用 @ 引用文件:

1
> @src/App.tsx 这个组件有什么问题?

Gemini 会读取文件内容并分析。

技巧 4:使用 ! 执行 shell 命令

在交互界面里,用 ! 前缀可以直接执行 shell 命令:

1
> !ls -la

技巧 5:查看配额使用情况

定期运行 /stats model 查看你的配额使用情况,避免超限。

扩展能力:MCP 服务器

Gemini CLI 最强大的地方是支持 MCP(Model Context Protocol)服务器。

MCP 让你可以给 Gemini CLI 接入各种外部服务。比如:

  • GitHub MCP:查询 PR、Issue、提交历史
  • Slack MCP:发送消息、查看频道
  • 数据库 MCP:执行 SQL 查询
  • Google Docs MCP:读写 Google 文档

安装 MCP 扩展

Gemini CLI 有个扩展市场,可以一键安装:

1
gemini extensions install @google/cloudrun

配置 MCP 服务器

编辑 ~/.gemini/settings.json,添加 MCP 服务器配置:

1
2
3
4
5
6
7
8
9
10
11
{
"mcpServers": {
"github": {
"command": "npx",
"args": ["-y", "@modelcontextprotocol/server-github"],
"env": {
"GITHUB_TOKEN": "your_token_here"
}
}
}
}

配置好后,你就可以这样用:

1
> @github 列出我的所有开放 PR

常见问题

Q: 免费配额用完了怎么办?

A: 可以升级到 Gemini Code Assist 付费版,或者使用 Gemini API Key 按量付费。

Q: 支持哪些编程语言?

A: 支持所有主流编程语言,包括 Python、JavaScript、TypeScript、Go、Rust、Java 等。

Q: 可以在企业环境使用吗?

A: 可以。Gemini CLI 支持企业部署,可以配置私有化部署和权限管理。

Q: 数据安全吗?

A: 使用 Gemini Code Assist 企业版时,数据受到企业级保护。个人版遵循 Google 的隐私政策。

Q: 可以离线使用吗?

A: 不可以,Gemini CLI 需要网络连接来调用 Gemini 模型。

写在最后

Gemini CLI 是一个真正实用的 AI 命令行工具。它不是噱头,而是能实实在在提升开发效率的助手。

我现在的工作流是:

  • 遇到不熟悉的代码,直接在终端里问 Gemini
  • 忘记命令,让 Gemini 帮我生成
  • 写脚本时,让 Gemini 帮我起草初版
  • 调试问题时,让 Gemini 帮我分析日志

它不会替代你的工作,但会让你的工作更轻松。

如果你还没试过,强烈建议装一个玩玩。反正免费配额够用,不用白不用。

你在用什么 AI 命令行工具?或者你觉得 Gemini CLI 还缺少什么功能?欢迎在评论区分享。