AI大模型与Agent实战入门

第二模块:实践操作

第1节:Agent生态全景与选型指南


本节目标


1.1 当前Agent产品格局全景


第一类:本地原生方案

代表:OpenClaw / Hermes Agent

优点:
- 完全开源,代码透明
- 数据100%本地,隐私安全
- 架构清晰,可深度定制
- 社区活跃,更新快
- 长期演进有保障

⚠️ 缺点:
- 需要一定技术基础
- 需要自己配置环境


第二类:SaaS服务平台

代表:Dify、Coze、扣子、各类云端Agent平台

优点:
- 开箱即用
- 无需维护环境
- 集成丰富
- 界面友好

⚠️ 缺点:
- 数据在第三方服务器
- 定制能力有限
- 成本随用量上涨
- 被平台锁定


第三类:IDE集成Agent

代表:Claude Code、GitHub Copilot Workspace、Cursor

优点:
- 深度集成开发环境
- 编程能力强
- 开发者体验好

⚠️ 缺点:
- 主要面向开发者
- 非编程场景能力一般
- 成本较高


第四类:第三方二次开发产品

代表:龙虾、各种Claude桌面封装版、Trae等

优点:
- 界面好看
- 上手简单

⚠️ 缺点:
- ⚠️ 绝大多数都不成熟
- 功能阉割
- 更新滞后于官方
- 安全隐患(可能偷API Key)
- 无社区支持


1.2 选型建议与理由


✅ 首选:原生OpenClaw / Hermes

核心理由:

  1. 架构清晰: 学习成本最低
  2. 社区活跃: 遇到问题有人帮
  3. 可扩展: 想加什么功能自己加
  4. 完全可控: 数据、代码、部署全在自己手里
  5. 长期演进: 不会突然跑路或涨价

✅ 可以用:成熟SaaS平台

适用场景:

注意:


⚠️ 谨慎使用:第三方二次开发封装产品

为什么不推荐:

  1. 功能阉割: 很多高级功能用不了
  2. 更新滞后: 官方更新后几个月才更
  3. 安全隐患: 你的API Key可能被窃取
  4. 无社区支持: 出问题没人管
  5. 收费陷阱: 免费版吸引,核心功能收费

1.3 Windows用户特别强调:WSL2


为什么强烈建议安装WSL2?

Windows原生开发的痛点:

  1. ❌ 路径问题:C:\ vs / 各种不兼容
  2. ❌ 权限问题:管理员权限、文件锁定
  3. ❌ Python版本:各种版本冲突
  4. ❌ 编译问题:C++扩展编译失败
  5. ❌ 脚本兼容:bash脚本跑不了

WSL2 完整安装指南

步骤1:启用WSL功能

方法A:命令行安装(推荐)

以管理员身份打开PowerShell,执行:

wsl --install

方法B:手动启用
1. 打开「控制面板」→「程序和功能」
2. 点击「启用或关闭Windows功能」
3. 勾选「适用于Linux的Windows子系统」和「虚拟机平台」
4. 重启电脑

步骤2:安装Ubuntu

  1. 打开Microsoft Store
  2. 搜索「Ubuntu」
  3. 安装「Ubuntu 22.04 LTS」(推荐)
  4. 启动Ubuntu,设置用户名和密码

📸 截图位置1:Microsoft Store搜索Ubuntu的界面

步骤3:验证安装成功

在Ubuntu终端输入:

lsb_release -a

预期输出:

Distributor ID: Ubuntu
Description:    Ubuntu 22.04 LTS
Release:        22.04
Codename:       jammy

步骤4:WSL2常用命令

# 查看WSL版本
wsl -l -v

# 设置默认版本为WSL2
wsl --set-default-version 2

# 进入WSL
wsl

# 关机(遇到问题时)
wsl --shutdown

# 查看磁盘占用
wsl --df

WSL2是什么?

简单说:在Windows里面跑一个真正的Linux

Windows 主机
    ↓
WSL2 虚拟机
    ↓
真正的 Ubuntu / Debian
    ↓
完美的开发环境

好处:

✅ 所有Linux工具直接用
✅ 没有路径问题
✅ 没有权限问题
✅ 性能接近原生Linux
✅ Windows文件互通:/mnt/c/ 就是Windows的C盘


WSL2 开发环境初始化

更新系统包:

sudo apt update && sudo apt upgrade -y

安装基础工具:

sudo apt install -y git python3 python3-pip python3-venv build-essential

配置Git:

git config --global user.name "你的名字"
git config --global user.email "你的邮箱"

WSL2 常见问题解决

问题1:WSL2网络很慢

解决: 关闭Windows Defender实时保护,或添加排除项

问题2:WSL2占用内存太大

解决: 创建 C:\Users\你的用户名\.wslconfig

[wsl2]
memory=4GB
processors=4
swap=2GB

问题3:文件权限问题

解决: 在WSL中操作,不要在Windows里改WSL的文件

问题4:VSCode连接WSL

  1. VSCode安装「WSL」插件
  2. 在WSL终端输入:code .
  3. 自动连接,完美体验

1.4 环境检查清单

课前检查:


本节小结

  1. 四类产品: 原生方案、SaaS、IDE集成、第三方封装
  2. 首选: 原生OpenClaw / Hermes
  3. Windows用户: 一定要装WSL2
  4. 课前准备: 环境检查清单

AI大模型与Agent实战入门

第二模块:实践操作

第2节:Hermes Agent 安装与基础配置


本节目标


2.1 安装Hermes Agent

步骤1:安装命令

pip install hermes-agent

常见坑及解决:

坑1:权限问题

# 解决:加--user
pip install hermes-agent --user

坑2:源太慢

# 解决:用清华源
pip install hermes-agent -i https://pypi.tuna.tsinghua.edu.cn/simple

🇨🇳 国内源配置大全

1. pip永久配置清华源

方法1:命令行配置(推荐)

pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple

方法2:手动创建配置文件

Linux/Mac:~/.pip/pip.conf
Windows:C:\Users\你的用户名\pip\pip.ini

内容:

[global]
index-url = https://pypi.tuna.tsinghua.edu.cn/simple
trusted-host = pypi.tuna.tsinghua.edu.cn

2. 其他可选pip源

地址 速度
清华大学 https://pypi.tuna.tsinghua.edu.cn/simple ⭐⭐⭐⭐⭐
阿里云 https://mirrors.aliyun.com/pypi/simple/ ⭐⭐⭐⭐
豆瓣 https://pypi.douban.com/simple/ ⭐⭐⭐
中科大 https://pypi.mirrors.ustc.edu.cn/simple/ ⭐⭐⭐⭐

3. apt国内源(Ubuntu)

备份原源:

sudo cp /etc/apt/sources.list /etc/apt/sources.list.bak

编辑源文件:

sudo nano /etc/apt/sources.list

替换为清华源(Ubuntu 22.04):

deb https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ jammy main restricted universe multiverse
deb https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ jammy-updates main restricted universe multiverse
deb https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ jammy-backports main restricted universe multiverse
deb https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ jammy-security main restricted universe multiverse

更新:

sudo apt update

4. npm国内源

# 淘宝源
npm config set registry https://registry.npmmirror.com

# 验证
npm config get registry

坑3:Python版本不对

# 检查版本
python --version
# 要求:3.10+

2.2 验证安装成功

命令:

hermes --version

预期输出:

hermes-agent, version x.y.z

如果显示"command not found":

# 解决1:刷新环境变量
source ~/.bashrc  # 或 ~/.zshrc

# 解决2:用python -m调用
python -m hermes --version

2.3 初始化配置向导

命令:

hermes setup

坑3:Python版本不对

# 检查版本
python --version
# 要求:3.10+

🐍 Python版本管理:pyenv使用教程

为什么需要pyenv?

Ubuntu安装pyenv:

# 安装依赖
sudo apt install -y git curl build-essential libssl-dev zlib1g-dev libbz2-dev \
libreadline-dev libsqlite3-dev wget curl llvm libncurses5-dev libncursesw5-dev \
xz-utils tk-dev libffi-dev liblzma-dev

# 安装pyenv
curl https://pyenv.run | bash

# 添加到~/.bashrc(或~/.zshrc)
echo 'export PYENV_ROOT="$HOME/.pyenv"' >> ~/.bashrc
echo 'command -v pyenv >/dev/null || export PATH="$PYENV_ROOT/bin:$PATH"' >> ~/.bashrc
echo 'eval "$(pyenv init -)"' >> ~/.bashrc

# 刷新配置
source ~/.bashrc

# 安装Python 3.11
pyenv install 3.11.6

# 设置全局默认版本
pyenv global 3.11.6

# 验证
python --version

常用pyenv命令:

pyenv versions          # 查看已安装版本
pyenv install --list  # 查看可安装版本
pyenv local 3.10.12  # 当前目录用特定版本

2.4 API配置详解

支持的API提供商:

提供商 推荐场景 输入价格(元/百万token) 输出价格(元/百万token)
DeepSeek 代码、推理、新手首选 0.7 2.8
字节豆包 中文、速度快 0.3 1.2
阿里通义千问 综合能力均衡 0.5 2.0
OpenAI GPT-4o 通用、高质量 35 105
Claude 3 Opus 长文本、复杂推理 105 350

2.5 配置你的第一个API

以DeepSeek为例(推荐新手):

  1. 访问 https://platform.deepseek.com/
  2. 注册账号
  3. 充值(最低10元,足够用很久)
  4. 创建API Key
  5. 复制保存好

📸 截图位置2:DeepSeek控制台创建API Key的界面

配置到Hermes:

hermes config set provider deepseek
hermes config set api_key YOUR_API_KEY

豆包API配置(火山引擎)

  1. 访问 https://console.volcengine.com/
  2. 搜索「豆包大模型」
  3. 创建API Key
  4. 配置:
hermes config set provider doubao
hermes config set api_key YOUR_API_KEY
hermes config set model doubao-pro-32k

本地开源模型(Ollama)

如果不想用本地部署开源模型:

# 1. 安装Ollama
curl -fsSL https://ollama.com/install.sh | sh

# 2. 下载模型
ollama pull qwen:7b

# 3. 配置Hermes
hermes config set provider ollama
hermes config set model qwen:7b

✅ 完全离线运行,不花一分钱!


🌐 代理配置教程

为什么需要代理?

临时配置(当前终端生效):

# Linux/Mac
export HTTP_PROXY=http://127.0.0.1:7890
export HTTPS_PROXY=http://127.0.0.1:7890

# Windows PowerShell
$env:HTTP_PROXY="http://127.0.0.1:7890"
$env:HTTPS_PROXY="http://127.0.0.1:7890"

永久配置:

添加到 ~/.bashrc~/.zshrc

export HTTP_PROXY=http://127.0.0.1:7890
export HTTPS_PROXY=http://127.0.0.1:7890
export NO_PROXY=localhost,127.0.0.1

验证代理是否生效:

curl https://www.google.com
# 能访问说明代理生效

2.6 查看配置文件

配置文件位置:

~/.hermes/config.yaml

查看配置:

hermes config list

配置文件结构示例:

provider: deepseek
api_key: sk-xxxxxxxxxxx
model: deepseek-chat
temperature: 0.7
max_tokens: 2000

2.7 第一次对话!

命令:

hermes chat

输入:

你好,请介绍一下你自己

预期:

Agent回复,说明安装成功!

按Ctrl+C退出对话模式


2.8 常用基础命令

# 查看版本
hermes --version

# 查看帮助
hermes --help

# 查看可用模型
hermes model list

# 对话模式
hermes chat

# 单次对话
hermes chat "你好,请讲个笑话"

2.9 第一个Skill体验

步骤:

  1. 进入对话模式
  2. 输入任务:
帮我写一个Python脚本,计算斐波那契数列
  1. 观察Agent的执行过程:
  2. 思考过程
  3. 调用工具
  4. 生成结果
  5. 对比:和直接用ChatGPT有什么不同?

2.10 常见问题排查

问题1:API Key无效

错误:Invalid API Key
解决:检查Key是否正确,是否有余额

问题2:网络连接失败

错误:Connection timeout
解决:检查网络、配置代理

问题3:命令找不到

错误:command not found: hermes
解决:确认安装成功,刷新环境变量

本节小结

  1. 安装: pip install hermes-agent
  2. 初始化: hermes setup
  3. 配置API: 推荐DeepSeek(便宜好用)
  4. 验证: hermes --version + hermes chat
  5. 常用命令: chat、model list、config