AI大模型与Agent实战入门 - 结业认证实操题目
📋 实操题目总览
| 序号 |
题目名称 |
难度 |
预计用时 |
考察重点 |
| 1 |
本地Agent环境搭建与模型配置 |
⭐ |
30分钟 |
Hermes安装、多模型配置 |
| 2 |
构建个人知识库RAG系统 |
⭐⭐ |
45分钟 |
Embedding模型、向量存储、RAG流程 |
| 3 |
自定义Skill开发:文件批量处理工具 |
⭐⭐⭐ |
60分钟 |
Skill开发规范、工具调用、文件操作 |
| 4 |
综合实战:个人助理Agent完整搭建 |
⭐⭐⭐⭐ |
90分钟 |
记忆系统、多Skill组合、端到端应用 |
题目 1:本地Agent环境搭建与模型配置
题目描述
在你的本地电脑上完成Hermes Agent的安装与配置,实现同时支持至少3个大模型的调用环境。
任务要求
- 安装Hermes Agent
- 从GitHub克隆或pip安装最新版本
- 验证安装成功:执行
hermes --version 命令
-
截图记录安装成功的终端输出
-
配置3个以上模型
- ✅ 至少配置1个云端推理模型(DeepSeek/Qwen/OpenAI任选)
- ✅ 至少配置1个开源模型(可选本地运行或API形式)
- ✅ 配置Embedding模型(用于RAG)
-
将配置文件 config.yaml 内容截图
-
Hello World测试
- 启动Hermes交互模式
- 发送命令:
请介绍一下你自己
- 截图Agent的回复内容
提交材料
- [ ] Hermes安装成功的终端截图
- [ ] 配置文件
config.yaml 的完整内容(脱敏处理)
- [ ] Hello World对话截图
评分标准
| 项目 |
分值 |
要求 |
| 环境安装 |
30分 |
成功安装Hermes并正常启动 |
| 模型配置 |
40分 |
至少3个模型正常可用 |
| 功能验证 |
30分 |
能正常对话并回复 |
| 总分 |
100分 |
|
题目 2:构建个人知识库RAG系统
题目描述
基于Hermes Agent构建一个个人知识库问答系统,将你电脑上的文档、笔记等资料导入,实现"基于自己的资料回答问题"。
任务要求
- 准备知识库素材
- 收集至少5篇文档(可以是你的笔记、技术文章、电子书章节等)
- 文档总字数不少于5000字
-
截图展示知识库文件夹结构
-
构建向量知识库
- 使用bge-m3或其他Embedding模型
- 选择Chroma、Qdrant或SQLite作为向量存储
- 将文档批量向量化并入库
-
截图向量数据库的统计信息(文档数、向量维度等)
-
RAG问答测试
- 测试问题1:
请总结一下我的知识库主要讲了什么内容?
- 测试问题2:
(根据你的知识库内容设计一个具体问题)
- 测试问题3:
这个知识库中没有提到的问题是什么?(验证不会编造)
-
截图完整的对话过程,包括检索到的文档片段
-
RAG效果对比
- 关闭RAG(直接问大模型):测试问题2的答案
- 开启RAG(基于知识库):测试问题2的答案
- 对比两个答案的差异,分析RAG的优势
提交材料
- [ ] 知识库文件夹结构截图
- [ ] 向量数据库构建成功的截图
- [ ] 3个测试问题的完整对话截图
- [ ] RAG效果对比分析(100字以上)
评分标准
| 项目 |
分值 |
要求 |
| 知识库构建 |
25分 |
5篇以上文档,总字数达标 |
| 向量化入库 |
25分 |
成功构建向量数据库 |
| RAG问答 |
30分 |
3个问题均能正确回答 |
| 对比分析 |
20分 |
清晰分析RAG的作用和优势 |
| 总分 |
100分 |
|
题目 3:自定义Skill开发:文件批量处理工具
题目描述
开发一个Hermes Skill,实现"文件批量重命名"功能。用户用自然语言描述需求,Agent自动完成文件重命名操作。
任务要求
- Skill功能设计
- Skill名称:
file_renamer
- 功能描述:根据用户描述批量重命名指定文件夹中的文件
- 支持的操作:添加前缀/后缀、替换特定字符、编号序列化
-
安全机制:执行前预览修改方案,用户确认后才执行
-
代码实现
- 遵循Hermes Skill开发规范
- 包含完整的参数说明和使用示例
- 异常处理:文件不存在、权限不足等情况
-
代码行数控制在200行以内
-
功能测试
- 测试场景1:给所有图片文件添加
旅游_ 前缀
- 测试场景2:将所有
.txt 文件按 文档_001.txt 格式编号
- 测试场景3:将文件名中的空格替换为下划线
-
截图记录每个测试的执行过程和结果
-
Skill文档
- 编写
README.md 文档
- 包含功能介绍、安装方法、使用示例
- 附上3个测试场景的截图
提交材料
- [ ] Skill源代码文件
file_renamer.py
- [ ] Skill配置文件
skill.yaml
- [ ] 3个测试场景的完整执行截图
- [ ] README.md 文档
评分标准
| 项目 |
分值 |
要求 |
| 代码质量 |
30分 |
结构清晰、注释完整、符合规范 |
| 功能完整性 |
35分 |
3个测试场景全部通过 |
| 用户体验 |
20分 |
有预览确认、友好的错误提示 |
| 文档质量 |
15分 |
README清晰,示例完整 |
| 总分 |
100分 |
|
题目 4:综合实战:个人助理Agent完整搭建
题目描述
整合前面所学的所有知识,构建一个完整的个人助理Agent,具备记忆功能、多个Skill组合、RAG知识库,能够帮你完成日常工作任务。
任务要求
- 核心功能规划(至少包含4项功能)
- ✅ 日程管理:记录、查询、提醒待办事项
- ✅ 文档问答:基于你的知识库回答问题(用上题的RAG)
- ✅ 文件操作:批量处理文件(用上题的Skill)
- ✅ 信息检索:联网搜索最新信息
-
✅ (可选)邮件发送、微信消息等集成功能
-
记忆系统设计
- 短期记忆:当前对话上下文
- 长期记忆:用户偏好、历史对话摘要
- 实现记忆的持久化存储(SQLite或文件)
-
截图展示记忆系统的数据结构
-
多Skill编排
- 至少集成3个不同的Skill
- 实现Agent自动判断该调用哪个Skill
- 设计一个复杂任务,需要Agent连续调用多个Skill完成
-
截图展示多Skill协作的完整流程
-
端到端演示
- 设计一个真实的工作场景:例如"帮我准备下周的项目汇报"
- Agent需要:搜索最新资料 → 读取本地文档 → 生成大纲 → 保存为文件
- 完整记录从用户发出指令到任务完成的全过程
-
最终产出物必须是真实可用的文件
-
效果评估报告
- 你的个人助理解决了什么实际问题?
- 相比没有Agent,效率提升了多少?
- 还有哪些地方可以改进?
- 不少于300字
提交材料
- [ ] 个人助理的完整代码或配置
- [ ] 记忆系统的设计说明和截图
- [ ] 多Skill协作的完整对话截图
- [ ] 端到端演示的全过程记录(至少10张截图)
- [ ] 效果评估报告(300字以上)
评分标准
| 项目 |
分值 |
要求 |
| 功能完整性 |
30分 |
4项核心功能全部实现 |
| 系统集成度 |
25分 |
记忆+Skill+RAG协同工作 |
| 演示效果 |
25分 |
端到端场景流畅,产出物可用 |
| 创新性 |
10分 |
有独特的功能或优化 |
| 报告质量 |
10分 |
思考深入,分析到位 |
| 总分 |
100分 |
|
🎓 结业标准
完成以上4个实操题目,总分达到320分(满分400分),即可获得:
- AI大模型与Agent实战入门 结业证书
- 优秀学员可获得导师1对1指导机会
- 优先参与后续进阶课程
💡 答题提示
- 善用文档:Hermes官方文档和社区资源是最好的帮手
- 循序渐进:从简单的题目开始,逐步深入
- 截图完整:每张截图要包含完整的上下文,不要只截局部
- 真实操作:所有操作必须是真实执行的,禁止P图
- 独立完成:可以查资料、问问题,但代码必须自己写
📞 技术支持
遇到问题时:
1. 先看官方文档和常见问题
2. 在GitHub Issues搜索是否有类似问题
3. 向课程助教提问时,附上:
- 错误截图
- 操作系统和环境版本
- 复现问题的步骤
祝大家学习顺利!🚀