AI大模型与Agent实战入门 - 结业认证实操题目

📋 实操题目总览

序号	题目名称	难度	预计用时	考察重点
1	本地Agent环境搭建与模型配置	⭐	30分钟	Hermes安装、多模型配置
2	构建个人知识库RAG系统	⭐⭐	45分钟	Embedding模型、向量存储、RAG流程
3	自定义Skill开发：文件批量处理工具	⭐⭐⭐	60分钟	Skill开发规范、工具调用、文件操作
4	综合实战：个人助理Agent完整搭建	⭐⭐⭐⭐	90分钟	记忆系统、多Skill组合、端到端应用

题目 1：本地Agent环境搭建与模型配置

题目描述

在你的本地电脑上完成Hermes Agent的安装与配置，实现同时支持至少3个大模型的调用环境。

任务要求

安装Hermes Agent
从GitHub克隆或pip安装最新版本
验证安装成功：执行 hermes --version 命令
截图记录安装成功的终端输出
配置3个以上模型
✅ 至少配置1个云端推理模型（DeepSeek/Qwen/OpenAI任选）
✅ 至少配置1个开源模型（可选本地运行或API形式）
✅ 配置Embedding模型（用于RAG）
将配置文件 config.yaml 内容截图
Hello World测试
启动Hermes交互模式
发送命令：请介绍一下你自己
截图Agent的回复内容

提交材料

[ ] Hermes安装成功的终端截图
[ ] 配置文件 config.yaml 的完整内容（脱敏处理）
[ ] Hello World对话截图

评分标准

项目	分值	要求
环境安装	30分	成功安装Hermes并正常启动
模型配置	40分	至少3个模型正常可用
功能验证	30分	能正常对话并回复
总分	100分

题目 2：构建个人知识库RAG系统

题目描述

基于Hermes Agent构建一个个人知识库问答系统，将你电脑上的文档、笔记等资料导入，实现"基于自己的资料回答问题"。

任务要求

准备知识库素材
收集至少5篇文档（可以是你的笔记、技术文章、电子书章节等）
文档总字数不少于5000字
截图展示知识库文件夹结构
构建向量知识库
使用bge-m3或其他Embedding模型
选择Chroma、Qdrant或SQLite作为向量存储
将文档批量向量化并入库
截图向量数据库的统计信息（文档数、向量维度等）
RAG问答测试
测试问题1：请总结一下我的知识库主要讲了什么内容？
测试问题2：（根据你的知识库内容设计一个具体问题）
测试问题3：这个知识库中没有提到的问题是什么？（验证不会编造）
截图完整的对话过程，包括检索到的文档片段
RAG效果对比
关闭RAG（直接问大模型）：测试问题2的答案
开启RAG（基于知识库）：测试问题2的答案
对比两个答案的差异，分析RAG的优势

提交材料

[ ] 知识库文件夹结构截图
[ ] 向量数据库构建成功的截图
[ ] 3个测试问题的完整对话截图
[ ] RAG效果对比分析（100字以上）

评分标准

项目	分值	要求
知识库构建	25分	5篇以上文档，总字数达标
向量化入库	25分	成功构建向量数据库
RAG问答	30分	3个问题均能正确回答
对比分析	20分	清晰分析RAG的作用和优势
总分	100分

题目 3：自定义Skill开发：文件批量处理工具

题目描述

开发一个Hermes Skill，实现"文件批量重命名"功能。用户用自然语言描述需求，Agent自动完成文件重命名操作。

任务要求

Skill功能设计
Skill名称：file_renamer
功能描述：根据用户描述批量重命名指定文件夹中的文件
支持的操作：添加前缀/后缀、替换特定字符、编号序列化
安全机制：执行前预览修改方案，用户确认后才执行
代码实现
遵循Hermes Skill开发规范
包含完整的参数说明和使用示例
异常处理：文件不存在、权限不足等情况
代码行数控制在200行以内
功能测试
测试场景1：给所有图片文件添加 旅游_ 前缀
测试场景2：将所有 .txt 文件按 文档_001.txt 格式编号
测试场景3：将文件名中的空格替换为下划线
截图记录每个测试的执行过程和结果
Skill文档
编写 README.md 文档
包含功能介绍、安装方法、使用示例
附上3个测试场景的截图

提交材料

[ ] Skill源代码文件 file_renamer.py
[ ] Skill配置文件 skill.yaml
[ ] 3个测试场景的完整执行截图
[ ] README.md 文档

评分标准

项目	分值	要求
代码质量	30分	结构清晰、注释完整、符合规范
功能完整性	35分	3个测试场景全部通过
用户体验	20分	有预览确认、友好的错误提示
文档质量	15分	README清晰，示例完整
总分	100分

题目 4：综合实战：个人助理Agent完整搭建

题目描述

整合前面所学的所有知识，构建一个完整的个人助理Agent，具备记忆功能、多个Skill组合、RAG知识库，能够帮你完成日常工作任务。

任务要求

核心功能规划（至少包含4项功能）
✅ 日程管理：记录、查询、提醒待办事项
✅ 文档问答：基于你的知识库回答问题（用上题的RAG）
✅ 文件操作：批量处理文件（用上题的Skill）
✅ 信息检索：联网搜索最新信息
✅ （可选）邮件发送、微信消息等集成功能
记忆系统设计
短期记忆：当前对话上下文
长期记忆：用户偏好、历史对话摘要
实现记忆的持久化存储（SQLite或文件）
截图展示记忆系统的数据结构
多Skill编排
至少集成3个不同的Skill
实现Agent自动判断该调用哪个Skill
设计一个复杂任务，需要Agent连续调用多个Skill完成
截图展示多Skill协作的完整流程
端到端演示
设计一个真实的工作场景：例如"帮我准备下周的项目汇报"
Agent需要：搜索最新资料 → 读取本地文档 → 生成大纲 → 保存为文件
完整记录从用户发出指令到任务完成的全过程
最终产出物必须是真实可用的文件
效果评估报告
你的个人助理解决了什么实际问题？
相比没有Agent，效率提升了多少？
还有哪些地方可以改进？
不少于300字

提交材料

[ ] 个人助理的完整代码或配置
[ ] 记忆系统的设计说明和截图
[ ] 多Skill协作的完整对话截图
[ ] 端到端演示的全过程记录（至少10张截图）
[ ] 效果评估报告（300字以上）

评分标准

项目	分值	要求
功能完整性	30分	4项核心功能全部实现
系统集成度	25分	记忆+Skill+RAG协同工作
演示效果	25分	端到端场景流畅，产出物可用
创新性	10分	有独特的功能或优化
报告质量	10分	思考深入，分析到位
总分	100分

🎓 结业标准

完成以上4个实操题目，总分达到320分（满分400分），即可获得：

AI大模型与Agent实战入门 结业证书
优秀学员可获得导师1对1指导机会
优先参与后续进阶课程

💡 答题提示

善用文档：Hermes官方文档和社区资源是最好的帮手
循序渐进：从简单的题目开始，逐步深入
截图完整：每张截图要包含完整的上下文，不要只截局部
真实操作：所有操作必须是真实执行的，禁止P图
独立完成：可以查资料、问问题，但代码必须自己写

📞 技术支持

遇到问题时：
1. 先看官方文档和常见问题
2. 在GitHub Issues搜索是否有类似问题
3. 向课程助教提问时，附上：
- 错误截图
- 操作系统和环境版本
- 复现问题的步骤

祝大家学习顺利！🚀