AI大模型与Agent实战入门 - 结业认证实操题目


📋 实操题目总览

序号 题目名称 难度 预计用时 考察重点
1 本地Agent环境搭建与模型配置 30分钟 Hermes安装、多模型配置
2 构建个人知识库RAG系统 ⭐⭐ 45分钟 Embedding模型、向量存储、RAG流程
3 自定义Skill开发:文件批量处理工具 ⭐⭐⭐ 60分钟 Skill开发规范、工具调用、文件操作
4 综合实战:个人助理Agent完整搭建 ⭐⭐⭐⭐ 90分钟 记忆系统、多Skill组合、端到端应用

题目 1:本地Agent环境搭建与模型配置

题目描述

在你的本地电脑上完成Hermes Agent的安装与配置,实现同时支持至少3个大模型的调用环境。

任务要求

  1. 安装Hermes Agent
  2. 从GitHub克隆或pip安装最新版本
  3. 验证安装成功:执行 hermes --version 命令
  4. 截图记录安装成功的终端输出

  5. 配置3个以上模型

  6. ✅ 至少配置1个云端推理模型(DeepSeek/Qwen/OpenAI任选)
  7. ✅ 至少配置1个开源模型(可选本地运行或API形式)
  8. ✅ 配置Embedding模型(用于RAG)
  9. 将配置文件 config.yaml 内容截图

  10. Hello World测试

  11. 启动Hermes交互模式
  12. 发送命令:请介绍一下你自己
  13. 截图Agent的回复内容

提交材料

评分标准

项目 分值 要求
环境安装 30分 成功安装Hermes并正常启动
模型配置 40分 至少3个模型正常可用
功能验证 30分 能正常对话并回复
总分 100分

题目 2:构建个人知识库RAG系统

题目描述

基于Hermes Agent构建一个个人知识库问答系统,将你电脑上的文档、笔记等资料导入,实现"基于自己的资料回答问题"。

任务要求

  1. 准备知识库素材
  2. 收集至少5篇文档(可以是你的笔记、技术文章、电子书章节等)
  3. 文档总字数不少于5000字
  4. 截图展示知识库文件夹结构

  5. 构建向量知识库

  6. 使用bge-m3或其他Embedding模型
  7. 选择Chroma、Qdrant或SQLite作为向量存储
  8. 将文档批量向量化并入库
  9. 截图向量数据库的统计信息(文档数、向量维度等)

  10. RAG问答测试

  11. 测试问题1:请总结一下我的知识库主要讲了什么内容?
  12. 测试问题2:(根据你的知识库内容设计一个具体问题)
  13. 测试问题3:这个知识库中没有提到的问题是什么?(验证不会编造)
  14. 截图完整的对话过程,包括检索到的文档片段

  15. RAG效果对比

  16. 关闭RAG(直接问大模型):测试问题2的答案
  17. 开启RAG(基于知识库):测试问题2的答案
  18. 对比两个答案的差异,分析RAG的优势

提交材料

评分标准

项目 分值 要求
知识库构建 25分 5篇以上文档,总字数达标
向量化入库 25分 成功构建向量数据库
RAG问答 30分 3个问题均能正确回答
对比分析 20分 清晰分析RAG的作用和优势
总分 100分

题目 3:自定义Skill开发:文件批量处理工具

题目描述

开发一个Hermes Skill,实现"文件批量重命名"功能。用户用自然语言描述需求,Agent自动完成文件重命名操作。

任务要求

  1. Skill功能设计
  2. Skill名称:file_renamer
  3. 功能描述:根据用户描述批量重命名指定文件夹中的文件
  4. 支持的操作:添加前缀/后缀、替换特定字符、编号序列化
  5. 安全机制:执行前预览修改方案,用户确认后才执行

  6. 代码实现

  7. 遵循Hermes Skill开发规范
  8. 包含完整的参数说明和使用示例
  9. 异常处理:文件不存在、权限不足等情况
  10. 代码行数控制在200行以内

  11. 功能测试

  12. 测试场景1:给所有图片文件添加 旅游_ 前缀
  13. 测试场景2:将所有 .txt 文件按 文档_001.txt 格式编号
  14. 测试场景3:将文件名中的空格替换为下划线
  15. 截图记录每个测试的执行过程和结果

  16. Skill文档

  17. 编写 README.md 文档
  18. 包含功能介绍、安装方法、使用示例
  19. 附上3个测试场景的截图

提交材料

评分标准

项目 分值 要求
代码质量 30分 结构清晰、注释完整、符合规范
功能完整性 35分 3个测试场景全部通过
用户体验 20分 有预览确认、友好的错误提示
文档质量 15分 README清晰,示例完整
总分 100分

题目 4:综合实战:个人助理Agent完整搭建

题目描述

整合前面所学的所有知识,构建一个完整的个人助理Agent,具备记忆功能、多个Skill组合、RAG知识库,能够帮你完成日常工作任务。

任务要求

  1. 核心功能规划(至少包含4项功能)
  2. ✅ 日程管理:记录、查询、提醒待办事项
  3. ✅ 文档问答:基于你的知识库回答问题(用上题的RAG)
  4. ✅ 文件操作:批量处理文件(用上题的Skill)
  5. ✅ 信息检索:联网搜索最新信息
  6. ✅ (可选)邮件发送、微信消息等集成功能

  7. 记忆系统设计

  8. 短期记忆:当前对话上下文
  9. 长期记忆:用户偏好、历史对话摘要
  10. 实现记忆的持久化存储(SQLite或文件)
  11. 截图展示记忆系统的数据结构

  12. 多Skill编排

  13. 至少集成3个不同的Skill
  14. 实现Agent自动判断该调用哪个Skill
  15. 设计一个复杂任务,需要Agent连续调用多个Skill完成
  16. 截图展示多Skill协作的完整流程

  17. 端到端演示

  18. 设计一个真实的工作场景:例如"帮我准备下周的项目汇报"
  19. Agent需要:搜索最新资料 → 读取本地文档 → 生成大纲 → 保存为文件
  20. 完整记录从用户发出指令到任务完成的全过程
  21. 最终产出物必须是真实可用的文件

  22. 效果评估报告

  23. 你的个人助理解决了什么实际问题?
  24. 相比没有Agent,效率提升了多少?
  25. 还有哪些地方可以改进?
  26. 不少于300字

提交材料

评分标准

项目 分值 要求
功能完整性 30分 4项核心功能全部实现
系统集成度 25分 记忆+Skill+RAG协同工作
演示效果 25分 端到端场景流畅,产出物可用
创新性 10分 有独特的功能或优化
报告质量 10分 思考深入,分析到位
总分 100分

🎓 结业标准

完成以上4个实操题目,总分达到320分(满分400分),即可获得:

  1. AI大模型与Agent实战入门 结业证书
  2. 优秀学员可获得导师1对1指导机会
  3. 优先参与后续进阶课程

💡 答题提示

  1. 善用文档:Hermes官方文档和社区资源是最好的帮手
  2. 循序渐进:从简单的题目开始,逐步深入
  3. 截图完整:每张截图要包含完整的上下文,不要只截局部
  4. 真实操作:所有操作必须是真实执行的,禁止P图
  5. 独立完成:可以查资料、问问题,但代码必须自己写

📞 技术支持

遇到问题时:
1. 先看官方文档和常见问题
2. 在GitHub Issues搜索是否有类似问题
3. 向课程助教提问时,附上:
- 错误截图
- 操作系统和环境版本
- 复现问题的步骤

祝大家学习顺利!🚀