大模型面试 RAG 专项 36 题详解

张开发
2026/4/2 23:38:31 15 分钟阅读
大模型面试 RAG 专项 36 题详解
一、RAG 基础概念与核心流程(8 题)1. 什么是 RAG?为什么要用 RAG?答:RAG = Retrieval-Augmented Generation,检索增强生成。先从外部知识库检索相关文本,再送给大模型生成答案。解决问题:大模型知识过时容易幻觉无法使用私有 / 实时数据隐私数据不能进预训练举例:问 “2026 年公司新政策”,模型没训练过,RAG 从内部文档检索后再回答,无幻觉、实时准确。2. RAG 经典六步流程是什么?答:文档加载(PDF/Word/Excel/ 网页)文本分块(Chunking)向量化 Embedding存入向量数据库用户查询向量化 + 检索 Top-K构造 Prompt → 大模型生成答案举例:上传产品手册 → 切块 → 转向量存 Chroma → 用户提问 → 召回相关段落 → 生成回答。3. RAG 对比 Fine-tuning 优势是什么?答

更多文章