算法备案、大模型备案、登记……到底该做哪个?一篇说清楚,别再被退回了

张开发
2026/4/4 6:20:02 15 分钟阅读
算法备案、大模型备案、登记……到底该做哪个?一篇说清楚,别再被退回了
一、让你头疼的材料到底是什么假设你做的是一款基于大模型的智能客服产品技术团队很牛产品体验也不错眼看就要上线了。但法务同事甩过来一句话“这个要算法备案可能还要大模型备案您确认下先做哪个。”你愣了一下“这两个不是一回事吗”法务摇摇头发过来一份长长的材料清单。你一看就头皮发麻安全评估报告、算法说明、训练数据来源、语料标注规则、隐私政策更新……少说几十项每一项都需要技术、法务、产品三方配合。监管越来越严你不是不想合规是真的不知道该怎么合规。那些专业术语像天书一样横在面前算法备案、大模型备案、模型登记都叫备案到底有什么区别该从哪儿下手找谁做花多少钱做错了怎么办这篇文章就是写给和曾经的你一样焦虑的人看的。二、先把“名字”搞清楚算法备案、大模型备案、登记很多人把“算法备案”“大模型备案”“模型登记”当成一回事其实不是。打个比方你就明白了。你要开一家餐厅需要同时去工商部门办营业执照类似模型登记去食药监部门办食品经营许可证类似大模型备案还要去消防部门做消防安全评估类似算法备案。三个部门、三套标准、三个流程少了任何一个餐厅都开不合法。AI领域的这三个备案也是同样的逻辑算法备案管的是你用算法做什么。核心监管逻辑是你的算法是怎么影响用户的比如推荐算法会决定用户看到什么内容搜索算法会决定什么信息被优先展示这些都涉及信息分发和用户权益需要备案。大模型备案管的是你的大模型本身。核心监管逻辑是你的大模型安全不安全会不会生成有害内容训练数据从哪儿来这些问题回答不好大模型就不能对外提供服务。模型登记管的是大模型的基本信息。核心监管逻辑是你的大模型是谁开发的、什么版本、对外提供什么能力像给一辆车上牌照一样登记了才能上路。三个备案管的维度不同主管部门不同要求不同流程不同我们一个个拆开说。三、算法备案不是所有产品都要做但做了的企业都在后悔没早做3.1 什么是算法备案算法备案的全称是**“互联网信息服务算法推荐服务备案”**依据的是2022年发布的《互联网信息服务算法推荐管理规定》。简单来说如果你用算法给用户做以下这些事情就需要做算法备案推荐内容比如今日头条的信息流推荐、抖音的视频推荐、电商平台的商品推荐排序搜索比如搜索引擎的结果排序、外卖平台的商家排名生成合成比如AI写作、AI换脸、AI配音这类AIGC功能个性化推送根据用户画像做精准营销、差异化定价大数据杀熟监管的出发点是算法可能会影响信息分发、左右用户决策、甚至涉及隐私和公平性所以需要备案接受监管。3.2 哪些产品必须做算法备案这里有个常见的误区很多人以为只有“算法公司”才需要做算法备案。只要你产品里用了上述几类算法功能就需要做。常见场景包括基于大模型的AI助手产品如果有内容推荐或生成类功能社区类产品有信息流推荐、热门排序电商平台有商品推荐、搜索排序内容平台有创作者推荐、内容分发客服类产品如果用了对话生成或智能分配一个自检的小方法打开你的产品问自己三个问题我的用户看到的信息是我人工安排的吗有没有算法在决定展示顺序有没有根据用户特征做个性化处理如果答案都是“否”那不需要算法备案。如果有建议你找我们进行评估。3.3 算法备案到底要准备什么材料算法备案的材料清单比较长主要包括算法主体的基本信息、算法推荐服务的主要功能说明、算法机理的简要说明、算法运行机制的技术文档、用户权益保护措施、安全评估报告、投诉举报渠道说明材料清单本身不复杂但难点在于第一很多材料需要技术团队配合写而且要写得“既专业又能让监管看懂”。很多企业自己写完提交被打回来好几次原因就是技术文档写得要么太深奥看不懂要么太浅被认为敷衍。第二安全评估报告有固定格式和评分标准需要严格按照要求来做。我们见过太多企业自己做的安全评估报告因为评分不达标被退回。第三备案信息需要定期更新如果产品功能调整、算法变更需要及时做变更备案。四、大模型备案管的是模型安不安全不是你公司有没有AI4.1 什么是大模型备案大模型备案的全称是**“生成式人工智能服务备案”**依据的是2023年发布的《生成式人工智能服务管理暂行办法》。它的监管逻辑和算法备案完全不同算法备案管的是“算法怎么用”大模型备案管的是“大模型安不安全”。如果你的产品对外提供大模型服务说白了就是让用户可以调用你的AI能力聊天、写作、生成图片等就需要做大模型备案。4.2 典型需要大模型备案的场景你自研了大模型对外提供API调用或直接服务你基于开源大模型做了微调对外提供服务你的产品接入了第三方大模型但在你的产品界面里直接呈现AI生成结果给用户这种情况要看具体业务形态有些需要备案有些可能不需要一个关键区分点如果你的产品只是调用了第三方大模型的API然后把结果展示给用户这算不算“大模型服务”这个问题在业内有争议不同地区的监管尺度可能略有差异。但保守建议是只要你的产品名称、对外宣传、功能呈现都和“大模型”“AI”强绑定让用户感知到是AI在服务你你最好提前确认是否需要备案。4.3 大模型备案的材料清单大模型备案的材料比算法备案更复杂主要包括模型的基本信息、训练数据来源说明、语料标注规则、安全性评估报告、 服务协议和用户协议、内容过滤和审核机制说明、投诉举报和应急处置方案、违法内容处置记录等等材料准备的难点在于训练数据来源要说得清楚很多人这一步就被卡住了——“我的数据是从公开网络爬的”“我的数据是买的”“我的数据是用户贡献的”……每种情况都有不同的合规要求不是简单一句“数据合规”就能过的。五、模型登记名字听起来最简单但坑也不少5.1 什么是模型登记模型登记是**“深度合成服务提供者”和“生成式人工智能服务提供者”**需要向网信部门做的信息登记。依据的是《互联网信息服务深度合成管理规定》和《生成式人工智能服务管理暂行办法》。模型登记更像是给大模型办一个“身份证”你是谁提供者名称、你叫什么模型名称、你长什么样版本号和基本参数、你有什么能力服务类型。登记的目的是监管手里有一份清单知道现在市面上有哪些大模型在提供服务一旦出问题可以追溯到具体责任主体。5.2 模型登记和大模型备案是什么关系这是另一个容易混淆的地方。简单说大模型备案是“安不安全”模型登记是“是谁”。两者的关系是独立关系模型登记是独立的备案项和大模型备案并行实际中经常一起做很多情况下企业会同时准备两个备案的材料一起提交但注意不是所有产品都需要同时做两个备案。有些产品只需要做模型登记不需要大模型备案有些产品两个都要做。后面讲“双备案”的时候会详细说。5.3 模型登记需要准备什么相比前两个备案模型登记的材料清单短一些主要包括服务提供者的基本信息、拟上线的深度合成/大模型服务的名称、形式、范围、模型基座的基本信息如使用开源模型需要说明、服务规则和协议、 投诉举报渠道六、“双备案”政策解读两个同时做当一个产品同时涉及算法推荐功能和大模型服务时就需要同时做两个备案这就是“双备案”。比如你的产品是一个AI聊天助手用户可以问问题、AI来回答。这个回答的生成过程涉及大模型服务需要大模型备案同时你的产品还有“热门问题推荐”“相关问题引导”等功能需要算法备案。时候你就需要做双备案。再比如你的产品是一个AI写作工具用户输入关键词AI生成文章。这个生成过程需要大模型备案同时你的产品会根据用户历史行为推荐“写作模板”“素材库”这就涉及算法推荐功能需要算法备案。一个判断标准打开你的产品如果用户能同时感受到“我在用AI服务”和“这个产品在给我推荐内容”那你大概率需要双备案。双备案的难度是单独备案的两倍吗不是两倍是指数级增加。原因很简单双备案需要同时满足两个备案的所有要求。材料要准备两套流程要跑两条对接的审核人员可能不同虽然都是网信部门但不同地区、不同业务线的审核标准可能有细微差异。更麻烦的是两个备案的进度可能不同步。比如大模型备案先过了算法备案被退回要求补充材料这时候你的产品是上还是不上所以双备案的企业建议一开始就找有经验的服务商统筹规划避免各自为战、反复返工。七、为什么你的材料总被退回总结了100退回案例后发现的问题我们团队这几年经手了上百个备案案例遇到过各种奇葩的退回理由。这里总结几个最高频的问题看看你有没有中招7.1 “算法机理说明”写得让审核员看不懂这是算法备案被退回的第一大原因很多人觉得算法机理说明要写得越专业越好结果审核员看完一头雾水。正确的方式是用非技术人员能理解的语言把算法的核心逻辑说清楚。比如你做一个内容推荐算法你要说的是“用户喜欢什么类型的文章就给他推类似的文章”而不是“在注意力机制下通过多层感知器计算用户与内容的匹配度”。7.2 训练数据来源说不清楚这是大模型备案被退回的第二大原因。很多企业的回答是“数据是从公开渠道获取的”“数据是经过清洗的”“数据是合规的”。但审核员要的不是结论是过程。你需要说明数据从哪里来、什么时候获取的、有没有涉及个人信息、怎么清洗的、清洗掉了什么、最终用了多少数据。这些问题如果回答不上来说明你的数据治理工作还没做到位需要先补课。7.3 安全评估报告格式不对算法备案和大模型备案都要求提交安全评估报告但两个报告的格式要求不同。有些企业拿算法备案的模板套大模型备案或者拿去年的模板套今年的最新要求结果一提交就被退回。建议先去监管部门官网下载最新版的模板对照着一条一条写。7.4 备案类型选错了这是最可惜的一种情况。辛辛苦苦准备了半年材料写了几百页结果提交后被告知“您的产品不适用这个备案类型请重新选择”。比如有些企业的产品其实不需要算法备案但自己以为需要白忙一场有些企业需要大模型备案但只做了算法备案被要求补做。避免方法提交前找有经验的人帮你过一遍材料确认备案类型是否正确。

更多文章