提高dify问题分类的准确性

张开发

• 2026/4/13 17:25:17 • 15 分钟阅读

分享文章

1. 模型与参数先把 “硬件” 拉满模型选择分类任务必须用强推理模型GPT-3.5-turbo / GPT-4通义千问 Pro / 文心 4.0 / 字节豆包 Pro小模型7B、1.8B分类准确率天生差不建议用于意图判断。参数设置关键Temperature 0 ~ 0.1越低越稳定、越不会乱分类。Top P 0.1 ~ 0.3禁止开启 “创意模式”“自由发挥”2. 只让分类器看当前问题不要看历史对话这是90% 人准确率低的核心原因。用户前面聊别的后面突然问新问题分类器会被上下文带偏。正确做法Question Classifier 的输入只传plaintextsys.query不要传入历史对话、不要传入系统提示。3. 类别设计必须清晰、互斥、不重叠类别越模糊准确率越低。原则类别之间不能有歧义一个问题只能属于一个类别类别数量不要太多建议 38 类必须加一个【其他】兜底错误示例投资、融资、找机构、找资金 → 应该合并为【找投资】需求、项目、产品、痛点 → 合并为【找需求】4. 提示词结构固定格式高准确率给你一个Dify 分类器专用高准确率提示词直接复制plaintext你是一个严格的意图分类器。规则 1. 只根据用户当前这句话判断不看上下文。 2. 必须且只能选择一个类别。 3. 语义不明确时一律返回【其他】。类别定义【找投资】用户询问融资、投资人、基金、投资偏好、合作、资金、IPO、并购、退出。【找需求】用户询问项目、产品需求、市场机会、客户痛点、解决方案、功能设计。【AI赛道】涉及大模型、LLM、RAG、Agent、提示词、AI应用、AIGC、向量库。【智能制造】涉及机器人、工业自动化、芯片、硬件、装备、产线、工厂、精密制造。【其他】不属于以上任何类别。用户问题{user_query} 只输出类别名称不要任何多余内容。5. 给每个类别提供 35 个示例句非常有效LLM 最喜欢示例有示例准确率直接提升一档。在提示词里加plaintext示例 1. 我想融资 → 【找投资】 2. 有什么好项目 → 【找需求】 3. 怎么做RAG → 【AI赛道】 4. 工业机器人前景 → 【智能制造】 5. 今天吃什么 → 【其他】6. 禁止输出解释只输出类别名分类器一旦开始解释就容易跑偏。强制要求只输出类别名称不要理由不要分析不要 JSON除非你必须用 JSON简单输出最稳定。7. 用 “强制格式指令” 锁死输出在最后加一句plaintext输出格式仅输出【】内的类别名称不输出任何其他内容。8. 避免类别太细、太相似例如不要分早期投资、成长期投资、PE 投资统一叫【找投资】细分类可以在后续节点再判断不要让分类器一次性做太难的任务。9. 测试集验证 Bad Case 优化准备 2050 条测试问句反复跑把分错的句子加入提示词作为反例。例如plaintext反例 “我有项目想找钱” → 不属于【找需求】属于【找投资】反例越多模型越不容易错。10. 进阶用 JSON 结构化输出更稳定如果你希望后续流程更稳可以让分类器输出 JSONplaintext{ category: 找投资 }JSON 格式比纯文本更不容易乱输出。最简单总结照着做就能提高用强模型温度 0.1只看当前问题不看历史类别少、清晰、互斥提示词给定义示例强制只输出类别收集错例优化提示词

更多文章

前端开发 2026/4/13 17:20:15

中医AI助手：如何用1.8B参数模型解决中医诊疗难题？

中医AI助手：如何用1.8B参数模型解决中医诊疗难题？ 【免费下载链接】CMLM-ZhongJing 首个中医大语言模型——“仲景”。受古代中医学巨匠张仲景深邃智慧启迪，专为传统中医领域打造的预训练大语言模型。 The first-ever Traditional Chinese Me…

张开发

前端开发 2026/4/13 17:18:01

MH-Z19 CO₂传感器嵌入式驱动与工程实践指南

1. MH-Z19 CO₂传感器库技术深度解析 MH-Z19 是一款由郑州炜盛电子科技有限公司（Winsen Electronics）推出的非分散红外（NDIR）原理CO₂浓度检测模块，广泛应用于室内空气质量监测、新风系统、智能农业温室控制、实验室环…

张开发

前端开发 2026/4/13 17:15:54

NearDrop：如何在macOS上实现Google Nearby Share的3种实用方法

NearDrop：如何在macOS上实现Google Nearby Share的3种实用方法【免费下载链接】NearDrop An unofficial Google Nearby Share/Quick Share app for macOS 项目地址: https://gitcode.com/gh_mirrors/ne/NearDrop 想要在macOS和Android设备之间轻松传输文件吗…

张开发

前端开发 2026/4/13 17:10:27

算法工程师视角下的TVA算法优化技巧（初级系列之一）

——算法工程师教你做好TVA优化的基础数据准备从算法工程师的视角来看，数据是TVA算法的“燃料”，算法的所有优化操作，本质上都是基于数据的调整和优化，没有高质量、全覆盖的样本数据，再好的算法架构（如Tran…

张开发

前端开发 2026/4/13 17:10:09

解锁音乐自由：ncmdumpGUI 让加密音频文件重获新生

解锁音乐自由：ncmdumpGUI 让加密音频文件重获新生【免费下载链接】ncmdumpGUI C#版本网易云音乐ncm文件格式转换，Windows图形界面版本项目地址: https://gitcode.com/gh_mirrors/nc/ncmdumpGUI 当你在网易云音乐购买的数字专辑只能在特定软件中…

张开发

前端开发 2026/4/13 17:06:52

MangoHud深度解析：Linux游戏性能监控架构设计与调优实战

MangoHud深度解析：Linux游戏性能监控架构设计与调优实战【免费下载链接】MangoHud A Vulkan and OpenGL overlay for monitoring FPS, temperatures, CPU/GPU load and more. 项目地址: https://gitcode.com/gh_mirrors/ma/MangoHud MangoHud是一款面向Linu…

张开发

前端开发 2026/4/13 17:06:52

ABAP开发实战：用cl_salv_bs_runtime_info实现ALV数据“静默”抓取与二次处理

ABAP开发实战：用cl_salv_bs_runtime_info实现ALV数据“静默”抓取与二次处理在SAP系统日常运维中，我们常遇到这样的需求：某个标准报表的输出数据需要自动流转到下游系统，或者需要对现有报表数据进行二次加工。传统做法要么要求修…

张开发

前端开发 2026/4/13 17:03:08

Nomic-Embed-Text-V2-MoE快速上手：Python安装与环境配置全攻略

Nomic-Embed-Text-V2-MoE快速上手：Python安装与环境配置全攻略你是不是也对最近火热的文本嵌入模型感兴趣，想亲手试试那个号称性能很强的Nomic-Embed-Text-V2-MoE？但一看到要配置Python环境、安装各种库，就觉得头大，…

张开发

前端开发 2026/4/13 17:00:25

Graphormer镜像部署教程：Docker外原生环境supervisor一键托管方案

Graphormer镜像部署教程：Docker外原生环境supervisor一键托管方案 1. 项目概述 Graphormer是一种基于纯Transformer架构的图神经网络模型，专门为分子图（原子-键结构）的全局结构建模与属性预测而设计。该模型在OGB、PCQM4M等分子…

张开发

前端开发 2026/4/13 16:58:36

Behaviac终极指南：构建专业级游戏AI行为系统的完整解决方案

Behaviac终极指南：构建专业级游戏AI行为系统的完整解决方案【免费下载链接】behaviac behaviac is a framework of the game AI development, and it also can be used as a rapid game prototype design tool. behaviac supports the behavior tree, finite state…

张开发

前端开发 2026/4/13 16:58:24

Dell G15散热优化终极指南：开源温度控制软件实战教程

Dell G15散热优化终极指南：开源温度控制软件实战教程【免费下载链接】tcc-g15 Thermal Control Center for Dell G15 - open source alternative to AWCC 项目地址: https://gitcode.com/gh_mirrors/tc/tcc-g15 还在为你的Dell G15游戏本发烫而烦恼吗&#…

张开发

前端开发 2026/4/13 16:57:48

Python实战：用蒙特卡罗算法模拟舞龙队路径规划（附完整代码）

Python实战：用蒙特卡罗算法模拟舞龙队路径规划（附完整代码） 舞龙表演作为传统民俗活动，其复杂的队形变换背后隐藏着精妙的运动轨迹设计。本文将带你用Python实现蒙特卡罗算法，从零开始构建舞龙队的运动路径模拟系统。不…

张开发

提高dify问题分类的准确性

最新文章

告别卡顿！CocosCreator TiledMap性能优化实战：关闭裁剪与节点遮挡详解

技术咨询中的问题诊断与解决方案

揭秘Midscene：三步开启零代码AI自动化新纪元，让浏览器听懂你的话！

Ubuntu中文乱码修复指南：从locale配置到界面切换

C语言实战：从零构建高效低通滤波器（完整代码解析）

内网多机连接fay使用

推荐文章

⑩【从0制作自己的ros导航小车：上位机篇】05、导航！

从NUSTCTF Ezjava1看Java Web参数绑定与条件竞争漏洞挖掘

SITS2026现场直击：LLM-native NLP架构设计原则（含可复用的5层抽象模型图谱）

AHT20温湿度传感器库深度解析与工业级应用实践

Rust的引用计数智能指针Rc与Arc在线程共享中的内部可变性

libhv实战：从零构建一个功能完备的HTTP客户端

相关文章

高效掌握多步提示工程：进阶AI任务处理的系统方法论

浏览器资源嗅探终极指南：如何轻松下载网页视频与音频

OPEN实战：基于深度强化学习的多无人机追逃在线规划，如何跨越仿真到现实的鸿沟？

从Depth Anything到Video版本：揭秘字节跳动如何用时空注意力突破视频深度估计瓶颈

终极指南：如何使用ChampR构建高性能英雄联盟游戏助手

GLM-4.1V-9B-Base效果展示：中文手绘草图→功能描述→技术实现建议生成

分享文章

更多文章

中医AI助手：如何用1.8B参数模型解决中医诊疗难题？

MH-Z19 CO₂传感器嵌入式驱动与工程实践指南

NearDrop：如何在macOS上实现Google Nearby Share的3种实用方法

算法工程师视角下的TVA算法优化技巧（初级系列之一）

解锁音乐自由：ncmdumpGUI 让加密音频文件重获新生

MangoHud深度解析：Linux游戏性能监控架构设计与调优实战

ABAP开发实战：用cl_salv_bs_runtime_info实现ALV数据“静默”抓取与二次处理

Nomic-Embed-Text-V2-MoE快速上手：Python安装与环境配置全攻略

Graphormer镜像部署教程：Docker外原生环境supervisor一键托管方案

Behaviac终极指南：构建专业级游戏AI行为系统的完整解决方案

Dell G15散热优化终极指南：开源温度控制软件实战教程

Python实战：用蒙特卡罗算法模拟舞龙队路径规划（附完整代码）