别再只调包了！手把手带你用PyTorch从零实现BiLSTM-CRF命名实体识别（附完整代码）

张开发

• 2026/4/17 15:19:33 • 15 分钟阅读

分享文章

别再只调包了！手把手带你用PyTorch从零实现BiLSTM-CRF命名实体识别（附完整代码）

从零构建BiLSTM-CRF命名实体识别模型深入原理与完整PyTorch实现1. 命名实体识别技术全景命名实体识别NER作为自然语言处理的基础任务其核心目标是从非结构化文本中定位并分类特定类型的实体。不同于简单的词典匹配现代NER系统需要解决实体边界模糊、类型多样、上下文依赖等复杂问题。在医疗领域NER面临独特挑战专业术语密集弥漫大B细胞淋巴瘤等专业名词需要精确识别表述变体丰富同一症状可能有气促、呼吸困难等多种表述标签约束严格疾病与症状标签需遵循B-dis/I-dis、B-sym/I-sym的标注规则传统方法对比# 基于规则的方法示例 def rule_based_ner(text): disease_dict [淋巴瘤, 肺癌, 冠心病] for term in disease_dict: if term in text: yield (term, disease) # 基于统计的方法HMM示例 hmm HiddenMarkovModel(transition_prob, emission_prob)2. BiLSTM-CRF架构深度解析2.1 模型整体架构graph TD A[输入序列] -- B[词嵌入层] B -- C[BiLSTM层] C -- D[全连接层] D -- E[CRF层] E -- F[预测标签序列]2.2 关键组件实现词嵌入层配置class BiLSTM_CRF(nn.Module): def __init__(self, vocab_size, embedding_dim, ...): super().__init__() self.embedding nn.Embedding( num_embeddingsvocab_size, embedding_dimembedding_dim, padding_idx0 )BiLSTM层参数参数名典型值作用hidden_size100单层LSTM单元数num_layers2堆叠LSTM层数dropout0.3层间dropout概率bidirectionalTrue启用双向结构CRF转移矩阵设计self.transitions nn.Parameter(torch.randn(tag_size, tag_size)) # 约束非法转移 self.transitions.data[START_TAG, :] -10000 self.transitions.data[:, STOP_TAG] -100003. 完整实现流程3.1 数据预处理管道def build_vocab(texts): char_to_id {PAD: 0, UNK: 1} for text in texts: for char in text: if char not in char_to_id: char_to_id[char] len(char_to_id) return char_to_id def sentence_to_ids(sentence, char_to_id, max_len): ids [char_to_id.get(c, 1) for c in sentence] ids ids[:max_len] [0]*(max_len - len(ids)) return torch.tensor(ids, dtypetorch.long)3.2 模型训练关键代码def train_epoch(model, dataloader, optimizer): model.train() total_loss 0 for inputs, tags in tqdm(dataloader): optimizer.zero_grad() loss model.neg_log_likelihood(inputs, tags) loss.backward() optimizer.step() total_loss loss.item() return total_loss / len(dataloader)3.3 维特比解码实现def viterbi_decode(emissions, transitions): seq_length, num_tags emissions.shape viterbi torch.zeros(seq_length, num_tags) backpointers torch.zeros(seq_length, num_tags, dtypetorch.long) # 初始化第一步 viterbi[0] emissions[0] for t in range(1, seq_length): scores viterbi[t-1].unsqueeze(1) transitions viterbi[t] emissions[t] scores.max(0)[0] backpointers[t] scores.argmax(0) # 回溯最佳路径 best_path [viterbi[-1].argmax().item()] for t in reversed(range(1, seq_length)): best_path.append(backpointers[t, best_path[-1]].item()) return best_path[::-1]4. 医疗NER实战技巧4.1 特殊处理策略领域词典增强medical_terms { B-dis: [淋巴瘤, 肺炎], I-dis: [型, 期] }标签不平衡处理class_weights torch.tensor([1.0, 2.0, 2.0, 3.0, 3.0]) # O, B-dis, I-dis, B-sym, I-sym criterion nn.CrossEntropyLoss(weightclass_weights)4.2 评估指标优化精确率-召回率平衡策略def evaluate(y_true, y_pred): tp ((y_true y_pred) (y_true ! 0)).sum().item() pred_pos (y_pred ! 0).sum().item() true_pos (y_true ! 0).sum().item() precision tp / (pred_pos 1e-10) recall tp / (true_pos 1e-10) f1 2 * precision * recall / (precision recall 1e-10) return precision, recall, f15. 进阶优化方向5.1 模型改进方案层次化表示self.char_embedding nn.Embedding(char_vocab_size, char_embed_dim) self.word_lstm nn.LSTM(word_embed_dim, hidden_size//2, bidirectionalTrue)注意力机制增强self.attention nn.MultiheadAttention(embed_dimhidden_size, num_heads4)5.2 预训练模型集成from transformers import BertModel class BERT_BiLSTM_CRF(nn.Module): def __init__(self, bert_path, tagset_size): super().__init__() self.bert BertModel.from_pretrained(bert_path) self.lstm nn.LSTM(768, hidden_size//2, bidirectionalTrue) self.crf CRF(tagset_size)6. 完整代码结构项目目录结构ner_project/ ├── data/ │ ├── train.txt # 标注数据 │ └── vocab.json # 字符词典 ├── model/ │ ├── bilstm_crf.py # 模型定义 │ └── train.py # 训练脚本 ├── utils/ │ ├── data_loader.py # 数据加载 │ └── metrics.py # 评估指标 └── config.yaml # 超参数配置核心训练循环for epoch in range(epochs): train_loss train_epoch(model, train_loader, optimizer) val_metrics evaluate(model, val_loader) print(fEpoch {epoch}:) print(f Train Loss: {train_loss:.4f}) print(f Val F1: {val_metrics[f1]:.4f}) if val_metrics[f1] best_f1: torch.save(model.state_dict(), best_model.pt) best_f1 val_metrics[f1]7. 实际应用建议领域适应技巧使用领域特定语料继续预训练设计领域相关的标签约束规则部署优化model BiLSTM_CRF.load_from_checkpoint(best_model.pt) model.eval() torchscript_model torch.jit.script(model) # 转换为TorchScript持续学习策略def online_learning(new_data): optimizer torch.optim.SGD(model.parameters(), lr0.01) for x, y in new_data: loss model(x, y) loss.backward() optimizer.step()通过本实现开发者不仅能掌握BiLSTM-CRF的核心原理还能获得可直接应用于实际项目的完整代码框架。建议在医疗文本上测试时重点关注模型对嵌套实体、不完整表述等复杂情况的处理能力。

更多文章

前端开发 2026/4/17 15:19:21

想转行ISP Tuning？给零基础新人的5个面试准备建议（附学习路线）

零基础转行ISP Tuning：5个实战化面试突围策略当手机拍摄的夜景照片出现噪点时，当车载摄像头在逆光下丢失细节时，背后都有一群"图像医生"在调试ISP参数。这就是ISP Tuning工程师的工作——用参数手术刀修复光学缺陷。如果你正从软…

GIMP批量图像处理插件BIMP完全指南：免费自动化工具终极解决方案【免费下载链接】gimp-plugin-bimp BIMP. Batch Image Manipulation Plugin for GIMP. 项目地址: https://gitcode.com/gh_mirrors/gi/gimp-plugin-bimp BIMP（Batch Image Manipula…

张开发

前端开发 2026/4/17 14:49:31

H5playerV2.1.2实战：5分钟搞定跨域播放器集成（含常见报错解决方案）

H5playerV2.1.2实战：5分钟搞定跨域播放器集成（含常见报错解决方案） 在视频监控、在线教育、直播平台等Web应用中，H5player凭借其无需插件、跨平台兼容的特性成为主流播放方案。但实际集成时，开发者常被跨域配置、HTTPS…

张开发

别再只调包了！手把手带你用PyTorch从零实现BiLSTM-CRF命名实体识别（附完整代码）

最新文章

MedVQA前沿模型精解：从多模态融合到检索增强的实战演进

UE线程安全锁 FCriticalSection 使用

跨境人必看！欧盟代理AI发展全景解析，机遇与合规要点一文吃透

SITS2026 AI配置生成器深度拆解：从YAML Schema解析到动态策略注入的7步工业级落地流程

为什么电机控制观测器要使用锁相环（PLL)---学习笔记

从微信支付P12证书中提取关键信息：OpenSSL与Java实战指南

推荐文章

⑩【从0制作自己的ros导航小车：上位机篇】05、导航！

从NUSTCTF Ezjava1看Java Web参数绑定与条件竞争漏洞挖掘

SITS2026现场直击：LLM-native NLP架构设计原则（含可复用的5层抽象模型图谱）

AHT20温湿度传感器库深度解析与工业级应用实践

Rust的引用计数智能指针Rc与Arc在线程共享中的内部可变性

libhv实战：从零构建一个功能完备的HTTP客户端

相关文章

高效掌握多步提示工程：进阶AI任务处理的系统方法论

浏览器资源嗅探终极指南：如何轻松下载网页视频与音频

OPEN实战：基于深度强化学习的多无人机追逃在线规划，如何跨越仿真到现实的鸿沟？

从Depth Anything到Video版本：揭秘字节跳动如何用时空注意力突破视频深度估计瓶颈

终极指南：如何使用ChampR构建高性能英雄联盟游戏助手

GLM-4.1V-9B-Base效果展示：中文手绘草图→功能描述→技术实现建议生成

分享文章

更多文章

想转行ISP Tuning？给零基础新人的5个面试准备建议（附学习路线）

终极Windows系统清理工具Win11Debloat：一键释放性能，还原纯净体验

舆情分析实战：如何用大连理工情感词典和K-means聚类，给微博评论自动打上情感标签并分组？

Win11系统2024年最新Anaconda安装指南：从下载到环境变量配置全解析

运维实战：K8s节点维护，用cordon、drain还是delete？一张图帮你做决策

Apex Legends智能压枪终极指南：免费开源工具实现精准射击

adb实战指南（二）- 解锁安卓设备调试权限与建立adb稳定连接

光伏并网逆变器资料：原理图、PCB、源码及元器件明细表大全

如何用AMLL打造媲美Apple Music的动态歌词体验：3步实现沉浸式音乐播放器

告别命令行GDB！用CLion远程调试Linux C++程序，像本地开发一样丝滑

GIMP批量图像处理插件BIMP完全指南：免费自动化工具终极解决方案

H5playerV2.1.2实战：5分钟搞定跨域播放器集成（含常见报错解决方案）