【数据结构与算法】第30篇：哈希表（Hash Table）

张开发

• 2026/4/6 23:21:46 • 15 分钟阅读

分享文章

一、什么是哈希表1.1 基本思想哈希表通过哈希函数将关键字映射到数组的某个位置实现快速访问。textkey → 哈希函数 → 数组下标 → 访问/存储示例hash(key) key % 10key25 → 25%105 → 存入下标5key37 → 37%107 → 存入下标71.2 哈希冲突不同的key映射到同一个位置称为哈希冲突。textkey25 → 5 key35 → 5 // 冲突解决冲突的两种主要方法链地址法每个位置是一个链表开放地址法冲突后找下一个空位二、哈希函数2.1 常用哈希函数方法公式适用场景直接定址法H(key)a×keyb关键字分布连续除留余数法H(key)key % p最常用p为质数平方取中法取平方后中间几位关键字无规律折叠法分割后求和关键字位数多2.2 除留余数法cint hash(int key, int size) { return key % size; // size通常取质数 }为什么size取质数减少冲突概率使分布更均匀。三、链地址法拉链法3.1 原理每个数组元素是一个链表的头指针冲突的元素放入同一链表。text数组: [0] → [1] → [2] → [3] → ... 链表: ↓ key1 → key2 → ...3.2 代码实现c#include stdio.h #include stdlib.h #define SIZE 10 // 链表节点 typedef struct Node { int key; struct Node *next; } Node; // 哈希表 typedef struct { Node *buckets[SIZE]; } HashTable; // 初始化 void initHashTable(HashTable *ht) { for (int i 0; i SIZE; i) { ht-buckets[i] NULL; } } // 哈希函数 int hash(int key) { return key % SIZE; } // 插入 void insert(HashTable *ht, int key) { int index hash(key); Node *newNode (Node*)malloc(sizeof(Node)); newNode-key key; newNode-next ht-buckets[index]; ht-buckets[index] newNode; } // 查找 int search(HashTable *ht, int key) { int index hash(key); Node *cur ht-buckets[index]; while (cur ! NULL) { if (cur-key key) return 1; cur cur-next; } return 0; } // 删除 int delete(HashTable *ht, int key) { int index hash(key); Node *cur ht-buckets[index]; Node *prev NULL; while (cur ! NULL) { if (cur-key key) { if (prev NULL) { ht-buckets[index] cur-next; } else { prev-next cur-next; } free(cur); return 1; } prev cur; cur cur-next; } return 0; } // 打印 void printHashTable(HashTable *ht) { for (int i 0; i SIZE; i) { printf([%d]: , i); Node *cur ht-buckets[i]; while (cur ! NULL) { printf(%d - , cur-key); cur cur-next; } printf(NULL\n); } } int main() { HashTable ht; initHashTable(ht); insert(ht, 25); insert(ht, 35); insert(ht, 45); insert(ht, 17); insert(ht, 28); printf(哈希表链地址法:\n); printHashTable(ht); printf(\n查找25: %s\n, search(ht, 25) ? 找到 : 未找到); printf(查找99: %s\n, search(ht, 99) ? 找到 : 未找到); delete(ht, 35); printf(\n删除35后:\n); printHashTable(ht); return 0; }运行结果text哈希表链地址法: [0]: NULL [1]: NULL [2]: NULL [3]: NULL [4]: NULL [5]: 45 - 35 - 25 - NULL [6]: NULL [7]: 17 - NULL [8]: 28 - NULL [9]: NULL 查找25: 找到查找99: 未找到删除35后: [5]: 45 - 25 - NULL四、开放地址法4.1 线性探测冲突时依次检查下一个位置H (H(key) i) % SIZE缺点容易产生聚集一连串被占用的位置。c#define SIZE 10 #define EMPTY -1 typedef struct { int data[SIZE]; } OpenHashTable; void initOpenHash(OpenHashTable *ht) { for (int i 0; i SIZE; i) { ht-data[i] EMPTY; } } int hash(int key) { return key % SIZE; } // 线性探测插入 void linearInsert(OpenHashTable *ht, int key) { int index hash(key); int i 0; while (ht-data[(index i) % SIZE] ! EMPTY i SIZE) { i; } if (i SIZE) { ht-data[(index i) % SIZE] key; } else { printf(哈希表已满\n); } } // 线性探测查找 int linearSearch(OpenHashTable *ht, int key) { int index hash(key); int i 0; while (i SIZE) { int pos (index i) % SIZE; if (ht-data[pos] key) return pos; if (ht-data[pos] EMPTY) return -1; // 空位说明不存在 i; } return -1; }4.2 二次探测解决线性探测的聚集问题H (H(key) i²) % SIZEc// 二次探测插入 void quadraticInsert(OpenHashTable *ht, int key) { int index hash(key); int i 0; while (ht-data[(index i * i) % SIZE] ! EMPTY i SIZE) { i; } if (i SIZE) { ht-data[(index i * i) % SIZE] key; } else { printf(哈希表已满\n); } }五、完整哈希表实现链地址法动态扩容c#include stdio.h #include stdlib.h #define INIT_SIZE 8 #define LOAD_FACTOR 0.75 typedef struct Node { int key; struct Node *next; } Node; typedef struct { Node **buckets; int size; // 桶的数量 int count; // 元素个数 } HashTable; // 哈希函数 int hash(HashTable *ht, int key) { return key % ht-size; } // 创建哈希表 HashTable* createHashTable() { HashTable *ht (HashTable*)malloc(sizeof(HashTable)); ht-size INIT_SIZE; ht-count 0; ht-buckets (Node**)calloc(ht-size, sizeof(Node*)); return ht; } // 插入不检查扩容 void insertNoResize(HashTable *ht, int key) { int index hash(ht, key); Node *newNode (Node*)malloc(sizeof(Node)); newNode-key key; newNode-next ht-buckets[index]; ht-buckets[index] newNode; ht-count; } // 查找 int search(HashTable *ht, int key) { int index hash(ht, key); Node *cur ht-buckets[index]; while (cur ! NULL) { if (cur-key key) return 1; cur cur-next; } return 0; } // 获取所有键 void getAllKeys(HashTable *ht, int *keys, int *len) { *len 0; for (int i 0; i ht-size; i) { Node *cur ht-buckets[i]; while (cur ! NULL) { keys[(*len)] cur-key; cur cur-next; } } } // 扩容 void resize(HashTable *ht) { int oldSize ht-size; Node **oldBuckets ht-buckets; // 创建新哈希表 ht-size oldSize * 2; ht-count 0; ht-buckets (Node**)calloc(ht-size, sizeof(Node*)); // 重新插入所有元素 for (int i 0; i oldSize; i) { Node *cur oldBuckets[i]; while (cur ! NULL) { insertNoResize(ht, cur-key); Node *temp cur; cur cur-next; free(temp); } } free(oldBuckets); } // 插入带扩容 void insert(HashTable *ht, int key) { if ((float)ht-count / ht-size LOAD_FACTOR) { printf(负载因子 %.2f %.2f扩容到 %d\n, (float)ht-count / ht-size, LOAD_FACTOR, ht-size * 2); resize(ht); } insertNoResize(ht, key); } // 打印 void printHashTable(HashTable *ht) { printf(哈希表 (size%d, count%d, load%.2f):\n, ht-size, ht-count, (float)ht-count / ht-size); for (int i 0; i ht-size; i) { printf([%d]: , i); Node *cur ht-buckets[i]; while (cur ! NULL) { printf(%d - , cur-key); cur cur-next; } printf(NULL\n); } } // 销毁 void destroyHashTable(HashTable *ht) { for (int i 0; i ht-size; i) { Node *cur ht-buckets[i]; while (cur ! NULL) { Node *temp cur; cur cur-next; free(temp); } } free(ht-buckets); free(ht); } int main() { HashTable *ht createHashTable(); printf( 插入元素观察扩容\n); int values[] {25, 35, 45, 17, 28, 19, 33, 42, 51, 67, 73, 88}; for (int i 0; i 12; i) { insert(ht, values[i]); printf(插入 %d\n, values[i]); } printf(\n); printHashTable(ht); printf(\n 查找测试 \n); printf(查找25: %s\n, search(ht, 25) ? 找到 : 未找到); printf(查找99: %s\n, search(ht, 99) ? 找到 : 未找到); destroyHashTable(ht); return 0; }运行结果text 插入元素观察扩容插入 25 插入 35 插入 45 插入 17 插入 28 插入 19 插入 33 负载因子 0.75 0.75扩容到 16 插入 42 插入 51 插入 67 插入 73 插入 88 哈希表 (size16, count12, load0.75): [0]: 64 - NULL [1]: 33 - 17 - 25 - NULL [2]: 42 - 18 - NULL [3]: 35 - 19 - 51 - 67 - NULL ...六、两种冲突解决方法的对比对比项链地址法开放地址法原理冲突元素用链表存储找下一个空位空间利用率需要额外指针100%利用删除操作简单复杂需标记删除聚集问题无有线性探测性能稳定性稳定可能退化实现复杂度中等较低适用场景通用数据量可预估七、复杂度分析操作平均时间复杂度最坏时间复杂度插入O(1)O(n)查找O(1)O(n)删除O(1)O(n)最坏情况所有key映射到同一个位置退化成链表。如何保证平均O(1)哈希函数分布均匀负载因子控制在0.75以下适时扩容八、小结这一篇我们学习了哈希表要点说明哈希函数除留余数法最常用size取质数链地址法数组链表实现简单性能稳定开放地址法线性探测、二次探测无额外指针负载因子扩容阈值通常0.75时间复杂度平均O(1)最坏O(n)哈希表的核心好的哈希函数让数据分布均匀合理的负载因子保证性能冲突解决策略影响实现复杂度下一篇我们讲排序算法概述与插入排序。九、思考题除留余数法中为什么模数取质数能减少冲突链地址法和开放地址法哪种删除操作更简单为什么如果负载因子超过1链地址法和开放地址法分别会发生什么如何设计一个字符串的哈希函数欢迎在评论区讨论你的答案。

【数据结构与算法】第30篇：哈希表（Hash Table）

最新文章

终极鸣潮自动化工具指南：3步实现智能后台战斗与资源收集

selenium安装和使用

IMUduino：基于ATmega32u4与nRF8001的嵌入式姿态感知平台

21.高阶组件（HOC）是什么概念？它们在 React 中通常怎样应用？

SPL06-007压力传感器驱动开发与校准实战

Syncano Arduino库：面向Yún平台的嵌入式云协同通信框架

推荐文章

突破手游操控瓶颈：QtScrcpy虚拟映射技术全解析

Flutter Riverpod：状态管理的新纪元

WintunAdapter 设计解析：一个 VNP 数据面的无锁优雅实现

Arduino二进制模拟时钟库：LED阵列驱动的轻量级时间可视化方案

RP2040硬件加速步进电机控制库picoasyncstepper

minimal-json：嵌入式C语言轻量级JSON解析器

相关文章

高效掌握多步提示工程：进阶AI任务处理的系统方法论

浏览器资源嗅探终极指南：如何轻松下载网页视频与音频

OPEN实战：基于深度强化学习的多无人机追逃在线规划，如何跨越仿真到现实的鸿沟？

从Depth Anything到Video版本：揭秘字节跳动如何用时空注意力突破视频深度估计瓶颈

终极指南：如何使用ChampR构建高性能英雄联盟游戏助手

GLM-4.1V-9B-Base效果展示：中文手绘草图→功能描述→技术实现建议生成

分享文章

更多文章

WebRTC Video Jitter Buffer深度解析：从网络抖动到流畅播放的智能调控

RetDec反编译神器：从零开始掌握二进制代码逆向分析

降AI后格式乱了怎么修：Word格式修复操作指南

含热电联供智能楼宇群‘主从博弈‘与需求响应协同能量管理

开源工具res-downloader：一站式网络资源高效获取与批量处理方案

M5Stack专用PCA9685舵机驱动库：FreeRTOS安全PWM控制

解密Docker存储：overlay2目录结构与容器ID映射原理详解

LangChain 1.x 入门指南：从智能体到实战案例

从测试到ISP调试：一名Camera Tuning工程师的四年转型与面试通关实录

Protocol Buffers（.proto）实战入门：Go 生态最常用的接口定义语言

基于两阶段鲁棒优化的微网电源容量优化配置代码功能说明

终极游戏模组管理器：XXMI启动器让模组管理变得前所未有的简单