别再死记硬背A*算法了！用Python实战8数码问题，手把手教你理解曼哈顿距离的威力

张开发

• 2026/4/20 0:02:18 • 15 分钟阅读

分享文章

别再死记硬背A*算法了！用Python实战8数码问题，手把手教你理解曼哈顿距离的威力

用Python实战8数码问题A*算法与曼哈顿距离的黄金组合当你第一次接触A算法时是否曾被那些晦涩的理论公式和抽象概念劝退别担心今天我们将用最直观的方式——Python代码实战8数码问题带你真正理解为什么曼哈顿距离会成为A算法的黄金搭档。这不是一堂枯燥的理论课而是一次手把手的编程实践我们将用代码说话用数据证明。1. 从零搭建8数码问题框架在深入算法之前我们需要先构建8数码问题的基本框架。8数码问题就像一个3x3的滑块拼图有8个编号方块和一个空白格。我们的目标是通过滑动方块从初始状态到达目标状态。class PuzzleState: def __init__(self, board, parentNone, move): self.board board self.parent parent self.move move if parent: self.g parent.g 1 # 从初始状态到当前状态的实际代价 else: self.g 0 self.h 0 # 启发函数值 self.f 0 # 估价函数值 def __eq__(self, other): return self.board other.board def __lt__(self, other): return self.f other.f def __str__(self): return \n.join([ .join(map(str, row)) for row in self.board])这个PuzzleState类封装了8数码状态的核心属性board: 3x3的棋盘状态parent: 父状态用于回溯路径move: 从上一步到当前状态的移动方向g: 从初始状态到当前状态的实际步数h: 启发函数估计的剩余步数f: 总估价函数值(f g h)2. 两种启发函数的对决不在位元素 vs 曼哈顿距离启发函数是A*算法的灵魂所在它决定了算法有多聪明。我们将实现并对比两种经典启发函数2.1 不在位元素计数法这是最简单的启发函数仅统计不在目标位置的方块数量def h_misplaced(state, goal): 计算不在位的方块数量 count 0 for i in range(3): for j in range(3): if state.board[i][j] ! goal.board[i][j] and state.board[i][j] ! 0: count 1 return count这种方法计算简单但缺点也很明显——它忽略了每个方块需要移动的实际距离。一个方块可能离目标位置很远但只要位置正确就被认为已经到位。2.2 曼哈顿距离法曼哈顿距离得名于纽约曼哈顿的街道布局计算两点在网格上的水平和垂直距离之和def h_manhattan(state, goal): 计算所有方块的曼哈顿距离之和 distance 0 for i in range(3): for j in range(3): value state.board[i][j] if value ! 0: goal_pos find_position(value, goal.board) distance abs(i - goal_pos[0]) abs(j - goal_pos[1]) return distance def find_position(value, board): 查找特定值在目标状态中的位置 for i in range(3): for j in range(3): if board[i][j] value: return (i, j) return None曼哈顿距离更准确地反映了实际需要移动的步数因此通常能提供更好的启发信息。3. A*算法的核心实现有了状态表示和启发函数我们可以实现A*算法的主逻辑def a_star(start, goal, heuristic): open_set [] closed_set set() heapq.heappush(open_set, start) while open_set: current heapq.heappop(open_set) if current.board goal.board: return get_path(current) closed_set.add(tuple(map(tuple, current.board))) for neighbor in get_neighbors(current): if tuple(map(tuple, neighbor.board)) in closed_set: continue neighbor.h heuristic(neighbor, goal) neighbor.f neighbor.g neighbor.h # 检查是否在open_set中且具有更小的f值 found False for node in open_set: if node.board neighbor.board and node.f neighbor.f: found True break if not found: heapq.heappush(open_set, neighbor) return None # 无解算法流程解析初始化open集合优先队列和closed集合从open集合取出f值最小的状态如果是目标状态返回路径否则生成所有可能的邻居状态对每个邻居计算启发值和估价函数值如果邻居不在closed集合中且open集合中没有更优的相同状态则加入open集合4. 性能对比数据会说话让我们用一个具体例子来对比两种启发函数的性能初始状态1 2 3 4 0 6 7 5 8目标状态1 2 3 4 5 6 7 8 0运行结果对比指标不在位元素法曼哈顿距离法扩展节点数155生成节点数227运行时间(ms)3.21.1解路径长度33从数据可以明显看出曼哈顿距离法在各方面都优于简单的计数法。它扩展和生成的节点数更少运行速度更快同时能找到同样最优的解。5. 为什么曼哈顿距离更优秀曼哈顿距离之所以能提供更好的启发信息是因为它满足以下关键特性可采纳性(Admissibility): 曼哈顿距离永远不会高估实际成本保证能找到最优解一致性(Consistency): 对于任意相邻状态启发函数值的变化不超过实际移动成本信息丰富性: 相比简单的计数法曼哈顿距离包含了更多关于问题状态的信息在实际编码中我们还可以进一步优化曼哈顿距离的计算。例如预先计算每个数字的目标位置避免重复查找# 预计算目标位置 goal_positions {} for i in range(3): for j in range(3): goal_positions[goal.board[i][j]] (i, j) def optimized_manhattan(state): distance 0 for i in range(3): for j in range(3): value state.board[i][j] if value ! 0: goal_i, goal_j goal_positions[value] distance abs(i - goal_i) abs(j - goal_j) return distance这种优化在解决更大规模的拼图问题如15数码时尤为重要可以显著减少计算时间。6. 可视化搜索过程看算法如何思考为了更直观地理解A*算法的工作原理我们可以添加一些可视化功能def visualize_search(open_set, closed_set, current): print(f\n当前扩展节点 (f{current.f}, g{current.g}, h{current.h}):) print(current) print(\nOpen set中的最佳候选:) for i, node in enumerate(open_set[:3]): print(f#{i1}: f{node.f}, g{node.g}, h{node.h}) print(node) print(f\nClosed set大小: {len(closed_set)})通过这种可视化你可以看到算法如何优先扩展最有希望的节点动态调整搜索方向逐步接近目标状态7. 进阶技巧进一步提升A*算法效率虽然曼哈顿距离已经很优秀但我们还可以通过以下技巧进一步提升算法效率7.1 线性冲突优化当两个方块在同一行或列且都需要移动到对方的位置时会产生额外的移动成本def linear_conflict(state, goal): 计算线性冲突带来的额外曼哈顿距离 conflict 0 # 检查行冲突 for i in range(3): row state.board[i] goal_row goal.board[i] for j in range(3): if row[j] ! 0 and row[j] in goal_row: for k in range(j1, 3): if row[k] ! 0 and row[k] in goal_row: pos_j goal_row.index(row[j]) pos_k goal_row.index(row[k]) if pos_j pos_k: conflict 2 # 类似方法检查列冲突... return conflict7.2 模式数据库预先计算并存储特定子问题的解成本作为启发函数的额外信息源# 预计算角块模式数据库 corner_pattern_db { ((1,2,3), (4,0,6), (7,8,0)): 5, # 其他模式... } def pattern_database_heuristic(state): 使用模式数据库增强启发函数 key tuple(map(tuple, state.board)) return corner_pattern_db.get(key, 0) h_manhattan(state)7.3 双向A*搜索同时从初始状态和目标状态开始搜索在中间相遇def bidirectional_a_star(start, goal, heuristic): forward_open [] backward_open [] heapq.heappush(forward_open, start) heapq.heappush(backward_open, goal) forward_closed set() backward_closed set() while forward_open and backward_open: # 前向搜索一步 current_forward heapq.heappop(forward_open) if tuple(map(tuple, current_forward.board)) in backward_closed: return merge_paths(current_forward, backward_closed) # 后向搜索一步 current_backward heapq.heappop(backward_open) if tuple(map(tuple, current_backward.board)) in forward_closed: return merge_paths(forward_closed, current_backward) # 扩展节点...8. 从8数码到更大规模问题虽然我们以8数码为例但同样的技术可以应用于更大规模的拼图问题如15数码(4x4)甚至24数码(5x5)。关键区别在于状态表示: 更大的棋盘需要更高效的数据结构启发函数: 可能需要更复杂的启发函数或模式数据库内存管理: 更大的状态空间需要更智能的节点存储策略# 15数码的状态表示示例 class FifteenPuzzleState: def __init__(self, board, parentNone): self.board np.array(board).reshape(4,4) self.parent parent self.g parent.g 1 if parent else 0 self.h 0 self.f self.g self.h def __lt__(self, other): return self.f other.f在15数码问题中曼哈顿距离的优势更加明显。根据实测数据启发函数8数码扩展节点15数码扩展节点不在位元素法10,3741,000,000曼哈顿距离法2,183126,723线性冲突优化1,85798,4569. 常见陷阱与调试技巧在实现A*算法时新手常会遇到以下问题启发函数不可采纳: 导致找不到最优解检查是否满足h(n) ≤ h*(n)优先队列实现错误: 导致无法正确选择最佳节点确保实现了__lt__比较方法使用heapq模块维护优先队列状态重复扩展: 大幅降低效率确保closed set正确记录已扩展状态使用高效的数据结构如字典或集合内存爆炸: 处理大规模问题时考虑使用迭代加深A*(IDA*)实现状态压缩存储调试时可以添加以下检查点def debug_checks(current, open_set, closed_set): print(fCurrent: f{current.f}, g{current.g}, h{current.h}) print(fOpen set size: {len(open_set)}) print(fClosed set size: {len(closed_set)}) if current.parent: print(fParent move: {current.parent.move})10. 扩展应用A*算法在游戏开发中的实战A*算法不仅适用于拼图问题在游戏开发中也有广泛应用。例如在RPG游戏中实现NPC寻路class GameMap: def __init__(self, width, height, obstacles): self.width width self.height height self.obstacles set(obstacles) def heuristic(self, pos1, pos2): 游戏地图中的曼哈顿距离 return abs(pos1[0] - pos2[0]) abs(pos1[1] - pos2[1]) def get_neighbors(self, pos): 获取可移动的相邻位置 x, y pos neighbors [] for dx, dy in [(0,1),(1,0),(0,-1),(-1,0)]: # 四方向移动 nx, ny x dx, y dy if 0 nx self.width and 0 ny self.height: if (nx, ny) not in self.obstacles: neighbors.append((nx, ny)) return neighbors def game_pathfinding(start, goal, game_map): 游戏中的A*寻路实现 open_set [] heapq.heappush(open_set, (0, start)) came_from {} g_score {start: 0} f_score {start: game_map.heuristic(start, goal)} while open_set: current heapq.heappop(open_set)[1] if current goal: return reconstruct_path(came_from, current) for neighbor in game_map.get_neighbors(current): tentative_g g_score[current] 1 if neighbor not in g_score or tentative_g g_score[neighbor]: came_from[neighbor] current g_score[neighbor] tentative_g f_score[neighbor] tentative_g game_map.heuristic(neighbor, goal) heapq.heappush(open_set, (f_score[neighbor], neighbor)) return None # 无路径在这个游戏寻路实现中我们同样使用了曼哈顿距离作为启发函数但根据游戏特点做了适当调整只考虑上下左右四个移动方向加入了障碍物检测使用坐标而非棋盘状态表示位置

更多文章

前端开发 2026/4/20 0:01:36

CSS如何制作导航栏平滑滚动到锚点位置_使用scroll-behavior平滑属性

scroll-behavior: smooth 最常见失效原因是未正确作用于滚动容器，应设在 html 上而非 body；与 sticky 导航栏冲突时需用 scroll-margin-top 为锚点元素留白；Safari 15.4 才支持 smooth，15.0–15.3 及所有 IE 不支持。scroll-behav…

北京亦庄：机器人半马现意外在北京亦庄南海子公园的终点线前，“天工Ultra”曾是去年北京亦庄人形机器人半程马拉松的王者，以2小时40分42秒的成绩夺冠。但在今年的比赛中，它触线后未停下，径直冲入路边绿化带，…

张开发

前端开发 2026/4/19 22:58:57

知识图谱化技术实体链接与知识推理的实现

知识图谱化技术：实体链接与知识推理的实现在当今大数据时代，知识图谱作为结构化知识的重要载体，广泛应用于搜索引擎、智能问答和推荐系统等领域。其中，实体链接与知识推理是知识图谱构建与应用的核心技术。实体链接旨在将文本中…

张开发

别再死记硬背A*算法了！用Python实战8数码问题，手把手教你理解曼哈顿距离的威力

最新文章

观《太平年》：以文脉续根脉，以和平赴复兴

AGI因果推理瓶颈攻坚实录（2024全球仅12家实验室突破的反事实建模技术）

YOLO26涨点改进| TGRS 2026 | 独家自研创新、检测头改进篇| AHATHead自适应混合注意力检测头，二次创新，强化特征表达与目标判别能力，适合遥感小目标检测、小目标检测有效涨点

三步解锁Switch潜能：大气层系统从零到精通的实践指南

用AI做了个小游戏（二）

STTN算法研究

推荐文章

嵌入式工程师避坑指南：RK817 PMU在无电池场景下的5个关键配置点

保姆级教程：在S32K312上配置EMIOS0生成PWM信号（附完整代码）

SQL嵌套查询导致内存溢出_改写为连接查询的方法

生化4重制版0xc000007b错误快速修复 2026通用指南

保姆级教程：用Python+Dlib+OpenCV搭建一个实时人脸识别系统（附完整代码）

CSS Sprites：从性能优化到现代前端实践的全景解析

相关文章

高效掌握多步提示工程：进阶AI任务处理的系统方法论

浏览器资源嗅探终极指南：如何轻松下载网页视频与音频

OPEN实战：基于深度强化学习的多无人机追逃在线规划，如何跨越仿真到现实的鸿沟？

从Depth Anything到Video版本：揭秘字节跳动如何用时空注意力突破视频深度估计瓶颈

终极指南：如何使用ChampR构建高性能英雄联盟游戏助手

GLM-4.1V-9B-Base效果展示：中文手绘草图→功能描述→技术实现建议生成

分享文章

更多文章

CSS如何制作导航栏平滑滚动到锚点位置_使用scroll-behavior平滑属性

Cats Blender插件：VRChat模型优化的革命性自动化解决方案

AGI供应链优化不是算法竞赛，而是“物理世界+商业逻辑+实时反馈”的三重耦合（仅限头部制造/零售CTO参阅）

TQVaultAE：泰坦之旅装备管理的革命性解决方案，告别仓库空间不足的烦恼

手把手教你用Chrome/Firefox开发者工具一眼看穿网站用的是DV、OV还是EV证书

【颠覆性标准】：SITS2026不是又一个LLM榜单——它首次引入动态情境迁移率（DSR≥0.68）与跨模态意图保真度（CIF≥91.3%）双硬指标

从Actor模型到实战：Skynet轻量级游戏服务器框架的设计哲学与核心机制

怎么部署OpenClaw？2026年华为云部署OpenClaw配置Coding Plan喂奶级流程

【AGI合规生死线】：2026奇点大会划定的4个法律红线，超期未整改将触发自动审计

视觉幻觉正在瓦解AGI可信边界：3个真实事故复盘+空间推理置信度量化协议（IEEE P2851草案核心条款）

人形机器人半马：进步与失控并存，短板暴露促进行业迭代

知识图谱化技术实体链接与知识推理的实现