OpenClaw技能开发入门：为Phi-3-vision制作商品截图分析插件

张开发

• 2026/4/7 17:12:47 • 15 分钟阅读

分享文章

OpenClaw技能开发入门为Phi-3-vision制作商品截图分析插件1. 为什么需要商品截图分析技能上周我在整理双十一购物清单时发现手动对比不同平台的商品价格和促销信息简直是一场噩梦。每次都要反复截图、整理、记录效率低下还容易出错。这让我意识到如果能用OpenClaw自动分析商品截图提取关键信息并生成比价报告该有多好。经过两天折腾我成功开发了一个基于Phi-3-vision模型的商品截图分析插件。这个技能可以自动识别截图中的商品名称、价格、促销标签提取商品规格参数和关键卖点生成结构化比价数据供后续分析最让我惊喜的是整个开发过程比想象中简单——从环境准备到技能发布只用了不到200行代码。下面我就分享这个插件的完整开发历程。2. 开发环境准备2.1 基础工具链配置首先确保本地已安装OpenClaw核心组件以macOS为例# 检查OpenClaw版本 openclaw --version # 安装ClawHub CLI工具 npm install -g clawhublatest2.2 Phi-3-vision模型接入在~/.openclaw/openclaw.json中添加模型配置{ models: { providers: { phi3-vision: { baseUrl: http://localhost:8000/v1, // vLLM服务地址 apiKey: your-api-key, api: openai-completions, models: [ { id: phi-3-vision-128k, name: Phi-3 Vision, contextWindow: 128000, vision: true } ] } } } }重启网关服务使配置生效openclaw gateway restart3. 技能开发全流程3.1 创建技能脚手架使用ClawHub初始化项目clawhub init screenshot-analyzer -t openclaw-skill cd screenshot-analyzer生成的标准目录结构包含package.json技能元数据src/index.js主逻辑文件configs/配置文件模板test/测试用例3.2 核心逻辑实现在src/index.js中编写分析逻辑const { BaseSkill } require(openclaw-sdk); class ScreenshotAnalyzer extends BaseSkill { async analyze(imagePath) { // 1. 图片预处理 const processedImage await this.preprocess(imagePath); // 2. 调用Phi-3-vision模型 const prompt 分析这张电商商品截图提取以下信息为JSON格式 - 商品名称 - 当前价格 - 原价如有折扣 - 促销标签 - 关键规格参数; const response await this.models.phi3Vision.chat({ messages: [{ role: user, content: [ { type: text, text: prompt }, { type: image_url, image_url: processedImage } ] }] }); // 3. 结果格式化 return this.formatResult(response.choices[0].message.content); } async preprocess(imagePath) { // 实现截图裁剪、尺寸调整等预处理 // 返回base64编码图像 } formatResult(rawText) { // 解析模型输出的JSON字符串 // 添加时间戳等元数据 } } module.exports ScreenshotAnalyzer;3.3 配置技能元数据在package.json中声明技能能力{ name: screenshot-analyzer, capabilities: { image_analysis: { description: 电商商品截图分析, parameters: { image_path: string } } } }4. 电商价格监控实战案例4.1 自动化监控脚本创建examples/price-monitor.js实现定时任务const claw require(openclaw); const analyzer require(../src); async function monitor() { // 1. 自动截图需配合浏览器插件 const screenshot await claw.capture(https://www.taobao.com); // 2. 调用分析技能 const result await analyzer.analyze(screenshot); // 3. 存储分析结果 await claw.db.insert(price_records, { product: result.name, current_price: result.price, timestamp: new Date() }); // 4. 价格波动提醒 if (result.price claw.env.get(ALERT_PRICE)) { await claw.notify(价格预警${result.name}降至${result.price}); } } // 每小时执行一次 claw.schedule(0 * * * *, monitor);4.2 结果可视化通过OpenClaw面板添加简单看板claw.dashboard.create(price-trend, { title: 价格趋势监控, type: line-chart, query: SELECT timestamp, current_price FROM price_records, refresh: 3600 // 每小时刷新 });5. 技能调试与发布5.1 本地测试方法启动调试模式clawhub dev --watch测试命令示例curl -X POST http://localhost:18789/skills/screenshot-analyzer/analyze \ -H Content-Type: application/json \ -d {image_path:/path/to/screenshot.png}5.2 发布到技能市场打包并发布技能clawhub pack clawhub publish --public发布后其他用户可通过以下命令安装clawhub install screenshot-analyzer6. 开发经验与避坑指南在实际开发中我遇到了几个典型问题图片尺寸问题Phi-3-vision对输入图像有尺寸限制需要在预处理阶段统一调整为1024x1024像素否则会导致API调用失败。结果格式化模型有时会返回非标准JSON我最终添加了JSON修复逻辑function safeParse(jsonStr) { try { return JSON.parse(jsonStr); } catch { // 尝试修复常见格式错误 const fixed jsonStr.replace(/(\w):/g, $1:); return JSON.parse(fixed); } }价格识别优化针对不同电商平台的价签样式我收集了100样例图片进行few-shot提示以下是价签示例 - ¥199 → 199 - 129.00 → 129 - 促销价: $99 → 99 请按相同格式解析...这个项目的完整代码已开源在GitHub包含更多细节处理和错误恢复逻辑。通过这次开发我深刻体会到OpenClaw技能生态的灵活性——不需要复杂架构就能快速实现有价值的自动化工具。获取更多AI镜像想探索更多AI镜像和应用场景访问 CSDN星图镜像广场提供丰富的预置镜像覆盖大模型推理、图像生成、视频生成、模型微调等多个领域支持一键部署。

更多文章

前端开发 2026/4/7 17:11:11

Dr. Memory快速入门：5个简单步骤检测内存泄漏

Dr. Memory快速入门：5个简单步骤检测内存泄漏【免费下载链接】drmemory Memory Debugger for Windows, Linux, Mac, and Android 项目地址: https://gitcode.com/gh_mirrors/dr/drmemory Dr. Memory是一款功能强大的内存调试工具，能够帮助开发者…

张开发

前端开发 2026/4/7 17:10:58

odiff在大型项目中的应用：处理25000+图像快照的最佳实践

odiff在大型项目中的应用：处理25000图像快照的最佳实践【免费下载链接】odiff A very fast SIMD-first image comparison library (with nodejs API) 项目地址: https://gitcode.com/gh_mirrors/od/odiff odiff是一个基于SIMD技术的超快速图像对比库&#x…

张开发

前端开发 2026/4/7 17:10:52

隐私优先：OpenClaw+百川2-13B量化模型本地化医疗数据整理

隐私优先：OpenClaw百川2-13B量化模型本地化医疗数据整理 1. 为什么选择本地化方案处理医疗数据去年参与一个医疗数据分析项目时，团队最初考虑使用云端大模型API处理患者检查报告。但在签署数据保密协议时，我们意识到一个问题：即…

张开发

$如何创建专业学术简历：Bill Ryan优雅LaTeX模板的终极指南$

前端开发 2026/4/7 17:10:04

如何创建专业学术简历：Bill Ryan优雅LaTeX模板的终极指南

如何创建专业学术简历：Bill Ryan优雅LaTeX模板的终极指南【免费下载链接】resume An elegant \LaTeX\ rsum template. 大陆镜像 https://gods.coding.net/p/resume/git 项目地址: https://gitcode.com/gh_mirrors/re/resume 在学术研究和职业发展中&#xf…

张开发

前端开发 2026/4/7 17:10:04

还在为网页资源无法保存而烦恼？猫抓浏览器扩展让视频音频提取变得如此简单

还在为网页资源无法保存而烦恼？猫抓浏览器扩展让视频音频提取变得如此简单【免费下载链接】cat-catch 猫抓浏览器资源嗅探扩展 / cat-catch Browser Resource Sniffing Extension 项目地址: https://gitcode.com/GitHub_Trending/ca/cat-catch 你是否曾遇到…

张开发

前端开发 2026/4/7 17:07:45

qemu-user-static架构设计解析：从RPM包到Docker镜像的完整转换流程

qemu-user-static架构设计解析：从RPM包到Docker镜像的完整转换流程【免费下载链接】qemu-user-static :earth_africa: /usr/bin/qemu-*-static 项目地址: https://gitcode.com/gh_mirrors/qe/qemu-user-static qemu-user-static是一个强大的工具集合&#x…

张开发

前端开发 2026/4/7 17:06:08

软件架构决策记录(ADR)实战：Awesome Software Architecture团队协作秘籍

软件架构决策记录(ADR)实战：Awesome Software Architecture团队协作秘籍【免费下载链接】awesome-software-architecture A curated list of resources on software architecture 项目地址: https://gitcode.com/gh_mirrors/awe/awesome-software-architecture …

张开发

前端开发 2026/4/7 17:02:40

从原理图到PCB：手把手教你设计一个兼容JTAG和SWD的20Pin调试接口（附Altium Designer/立创EDA实战）

从原理图到PCB：手把手教你设计一个兼容JTAG和SWD的20Pin调试接口（附Altium Designer/立创EDA实战） 调试接口是嵌入式硬件开发中不可或缺的一部分，它如同硬件工程师的"听诊器"，让我们能够深入观察和诊断系统的…

张开发

前端开发 2026/4/7 17:01:15

React Native Tab View 终极测试指南：单元测试与集成测试最佳实践

React Native Tab View 终极测试指南：单元测试与集成测试最佳实践【免费下载链接】react-native-tab-view A cross-platform Tab View component for React Native 项目地址: https://gitcode.com/gh_mirrors/re/react-native-tab-view React Native Tab Vi…

张开发

前端开发 2026/4/7 17:00:39

React Native Tab View终极指南：快速构建音乐播放器和聊天应用

React Native Tab View终极指南：快速构建音乐播放器和聊天应用【免费下载链接】react-native-tab-view A cross-platform Tab View component for React Native 项目地址: https://gitcode.com/gh_mirrors/re/react-native-tab-view React Native Tab View是…

张开发

前端开发 2026/4/7 16:57:56

风电光伏场景并加以削减，以探索不同场景下的能源利用效率与成本优化策略

风电光伏的场景生成与消减-matlab代码可利用蒙特卡洛模拟或者拉丁超立方生成光伏和风电出力场景，并采用快速前推法或同步回代消除法进行削减，可以对生成场景数和削减数据进行修改，下图展示的为1000个场景削减至10个典型场景，并获…

张开发

前端开发 2026/4/7 16:57:07

Grimoire 安全机制：Lucia身份验证与用户权限管理

Grimoire 安全机制：Lucia身份验证与用户权限管理【免费下载链接】grimoire Bookmark manager for the wizards 🧙 项目地址: https://gitcode.com/gh_mirrors/gr/grimoire Grimoire 作为一款面向巫师的书签管理器，不仅提供强大的书签…

张开发

OpenClaw技能开发入门：为Phi-3-vision制作商品截图分析插件

最新文章

[IT Network]如何在cisco packet tracer建立ssh的連線?

OpenClaw备份恢复：百川2-13B-4bits量化版技能与配置迁移

【架构实战】图数据库Neo4j在社交系统中的应用

告别环境配置！用LabelMe.exe在Windows上5分钟搞定图像标注（附数据格式转换技巧）

突破帧率限制：AI补帧技术如何告别动态视觉卡顿烦恼

多语言实战：双向A*算法在机器人路径规划中的性能优化与工程实现

推荐文章

突破手游操控瓶颈：QtScrcpy虚拟映射技术全解析

Flutter Riverpod：状态管理的新纪元

WintunAdapter 设计解析：一个 VNP 数据面的无锁优雅实现

Arduino二进制模拟时钟库：LED阵列驱动的轻量级时间可视化方案

RP2040硬件加速步进电机控制库picoasyncstepper

minimal-json：嵌入式C语言轻量级JSON解析器

相关文章

高效掌握多步提示工程：进阶AI任务处理的系统方法论

浏览器资源嗅探终极指南：如何轻松下载网页视频与音频

OPEN实战：基于深度强化学习的多无人机追逃在线规划，如何跨越仿真到现实的鸿沟？

从Depth Anything到Video版本：揭秘字节跳动如何用时空注意力突破视频深度估计瓶颈

终极指南：如何使用ChampR构建高性能英雄联盟游戏助手

GLM-4.1V-9B-Base效果展示：中文手绘草图→功能描述→技术实现建议生成

分享文章

更多文章

Dr. Memory快速入门：5个简单步骤检测内存泄漏

odiff在大型项目中的应用：处理25000+图像快照的最佳实践

隐私优先：OpenClaw+百川2-13B量化模型本地化医疗数据整理

如何创建专业学术简历：Bill Ryan优雅LaTeX模板的终极指南

还在为网页资源无法保存而烦恼？猫抓浏览器扩展让视频音频提取变得如此简单

qemu-user-static架构设计解析：从RPM包到Docker镜像的完整转换流程

软件架构决策记录(ADR)实战：Awesome Software Architecture团队协作秘籍

从原理图到PCB：手把手教你设计一个兼容JTAG和SWD的20Pin调试接口（附Altium Designer/立创EDA实战）

React Native Tab View 终极测试指南：单元测试与集成测试最佳实践

React Native Tab View终极指南：快速构建音乐播放器和聊天应用

风电光伏场景并加以削减，以探索不同场景下的能源利用效率与成本优化策略

Grimoire 安全机制：Lucia身份验证与用户权限管理