龙虾-OpenClaw一文详细了解-手搓OpenClaw-1

张开发
2026/4/9 9:14:36 15 分钟阅读

分享文章

龙虾-OpenClaw一文详细了解-手搓OpenClaw-1
龙虾-OpenClaw一文详细了解-手搓OpenClaw-1这一系列我会用 Python 一步步手搓一个“可运行、可扩展、可解释”的 OpenClaw 简化版。第一篇先不追求功能多而是先搭好最重要的骨架服务入口、会话并发模型、最小 Agent Loop。0. 为什么要手搓 OpenClawOpenClaw 很强但完整工程体量也很大。对于大多数开发者来说直接阅读全量代码会有三个痛点模块多Gateway、Agent、Tools、Sessions、Channels 互相耦合路径长一条消息从输入到回复跨越多个子系统调试难没有自己的“最小版本”很难定位问题所以这个系列采用一个更实用的学习路径先做最小闭环再逐步补齐能力。1. 目标用 Python 从 0 到 1 复现 OpenClaw 的核心能力Agent Loop工具调用 多轮推理Session 与并发隔离记忆系统短期 长期Skills 系统分层加载Web/Telegram 等渠道接入第一篇的阶段目标是跑起 FastAPI 服务打通一个最小/v1/chat对话接口具备会话隔离与并发控制每会话锁 全局信号量2. 目标架构用户输入: CLI/Web/Telegram/DiscordGateway ServerSessionManagerSession Lock Global SemaphoreAgent LoopPrompt BuilderLLM Provider AdapterTool Runtimeexec/web/search/read/write...Memory Manager短期会话历史长期记忆: MEMORY.md 日志Knowledge RAGBM25 Embedding RRF RerankSkill RegistryL1 元数据L2 指令加载L3 资源加载Cron Scheduler3. 技术选型语言Python 3.11服务框架FastAPIWeb/Dashboard/API 一体模型接入先用简化 Provider 抽象后续切真实 OpenAI Compatible并发模型asyncio 每会话Lock 全局Semaphore配置与数据模型Pydantic v2pydantic-settings日志标准logging后续可升级 JSON 结构化日志任务调度APScheduler后续阶段引入数据库第一篇先不强依赖阶段二引入PostgreSQL pgvector4. 第一篇完成了什么本篇配套工程目录openclaw_py下载地址:https://gitee.com/wisdomfriend/openclaw_py已经有这些关键模块app/main.pyFastAPI 启动入口app/api/routes_chat.py最小聊天接口app/session/manager.py会话复用 并发控制app/core/agent.py最小 Agent Loop先支持 echo 与工具占位app/core/tools.py工具注册与调用骨架run.py一键启动uvicorn.env与requirements.txt本地运行基础配置5. 如何运行可复制cdopenclaw_py python-mvenv .venv .venv\Scripts\activate pipinstall-rrequirements.txt python run.py服务启动后健康检查http://127.0.0.1:7788/healthOpenAPI 文档http://127.0.0.1:7788/docs测试聊天接口PowerShellcurl-XPOSThttp://127.0.0.1:7788/v1/chat^-HContent-Type: application/json^-d{\session_id\:\demo\,\message\:\hello\}6. 设计细节为什么 SessionManager 要先做很多人一开始只关心 LLM 调用但真实系统更容易先死在并发上。如果同一个session_id同时进两条消息不加锁就会出现历史消息交错写入上下文错乱回复“串台”工具调用顺序被打乱所以第一篇就把这一层打好同一会话串行asyncio.Lock全局会话限流asyncio.Semaphore这一步是后面做“记忆系统”和“多渠道接入”的地基。from__future__importannotationsimportasynciofromcontextlibimportasynccontextmanagerfromtypingimportAsyncIteratorfromapp.configimportsettingsfromapp.core.agentimportAgentclassSessionManager:def__init__(self,max_concurrent:int4)-None:self._sessions:dict[str,Agent]{}self._locks:dict[str,asyncio.Lock]{}self._semaphoreasyncio.Semaphore(max_concurrent)defget_or_create(self,session_id:str)-Agent:ifsession_idnotinself._sessions:self._sessions[session_id]Agent()returnself._sessions[session_id]defget_lock(self,session_id:str)-asyncio.Lock:ifsession_idnotinself._locks:self._locks[session_id]asyncio.Lock()returnself._locks[session_id]asynccontextmanagerasyncdefacquire(self,session_id:str)-AsyncIterator[None]:lockself.get_lock(session_id)asyncwithlock:asyncwithself._semaphore:yielddef__len__(self)-int:returnlen(self._sessions)_session_managerSessionManager(max_concurrentsettings.max_concurrent_agents)defget_session_manager()-SessionManager:return_session_manager7. 这篇没做什么为了保证节奏清晰第一篇有意不做不接真实大模型 API先保留 Provider 接口不做复杂工具协议先保留 Tool Runtime 骨架不做数据库与向量检索留给阶段二不做 Telegram/Discord 真接入留给阶段三8. 常见坑与排查端口占用把.env里的PORT改掉全局环境依赖冲突优先用.venv不要直接污染系统 Python9. 下一篇预告下一篇我会接入真实的OpenAI-Compatible Provider把当前的EchoProvider替换掉内容包括.env增加OPENAI_API_KEY与OPENAI_BASE_URLProvider 抽象如何兼容不同模型厂商超时、重试、错误映射的最小实现到那时这个项目就会从“骨架”进化成“真能聊天的 Agent”。

更多文章