斯坦福：强化学习生物约束型虚拟细胞建模

张开发

• 2026/4/14 13:08:28 • 15 分钟阅读

分享文章

摘要利用生成模型构建虚拟细胞以在硅基平台模拟细胞行为正成为加速药物研发的新兴范式。但现有基于图像的生成方法易生成违背基础物理与生物约束的不合理细胞图像。针对该问题本文提出采用强化学习RL对虚拟细胞模型进行后训练将具有生物学意义的评估器作为奖励函数。本文设计了涵盖生物功能、结构有效性、形态正确性3大类的7项奖励对当前最优的CellFlux模型斯坦福哈佛医学院虚拟细胞图像生成基础模型进行优化得到CellFluxRL。在所有奖励指标上CellFluxRL均优于原始CellFlux结合测试时缩放策略可进一步提升性能。总体而言本文提出的虚拟细胞建模框架通过强化学习施加基于物理的约束将细胞生成从「视觉逼真」推进至「生物学有意义」的层面。#虚拟细胞建模 #强化学习 #生物约束 #流匹配 #生成模型 #细胞形态模拟 #药物发现引言图1细胞生成失效案例细胞生成模型的失效示例。例如生成的细胞核出现在细胞质外部。图2研究动机现有用于模拟细胞扰动的生成模型无法生成物理合理的细胞图像。例如细胞核可能出现在细胞膜外。本文设计1套具有生物学意义的验证器承担3种角色(1) 作为评估器评判生成图像的生物合理性(2) 作为奖励信号通过强化学习优化生成效果(3) 作为验证模块通过测试时缩放提升样本质量。方法基于生物奖励的强化学习图3CellFluxRL算法流程CellFluxRL算法。强化学习后训练旨在提升高奖励样本的生成概率降低低奖励样本的生成概率。因此CellFluxRL的核心训练循环由采样与训练交替阶段构成。(a) 采样阶段从固定的对照细胞图像与扰动条件生成多个rollout样本并用奖励模型打分(b) 训练阶段由于流匹配的精确似然难以求解本文从1批rollout样本中构建正向与反向速度场通过对比优化实现目标方法遵循DiffusionNFT。结果实验细节表1生物奖励与生成质量指标的定量对比每行代表不同评估指标每列代表不同方法。TTS指采用N4的最优样本选择策略进行测试时缩放的CellFluxRL按加权总奖励选择最优样本。加粗值为最优性能下划线值为次优性能。强化学习带来性能提升图4定性对比CellFluxRL生成更贴合生物规律的图像能更精准地复现药物诱导的形态变化。在这些示例中依托泊苷诱导的细胞圆化、秋水仙胺介导的微管解聚、AZ138相关的细胞收缩均被更真实地还原顺铂处理后的细胞密度也与真实情况更匹配。测试时缩放TTS进一步将生成结果向真实目标图像优化。测试时缩放进一步提升效果图5基于最优N样本选择的测试时缩放效果从N个rollout样本中选择总奖励加权组合最高的样本绘制各单项奖励结果。在所有奖励指标上强化学习后模型橙色的缩放效果始终优于基础模型蓝色。KL散度权重的敏感性分析图6KL权重β的敏感性分析每个子图展示强化学习后训练的模型奖励随β值的变化趋势。单奖励优化消融实验表2 基于强化学习的单奖励优化每列代表仅优化单项奖励的模型或优化全部奖励的CellFluxRL每行代表不同评估指标。加粗值为最优性能下划线值为次优性能虚下划线值为第3优性能。详细总结思维导图生物有效性全面超越基线参考CellFluxRL: Biologically-Constrained Virtual Cell Modeling via Reinforcement Learninghttps://doi.org/10.48550/arXiv.2603.21743260405CellFluxRL.pdf注AI辅助创作如有错误欢迎指出。内容仅供参考不构成任何建议。

更多文章

前端开发 2026/4/14 13:07:40

Equalizer APO终极指南：如何免费实现Windows系统级音频均衡器优化

Equalizer APO终极指南：如何免费实现Windows系统级音频均衡器优化【免费下载链接】equalizerapo Equalizer APO mirror 项目地址: https://gitcode.com/gh_mirrors/eq/equalizerapo 你是否曾经想过，为什么同样的音乐在不同的设备上听起来差别那么…

Window Resizer完整指南：5步掌握强制调整Windows窗口大小的终极方法【免费下载链接】WindowResizer 一个可以强制调整应用程序窗口大小的工具项目地址: https://gitcode.com/gh_mirrors/wi/WindowResizer 还在为某些应用程序窗口无法调整大小而烦恼吗&…

张开发

前端开发 2026/4/14 12:51:05

LeNet-5实战：UCM遥感数据集21类场景分类详解

1. UCM遥感数据集详解 UCM数据集全称UC Merced Land-Use Dataset，是遥感图像分类领域的经典基准数据集。我第一次接触这个数据集时，就被它清晰的类别划分和规整的图像质量所吸引。这个数据集包含21类典型的地表场景，每类100张256256像素的RGB…

张开发

斯坦福：强化学习生物约束型虚拟细胞建模

最新文章

全网最全Java高级面试题汇总

AI大模型就业指南，盘点大模型热门就业方向有哪些？非常详细收藏我这一篇就够了

3步告别抢票烦恼：大麦网自动化抢票工具实战指南

Kali Linux下Vulnhub-CTF6靶机渗透实战：从信息收集到udev提权完整流程

从钟楼到穹顶，读懂一座教堂的城市记忆

别再手动画了！Cadence Allegro PCB设计，用这个隐藏功能5分钟搞定测试点（附10/50mil焊盘文件）

推荐文章

⑩【从0制作自己的ros导航小车：上位机篇】05、导航！

从NUSTCTF Ezjava1看Java Web参数绑定与条件竞争漏洞挖掘

SITS2026现场直击：LLM-native NLP架构设计原则（含可复用的5层抽象模型图谱）

AHT20温湿度传感器库深度解析与工业级应用实践

Rust的引用计数智能指针Rc与Arc在线程共享中的内部可变性

libhv实战：从零构建一个功能完备的HTTP客户端

相关文章

高效掌握多步提示工程：进阶AI任务处理的系统方法论

浏览器资源嗅探终极指南：如何轻松下载网页视频与音频

OPEN实战：基于深度强化学习的多无人机追逃在线规划，如何跨越仿真到现实的鸿沟？

从Depth Anything到Video版本：揭秘字节跳动如何用时空注意力突破视频深度估计瓶颈

终极指南：如何使用ChampR构建高性能英雄联盟游戏助手

GLM-4.1V-9B-Base效果展示：中文手绘草图→功能描述→技术实现建议生成

分享文章

更多文章

Equalizer APO终极指南：如何免费实现Windows系统级音频均衡器优化

3分钟极速安装：TrollInstallerX让TrollStore安装从未如此简单

英雄联盟终极助手：League Akari 完整使用指南与实战技巧

在Ubuntu20.04上搭建Gazebo仿真环境：从零开始运行ROS小车模型

Lychee-Rerank赋能互联网广告推荐：提升广告与用户意图匹配度

视频字幕制作革命：VideoSrt让语音识别字幕生成效率提升500%

AI Agent在智能投研中的实战：多智能体信息整合与策略生成

liquidctl RGB控制详解：打造个性化灯光效果

图形学进阶|屏幕空间反射(SSR)的优化与实现

组态王KingSCADA连接S7-1200避坑指南：IOserver配置、变量映射与网络站点管理的那些坑

Window Resizer完整指南：5步掌握强制调整Windows窗口大小的终极方法

LeNet-5实战：UCM遥感数据集21类场景分类详解