AI绘画神器Stable Diffusion入门：输入文字就能生成精美图片的简单方法

张开发

• 2026/4/14 11:10:24 • 15 分钟阅读

分享文章

AI绘画神器Stable Diffusion入门输入文字就能生成精美图片的简单方法1. 前言从想法到画面只需一句话你有没有过这样的时刻脑子里突然冒出一个绝妙的画面——也许是月光下漫步的独角兽也许是赛博朋克都市的霓虹雨夜或者只是想要一张“戴着眼镜看书的小猫”的可爱图片。以前要把这些想法变成真实的图像你需要学习绘画、掌握设计软件或者花钱请人创作。现在情况完全不同了。今天我要介绍的 Stable Diffusion就是一个能听懂你描述、帮你把文字变成图片的AI绘画工具。你不需要任何美术基础不需要学习复杂的软件甚至不需要懂技术原理。只要你会用中文描述想法然后简单翻译成英文它就能在几十秒内给你生成一张独一无二的图片。我刚开始接触 Stable Diffusion 时也被它的能力震撼到了。从简单的“一只猫”到复杂的“未来城市中机器人正在咖啡馆里喝咖啡窗外是飞行汽车”它都能理解并尝试呈现。虽然有时候结果会有点“抽象艺术”的感觉但更多时候你会得到远超预期的精美作品。这篇文章就是为你这样的完全新手准备的。我会用最直白的方式带你从零开始一步步学会怎么用 Stable Diffusion 生成你的第一张AI图片。我们用的版本是经典的stable-diffusion-v1-5-archive它稳定、轻量对电脑配置要求不高非常适合入门。2. 准备工作打开你的AI画板在开始画画之前我们得先准备好“画板”和“画笔”。别担心这个过程比安装一个普通软件还要简单。2.1 访问你的专属AI绘画工作室如果你已经在CSDN星图等平台部署好了stable-diffusion-v1-5-archive镜像那么最困难的部分已经完成了。现在你只需要打开浏览器。在你的浏览器地址栏里输入以下地址请将你的服务器IP替换成你实际的服务IP地址http://你的服务器IP:7860举个例子如果你的服务器IP是192.168.1.100那么你就输入http://192.168.1.100:7860按下回车稍等几秒钟一个简洁的网页界面就会加载出来。这就是 Stable Diffusion 的 WebUI网页用户界面也是我们接下来要操作的“画板”。它的界面看起来可能有点简单但功能都藏在里面了。第一次打开时系统可能需要一点时间加载模型这是正常的。如果页面成功显示恭喜你你已经成功了一大半2.2 认识你的创作界面让我们快速浏览一下这个界面知道每个地方是干什么的。你可以对照着下面的简化布局图来看[ 网页顶部Stable Diffusion 标题 ] [ 左侧大区域Prompt (正向提示词) ] 在这里用英文描述你“想要”的画面。 [ 左侧下方Negative Prompt (负面提示词) ] 在这里用英文描述你“不想要”的画面元素。 [ 右侧区域生成参数 ] Steps (步数)控制绘画的精细度。 Guidance Scale (引导系数)控制AI听话的程度。 Width/Height (宽/高)设置图片尺寸。 Seed (种子)控制图片的随机性。 [ 中间下方一个大大的 Generate (生成) 按钮 ] 点击它魔法就开始啦 [ 右侧下方图片显示区域 ] 生成的图片会出现在这里。界面看起来很清爽对吧我们不需要一下子搞懂所有参数。对于第一次使用你只需要关注三个地方Prompt输入框、Generate按钮和图片显示区域。其他的我们可以先用默认值。3. 第一次创作生成你的第一张AI图片好了理论知识到此为止。现在让我们动手生成第一张图片。这个过程就像用搜索引擎一样简单输入关键词点击按钮等待结果。3.1 写下你的第一个“魔法咒语”在Prompt提示词输入框里我们需要用英文告诉AI我们想要什么。是的模型是英文训练的所以用英文效果最好。别担心不需要复杂的句子几个关键词就行。这里给你一个绝对能出效果的“新手友好咒语”a cute cat, fluffy, big eyes, sitting on a sofa, sunny room, detailed, high quality翻译过来就是“一只可爱的猫毛茸茸的大眼睛坐在沙发上阳光充足的房间细节丰富高质量”。你可以直接复制粘贴这段文字到 Prompt 框里。这就是我们的“绘画指令”。3.2 点击按钮见证魔法现在把目光移到界面中间偏下的位置找到那个最大的按钮——Generate生成。深吸一口气带着一点期待点击它。点击之后你会看到按钮可能变成“Processing…”或者“Running…”图片显示区域会出现一个进度条。这意味着AI正在努力理解你的文字并在它的“想象”中作画。根据你的服务器性能这个过程通常需要10秒到1分钟。第一次生成可能会稍慢一点因为系统需要把模型完全加载到内存里。请耐心等待。3.3 欣赏你的作品当进度条走完你的第一张AI生成图片就会出现在右侧的显示区域它可能是一只非常写实的猫也可能是一只卡通风格的猫。毛发的质感、眼睛的光泽、沙发的纹理、阳光的感觉……所有这些都来自于你刚才输入的那一串英文单词。怎么样是不是感觉很神奇你没有画一笔一划但一张图片就这样诞生了。这就是 Stable Diffusion 的魅力。如果生成的图片和你想象的有点出入或者你想看看AI还能画出什么别的猫很简单——再次点击那个 Generate 按钮。每次点击AI都会基于同样的描述重新“想象”并画出一张全新的、不同的图片。你可以多生成几次看看AI的创意有多丰富。4. 掌握核心技巧如何让AI画出你心中的画面生成了第一张图你可能已经跃跃欲试想画点更复杂、更符合自己想法的东西了。别急我们还需要掌握几个核心技巧才能从“随机抽卡”变成“精准控制”。4.1 写出更好的“提示词”Prompt提示词是控制AI的核心。写得好出神入化写得不好鬼斧神工字面意思。一个好的提示词就像给画师的详细简报。一个有效的提示词结构通常包含这些部分主体 (Subject)你要画的核心是什么人、动物、物体a beautiful girl一个美丽的女孩,a futuristic car一辆未来汽车。环境/场景 (Environment/Scene)主体在哪里in a forest在森林里,on the moon在月球上。风格/质感 (Style/Quality)想要什么画风oil painting油画,anime style动漫风格,photorealistic照片级真实,8k, detailed8K分辨率细节丰富。光照/氛围 (Lighting/Atmosphere)光线和感觉如何soft lighting柔和光线,dramatic sunset戏剧性的日落,foggy有雾的。构图/视角 (Composition/View)从什么角度看close-up portrait特写肖像,wide shot广角镜头,from above俯视。举个例子把刚才的“猫”升级一下基础版a cat(一只猫)进阶版a cute cat, fluffy(一只可爱的毛茸茸的猫)高级版a majestic Norwegian forest cat, fluffy long fur, green eyes, sitting by a window with sunlight streaming in, photorealistic, detailed fur, 8k(一只威严的挪威森林猫毛茸茸的长毛绿眼睛坐在窗边阳光洒入照片级真实毛发细节丰富8K画质)看到区别了吗描述越具体、越丰富AI就越能理解你的意图。4.2 使用“负面提示词”Negative Prompt排除不想要的这是新手最容易忽略但效果立竿见影的技巧。在Negative Prompt输入框里你可以告诉AI“不要画什么”。比如你画人像时AI有时会生成手指数量不对、脸部扭曲的图片。这时你就可以在负面提示词里加入ugly, blurry, low quality, deformed face, extra fingers, bad hands, mutated(丑陋模糊低质量畸形的脸多余的手指不好的手变异的)这相当于给AI一个“黑名单”让它主动避免生成这些有问题的元素。一套常用的负面提示词可以大大提升出图成功率。4.3 理解关键参数步数Steps和引导系数Guidance Scale生成按钮旁边有几个参数我们重点看两个最重要的Steps步数默认20你可以理解为AI“思考”和“绘制”的步骤数。步数太低如10画面可能粗糙、不完整步数太高如50细节会更丰富但速度会变慢且可能产生过度“加工”的奇怪效果。新手建议保持在20-30之间是质量和速度的平衡点。Guidance Scale引导系数默认7.5这个参数控制AI有多“听话”。值越低如5AI自由发挥的空间越大创意可能更天马行空但也可能完全偏离你的描述值越高如12AI会死死扣住你的提示词但画面可能显得僵硬、缺乏艺术感。新手建议从7.5-10开始尝试。4.4 图片尺寸Size的选择Width宽和 Height高决定了图片的大小。stable-diffusion-v1-5模型在512x512像素下训练得最好所以这是最稳定、最快的尺寸。512x512通用尺寸速度快效果稳定。强烈推荐新手使用。768x512适合横屏风景、电影画面。512x768适合竖屏人像、海报。更高尺寸如768x768, 1024x1024能生成更多细节但需要更多显存速度更慢且有时会出现重复图案或扭曲。新手可以先不尝试。5. 从模仿到创造实用案例与提示词库知道了方法我们来看看具体能画出什么。这里我提供几个不同风格的案例和对应的提示词你可以直接复制使用也可以在此基础上修改创造出属于你自己的作品。5.1 案例一动漫风格人物目标生成一张日系动漫风格的少女头像。提示词 (Prompt)(masterpiece, best quality), 1girl, solo, long silver hair, blue eyes, elegant, looking at viewer, detailed face, cute, school uniform, cherry blossoms in background, anime style, studio ghibli style杰作最佳质量1个女孩单独银色长发蓝眼睛优雅看着观众脸部细节可爱校服背景有樱花动漫风格吉卜力工作室风格负面提示词 (Negative Prompt)ugly, blurry, lowres, bad anatomy, extra limbs, disfigured, deformed, cross-eyed, bad hands, text, error, extra digit, fewer digits, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username参数建议Steps: 25, Guidance Scale: 7.5, Size: 512x768 (竖版人像)5.2 案例二奇幻风景目标生成一张梦幻的精灵森林场景。提示词 (Prompt)fantasy landscape, enchanted forest, glowing mushrooms, giant glowing flowers, bioluminescent plants, magical waterfall, fairies flying, starry sky, moon light, ethereal, dreamy, highly detailed, digital painting, art by greg rutkowski奇幻风景魔法森林发光的蘑菇巨大的发光花朵生物发光植物魔法瀑布飞舞的精灵星空月光空灵梦幻高度详细数字绘画Greg Rutkowski风格负面提示词同上或使用通用负面词。参数建议Steps: 30, Guidance Scale: 9, Size: 768x512 (横版风景)5.3 案例三赛博朋克城市目标生成一张充满未来感和霓虹灯的都市街景。提示词 (Prompt)cyberpunk city street, neon lights, rain, wet ground, reflections, futuristic Asian metropolis, towering skyscrapers, flying cars, crowded, night, cinematic lighting, 4k, detailed, Blade Runner style赛博朋克城市街道霓虹灯雨潮湿的地面倒影未来主义亚洲大都市高耸的摩天楼飞行汽车拥挤夜晚电影感灯光4k细节丰富银翼杀手风格负面提示词同上。参数建议Steps: 28, Guidance Scale: 8.5, Size: 768x5125.4 建立你的提示词灵感库你可以把下面这些常用的质量词和风格词收藏起来像搭积木一样组合进你的提示词里质量增强masterpiece, best quality, ultra detailed, 8k, HDR(杰作最佳质量超详细8KHDR)艺术风格digital painting, oil painting, watercolor, sketch, pencil drawing(数字绘画油画水彩素描铅笔画)摄影风格photorealistic, photography, 35mm film, depth of field(照片级真实摄影35毫米胶片景深)光照效果dramatic lighting, soft lighting, rim light, volumetric light(戏剧性灯光柔和灯光轮廓光体积光)构图视角close-up, wide angle, low angle, birds eye view(特写广角低角度鸟瞰视角)6. 常见问题与进阶提示刚开始玩肯定会遇到各种小问题。别慌大多数问题都有简单的解决办法。6.1 为什么我生成的图片很奇怪/很丑这是新手最常见的问题。通常有以下几个原因和解决办法提示词太简单或太抽象a dog一只狗就比a cute corgi puppy running on green grass, sunny day一只可爱的柯基小狗在绿草地上奔跑阳光明媚模糊得多。多加点细节。没有使用负面提示词AI不知道要避免什么就容易生成扭曲、多肢体、低质量的图片。务必填上通用的负面提示词。步数Steps太低低于15步画面可能还没“画完”就停止了。调到20-30步。引导系数Guidance Scale不合适太高15可能让画面生硬太低5可能完全放飞。保持在7-10之间尝试。6.2 如何生成一模一样的图片有时候你生成了一张特别满意的图想再生成几张类似的或者想微调一下。这时就需要用到Seed种子参数。每次生成图片时系统都会使用一个随机的种子值通常是-1代表随机。如果你生成了一张好图在图片信息里找到它的Seed值在WebUI中生成的图片下方通常会显示参数包含Seed。把这个数字填到 Seed 输入框里并且保持其他所有参数提示词、尺寸、步数等完全不变再次点击生成你就能得到一张几乎一模一样的图片。注意是“几乎”因为一些随机性可能依然存在但主体构图和风格会高度一致。6.3 生成速度很慢怎么办检查尺寸确保图片尺寸是512x512或相近的倍数。1024x1024会比512x512慢很多。降低步数将Steps从30降到20速度会有明显提升。耐心等待首次加载服务重启或第一次生成时需要加载模型到显存会慢一些后续生成就快了。6.4 提示词必须用英文吗可以用中文吗强烈建议使用英文。Stable Diffusion v1.5 是基于英文语料库训练的它对英文的理解能力远远强于中文。直接输入中文提示词效果往往不理想甚至会产生乱码图像。一个简单的方法是先用中文想好你要什么然后用翻译软件如谷歌翻译、DeepL翻译成英文再将英文提示词输入进去。虽然多了一步但出图效果会好得多。7. 总结开始你的AI绘画之旅好了我们已经走完了从零到一的全过程。让我们最后回顾一下用 Stable Diffusion 生成一张AI图片到底有多简单打开画板在浏览器输入http://你的服务器IP:7860。构思描述在心里想好你要的画面并用英文把它描述出来主体环境风格细节。输入咒语把英文描述写到Prompt框里把不想要的东西如丑陋、模糊、多手指写到Negative Prompt框里。调整参数可选新手可以先用默认值Steps:20, Guidance:7.5, Size:512x512。点击生成按下Generate按钮等待魔法发生。迭代优化如果结果不满意就调整你的提示词更具体或换种说法或者调整参数如增加步数然后再次生成。AI绘画的魅力在于它的无限可能和即时反馈。你不需要等待灵感只需要不断尝试。今天画一只猫明天画一座城堡后天尝试把猫画进城堡里。不要害怕“浪费”几次生成机会去试错。每一次看似不成功的尝试都在帮你更了解这个工具的“脾气”。很快你就能从“AI在画什么”过渡到“我想让AI画什么”。现在打开你的 Stable Diffusion WebUI输入你的第一个创意点击那个神奇的按钮吧。你的想象力就是唯一的限制。获取更多AI镜像想探索更多AI镜像和应用场景访问 CSDN星图镜像广场提供丰富的预置镜像覆盖大模型推理、图像生成、视频生成、模型微调等多个领域支持一键部署。

更多文章

前端开发 2026/4/14 11:08:29

语音指令分类模型训练（基于机器学习方法）

1、统计音频长度信息，便于后续参数的设定import os import librosa import numpy as np# 配置参数 DATA_PATH "data4c" # 数据集根目录 FIXED_SAMPLE_RATE 16000def stat_audio_lengths():# 存储所有音频的长度（采样点数）和时长…

接前一篇文章：软考系统架构设计师历年真题集萃（240）第476题看关系R.S如下表所示，则关系R与S进行自然连接运算后的属性列数和元组个数分别为（）。 R A B C D 6 6

张开发

前端开发 2026/4/14 10:51:30

YOLO12性能展示：RTX 4090 D加持，实时推理流畅无压力

YOLO12性能展示：RTX 4090 D加持，实时推理流畅无压力当目标检测遇上RTX 4090 D，会碰撞出怎样的火花？今天，我们就来实测一下YOLO12这款2025年最新发布的目标检测模型，看看它在顶级硬件加持下的真实表现。 …

张开发

AI绘画神器Stable Diffusion入门：输入文字就能生成精美图片的简单方法

最新文章

别再只用NDVI了！用Python+Sentinel-2数据实战对比5种常用植被指数（附代码）

Gazebo中高效加载DEM高程图的实用技巧与常见问题解决

cv_unet_image-colorization老照片修复案例：ResNet+UNet架构如何让历史影像重现光彩

# 001、开篇：认知变现时代，普通人如何抓住AI红利

程序员自我提升之路：Reddit与Udemy

开源Altium电路图解析器：打破专业软件壁垒的Python解决方案

推荐文章

⑩【从0制作自己的ros导航小车：上位机篇】05、导航！

从NUSTCTF Ezjava1看Java Web参数绑定与条件竞争漏洞挖掘

SITS2026现场直击：LLM-native NLP架构设计原则（含可复用的5层抽象模型图谱）

AHT20温湿度传感器库深度解析与工业级应用实践

Rust的引用计数智能指针Rc与Arc在线程共享中的内部可变性

libhv实战：从零构建一个功能完备的HTTP客户端

相关文章

高效掌握多步提示工程：进阶AI任务处理的系统方法论

浏览器资源嗅探终极指南：如何轻松下载网页视频与音频

OPEN实战：基于深度强化学习的多无人机追逃在线规划，如何跨越仿真到现实的鸿沟？

从Depth Anything到Video版本：揭秘字节跳动如何用时空注意力突破视频深度估计瓶颈

终极指南：如何使用ChampR构建高性能英雄联盟游戏助手

GLM-4.1V-9B-Base效果展示：中文手绘草图→功能描述→技术实现建议生成

分享文章

更多文章

语音指令分类模型训练（基于机器学习方法）

Blender 3MF插件深度解析：打造专业级3D打印工作流

【CTFshow-pwn系列】03_栈溢出【pwn 065】详解：可见字符Shellcode绕过字符校验完整解题复盘

RK3576 Android开机时间优化实战：从14.8秒到10秒内，我都改了哪些配置？

别再被查重降重虐哭！PaperXie：手把手教你拿捏论文重复率 + AIGC 率双达标

Adobe-GenP 3.0终极指南：如何快速解锁Adobe CC全系列软件

FRCRN在无障碍技术中的价值：为听障用户提供高保真人声增强方案

打造无人机实时图传系统：ZLMediaKit 高性能部署全流程详解

Pandas数据行间运算实战：diff与shift的高效应用

像素到路径的数学魔法：Vectorizer 实现多色图像矢量化的技术解析

软考系统架构设计师历年真题集萃（241）

YOLO12性能展示：RTX 4090 D加持，实时推理流畅无压力