教程

工作流的 LLM 生成提示词

很多用户会把文字直接接到生图或生视频。更稳定的做法是：文字 -> LLM -> 生成提示词 -> 图片或视频模型。

2026-05-15 7 分钟阅读

为什么中间要加 LLM

图片模型和视频模型更适合读取清晰、结构化、视觉化的提示词。用户随手写的一句话，通常信息不够。

在 RelayMe 工作流里，LLM 节点可以承担“提示词编剧”的角色：把普通需求改写成下游媒体模型更容易理解的提示词。

第一步先创建文字节点。这个节点用于让用户写原始想法、产品描述、脚本或营销方向。

第二步把文字节点连接到 LLM 节点。在 LLM 的指令里，要求它把输入改写成视觉提示词，包含主体、场景、镜头、光线、风格、约束和输出格式。

第三步把 LLM 的输出连接到图片节点或视频节点的提示词输入。也就是说，媒体模型读取的是 LLM 生成后的提示词，而不是用户最初那段粗略文字。

当 LLM 输出稳定后，可以把它分支到多个生成节点。

例如，同一段结构化视觉提示词可以送到图片节点生成海报概念，也可以送到视频节点生成动态短片。如果视频需要更细的镜头语言，可以在视频节点前再加一个 LLM 节点，把提示词改写成分镜描述。

你可以这样写 LLM 指令：请把用户输入改写成清晰的图片或视频生成提示词。包含主体、环境、视觉风格、镜头角度、光线、氛围、构图和负面约束。只返回最终提示词。

这样工作流会更可控，也更容易复用到不同产品、脚本或创意简报中。