用Image2复刻任意画面:RTF反编译提示词方法
引言
一套用 RTF 框架复刻任意画面的实用方法论——从参考图到提示词模板,再到高还原度输出。
起点:一张干净醒目的封面
看见一个还不错的封面,简单、干净、醒目,准备用 Image2 来套用它。

第一轮:直接让模型反推提示词
最开始我是直接把图片扔进大模型,让它给我反推提示词。没有意外的是它给了我一个版本的提示词,并告诉我怎么做效果更好。

没出意外的是,出来的图效果很差(就不展示了),连着测试了好几次,最终得到结论:这种大众化的做法没法很好地完成复刻。
转折:RTF 反编译框架
于是想到了姚金刚老师之前分享的"图片反编译"提示词模板。它的核心是 RTF 框架——通过给定图片,重新定义 Role(角色)、Task(任务)和 Format(格式),然后输出一版提示词。
通过这个模板,我得到了如下版本的提示词(以公众号封面设计为例):
根据参考图和下列提示词,对用户内容文字进行公众号封面设计
## Role
你是专业的微信公众号封面设计师,根据用户内容生成完全符合"中文爆款文章封面"风格的横版海报。
## Task
用户内容:{}
严格按照以下原图规范执行:
### 宽高比约束(不可更改)
- 精确比例:2.4221(约 2.42:1)
- CSS实现:aspect-ratio: 482 / 199
- 兼容方案:padding-top: 41.29%
### 字体系统(精确规格)
- 主数字标题:font-size: 165px; font-weight: 900; line-height: 0.9; letter-spacing: -0.06em
- 次级超大标题:font-size: 160px; font-weight: 900; line-height: 0.9; letter-spacing: -0.05em
- 小辅助字:font-size: 27px; font-weight: 800; line-height: 1; letter-spacing: -0.02em
- 底部结论文案:font-size: 46px; font-weight: 900; line-height: 1; letter-spacing: -0.03em
- 角标文字:font-size: 13px; font-weight: 700; line-height: 1
- 字体族:font-family: "Source Han Sans SC", "Noto Sans SC", "Microsoft YaHei", sans-serif
- 字形要求:极粗、紧凑、块面感强,接近报纸头版标题或压缩黑体
### 色彩系统(精确色值)
- 主色:#BF1F24,用于大号数字和重点字
- 背景:#EBDCC8,带轻微纸张颗粒感
- 文字色:#131211,用于大标题黑字与主要结构
- 底部黑条:#090908
- 标签文字:#FFFFFF
- 装饰色:#BD211D,用于底部重点字或小面积强调
### 布局系统(精确定位)
- 整体为固定定位横版封面,留白极少,冲击力优先
- 左侧放一个超大红色数字组,占画面高度约 70%
- 中部偏左插入一个黑白老人半身像,头部与手臂压在大字前方
- 中部偏右放一个超大红字,右侧放一个超大黑字,组成标题主骨架
- 底部设置通栏黑色横条,高度约画面 39%
- 左下角放一个小型黑色胶囊标签
- 右下角在黑条上放一句强结论型白字标题,最后一个字可用红色强调
### 视觉元素系统(完整规格)
- 人物元素:中国老人,黑白纪实肖像,开怀大笑,表情夸张但真实,半身出镜
- 动作设计:一只手扶着底部黑条边缘,另一只手向镜头举起黑色卡片或手机
- 道具设计:黑色卡片/手机,顶部有一个白色符号,局部有少量红字,像"成果展示"
- 背景系统:纯米白底,轻微印刷颗粒和复古纸张质感
- 标签元素:左下角黑色圆角胶囊,白字,像"文章角标"
- 风格限制:不要科技蓝,不要电商渐变,不要复杂光效,不要真实杂乱环境
### 内容模块架构
- 模块1:左侧超大数字,负责第一眼抓人
- 模块2:中央人物,负责情绪和传播感
- 模块3:中右侧超大标题字,负责主题补全
- 模块4:底部黑条文案,负责结论输出
- 模块5:左下角小标签,负责平台感和封面完成度
### 排版系统深度约束
- 所有超大标题必须互相贴近,形成高密度标题墙
- 人物必须压在大字前面,形成明确前后层次
- 底部黑条必须贯穿全宽,成为承载文案和托住人物的结构面
- 视觉重心位于画面中部偏左,依靠人物脸部和手中卡片建立焦点
- 整体追求"微信爆文封面"的直接、粗暴、好传播,不追求精致优雅
### 内容处理规则
- 主标题:优先拆成"数字/关键词/结果"三段式结构
- 小辅助字:用来补足时间、单位、语气词
- 结论文案:必须像一句口语化判断,如"你也能行"
- 角标:可固定为同类平台感小标签
- 内容适配:字数过多时优先保留数字、结果词、结论句,删掉解释性废话
### 输出风格关键词
微信公众号封面、中文爆款标题、黑红米白、报纸头版感、复古宣传海报感、纪实老人肖像、夸张情绪、超大黑体字、底部黑条、强传播性、高对比、极简粗暴、社交媒体点击感
## 输出格式
生成一张横版公众号封面图,要求中文可读、标题巨大、人物表情抓人、底部结论醒目。
输出效果
输出的图片是这样的:

对比参考图和输出结果,效果还是令人满意的。
关键步骤总结
- 放入提示词时,自定义用户内容要考虑字数、版面位置等维度。
- 不需要的内容可以在提示词中删除,比如左下角的小文字/角标。
- 原图最好能和提示词一起用作参考。
图片反编译 RTF 通用提示词
以下是姚金刚老师的图片反编译 RTF 通用提示词(版本 V0.8),支持海报、卡片、banner 等多种设计类型:
<!--
作者:姚金刚
版本:V0.8
描述:上传参考图片,精确分析设计参数(宽高比、字体、色彩、布局、视觉元素),自动生成个性化RTF提示词,实现90%+还原度的图片反编译。
框架:RTF结构化提示词框架,支持海报、卡片、banner等多种设计类型的像素级精确还原。
创建日期:2025-06-23
-->
# 图片反编译 - RTF通用提示词
## Role(角色)
你是图片反编译专家,能够精确分析图片的设计参数并生成可复用的RTF提示词模板。
## Task(任务)
当用户上传图片时,你需要:
### 第一步:像素级精确分析
1. 宽高比测量:识别有效内容边界,计算宽度÷高度,精确到小数点后4位
2. 字号测量:测量字符实际高度,然后根据字体类型推算font-size(实际高度通常是font-size的80-90%)
3. 色彩提取:使用取色工具精确获取RGB值,转换为16进制色值
4. 布局识别:测量元素间距、对齐基准线、网格尺寸的像素值
5. 装饰分析:测量边框宽度、阴影偏移、圆角半径的精确数值
### 第二步:生成可执行RTF提示词
将所有测量数值填入模板,生成可直接复制使用的完整提示词
## 分析输出格式
### 分析报告格式(基于实际上传图片)
**第一步:基础测量**
1. 识别图片有效内容区域,测量实际宽度和高度
2. 计算精确宽高比:宽度÷高度,保留4位小数
3. 判断设计类型:海报/卡片/banner/信息图/其他
4. 识别设计风格:现代简约/商务专业/科技未来/复古经典/其他
**第二步:字体系统分析**
1. 识别所有文字层级(主标题/副标题/正文/辅助文字)
2. 测量每个层级的字符实际高度(像素值)
3. 根据字体类型推算font-size(实际高度通常是font-size的80-90%)
4. 测量字重(笔画粗细)、行高、字间距
5. 识别字体族(中文/英文字体名称)
**第三步:色彩系统提取**
1. 提取主色:最突出/最重要的颜色,记录RGB和16进制值
2. 提取背景色:纯色/渐变,记录完整参数
3. 提取文字色:各层级文字的具体颜色
4. 提取装饰色:边框/图标/分割线等元素颜色
5. 分析色彩层次关系和应用规律
**第四步:布局结构解析**
1. 识别布局类型:网格/流式/固定定位
2. 测量网格参数:行数、列数、间距
3. 测量对齐基准线位置
4. 建立间距体系:找出基础间距单位和倍数关系
**第五步:视觉元素完整分析**
1. 图片/图标识别:位置、尺寸、样式、与文字的关系
2. 边框装饰:宽度、样式、颜色、圆角、位置
3. 阴影效果:偏移、模糊、扩散、颜色、透明度、层次
4. 背景系统:渐变角度、颜色节点、图片、纹理、透明度
5. 形状元素:几何图形、分割线、装饰框、标签等
6. 特殊符号:图标、bullet点、箭头、星号等的具体参数
**第六步:内容模块结构分析**
1. 模块识别:标题区、内容区、图片区、CTA区、装饰区等
2. 模块关系:层次关系、空间关系、视觉权重分配
3. 信息架构:主要信息→次要信息→辅助信息的层级
4. 视觉流程:用户视线的引导路径和阅读顺序
5. 功能区域:logo位置、联系方式、二维码、按钮等
**第七步:排版系统深度解析**
1. 网格系统:主网格、子网格、网格嵌套关系
2. 对齐规律:多重对齐基准线、对齐的一致性规则
3. 留白策略:内边距、外边距、模块间距的规律
4. 比例关系:黄金比例、模块尺寸比例、字号比例关系
5. 视觉平衡:重量分布、对称性、视觉重心位置
**完整分析输出示例**
基础信息:宽高比[实测值] ([比例]),内容区域[宽]×[高]px,类型[实际类型],风格[实际风格]
字体系统:主标题[实测值]px/字重[实测值]/行高[实测值],副标题[参数],正文[参数],字体族[实际字体]
色彩系统:主色#[实测色值]/背景[实际参数]/文字色[实测值]/装饰色[实测值]
布局结构:[实际布局类型],[实测网格参数],对齐[实测基准线],间距[实测体系]
视觉元素:图片[位置尺寸]/边框[参数]/阴影[参数]/背景[参数]/形状[参数]/符号[参数]
内容模块:[模块类型和数量]/[模块关系]/[信息架构]/[视觉流程]/[功能区域分布]
排版系统:网格[嵌套关系]/对齐[多重基准]/留白[策略]/比例[关系]/平衡[重心位置]
---
## RTF提示词生成器(动态模板)
基于上述分析结果,自动生成个性化RTF提示词:
## Role
你是专业的[根据分析结果填入:设计类型]设计师,根据用户内容生成完全符合指定风格的设计。
## Task
用户内容:{}
严格按照以下原图规范执行:
### 宽高比约束(不可更改)
- 精确比例:[填入实测宽高比] ([填入简化比例])
- CSS实现:aspect-ratio: [宽] / [高]
- 兼容方案:padding-top: [高/宽×100]%
### 字体系统(精确规格)
- 主标题:font-size: [实测值]px; font-weight: [实测值]; line-height: [实测值]; letter-spacing: [实测值]em
- 副标题:font-size: [实测值]px; font-weight: [实测值]; line-height: [实测值]; letter-spacing: [实测值]em
- 正文:font-size: [实测值]px; font-weight: [实测值]; line-height: [实测值]; letter-spacing: [实测值]em
- 字体族:font-family: [实际识别的字体栈]
### 色彩系统(精确色值)
- 主色:[实测色值] - 应用于[实际应用场景]
- 背景:[实测背景参数:纯色或渐变]
- 文字色:[各层级实测色值和说明]
- 装饰色:[实测色值] - [实际应用场景]
### 布局系统(精确定位)
- 网格:display: [实际布局类型]; [实测网格参数]
- 容器:max-width: [实测值]px; padding: [实测的上下左右数值]
- 间距:[各种间距的实测值和应用场景]
- 对齐:[实际的对齐方式和基准线]
### 视觉元素系统(完整规格)
- 图片元素:[实测位置、尺寸、样式参数及CSS实现]
- 边框装饰:border: [实测完整边框参数]; border-radius: [实测值]px
- 阴影效果:box-shadow: [实测完整阴影参数]
- 背景系统:background: [实测完整背景参数]
- 形状元素:[几何图形、分割线的完整CSS实现]
- 特殊符号:[图标、符号的完整实现代码]
### 内容模块架构(精确还原)
- 模块布局:[各模块的位置、尺寸、层级关系]
- 信息层级:[主要→次要→辅助信息的视觉权重分配]
- 视觉流程:[用户视线引导的具体实现方式]
- 功能区域:[logo、CTA、联系方式等的精确定位]
### 排版系统深度约束
- 网格嵌套:[主网格和子网格的完整定义]
- 多重对齐:[所有对齐基准线的精确位置]
- 留白策略:[内外边距的完整规律和数值]
- 比例系统:[所有尺寸比例关系的数学定义]
- 视觉平衡:[重心位置和平衡点的精确控制]
### 内容处理规则
- 主标题:[根据原图分析的字数范围],提取核心主题
- 副标题:[根据原图分析的字数范围],补充说明
- 正文:按"[根据原图实际结构分析得出的顺序]"重组内容
- 内容适配:过多时智能截取,过少时保持结构填充装饰
### 响应式适配(保持宽高比)
- 移动端(小于768px):字号×0.85,间距×0.8,容器 max-width: [根据原图计算的移动端宽度]px
- 桌面端(大于等于768px):原始尺寸,容器 max-width: [实测容器宽度]px
## 输出格式
生成包含所有实测参数的完整可运行HTML代码
## 质量标准
- 宽高比精度:误差<0.01
- 字号精度:误差<1px
- 色彩精度:色差<3%
- 整体还原度:>95%
使用方法:
- 上传参考图片,AI 分析核心参数
- 获取 RTF 提示词,复制模板使用
- 输入内容,生成高还原度设计
如果画面不满意,是可以微调的。
来源:阳阳ai分享
加载评论中...