大展神通的gpt-image-2

gpt-image-2

2026-04-22 ChatGPT image-2 正式上线,效果比我预期还要好,这里简单记录一下我实际试下来的几个玩法。

整体感受就是:它不只是“能出图”,而是已经开始具备把想法快速整理成成品的能力了。

海报生成

毕业艺术照

在原图上修改,很容易就能做出更专业、更像宣传照的感觉。

这种玩法很适合做头像、海报封面或者个人展示图,省去了很多来回修图的时间。

毕业定妆照

PPT页面生成

如果说海报更偏展示感,那 PPT 页面对我来说更像是“效率工具”。

直接生成

直接给主题和内容,它就能先把页面气质和排版方向做出来,拿来做初稿非常省事。

img

结合公司模板

将公司的PPT模扔上去,并给足项目信息,就可以坐享其成了

这一点很实用,因为它不只是生成一页图,而是会尽量往“像你们公司真的会用的页面”靠。

P1

P2

架构图生成

这一块是我觉得最惊喜的部分之一,尤其适合拿来做汇报材料和方案包装。

项目架构图

让 codex 扫描了我的项目仓库,先帮我整理结构,再交给 image-2 出图。

这样做的好处是,先把信息整理清楚,再去生成图片,最终出来的图会稳很多。

  • 架构图v1

架构图-v1


  • 架构图v2

架构图-v2

  • 提示词:
使用 image2 生成 2 张架构图。

请绘制一张“manus-like-system”项目的系统架构图,中文标注,白色背景,16:9 横版,风格清晰专业(偏技术文档风),矢量感强,文字清楚可读。

图中必须包含以下分层与连接关系:

1) 客户端层(左上):
- Web Frontend(React / SSE)
- Chat Platforms(Feishu Webhook / Realtime)

2) 服务层(中上,HTTP Services):
- API Service :8080(会话管理 / 任务提交查询 / 文件上传下载 / 预览查询 / 运维接口)
- Conversation Server :8082(创建会话 / 追加轮次)
- Integration Service :8081(飞书接入 / 消息投递 / SSE 消费)
- Web Gateway :8090(预览代理 / 容器生命周期管理)

3) 存储与消息层(中间):
- Redis :6379(Streams + Hashes + ZSets)
- 关键 stream 标签:
  manus:jobs
  manus:job:{id}:events
  manus:notifications:job-finished

4) 执行层(中下):
- Worker Pool(Worker #1 ... Worker #N)
- 每个 Worker 执行 Codex CLI(chat / ws / web)
- 从 Redis 消费任务并回写事件

5) 运行时与文件层(底部):
- Workspace & Artifacts
  runtime/workspaces/
  runtime/artifacts/
  runtime/uploads/
  runtime/logs/
- Preview Container(Docker + Vite Dev Server),由 Web Gateway 管理

连线关系(必须体现箭头方向):
- Web Frontend -> API Service
- Chat Platforms -> Integration Service -> API Service
- API Service -> Conversation Server
- API Service -> Web Gateway
- API Service / Conversation Server / Integration Service / Web Gateway 都与 Redis 交互
- Redis -> Worker Pool(任务分发)
- Worker Pool -> Redis(事件回写)
- Worker Pool -> Workspace & Artifacts
- Web Gateway -> Preview Container
- Web Frontend -> Web Gateway(访问 /preview/{id})

视觉要求:
- 用不同颜色区分“客户端、服务、存储、Worker、运行时”五类模块
- 每个框有标题和 1~2 行关键职责说明
- 使用简洁图标(浏览器、云服务、数据库、齿轮/工人、文件夹、容器)
- 主标题:Manus-like System 架构图
- 右下角附小图例(颜色含义)
- 保持网格对齐、留白充足、避免连线交叉

专业的云厂商架构图

从草图到“像云厂商方案图”的感觉,提升非常明显。

总体

流程

小项目的架构图,也能被包装得更完整、更适合拿去讲方案。

云厂商架构图替换

azure架构图 转换成 阿里云的架构图

这种替换能力很适合做多云版本方案、客户定制版本,或者快速对齐不同厂商口径。

总体

流程

基本满足吧,如果配色不满意,再聊再修

WEB页面

将公司素材扔到 ChatGPT 上,就能生成一个还不错的设计。

比自己想要好很多

有时候你脑子里只有一个模糊方向,它反而能先给你一个完成度不错的版本,用来继续往下改。

虹启万象

这意味着很多平台方案、活动页面、产品概念稿,其实都可以先快速模拟出来。

无论是做展示、做提案,还是向上汇报,都会轻松很多。

简历生成

将自己的简历信息全部扔上去,让它生成简历图片。

这个方向也很有意思,本质上是把“内容整理”直接变成“视觉成品”。

个人简历

上传个人照片,你可以先让ai美颜一下生成定妆照

小红书图片

这一类内容也很适合,因为它天然就需要“强视觉 + 强信息密度”。

旅游规划图片

拿来做旅游规划、攻略封面、清单图这类内容,会非常顺手,后面有空可以继续补更多案例。

总结

与Agent协作方法论

我现在的体感是,image-2 最强的地方不是单次出图有多惊艳,而是它已经能稳定接住“整理需求 -> 组织信息 -> 生成成品”这一整段流程。

只要前面的材料喂得足,后面的产出质量通常都会高很多。

使用 ChatGPT 时,先尽量给足背景、资料、参考和目标,把需求写清楚。

如果一开始说不明白,就先和 AI 多聊几轮,把想法逐步聊清楚。

等需求基本明确后,让 AI 帮你总结讨论结果,并整理成一份完整提示词。
最后再新开一个对话,把整理好的信息、材料和明确需求一次性输入进去,用来生成最终结果。

核心方法就是:先沟通梳理,再总结提示词,最后正式生成。

github