图像 · 图像编辑 · 单图片编辑排行榜

基于公开偏好评测数据展示 图像编辑 / 单图片编辑 榜单,每个榜单独立排序。

选型指南

单图片编辑模型怎么选?

单图片编辑排行榜用于回答“单图片编辑哪个 AI 模型更强”这类选型问题。页面基于公开偏好评测数据展示模型排名,每个榜单独立排序,不把不同任务的原始分数直接混合。当前榜首是 gpt-image-2 (medium),厂商为 openai,百分制分数 100.0,样本量 77.2K。 数据来源保留 Arena 原始榜单和 LMArena leaderboard dataset,更新时间以榜单发布时间 2026-06-02 为准。

gpt-image-2 (medium)mai-image-2.5chatgpt-image-latest-high-fidelity (20251216)grok-imagine-image-quality (20260519)gemini-3.1-flash-image-preview (nano-banana-2) [web-search]
当前目录图像 · 图像编辑 · 单图片编辑
模型数量48
榜单发布时间2026/06/02
Arena 公开偏好评测原始榜单: 图像编辑总榜榜单发布时间: 2026/06/02榜单数据集: LMArena latest parquet打开 Arena 来源打开榜单数据集
1
gpt-image-2 (medium)
Openai
100.0
77.2K
-
¥36.4 / ¥233输入/输出
2
mai-image-2.5
Microsoft Ai
97.9
5.6K
32K
¥36 / ¥338输入/输出
3
chatgpt-image-latest-high-fidelity (20251216)
Openai
95.7
391.1K
1M
¥36 / ¥216输入/输出
4
grok-imagine-image-quality (20260519)
Xai
93.6
8K
1M
¥9 / ¥18输入/输出
5
gemini-3.1-flash-image-preview (nano-banana-2) [web-search]
Google
91.5
193.7K
131K
¥3.6 / ¥21.6输入/输出
6
gemini-3-pro-image-preview-2k (nano-banana-pro)
Google
89.4
383.6K
1.05M
¥14.4 / ¥86.4输入/输出
7
gemini-3-pro-image-preview (nano-banana-pro)
Google
87.2
518.4K
1.05M
¥14.4 / ¥86.4输入/输出
8
gpt-image-1.5-high-fidelity
Openai
85.1
411.2K
1M
¥36 / ¥216输入/输出
9
grok-imagine-image-quality
Xai
83.0
32.6K
1M
¥9 / ¥18输入/输出
10
uni-1.1-max
Luma Ai
80.9
31.8K
-
-
11
grok-imagine-image
Xai
78.7
312.8K
1M
¥9 / ¥18输入/输出
12
uni-1.1
Luma Ai
76.6
35.4K
-
-
13
wan2.7-image-pro
Alibaba
74.5
40.8K
8.19K
¥0 / ¥0输入/输出
14
seedream-4.5
Bytedance
72.3
748.5K
-
-
15
wan2.7-image
Alibaba
70.2
41.6K
8.19K
¥0 / ¥0输入/输出
16
hunyuan-image-3.0-instruct
Tencent
68.1
225.4K
-
-
17
gemini-2.5-flash-image-preview (nano-banana)
Google
66.0
10849.5K
1.05M
¥2.16 / ¥18输入/输出
18
seedream-5.0-lite
Bytedance
63.8
193.9K
-
-
19
qwen-image-2.0-pro-2026-04-22
Alibaba
61.7
7.1K
8.19K
¥0 / ¥0输入/输出
20
seedream-4-2k
Bytedance
59.6
213K
-
-
21
flux-2-max
Bfl
57.4
340.1K
-
-
22
reve-v1.1
Reve
55.3
611.9K
-
-
23
qwen-image-2.0-2026-03-03
Alibaba
53.2
129.4K
8.19K
¥0 / ¥0输入/输出
24
kling-image-o1
Kling
51.1
122.5K
200K
¥108 / ¥432输入/输出
25
flux-2-pro
Bfl
48.9
356.6K
-
-
26
qwen-image-edit
Alibaba
46.8
1981.3K
-
¥0 / ¥0输入/输出
27
reve-v1
Reve
44.7
380.9K
-
-
28
qwen-image-edit-2511
Alibaba
42.6
329.9K
8.19K
¥3.6 / ¥14.4输入/输出
29
wan2.6-image
Alibaba
40.4
393.9K
-
-
30
flux-2-flex
Bfl
38.3
402.3K
-
-
31
flux-2-klein-9b
Bfl
36.2
485K
-
-
32
flux-2-dev
Bfl
34.0
168.2K
-
-
33
seedream-4-high-res-fal
Bytedance
31.9
1171.4K
-
-
34
seedream-4-fal
Bytedance
29.8
153.9K
-
-
35
p-image-edit
-
27.7
322.8K
-
¥0 / ¥0输入/输出
36
reve-v1.1-fast
Reve
25.5
515.4K
-
-
37
reve-edit-fast
Reve
23.4
221.3K
-
-
38
flux-2-klein-4b
Bfl
21.3
485.5K
-
-
39
wan2.5-i2i-preview
Alibaba
19.1
368K
-
-
40
flux-1-kontext-max
Bfl
17.0
391.7K
-
-
41
flux-1-kontext-pro
Bfl
14.9
6424K
-
-
42
flux-1-kontext-dev
Bfl
12.8
3652.1K
-
-
43
seededit-3.0
Bytedance
10.6
4950.1K
-
-
44
gpt-image-1
Openai
8.5
2861.2K
-
¥36 / ¥288输入/输出
45
gpt-image-1-mini
Openai
6.4
642.2K
1M
¥36 / ¥216输入/输出
46
gemini-2.0-flash-preview-image-generation
Google
4.3
4965.7K
1.05M
¥1.08 / ¥4.32输入/输出
47
bagel
Bytedance
2.1
13.6K
-
-
48
step1x-edit
Stepfun
0.0
155.7K
-
-
榜首模型解读

gpt-image-2 (medium) 为什么排第一

gpt-image-2 (medium) 当前排名第 1,厂商为 openai,百分制分数 100.0,样本量 77.2K。如果你的任务与本榜单口径一致,可以优先把它作为候选模型,再结合价格、上下文长度和可用性做最终选择。

如何选择模型

不要只看第一名

先选择最接近真实任务的排行榜,再比较 Top 模型的分数和样本量。分数越高说明同一榜单内偏好表现越强;样本量越高通常结果更稳定。最后再结合价格、上下文长度、开源闭源和厂商可用性筛选。

常见问题

单图片编辑常见问题

单图片编辑排行榜看什么指标?

主要看排名、百分制分数、样本量和来源。分数用于快速比较同一榜单内模型表现,样本量用于判断结果稳定性。

为什么不同榜单不能直接混合成总分?

不同榜单的任务、样本和评测口径不同,模力榜默认只在同一榜单内排序,避免把写作、代码、图像等能力强行合并。

单图片编辑模型应该怎么选?

优先看与你任务最接近的榜单,再结合价格、上下文长度、开源闭源和厂商可用性。排名靠前不代表适合所有预算和部署方式。

榜单多久更新?

页面展示的是最新成功采集的公开榜单数据。当前优先使用 LMArena leaderboard dataset,并在页面来源中保留原始链接。