图像 · 文生图 · 总榜

基于公开偏好评测数据展示文生图 / 总榜榜单，每个榜单独立排序。

选型指南

总榜模型怎么选？

总榜排行榜用于回答“总榜哪个 AI 模型更强”这类选型问题。页面基于公开偏好评测数据展示模型排名，每个榜单独立排序，不把不同任务的原始分数直接混合。当前榜首是 gpt-image-2 (medium)，厂商为 openai，百分制分数 100.0，样本量 40.4K。数据来源保留 Arena 原始榜单和 LMArena leaderboard dataset，更新时间以榜单发布时间 2026-05-26 为准。

gpt-image-2 (medium)gemini-3.1-flash-image-preview (nano-banana-2) [web-search]mai-image-2.5-previewgemini-3-pro-image-preview-2k (nano-banana-pro)gpt-image-1.5-high-fidelity

gpt-image-2 (medium)

Openai

100.0

40.4K

¥36.4 / ¥233输入/输出

gemini-3.1-flash-image-preview (nano-banana-2) [web-search]

Google

98.4

70.9K

131K

¥3.6 / ¥21.6输入/输出

mai-image-2.5-preview

Microsoft Ai

96.8

5.3K

32K

¥36 / ¥338输入/输出

gemini-3-pro-image-preview-2k (nano-banana-pro)

Google

95.2

109.6K

1.05M

¥14.4 / ¥86.4输入/输出

gpt-image-1.5-high-fidelity

Openai

93.7

114.2K

¥36 / ¥216输入/输出

gemini-3-pro-image-preview (nano-banana-pro)

Google

92.1

82.6K

1.05M

¥14.4 / ¥86.4输入/输出

grok-imagine-image-quality

Xai

90.5

19.4K

¥9 / ¥18输入/输出

uni-1.1-max

Luma Ai

88.9

8.9K

mai-image-2

Microsoft Ai

87.3

48.3K

32K

¥36 / ¥338输入/输出

uni-1.1

Luma Ai

85.7

10K

grok-imagine-image

Xai

84.1

166.8K

¥9 / ¥18输入/输出

recraft-v4.1-utility-pro

Recraft

82.5

2.5K

qwen-image-2.0-pro-2026-04-22

Alibaba

81.0

5.2K

8.19K

¥0 / ¥0输入/输出

flux-2-max

Bfl

79.4

111.5K

grok-imagine-image-pro

Xai

77.8

93K

¥9 / ¥18输入/输出

reve-v1.5

Reve

76.2

14.9K

flux-2-pro

Bfl

74.6

147.1K

flux-2-flex

Bfl

73.0

143.2K

gemini-2.5-flash-image-preview (nano-banana)

Google

71.4

779.8K

1.05M

¥2.16 / ¥18输入/输出

hunyuan-image-3.0

Tencent

69.8

172.9K

flux-2-dev

Bfl

68.3

58K

imagen-ultra-4.0-generate-001

Google

66.7

389.6K

seedream-4.5

Bytedance

65.1

189K

seedream-4-2k

Bytedance

63.5

12.6K

wan2.6-t2i

Alibaba

61.9

145.8K

qwen-image-2512

Alibaba

60.3

70K

8.19K

¥3.6 / ¥14.4输入/输出

recraft-v4.1-pro

Recraft

58.7

2.7K

imagen-4.0-generate-001

Google

57.1

516.9K

seedream-5.0-lite

Bytedance

55.6

68.1K

hidream-o1-image

Hidream

54.0

5.1K

200K

¥108 / ¥432输入/输出

seedream-4-fal

Bytedance

52.4

11.9K

wan2.5-t2i-preview

Alibaba

50.8

194.4K

qwen-image-2.0-2026-03-03

Alibaba

49.2

53.6K

8.19K

¥0 / ¥0输入/输出

gpt-image-1

Openai

47.6

265.5K

¥36 / ¥288输入/输出

seedream-4-high-res-fal

Bytedance

46.0

169.3K

recraft-v4

Recraft

44.4

69.2K

gpt-image-1-mini

Openai

42.9

157.8K

¥36 / ¥216输入/输出

wan2.7-image-pro

Alibaba

41.3

28.5K

8.19K

¥0 / ¥0输入/输出

wan2.7-image

Alibaba

39.7

28.8K

8.19K

¥0 / ¥0输入/输出

mai-image-1

Microsoft Ai

38.1

94.5K

32K

¥36 / ¥338输入/输出

z-image-turbo

Alibaba

36.5

18.3K

seedream-3

Bytedance

34.9

36.9K

flux-1-kontext-max

Bfl

33.3

65.9K

flux-2-klein-9b

Bfl

31.7

133.8K

qwen-image-prompt-extend

Alibaba

30.2

697.8K

8.19K

¥3.6 / ¥14.4输入/输出

flux-1-kontext-pro

Bfl

28.6

332.1K

imagen-3.0-generate-002

Google

27.0

361.4K

qwen-image

Alibaba

25.4

85.1K

8.19K

¥3.6 / ¥14.4输入/输出

ideogram-v3-quality

Ideogram

23.8

115.3K

photon

Luma Ai

22.2

127.6K

UNp-image

20.6

97.3K

flux-2-klein-4b

Bfl

19.0

135.7K

runway-gen4

Runway

17.5

46.6K

recraft-v3

Recraft

15.9

192K

flux-1.1-pro

Bfl

14.3

70.5K

lucid-origin

Leonardo Ai

12.7

286.6K

ideogram-v2

Ideogram

11.1

72.1K

glm-image

Zai

9.5

4.6K

200K

¥5.4 / ¥18.7输入/输出

gemini-2.0-flash-preview-image-generation

Google

7.9

258.2K

1.05M

¥1.08 / ¥4.32输入/输出

flux-1-dev-fp8

Bfl

6.3

49.2K

dall-e-3

Openai

4.8

240.1K

flux-1-kontext-dev

Bfl

3.2

216.3K

UNstable-diffusion-v35-large

1.6

23.4K

0.26K

¥0.58 / ¥0输入/输出

bagel

Bytedance

0.0

12.4K

常见问题

总榜常见问题

总榜排行榜看什么指标？

主要看排名、百分制分数、样本量和来源。分数用于快速比较同一榜单内模型表现，样本量用于判断结果稳定性。

为什么不同榜单不能直接混合成总分？

不同榜单的任务、样本和评测口径不同，模力榜默认只在同一榜单内排序，避免把写作、代码、图像等能力强行合并。

总榜模型应该怎么选？

优先看与你任务最接近的榜单，再结合价格、上下文长度、开源闭源和厂商可用性。排名靠前不代表适合所有预算和部署方式。

榜单多久更新？

页面展示的是最新成功采集的公开榜单数据。当前优先使用 LMArena leaderboard dataset，并在页面来源中保留原始链接。

图像 · 文生图 · 总榜

总榜模型怎么选？

gpt-image-2 (medium) 为什么排第一

不要只看第一名

继续比较相近能力

总榜常见问题