对话 · 文本 · 专家榜

基于公开偏好评测数据展示文本 / 专家榜榜单，每个榜单独立排序。

选型指南

专家榜模型怎么选？

专家榜排行榜用于回答“专家榜哪个 AI 模型更强”这类选型问题。页面基于公开偏好评测数据展示模型排名，每个榜单独立排序，不把不同任务的原始分数直接混合。当前榜首是 claude-opus-4-6，厂商为 anthropic，百分制分数 100.0，样本量 3.1K。数据来源保留 Arena 原始榜单和 LMArena leaderboard dataset，更新时间以榜单发布时间 2026-05-27 为准。

claude-opus-4-6claude-opus-4-6-thinkinggpt-5.5-highgpt-5.4-highclaude-opus-4-7

claude-opus-4-6

Anthropic

100.0

3.1K

¥36 / ¥180输入/输出

claude-opus-4-6-thinking

Anthropic

99.7

2.6K

¥36 / ¥180输入/输出

gpt-5.5-high

Openai

99.4

1.5K

1.05M

¥36 / ¥216输入/输出

gpt-5.4-high

Openai

99.0

2.4K

1.05M

¥18 / ¥108输入/输出

claude-opus-4-7

Anthropic

98.7

¥36 / ¥180输入/输出

mimo-v2.5-pro

Xiaomi

98.4

1.4K

1.05M

¥7.2 / ¥21.6输入/输出

gemini-3.5-flash

Google

98.1

899

1.05M

¥10.8 / ¥64.8输入/输出

claude-opus-4-7-thinking

Anthropic

97.7

1.9K

¥36 / ¥180输入/输出

amazon-nova-experimental-chat-26-02-10

Amazon

97.4

270

gpt-5.5

Openai

97.1

1.6K

1.05M

¥36 / ¥216输入/输出

claude-sonnet-4-6

Anthropic

96.8

2.5K

¥21.6 / ¥108输入/输出

gemini-3.1-pro-preview

Google

96.4

3.8K

1.05M

¥14.4 / ¥86.4输入/输出

qwen3.5-max-preview

Alibaba

96.1

1.9K

qwen3.7-max-preview

Alibaba

95.8

345

¥18 / ¥54输入/输出

gpt-5.4

Openai

95.5

2.5K

1.05M

¥18 / ¥108输入/输出

kimi-k2.6

Moonshot

95.1

1.3K

262K

¥6.84 / ¥28.8输入/输出

glm-5.1

Zai

94.8

1.2K

200K

¥0 / ¥0输入/输出

claude-opus-4-5-20251101

Anthropic

94.5

4.6K

200K

¥36 / ¥180输入/输出

claude-sonnet-4-5-20250929-thinking-32k

Anthropic

94.2

200K

¥21.6 / ¥108输入/输出

claude-opus-4-5-20251101-thinking-32k

Anthropic

93.8

2.2K

200K

¥108 / ¥540输入/输出

gemini-3-pro

Google

93.5

2.5K

1.05M

¥14.4 / ¥86.4输入/输出

mimo-v2-pro

Xiaomi

93.2

1.9K

1.05M

¥7.2 / ¥21.6输入/输出

claude-sonnet-4-5-20250929

Anthropic

92.9

5.1K

200K

¥21.6 / ¥108输入/输出

qwen3.6-max-preview

Alibaba

92.5

469

246K

¥9.5 / ¥56.9输入/输出

ernie-5.1

Baidu

92.2

1.2K

119K

¥5.4 / ¥21.6输入/输出

gpt-5.1-high

Openai

91.9

2.3K

400K

¥9 / ¥72输入/输出

qwen3.5-397b-a17b

Alibaba

91.6

2.8K

262K

¥3.1 / ¥18.6输入/输出

kimi-k2.5-thinking

Moonshot

91.2

2.8K

262K

¥4.32 / ¥21.6输入/输出

gemini-3-flash

Google

90.9

1.9K

1.05M

¥3.6 / ¥21.6输入/输出

mimo-v2.5

Xiaomi

90.6

1.5K

1.05M

¥2.88 / ¥14.4输入/输出

glm-5

Zai

90.3

1.7K

205K

¥7.2 / ¥23输入/输出

qwen3-max-preview

Alibaba

89.9

1.3K

262K

¥6.2 / ¥24.8输入/输出

qwen3-235b-a22b-thinking-2507

Alibaba

89.6

411

131K

¥2.07 / ¥8.26输入/输出

gemini-2.5-pro

Google

89.3

7.5K

1.05M

¥9 / ¥72输入/输出

qwen3.6-plus

Alibaba

89.0

1.6K

¥3.6 / ¥21.6输入/输出

deepseek-v4-pro

Deepseek

88.6

1.6K

¥3.13 / ¥6.26输入/输出

muse-spark

Meta

88.3

1.1K

longcat-flash-chat-2602-exp

Meituan

88.0

2.1K

128K

¥1.08 / ¥10.8输入/输出

gemma-4-31b

Google

87.7

437

262K

¥3.24 / ¥7.2输入/输出

grok-4.20-multi-agent-beta-0309

Xai

87.3

2.5K

¥14.4 / ¥43.2输入/输出

gemma-4-26b-a4b

Google

87.0

406

262K

¥0.94 / ¥2.88输入/输出

deepseek-v4-pro-thinking

Deepseek

86.7

1.4K

¥3.13 / ¥6.26输入/输出

gpt-5.2-high

Openai

86.4

3.5K

400K

¥12.6 / ¥101输入/输出

qwen3-vl-235b-a22b-instruct

Alibaba

86.0

563

128K

¥2.16 / ¥8.64输入/输出

amazon-nova-experimental-chat-26-01-10

Amazon

85.7

253

qwen3-235b-a22b-instruct-2507

Alibaba

85.4

5.7K

128K

¥2.09 / ¥8.23输入/输出

dola-seed-2.0-pro

Bytedance

85.1

3.2K

gpt-5.4-mini-high

Openai

84.7

2.3K

400K

¥5.4 / ¥32.4输入/输出

grok-4.20-beta-0309-reasoning

Xai

84.4

2.6K

¥14.4 / ¥43.2输入/输出

gpt-5.1

Openai

84.1

2.7K

400K

¥9 / ¥72输入/输出

kimi-k2.5-instant

Moonshot

83.8

565

262K

¥4.32 / ¥21.6输入/输出

minimax-m2.1-preview

Minimax

83.4

1.1K

205K

¥0 / ¥0输入/输出

gpt-5.2-chat-latest-20260210

Openai

83.1

2.7K

400K

¥12.6 / ¥101输入/输出

claude-haiku-4-5-20251001

Anthropic

82.8

5.4K

200K

¥7.2 / ¥36输入/输出

claude-opus-4-1-20250805-thinking-16k

Anthropic

82.5

2.3K

200K

¥108 / ¥540输入/输出

deepseek-v4-flash

Deepseek

82.1

1.5K

¥1.01 / ¥2.02输入/输出

kimi-k2-thinking-turbo

Moonshot

81.8

4.1K

262K

¥17.3 / ¥72输入/输出

longcat-flash-chat

Meituan

81.5

515

128K

¥1.08 / ¥10.8输入/输出

amazon-nova-experimental-chat-11-10

Amazon

81.2

1.5K

deepseek-v4-flash-thinking

Deepseek

80.8

1.6K

¥1.01 / ¥2.02输入/输出

deepseek-v3.2

Deepseek

80.5

128K

¥2.09 / ¥3.1输入/输出

glm-4.6

Zai

80.2

1.9K

205K

¥4.32 / ¥15.8输入/输出

minimax-m2.7

Minimax

79.9

1.9K

205K

¥0 / ¥0输入/输出

qwen3.5-122b-a10b

Alibaba

79.5

2.3K

262K

¥2.88 / ¥23输入/输出

gpt-5.2

Openai

79.2

3.7K

400K

¥12.6 / ¥101输入/输出

deepseek-v3.2-thinking

Deepseek

78.9

2.5K

128K

¥2.09 / ¥3.1输入/输出

hunyuan-hy3-preview

Tencent

78.6

575

256K

¥0 / ¥0输入/输出

glm-4.5

Zai

78.2

1.1K

131K

¥4.32 / ¥15.8输入/输出

ernie-5.0-0110

Baidu

77.9

2.6K

128K

¥7.92 / ¥14.4输入/输出

gemini-2.5-flash

Google

77.6

7.6K

1.05M

¥2.16 / ¥18输入/输出

qwen3.5-27b

Alibaba

77.3

2.2K

262K

¥2.16 / ¥17.3输入/输出

grok-4.20-beta1

Xai

76.9

¥14.4 / ¥43.2输入/输出

gemini-3-flash (thinking-minimal)

Google

76.6

4.2K

1.05M

¥3.6 / ¥21.6输入/输出

claude-opus-4-1-20250805

Anthropic

76.3

3.9K

200K

¥108 / ¥540输入/输出

mimo-v2-flash (non-thinking)

Xiaomi

76.0

3.4K

262K

¥0.72 / ¥2.16输入/输出

gemini-2.5-flash-preview-09-2025

Google

75.6

1.6K

¥2.16 / ¥18输入/输出

ernie-5.0-preview-1022

Baidu

75.3

276

128K

¥7.92 / ¥14.4输入/输出

grok-4.1-thinking

Xai

75.0

4.4K

200K

¥14.4 / ¥72输入/输出

qwen3-vl-235b-a22b-thinking

Alibaba

74.7

378

131K

¥2.06 / ¥8.26输入/输出

ernie-5.0-preview-1203

Baidu

74.4

672

128K

¥7.92 / ¥14.4输入/输出

mimo-v2-omni

Xiaomi

74.0

283

262K

¥2.88 / ¥14.4输入/输出

gpt-5-high

Openai

73.7

1.6K

400K

¥9 / ¥72输入/输出

glm-4.7

Zai

73.4

717

205K

¥0 / ¥0输入/输出

step-3.5-flash

Stepfun

73.1

2.7K

256K

¥0.69 / ¥2.07输入/输出

grok-3-preview-02-24

Xai

72.7

1.5K

¥9 / ¥18输入/输出

grok-4-0709

Xai

72.4

256K

¥21.6 / ¥108输入/输出

deepseek-v3.2-exp-thinking

Deepseek

72.1

396

128K

¥0 / ¥0输入/输出

mistral-large-3

Mistral

71.8

262K

¥3.6 / ¥10.8输入/输出

grok-4.1

Xai

71.4

4.4K

200K

¥14.4 / ¥72输入/输出

amazon-nova-experimental-chat-12-10

Amazon

71.1

242

gpt-5.5-instant

Openai

70.8

2.4K

400K

¥9 / ¥72输入/输出

mistral-medium-2508

Mistral

70.5

5.8K

262K

¥2.88 / ¥14.4输入/输出

qwen3.5-flash

Alibaba

70.1

2.4K

¥1.24 / ¥12.4输入/输出

qwen3-next-80b-a3b-instruct

Alibaba

69.8

131K

¥1.04 / ¥4.13输入/输出

qwen3.5-35b-a3b

Alibaba

69.5

2.4K

262K

¥1.8 / ¥14.4输入/输出

grok-4-fast-reasoning

Xai

69.2

862

¥1.44 / ¥3.6输入/输出

gpt-5-chat

Openai

68.8

1.5K

400K

¥9 / ¥72输入/输出

grok-4-fast-chat

Xai

68.5

298

¥1.44 / ¥3.6输入/输出

mimo-v2-flash (thinking)

Xiaomi

68.2

711

262K

¥0.72 / ¥2.16输入/输出

100

deepseek-v3.1

Deepseek

67.9

726

128K

¥1.44 / ¥5.04输入/输出

101

grok-4-1-fast-reasoning

Xai

67.5

3.8K

¥1.44 / ¥3.6输入/输出

102

gemini-3.1-flash-lite-preview

Google

67.2

1.05M

¥1.8 / ¥10.8输入/输出

103

deepseek-v3.1-thinking

Deepseek

66.9

529

128K

¥1.44 / ¥5.04输入/输出

104

nvidia-nemotron-3-super-120b-a12b

Nvidia

66.6

594

262K

¥1.44 / ¥5.76输入/输出

105

deepseek-v3.2-exp

Deepseek

66.2

610

128K

¥0 / ¥0输入/输出

106

o3-2025-04-16

Openai

65.9

200K

¥14.4 / ¥57.6输入/输出

107

chatgpt-4o-latest-20250326

Openai

65.6

4.3K

128K

¥18 / ¥72输入/输出

108

qwen3-max-2025-09-23

Alibaba

65.3

449

258K

¥6.19 / ¥24.7输入/输出

109

deepseek-r1-0528

Deepseek

64.9

881

164K

¥3.6 / ¥15.5输入/输出

110

gpt-5.3-chat-latest

Openai

64.6

2.6K

128K

¥12.6 / ¥101输入/输出

111

gpt-5.4-nano-high

Openai

64.3

2.3K

400K

¥1.44 / ¥9输入/输出

112

gpt-4.5-preview-2025-02-27

Openai

64.0

608

8.19K

¥216 / ¥432输入/输出

113

qwen3-30b-a3b-instruct-2507

Alibaba

63.6

1.1K

262K

¥2.16 / ¥3.6输入/输出

114

grok-3-mini-high

Xai

63.3

921

128K

¥0 / ¥0输入/输出

115

hunyuan-t1-20250711

Tencent

63.0

215

131K

¥0 / ¥0输入/输出

116

amazon-nova-experimental-chat-10-20

Amazon

62.7

652

117

grok-4.3

Xai

62.3

1.5K

¥9 / ¥18输入/输出

118

claude-opus-4-20250514-thinking-16k

Anthropic

62.0

1.7K

200K

¥108 / ¥540输入/输出

119

gpt-5-mini-high

Openai

61.7

1.1K

400K

¥1.8 / ¥14.4输入/输出

120

minimax-m2.5

Minimax

61.4

205K

¥0 / ¥0输入/输出

121

gemini-2.5-flash-lite-preview-09-2025-no-thinking

Google

61.0

2.5K

1.05M

¥0.72 / ¥2.88输入/输出

122

claude-sonnet-4-20250514-thinking-32k

Anthropic

60.7

1.7K

200K

¥21.6 / ¥108输入/输出

123

claude-opus-4-20250514

Anthropic

60.4

2.2K

200K

¥108 / ¥540输入/输出

124

glm-4.5-air

Zai

60.1

1.4K

131K

¥0 / ¥0输入/输出

125

qwen3-235b-a22b-no-thinking

Alibaba

59.7

1.9K

131K

¥2.07 / ¥8.26输入/输出

126

qwen3-next-80b-a3b-thinking

Alibaba

59.4

620

131K

¥1.04 / ¥10.3输入/输出

127

nvidia-nemotron-3-nano-30b-a3b-bf16

Nvidia

59.1

944

131K

¥0 / ¥0输入/输出

128

nova-2-lite

Amazon

58.8

713

128K

¥2.38 / ¥19.8输入/输出

129

kimi-k2-0905-preview

Moonshot

58.4

555

262K

¥4.32 / ¥18输入/输出

130

gemini-2.5-flash-lite-preview-06-17-thinking

Google

58.1

1.6K

65.5K

¥0.72 / ¥2.88输入/输出

131

gpt-4.1-2025-04-14

Openai

57.8

2.5K

1.05M

¥14.4 / ¥57.6输入/输出

132

o3-mini-high

Openai

57.5

847

200K

¥7.92 / ¥31.7输入/输出

133

qwen3-32b

Alibaba

57.1

236

131K

¥2.07 / ¥8.26输入/输出

134

glm-4.7-flash

Zai

56.8

795

200K

¥0 / ¥0输入/输出

135

o1-2024-12-17

Openai

56.5

1.3K

128K

¥108 / ¥432输入/输出

136

UNtrinity-large-thinking

56.2

2.1K

262K

¥1.8 / ¥6.48输入/输出

137

grok-3-mini-beta

Xai

55.8

1.2K

¥9 / ¥18输入/输出

138

gpt-oss-120b

Openai

55.5

1.3K

131K

¥1.08 / ¥4.32输入/输出

139

glm-4.5v

Zai

55.2

196

64K

¥4.32 / ¥13输入/输出

140

mercury-2

Inception Ai

54.9

229

128K

¥1.8 / ¥5.4输入/输出

141

ling-flash-2.0

Ant Group

54.5

341

131K

¥1.01 / ¥4.1输入/输出

142

deepseek-v3-0324

Deepseek

54.2

2.3K

75K

¥1.44 / ¥5.76输入/输出

143

UNtrinity-large-preview

53.9

2.4K

262K

¥1.8 / ¥6.48输入/输出

144

qwen3-235b-a22b

Alibaba

53.6

1.3K

131K

¥2.07 / ¥8.26输入/输出

145

kimi-k2-0711-preview

Moonshot

53.2

1.5K

131K

¥4.32 / ¥18输入/输出

146

o4-mini-2025-04-16

Openai

52.9

2.3K

200K

¥7.92 / ¥31.7输入/输出

147

mistral-medium-2505

Mistral

52.6

1.8K

262K

¥2.88 / ¥14.4输入/输出

148

gemini-2.0-flash-001

Google

52.3

2.2K

1.05M

¥1.08 / ¥4.32输入/输出

149

ring-flash-2.0

Ant Group

51.9

331

131K

¥1.01 / ¥4.1输入/输出

150

hunyuan-turbos-20250416

Tencent

51.6

581

131K

¥0 / ¥0输入/输出

151

gpt-4.1-mini-2025-04-14

Openai

51.3

1.05M

¥2.88 / ¥11.5输入/输出

152

o1-preview

Openai

51.0

128K

¥108 / ¥432输入/输出

153

deepseek-r1

Deepseek

50.6

848

164K

¥5.04 / ¥18输入/输出

154

qwen3-coder-480b-a35b-instruct

Alibaba

50.3

1.3K

262K

¥6.2 / ¥24.8输入/输出

155

qwen2.5-max

Alibaba

50.0

1.7K

32K

¥11.5 / ¥46输入/输出

156

claude-sonnet-4-20250514

Anthropic

49.7

200K

¥21.6 / ¥108输入/输出

157

o3-mini

Openai

49.4

2.9K

200K

¥7.92 / ¥31.7输入/输出

158

step-3

Stepfun

49.0

259

65.5K

¥1.8 / ¥4.68输入/输出

159

qwen-plus-0125

Alibaba

48.7

358

¥0.83 / ¥2.07输入/输出

160

qwq-32b

Alibaba

48.4

1.2K

131K

¥2.07 / ¥6.2输入/输出

161

minimax-m2

Minimax

48.1

258

197K

¥0 / ¥0输入/输出

162

gpt-5-nano-high

Openai

47.7

324

400K

¥0.36 / ¥2.88输入/输出

163

nvidia-llama-3.3-nemotron-super-49b-v1.5

Nvidia

47.4

180

131K

¥2.88 / ¥2.88输入/输出

164

claude-3-7-sonnet-20250219-thinking-32k

Anthropic

47.1

1.9K

165

UNintellect-3

46.8

309

131K

¥1.44 / ¥7.92输入/输出

166

minimax-m1

Minimax

46.4

1.6K

¥0.95 / ¥9.03输入/输出

167

o1-mini

Openai

46.1

3.2K

128K

¥7.92 / ¥31.7输入/输出

168

qwen3-30b-a3b

Alibaba

45.8

1.3K

128K

¥0.79 / ¥7.78输入/输出

169

olmo-3.1-32b-instruct

Allenai

45.5

752

200K

¥14.4 / ¥57.6输入/输出

170

granite-4.1-8b

Ibm

45.1

353

131K

¥0.36 / ¥0.72输入/输出

171

deepseek-v3

Deepseek

44.8

1.2K

128K

¥0 / ¥0输入/输出

172

gemini-2.0-flash-lite-preview-02-05

Google

44.5

1.2K

1.05M

¥0.54 / ¥2.16输入/输出

173

gemma-3-27b-it

Google

44.2

2.2K

128K

¥2.15 / ¥2.15输入/输出

174

claude-3-7-sonnet-20250219

Anthropic

43.8

2.1K

200K

¥21.6 / ¥108输入/输出

175

step-1o-turbo-202506

Stepfun

43.5

472

176

mistral-small-2506

Mistral

43.2

840

262K

¥2.88 / ¥14.4输入/输出

177

command-a-03-2025

Cohere

42.9

2.8K

256K

¥18 / ¥72输入/输出

178

qwen2.5-plus-1127

Alibaba

42.5

664

179

olmo-3-32b-think

Allenai

42.2

275

128K

¥2.16 / ¥3.24输入/输出

180

UNyi-lightning

41.9

1.5K

12K

¥1.44 / ¥1.44输入/输出

181

olmo-3.1-32b-think

Allenai

41.6

503

200K

¥14.4 / ¥57.6输入/输出

182

glm-4-plus-0111

Zai

41.2

354

128K

¥72 / ¥72输入/输出

183

step-2-16k-exp-202412

Stepfun

40.9

310

16.4K

¥37.5 / ¥118输入/输出

184

gemini-1.5-pro-002

Google

40.6

3.3K

185

hunyuan-large-2025-02-10

Tencent

40.3

228

186

gpt-4.1-nano-2025-04-14

Openai

39.9

328

1.05M

¥14.4 / ¥57.6输入/输出

187

UNathene-v2-chat

39.6

1.5K

188

deepseek-v2.5-1210

Deepseek

39.3

441

¥1.01 / ¥2.02输入/输出

189

claude-3-5-sonnet-20241022

Anthropic

39.0

200K

¥21.6 / ¥108输入/输出

190

gpt-oss-20b

Openai

38.6

489

131K

¥0.32 / ¥1.3输入/输出

191

llama-4-maverick-17b-128e-instruct

Meta

38.3

¥1.8 / ¥6.26输入/输出

192

mistral-small-3.1-24b-instruct-2503

Mistral

38.0

1.6K

262K

¥2.88 / ¥14.4输入/输出

193

grok-2-2024-08-13

Xai

37.7

3.5K

¥9 / ¥18输入/输出

194

hunyuan-large-vision

Tencent

37.3

287

195

glm-4-plus

Zai

37.0

1.6K

128K

¥54 / ¥54输入/输出

196

gpt-4o-2024-05-13

Openai

36.7

5.9K

128K

¥36 / ¥108输入/输出

197

gemma-3-12b-it

Google

36.4

186

128K

¥1.96 / ¥1.96输入/输出

198

qwen-max-0919

Alibaba

36.0

131K

¥2.48 / ¥9.91输入/输出

199

hunyuan-standard-2025-02-10

Tencent

35.7

207

200

gemma-3n-e4b-it

Google

35.4

1.1K

128K

¥0 / ¥0输入/输出

201

claude-3-5-sonnet-20240620

Anthropic

35.1

4.3K

200K

¥21.6 / ¥108输入/输出

202

qwen2.5-72b-instruct

Alibaba

34.7

2.4K

131K

¥4.13 / ¥12.4输入/输出

203

gemini-1.5-pro-001

Google

34.4

3.9K

204

llama-3.1-405b-instruct-fp8

Meta

34.1

3.1K

128K

¥0 / ¥0输入/输出

205

llama-3.1-nemotron-70b-instruct

Nvidia

33.8

453

128K

¥0 / ¥0输入/输出

206

ibm-granite-h-small

Ibm

33.4

283

207

gpt-4o-2024-08-06

Openai

33.1

2.3K

128K

¥18 / ¥72输入/输出

208

deepseek-v2.5

Deepseek

32.8

1.5K

¥1.01 / ¥2.02输入/输出

209

llama-4-scout-17b-16e-instruct

Meta

32.5

1.5K

128K

¥1.44 / ¥5.62输入/输出

210

grok-2-mini-2024-08-13

Xai

32.1

2.8K

¥9 / ¥18输入/输出

211

gpt-4o-mini-2024-07-18

Openai

31.8

3.5K

128K

¥1.08 / ¥4.32输入/输出

212

gemini-1.5-flash-002

Google

31.5

2.1K

¥0.54 / ¥2.2输入/输出

213

mistral-large-2407

Mistral

31.2

2.5K

131K

¥14.4 / ¥43.2输入/输出

214

llama-3.1-405b-instruct-bf16

Meta

30.8

2.1K

128K

¥0 / ¥0输入/输出

215

UNathene-70b-0725

30.5

867

216

llama-3.3-70b-instruct

Meta

30.2

2.9K

128K

¥0 / ¥0输入/输出

217

gemma-3-4b-it

Google

29.9

208

128K

¥1.44 / ¥1.44输入/输出

218

gpt-4-turbo-2024-04-09

Openai

29.5

5.2K

128K

¥72 / ¥216输入/输出

219

claude-3-opus-20240229

Anthropic

29.2

10.4K

200K

¥108 / ¥540输入/输出

220

qwen2.5-coder-32b-instruct

Alibaba

28.9

267

131K

¥2.07 / ¥6.2输入/输出

221

magistral-medium-2506

Mistral

28.6

553

128K

¥14.4 / ¥36输入/输出

222

UNjamba-1.5-large

28.2

331

256K

¥0 / ¥0输入/输出

223

gemini-advanced-0514

Google

27.9

2.4K

224

UNreka-core-20240904

27.6

458

225

gpt-4-1106-preview

Openai

27.3

4.2K

8.19K

¥216 / ¥432输入/输出

226

amazon-nova-pro-v1.0

Amazon

26.9

1.4K

300K

¥5.76 / ¥23输入/输出

227

llama-3.1-70b-instruct

Meta

26.6

2.9K

131K

¥2.88 / ¥2.88输入/输出

228

mistral-large-2411

Mistral

26.3

1.5K

128K

¥14.4 / ¥43.2输入/输出

229

claude-3-5-haiku-20241022

Anthropic

26.0

3.5K

200K

¥5.76 / ¥28.8输入/输出

230

gpt-4-0125-preview

Openai

25.6

4.5K

8.19K

¥216 / ¥432输入/输出

231

phi-4

Microsoft

25.3

1.1K

128K

¥0.9 / ¥3.6输入/输出

232

mistral-small-24b-instruct-2501

Mistral

25.0

754

262K

¥2.88 / ¥14.4输入/输出

233

amazon-nova-lite-v1.0

Amazon

24.7

1.1K

300K

¥0.43 / ¥1.73输入/输出

234

gemini-1.5-flash-001

Google

24.4

3.2K

¥0.54 / ¥2.2输入/输出

235

gemini-1.5-flash-8b-001

Google

24.0

2.1K

¥0.54 / ¥2.2输入/输出

236

amazon-nova-micro-v1.0

Amazon

23.7

1.1K

128K

¥0.25 / ¥1.01输入/输出

237

c4ai-aya-expanse-32b

Cohere

23.4

1.8K

238

UNreka-flash-20240904

23.1

493

65.5K

¥0.72 / ¥1.44输入/输出

239

deepseek-coder-v2

Deepseek

22.7

769

¥1.01 / ¥2.02输入/输出

240

glm-4-0520

Zai

22.4

514

128K

¥108 / ¥108输入/输出

241

command-r-plus-08-2024

Cohere

22.1

524

128K

¥18 / ¥72输入/输出

242

claude-3-sonnet-20240229

Anthropic

21.8

5.6K

200K

¥21.6 / ¥108输入/输出

243

gemma-2-27b-it

Google

21.4

8.19K

¥0.58 / ¥0.58输入/输出

244

nemotron-4-340b-instruct

Nvidia

21.1

245

qwen2-72b-instruct

Alibaba

20.8

1.8K

131K

¥4.13 / ¥12.4输入/输出

246

ministral-8b-2410

Mistral

20.5

332

128K

¥0.72 / ¥0.72输入/输出

247

llama-3.1-nemotron-51b-instruct

Nvidia

20.1

265

128K

¥0 / ¥0输入/输出

248

UNgemma-2-9b-it-simpo

19.8

369

8.19K

¥1.44 / ¥1.44输入/输出

249

command-r-plus

Cohere

19.5

128K

¥18 / ¥72输入/输出

250

c4ai-aya-expanse-8b

Cohere

19.2

600

251

UNinternlm2_5-20b-chat

18.8

604

252

llama-3-70b-instruct

Meta

18.5

8.19K

¥3.67 / ¥5.33输入/输出

253

gpt-4-0314

Openai

18.2

2.2K

8.19K

¥216 / ¥432输入/输出

254

claude-3-haiku-20240307

Anthropic

17.9

6.3K

200K

¥1.8 / ¥9输入/输出

255

gemma-2-9b-it

Google

17.5

2.8K

8.19K

¥1.44 / ¥1.44输入/输出

256

qwen1.5-110b-chat

Alibaba

17.2

1.4K

257

UNyi-1.5-34b-chat

16.9

258

llama-3.1-8b-instruct

Meta

16.6

2.6K

131K

¥0.79 / ¥0.79输入/输出

259

granite-3.1-8b-instruct

Ibm

16.2

237

260

command-r-08-2024

Cohere

15.9

604

128K

¥18 / ¥72输入/输出

261

qwen1.5-72b-chat

Alibaba

15.6

1.8K

262

UNjamba-1.5-mini

15.3

332

256K

¥0 / ¥0输入/输出

263

qwq-32b-preview

Alibaba

14.9

232

131K

¥2.07 / ¥6.2输入/输出

264

granite-3.1-2b-instruct

Ibm

14.6

225

265

gpt-4-0613

Openai

14.3

3.6K

8.19K

¥216 / ¥432输入/输出

266

qwen1.5-32b-chat

Alibaba

14.0

1.2K

267

mistral-medium

Mistral

13.6

1.4K

262K

¥2.88 / ¥14.4输入/输出

268

mistral-large-2402

Mistral

13.3

2.9K

262K

¥2.88 / ¥14.4输入/输出

269

UNreka-flash-21b-20240226-online

13.0

830

270

llama-3-8b-instruct

Meta

12.7

5.4K

8.19K

¥0.29 / ¥0.29输入/输出

271

mixtral-8x22b-instruct-v0.1

Mistral

12.3

2.6K

64K

¥14.4 / ¥43.2输入/输出

272

phi-3-medium-4k-instruct

Microsoft

12.0

1.1K

4.1K

¥1.22 / ¥4.9输入/输出

273

command-r

Cohere

11.7

2.8K

128K

¥18 / ¥72输入/输出

274

UNreka-flash-21b-20240226

11.4

1.3K

275

gemma-2-2b-it

Google

11.0

2.5K

128K

¥0 / ¥0输入/输出

276

qwen1.5-14b-chat

Alibaba

10.7

944

277

llama-3.2-3b-instruct

Meta

10.4

499

131K

¥0.22 / ¥0.35输入/输出

278

mixtral-8x7b-instruct-v0.1

Mistral

10.1

3.2K

32K

¥5.04 / ¥5.04输入/输出

279

granite-3.0-8b-instruct

Ibm

9.7

345

280

UNstarling-lm-7b-beta

9.4

952

200K

¥5.4 / ¥18.7输入/输出

281

UNdbrx-instruct-preview

9.1

1.7K

282

gpt-3.5-turbo-1106

Openai

8.8

437

16.4K

¥7.2 / ¥14.4输入/输出

283

phi-3-small-8k-instruct

Microsoft

8.4

895

8.19K

¥1.08 / ¥4.32输入/输出

284

gpt-3.5-turbo-0125

Openai

8.1

3.2K

16.4K

¥3.6 / ¥10.8输入/输出

285

granite-3.0-2b-instruct

Ibm

7.8

407

286

UNzephyr-orpo-141b-A35b-v0.1

7.5

219

200K

¥108 / ¥432输入/输出

287

UNyi-34b-chat

7.1

559

288

gemini-pro-dev-api

Google

6.8

694

1.05M

¥14.4 / ¥86.4输入/输出

289

qwen1.5-7b-chat

Alibaba

6.5

231

290

UNopenchat-3.5-0106

6.2

611

291

phi-3-mini-4k-instruct-june-2024

Microsoft

5.8

486

4.1K

¥0.94 / ¥3.74输入/输出

292

phi-3-mini-4k-instruct

Microsoft

5.5

936

4.1K

¥0.94 / ¥3.74输入/输出

293

UNopenchat-3.5

5.2

194

294

gemma-1.1-7b-it

Google

4.9

1.2K

295

llama-2-70b-chat

Meta

4.5

1.4K

296

llama-2-7b-chat

Meta

4.2

411

128K

¥4.03 / ¥48输入/输出

297

mistral-7b-instruct-v0.2

Mistral

3.9

798

262K

¥2.88 / ¥14.4输入/输出

298

UNstarling-lm-7b-alpha

3.6

318

200K

¥5.4 / ¥18.7输入/输出

299

llama-2-13b-chat

Meta

3.2

539

300

UNvicuna-33b

2.9

484

301

UNsnowflake-arctic-instruct

2.6

1.7K

302

llama-3.2-1b-instruct

Meta

2.3

487

16.4K

¥0.07 / ¥0.08输入/输出

303

UNzephyr-7b-beta

1.9

201

304

gemma-7b-it

Google

1.6

340

305

UNvicuna-13b

1.3

321

306

phi-3-mini-128k-instruct

Microsoft

1.0

1.1K

128K

¥0.94 / ¥3.74输入/输出

307

qwen1.5-4b-chat

Alibaba

0.6

356

308

gemma-1.1-2b-it

Google

0.3

578

309

mistral-7b-instruct

Mistral

0.0

183

262K

¥2.88 / ¥14.4输入/输出

常见问题

专家榜常见问题

专家榜排行榜看什么指标？

主要看排名、百分制分数、样本量和来源。分数用于快速比较同一榜单内模型表现，样本量用于判断结果稳定性。

为什么不同榜单不能直接混合成总分？

不同榜单的任务、样本和评测口径不同，模力榜默认只在同一榜单内排序，避免把写作、代码、图像等能力强行合并。

专家榜模型应该怎么选？

优先看与你任务最接近的榜单，再结合价格、上下文长度、开源闭源和厂商可用性。排名靠前不代表适合所有预算和部署方式。

榜单多久更新？

页面展示的是最新成功采集的公开榜单数据。当前优先使用 LMArena leaderboard dataset，并在页面来源中保留原始链接。

对话 · 文本 · 专家榜

专家榜模型怎么选？

claude-opus-4-6 为什么排第一

不要只看第一名

继续比较相近能力

专家榜常见问题