排名模型厂商分数(百分制)样本量上下文价格/百万token
1
A
claude-opus-4-6-thinking Anthropic
100.0
11.9K
1M
¥36 / ¥180输入/输出
2
A
claude-opus-4-6 Anthropic
95.7
20.4K
1M
¥36 / ¥180输入/输出
3
A
claude-opus-4-7 Anthropic
91.3
6.7K
1M
¥36 / ¥180输入/输出
4
A
claude-opus-4-7-thinking Anthropic
87.0
6.4K
1M
¥36 / ¥180输入/输出
5
O
gpt-5.5-high Openai
82.6
4.6K
1.05M
¥36 / ¥216输入/输出
6
A
claude-sonnet-4-6 Anthropic
78.3
31.9K
1M
¥21.6 / ¥108输入/输出
7
O
gpt-5.5 Openai
73.9
4.7K
1.05M
¥36 / ¥216输入/输出
8
O
gpt-5.4 Openai
69.6
14.4K
1.05M
¥18 / ¥108输入/输出
9
A
claude-opus-4-5-20251101 Anthropic
65.2
8K
200K
¥36 / ¥180输入/输出
10
M
kimi-k2.6 Moonshot
60.9
3.8K
262K
¥6.84 / ¥28.8输入/输出
11
M
muse-spark Meta
56.5
868
-
-
12
A
claude-sonnet-4-5-20250929 Anthropic
52.2
16.7K
200K
¥21.6 / ¥108输入/输出
13
G
gemini-3.1-pro-preview Google
47.8
24.9K
1.05M
¥14.4 / ¥86.4输入/输出
14
G
gemini-3-pro Google
43.5
10.8K
1.05M
¥14.4 / ¥86.4输入/输出
15
M
kimi-k2.5-thinking Moonshot
39.1
10.5K
262K
¥4.32 / ¥21.6输入/输出
16
G
gemini-2.5-pro Google
34.8
20K
1.05M
¥9 / ¥72输入/输出
17
G
gemma-4-31b Google
30.4
4.4K
262K
¥3.24 / ¥7.2输入/输出
18
A
claude-haiku-4-5-20251001 Anthropic
26.1
17.9K
200K
¥7.2 / ¥36输入/输出
19
X
grok-4.20-beta-0309-reasoning Xai
21.7
6.8K
2M
¥14.4 / ¥43.2输入/输出
20
G
gemini-3-flash Google
17.4
7.2K
1.05M
¥3.6 / ¥21.6输入/输出
21
O
gpt-5.2-high Openai
13.0
7.1K
400K
¥12.6 / ¥101输入/输出
22
O
gpt-5.2 Openai
8.7
22.4K
400K
¥12.6 / ¥101输入/输出
23
O
gpt-5.5-instant Openai
4.3
3.5K
400K
¥9 / ¥72输入/输出
24
O
gpt-5.1 Openai
0.0
8.3K
400K
¥9 / ¥72输入/输出
榜首模型解读claude-opus-4-6-thinking 为什么排第一
claude-opus-4-6-thinking 当前排名第 1,厂商为 anthropic,百分制分数 100.0,样本量 11.9K。如果你的任务与本榜单口径一致,可以优先把它作为候选模型,再结合价格、上下文长度和可用性做最终选择。
如何选择模型不要只看第一名
先选择最接近真实任务的排行榜,再比较 Top 模型的分数和样本量。分数越高说明同一榜单内偏好表现越强;样本量越高通常结果更稳定。最后再结合价格、上下文长度、开源闭源和厂商可用性筛选。
相关排行榜继续比较相近能力