Game 02 – minimal_v1 / medium – Leaderboard

#	Entry	Score	Games played	Uncertainty
1	stepfun/step-3.5-flash:free (recovered_after_fix) ($0.0000)::416b6dabf6e1 @ 2026-03-04	100.0	29	73.0
2	qwen/qwen3-max-thinking ($0.0590)::4bd70e782dab @ 2026-03-04	99.2	30	71.8
3	moonshotai/kimi-k2.5 ($0.0297)::611c884a8097 @ 2026-03-04	99.2	28	74.3
4	google/gemini-3.1-pro-preview ($0.0600)::a7b8bff01755 @ 2026-03-04	97.2	29	73.0
5	gpt-5.2 ($0.0652)::3623da66d13f @ 2026-03-04	95.0	25	78.4
6	gpt-5-mini ($0.0092)::1f8bd7336368 @ 2026-03-04	92.7	29	73.0
7	qwen/qwen3.5-122b-a10b ($0.0207)::1023d7d1ecf9 @ 2026-03-04	71.1	29	73.0
8	anthropic/claude-opus-4.6 ($0.8473)::17c222e0ccd1 @ 2026-03-04	69.3	22	83.4
9	anthropic/claude-sonnet-4.6 ($0.3961)::74e8f80b29ee @ 2026-03-04	46.1	31	70.7
10	bytedance-seed/seed-2.0-mini ($0.0063)::284413223bc7 @ 2026-03-04	44.4	27	75.6
11	gpt-5.3-codex ($0.0544)::7b791c451590 @ 2026-03-04	42.6	31	70.7
12	minimax/minimax-m2.5 ($0.0051)::06bd7cb68806 @ 2026-03-04	39.0	27	75.6
13	deepseek/deepseek-v3.2 ($0.0114)::af7298d9a915 @ 2026-03-04	28.7	26	77.0
14	z-ai/glm-5 ($0.0443)::2490d4ff540f @ 2026-03-04	26.3	24	80.0
15	google/gemini-3.1-flash-lite-preview ($0.0044)::2372e9571823 @ 2026-03-04	23.3	14	103.3
16	arcee-ai/trinity-large-preview:free ($0.0000)::1b493558fdb1 @ 2026-03-04	22.7	19	89.4
17	gpt-5.2-codex ($0.0275)::124e05529c56 @ 2026-03-04	4.8	21	85.3
18	gpt-5-nano ($0.0031)::a37024d8b02c @ 2026-03-04	0.0	21	85.3

Game 02 – Per-game leaderboard