Game 02 – full_freedom / medium – Leaderboard

#	Entry	Score	Games played	Uncertainty
1	deepseek/deepseek-v3.2 (recovered_after_fix) ($0.0064)::7530590d3a37 @ 2026-03-04	100.0	27	75.6
2	qwen/qwen3-max-thinking ($0.0514)::0a63458392d1 @ 2026-03-04	89.6	26	77.0
3	gpt-5.2-codex ($0.0446)::2252f948c0cf @ 2026-03-04	86.6	30	71.8
4	stepfun/step-3.5-flash:free ($0.0000)::3dbf666dcbd0 @ 2026-03-04	86.6	27	75.6
5	gpt-5-mini ($0.0076)::058b46859b5d @ 2026-03-04	84.7	31	70.7
6	z-ai/glm-5 ($0.0371)::cb0020652f27 @ 2026-03-04	83.9	25	78.4
7	gpt-5.2 (recovered_after_fix) ($0.0915)::661c421e12a5 @ 2026-03-04	80.0	29	73.0
8	google/gemini-3.1-pro-preview ($0.0708)::066d0848caff @ 2026-03-04	77.7	25	78.4
9	arcee-ai/trinity-large-preview:free ($0.0000)::29c62944fbd3 @ 2026-03-04	74.8	24	80.0
10	gpt-5.3-codex ($0.0617)::15ca78810d8f @ 2026-03-04	63.9	28	74.3
11	moonshotai/kimi-k2.5 ($0.0325)::75c2cc06f5f9 @ 2026-03-04	61.5	24	80.0
12	qwen/qwen3.5-122b-a10b ($0.0434)::71dca6c97f92 @ 2026-03-04	52.5	27	75.6
13	google/gemini-3.1-flash-lite-preview ($0.0032)::b0ae954bb34a @ 2026-03-04	51.0	30	71.8
14	anthropic/claude-opus-4.6 ($0.7125)::01029ef54314 @ 2026-03-04	31.6	26	77.0
15	anthropic/claude-sonnet-4.6 ($0.6293)::1c1d04ac560e @ 2026-03-04	30.6	24	80.0
16	minimax/minimax-m2.5 ($0.0130)::33656ecfc86a @ 2026-03-04	25.5	33	68.6
17	bytedance-seed/seed-2.0-mini ($0.0062)::9c565cec5a53 @ 2026-03-04	2.9	33	68.6
18	gpt-5-nano (recovered_after_fix) ($0.0065)::7b7318670453 @ 2026-03-04	0.0	31	70.7

Game 02 – Per-game leaderboard