AI 英超预测亏损成主旋律一项新研究揭示即使是最先进的 AI 系统在长时间分析现实世界方面困难重重。在 2023 - 2024 赛季英超联赛的虚拟重现测试中来自谷歌、OpenAI 和 Anthropic 等的八个顶尖 AI 系统表现不佳。测试里这些 AI 虽被提供了每支球队及过往比赛的详细历史数据和统计信息但多数未能实现盈利。其中表现最佳的 Anthropic 的 Claude Opus 4.6 平均亏损11%也仅一次尝试接近收支平衡。谷歌 Gemini 3.1 Pro盈利与破产的极端反差在众多 AI 中谷歌的 Gemini 3.1 Pro 表现极为不稳定。它有一次实现了34%的盈利展现出强大的分析能力但另一次却直接破产。这种巨大的反差表明AI 在应对现实问题时还难以做到稳定可靠可能受到多种复杂因素的影响如球员状态的突然变化、比赛中的意外事件等。xAI Grok 4.20测试中的惨败xAI 的 Grok 4.20 在测试中的表现更是糟糕有一次直接破产另外两次甚至未能完成测试。这反映出该 AI 在处理复杂的现实情况时存在严重的不足无法根据球员数据的更新做出有效的调整难以适应比赛推进过程中的新情况。AI 能力提升与现实应用困境AI 初创公司 General Reasoning 发布的 “KellyBench” 报告指出AI 在某些任务如编写软件上的能力迅速提升但在解决像英超比赛预测这类现实问题方面仍存在明显不足。这背后可能是因为现实世界的情况过于复杂多变充满了不确定性而 AI 目前的算法和模型还无法完全应对。编辑观点对于 AI 开发者应加强对现实复杂场景的研究优化算法以提高稳定性。企业在应用 AI 时不能盲目依赖需结合人工判断。投资者则要谨慎评估 AI 项目在现实应用中的风险。