斯坦福 2025 年 AI 指数报告:10 张图表看懂人工智能发展现状
小模型性能提升、监管权下放至各州、技术滥用现象激增

最新发布的《2025 人工智能指数报告》显示,人工智能领域正日趋成熟:AI 优化技术持续进步,但与此同时,该技术的应用与滥用也呈现出泛滥态势。
报告于 2025 年 4 月 7 日发布,由斯坦福大学以人为本人工智能研究院(HAI)发起,由来自学术界和产业界的跨学科专家组成的 AI 指数指导委员会主导编制。
以下是来自该报告的 10 个核心要点:
2022 年时,能在 MMLU 多任务语言理解基准测试中达到 60% 准确率的最小模型是拥有 5400 亿参数的 PaLM。
而到 2024 年,微软仅 38 亿参数的 Phi-3-mini 模型就实现了同等表现,两年间模型体积缩小了 142 倍。
对于 MMLU 测试中达到 GPT-3.5 水平(64.8% 准确率)的模型,单次百万 token 查询成本从 2022 年 11 月的 20 美元,暴跌至 2024 年 10 月的 0.07 美元(Gemini-1.5-Flash-8B 模型),18 个月内降幅超 280 倍。不同任务的 LLM 推理价格年降幅达 9-900 倍不等。
03. 中国模型迎头赶上
美国虽仍保持顶尖 AI 模型数量优势(2024 年 40 个重要模型 vs 中国 15 个 / 欧洲 3 个),但中国模型在质量上快速逼近。
在 MMLU、HumanEval 等核心基准测试中,中美模型性能差距已从 2023 年的两位数百分比缩小至 2024 年的毫厘之间。中国在 AI 论文发表量和专利数量上持续领跑全球。

04. AI 滥用事件激增
根据 AI 事件数据库(AI Incidents Database)统计,2024 年 AI 相关危害事件达 233 起,创历史新高,较 2023 年暴增 56.4%。典型案例包括深度伪造私密影像、涉嫌导致青少年自杀的聊天机器人等。虽非全貌,但问题激增态势令人震惊。

05. Agent 实用性突破
AI Agent 展现初步潜力。2024 年推出的 RE-Bench 为评估 Agent 复杂任务设立了严格基准:在短时任务(2 小时)中,顶级 AI 系统表现超人类专家 4 倍;但在长时任务(32 小时)中,人类反超 AI 达 2 倍优势。
值得注意的是,AI 已在特定领域(如编写特定代码)达到专家水平,且效率更高。

06. AI 投资额飙升
2024 年美国私营领域 AI 投资高达 1090 亿美元,几乎是中国(93 亿美元)的 12 倍、英国(45 亿美元)的 24 倍。
在生成式 AI 领域差距更为显著:美国投资额超出欧盟与英国总和 255 亿美元,较 2023 年的 211 亿美元差距进一步扩大。

07. 企业加速拥抱 AI 技术
企业正在转向 AI。2024 年,报告使用 AI 的受访者比例从 2023 年的 55% 跃升至 78%。更值得注意的是,将生成式 AI 应用于至少一项业务职能的企业比例实现翻倍增长,从 33% 激增至 71%。

08. 医疗 AI 产品迎来审批爆发
FDA 批准的 AI 医疗设备数量呈现指数级增长。自 1995 年首个 AI 医疗设备获批后,2015 年仅累计批准 6 个,而到 2023 年这一数字已飙升至 223 个,展现出医疗 AI 应用的加速普及态势。

09. 美国 AI 监管:州政府主导推进
在联邦立法进展缓慢的背景下,美国各州正成为 AI 监管的主力军。2016 年全美仅通过 1 项州级 AI 相关法案,到 2023 年增至 49 项。 而过去一年间,这一数字更是翻倍增长至 131 项。尽管联邦层面提出的 AI 法案数量也有所增加,但实际通过率仍然偏低。

10. 亚洲对 AI 持更多乐观态度
全球对 AI 的接受度呈现明显地域差异:在中国(83%)、印尼(80%)和泰国(77%),绝大多数民众认为 AI 产品利大于弊;而在加拿大(40%)、美国(39%)和荷兰(36%),持此乐观态度的民众比例不足半数。

原文来源于:
1.https://hai.stanford.edu/ai-index/2025-ai-index-report
中文内容由元宇宙之心(MetaverseHub)团队编译,如需转载请联系我们。
最新行业深度研究报告发放中! 资本实验室全新发布 37 页量化报告《 2023 全球区块链应用市场暨产业图谱报告(2023) 》,收录 1000+ 应用案例 ,探索区块链应用趋势 , 入群即可免费领取 。

XIN 科技周刊(3.29-4.4) 机器人“超模”G1 首秀上海时装周,一点不逊色人类模特


比尔·盖茨最新预言:AI 时代人类每周仅工作 2 天,这三大职业将成为“铁饭碗”

从吉卜力爆火到 400 亿美元融资,OpenAI 为何选择在此时重返开源赛道?
百万 token 加持,谷歌 Gemini 2.5 Pro 正面对决 DeepSeek-R1
免责声明:文章中的所有内容仅代表作者的观点,与本平台无关。用户不应以本文作为投资决策的参考。
你也可能喜欢
KiloEx 宣布已正式恢复运营
DOLOUSDT 现已上线合约交易和交易BOT
草间弥生经典之作《Pumpkin (2), 1990》,即将上线 DuckChain
特朗普内阁预谋“篡位”马斯克,白宫:他“哪儿也不去”!
特朗普内阁虎视眈眈,准备在马斯克退居幕后时重新掌权。白宫则称希望马斯克继续“投入大量时间”支持总统......