跳转到主要内容

热门内容

今日:


总体:


最近浏览:


Chinese, Simplified

category

斯坦福大学的人工智能指数追踪绩效、投资、公众舆论等

如果你阅读有关人工智能的新闻,你可能会感到被相互矛盾的信息轰炸:人工智能正在蓬勃发展。AI是一个泡沫。人工智能目前的技术和架构将不断取得突破。人工智能正走在一条不可持续的道路上,需要激进的新想法。AI将取代你的工作。人工智能主要用于将您的家庭照片转换为吉卜力工作室风格的动画图像。

斯坦福大学以人为本的人工智能研究所发布的2025年人工智能指数打破了这种混乱。这份400多页的报告充斥着关于研发、技术性能、负责任的人工智能、经济影响、科学和医学、政策、教育和舆论等主题的图表和数据。正如IEEE Spectrum每年所做的那样(见我们2021年、2022年、2023年和2024年的报道),我们已经阅读了整件事,并挑出了我们认为能讲述人工智能真实故事的图表。

1.美国公司领先


图表显示了2003-2024年人工智能模型的显著趋势:2024年美国40个,中国15个,欧洲3个。
虽然有许多不同的方法来衡量哪个国家在人工智能竞赛中“领先”(发表或引用的期刊文章、授予的专利等),但一个简单的指标是谁推出了重要的模型。Epoch AI研究所拥有一个从1950年到现在的有影响力和重要的AI模型数据库,AI指数从中提取了本图表所示的信息。

去年,有40个著名的车型来自美国,而中国有15个,欧洲有3个(顺便说一句,都来自法国)。另一张图(此处未显示)显示,2024年的模型几乎都来自工业界,而不是学术界或政府。至于2023年至2024年发布的知名车型的减少,该指数表明,这可能是由于技术日益复杂和培训成本不断上升。

2.说到训练成本。。。


柱状图显示了2017年至2024年的人工智能培训成本,Gemini 1.0 Ultra的峰值为1.919亿美元。
哇,但它很贵!人工智能指数没有精确的数据,因为许多领先的人工智能公司已经停止发布有关其训练运行的信息。但研究人员与Epoch AI合作,根据收集到的有关训练持续时间、硬件类型和数量等的详细信息,估计了至少一些模型的成本。他们能够估算成本的最昂贵的型号是谷歌的Gemini 1.0 Ultra,成本惊人,约为1.92亿美元。培训成本的普遍增加与报告的其他发现相吻合:模型在参数计数、培训时间和培训数据量方面也在继续增加。

这张图表中没有包括中国新贵DeepSeek,该公司在1月份以仅600万美元的价格培训了一个有竞争力的大型语言模型,震惊了金融市场,但一些行业专家对此表示质疑。人工智能指数指导委员会联合主任Yolanda Gil告诉IEEE Spectrum,她认为DeepSeek“非常令人印象深刻”,并指出计算机科学的历史上充斥着早期低效技术被更优雅的解决方案所取代的例子。她说:“我并不是唯一一个认为在某个时候会有更有效的LLM版本的人。”。“我们只是不知道谁会建造它,以及如何建造。”

3.然而,使用人工智能的成本正在下降


折线图显示,2022年至2024年,GPT-3.5和GPT-4的基准推断价格呈下降趋势。
培训(大多数)人工智能模型的成本不断增加,这可能会掩盖报告强调的一些积极趋势:硬件成本下降,硬件性能提高,能源效率提高。这意味着推理成本或查询训练模型的费用正在急剧下降。这张图表以对数尺度显示了每美元人工智能性能的趋势。报告指出,蓝线表示从每百万代币20美元下降到每百万代币0.07美元;粉线显示,在不到一年的时间里,价格从15美元降至0.12美元。

4.人工智能的巨大碳足迹


柱状图显示2012年-2013年2024年训练人工智能模型的碳排放量增加。
虽然能源效率是一个积极的趋势,但让我们回到消极的趋势:尽管效率有所提高,但整体功耗仍在上升,这意味着处于人工智能热潮中心的数据中心有巨大的碳足迹。人工智能指数根据培训硬件、云提供商和位置等因素估计了选定人工智能模型的碳排放量,发现培训前沿人工智能模型产生的碳排放随着时间的推移稳步增加,DeepSeek是一个例外。

这张图表中最严重的罪犯是Meta的Llama 3.1,估计排放了8930吨二氧化碳,相当于大约496名美国人一年的生活。这种巨大的环境影响解释了为什么人工智能公司一直将核能作为可靠的无碳能源。

5.性能差距缩小


美国与中国聊天机器人得分:美国趋势从1250上升到1385,中国从1150上升到1362,2024年1月至2025年2月。
美国在发布的知名车型数量上可能仍处于领先地位,但中国车型在质量上正在迎头赶上。这张图表显示了聊天机器人基准的性能差距正在缩小。2024年1月,美国顶级型号的表现比中国最佳型号高出9.26%;到2025年2月,这一差距已缩小至

仅1.70%。该报告在与推理、数学和编码相关的其他基准测试中也发现了类似的结果。

6.人类的最后一次考试

 


条形图显示了各种AI模型的准确率,其中“o1”的准确率最高,为8.80%。
今年的报告强调了一个不可否认的事实,即我们用来衡量人工智能系统能力的许多基准都是“饱和的”——人工智能系统在基准上得分如此之高,以至于它们不再有用。它发生在许多领域:常识、图像推理、数学、编码等。Gil说,她惊讶地看到一个又一个基准变得无关紧要。她说:“我一直在想(性能)将趋于平稳,它将达到一个我们需要新技术或截然不同的架构的地步”,以继续取得进展。“但事实并非如此。”

鉴于这种情况,坚定的研究人员一直在制定新的基准,他们希望这些基准能够挑战人工智能系统。其中之一是“人类的最后一次考试”,由来自全球500个机构的主题专家提出的极具挑战性的问题组成。到目前为止,即使是最好的人工智能系统也很难做到:OpenAI的推理模型o1迄今为止得分最高,正确答案率为8.8%。我们将看看这会持续多久。

7.对数据共享的威胁


柱状图显示了2016年至2024年顶级网络域名中的各种robots.txt限制类别。
今天的生成式人工智能系统通过对从互联网上抓取的大量数据进行训练来获得智能,从而产生了人们常说的“数据是人工智能经济的新石油”的观点。随着人工智能公司不断突破他们可以输入模型的数据量的限制,人们开始担心“峰值数据”,以及我们什么时候会用完这些数据。一个问题是,网站越来越多地限制机器人抓取他们的网站和抓取他们的数据(也许是因为担心人工智能公司从网站的数据中获利,同时扼杀了他们的商业模式)。网站在机器可读的robots.txt文件中声明了这些限制。

此图显示,来自顶级域名的48%的数据现在完全受到限制。但Gil表示,人工智能中的新方法可能会结束对庞大数据集的依赖。她说:“我预计,在某个时候,数据量不会那么关键。”。

8.公司资金来了


柱状图:按活动划分的人工智能投资趋势(2013-2024)。最高:2021年(3607.3亿美元),最低:2013年(145.7亿美元)。
在过去的五年里,企业界已经打开了人工智能资金的龙头。尽管2024年的全球总投资没有达到2021年令人眼花缭乱的高度,但值得注意的是,私人投资从未如此之高。在2024年1500亿美元的私人投资中,该指数中的另一张图表(此处未显示)显示,约330亿美元用于生成人工智能的投资。

9.等待巨大的投资回报率


人工智能使用对成本和收入的影响(2024年):服务运营成本下降幅度最大,营销收入增长幅度最大。
据推测,企业投资人工智能是因为他们期望获得巨大的投资回报。这是人们气喘吁吁地谈论人工智能的变革性质和生产力前所未有的提高的部分。但公平地说,企业还没有看到能够带来显著节省或大量新利润的转型。这张图表基于麦肯锡的一项调查数据显示,在报告成本削减的公司中,大多数公司的节省不到10%。在因人工智能而收入增长的公司中,大多数公司报告的收益不到5%。这种巨大的回报可能还会到来,投资数据表明,很多公司都在押注它。只是还没有到来。

10.也许AI博士很快就会见到你


方框图显示,与医生+GPT-4和单独的医生相比,单独的GPT-4在临床诊断中得分最高。
人工智能在科学和医学领域的应用是人工智能繁荣中的一个小繁荣。该报告列出了各种新的基础模型,这些模型已经发布,以帮助材料科学、天气预报和量子计算等领域的研究人员。许多公司正试图将人工智能的预测和生成能力转化为有利可图的药物发现。OpenAI的o1推理模型最近在一个名为MedQA的基准测试中获得了96%的分数,该测试有来自医学委员会考试的问题。

但总的来说,这似乎是另一个具有巨大潜力的领域,尚未转化为对现实世界的重大影响——部分原因可能是人类还没有完全弄清楚如何使用这项技术。该图表显示了2024年的一项研究的结果,该研究测试了如果医生在使用典型资源的同时使用GPT-4,他们是否会做出更准确的诊断。他们没有,也没有让他们更快。与此同时,GPT-4本身的表现优于人类AI团队和人类。

11.美国政策行动转向美国


2016-2024年,美国与人工智能相关的拟议法案从0上升到221。通过的法案很少,其中2024年只有4项。
在美国,这张图表显示,国会大厅里有很多关于人工智能的讨论,但很少有行动。报告指出,美国的行动已转移到州一级,2024年有131项法案通过成为法律。在这些州法案中,有56项与深度伪造有关,禁止在选举中使用或传播未经同意的亲密图像。

在美国之外,欧洲确实通过了《人工智能法案》,该法案对制造被视为高风险的人工智能系统的公司规定了新的义务。但全球的大趋势是,各国齐心协力,就人工智能在世界上应该发挥的作用发表全面而不具约束力的声明。所以周围有很多讨论。

12.人类是乐观主义者


柱状图显示了人们对人工智能对工作的影响的看法,这可能会改变工作习惯,而不是取代工作。
无论你是股票摄影师、营销经理还是卡车司机,关于人工智能是否或何时会来找你的工作,都有很多公开讨论。但在最近一项关于人工智能态度的全球调查中,大多数人并没有感到受到人工智能的威胁。虽然来自32个国家的60%的受访者认为人工智能将改变他们的工作方式,但只有36%的人预计会被取代。吉尔说:“我对这些调查结果感到非常惊讶。”。“思考‘人工智能将改变我的工作,但我仍然会带来价值’是非常有力量的。”请继续关注,看看我们是否都能通过管理热切的人工智能员工团队来带来价值。

 

本文地址
最后修改
星期五, 四月 18, 2025 - 11:02
Article