LOADING STUFF...

2025 AI深度前瞻:推理成本暴降90%

科技2周前发布 hotfox
3 0 0

走出最后一个AI寒冬,21世纪第三个十年见证了现代AI的诞生。

斯坦福大学教授、“AI教母”李飞飞将当前AI领域的变化描述为科技领域的“寒武纪大爆发”。回顾过去一年,Scaling Law驱动的新范式开始告别参数规模崇拜;多模态AI生成能力涌现多个爆款应用,打开了全新的竞速空间,也为即将到来的2025年带来了诸多可能性。

12月,微软亚洲研究院、中金研究、红杉资本、Wired等发布了多份新年技术趋势展望报告,其中端侧大模型、智能代理等成为多个机构加注的焦点,值得行业长期关注。

一、计算成本呈每年十倍速下降,大模型向端侧及边缘侧落地

  • 计算成本显著下降

目前,动辄数十亿美金的计算资源投入和昂贵的推理费用正在削弱生成式人工智能的创新能力。为了实现新的技术突破,大型语言模型(LLM)迫切需要变得更加精简、效率更高、成本更低。在《WIRED》杂志的《2025年趋势展望》特刊中,李开复博士预计,2025年将成为一个关键的转变点,届时将有大量以AI为核心的应用出现,这些应用将得益于性能卓越但更加经济的模型。

2025 AI深度前瞻:推理成本暴降90%,智能体迎GPT时刻,空间智能涌现

李开复博士认为,当前硅谷巨头如OpenAI、谷歌、xAI等公司不惜重金的投入造就了一个不均衡的生态。由庞大的GPU集群训练出的大模型,推理成本高昂,最终会转嫁到所有使用这些大模型的应用上。这种失衡生态使英伟达成为最大受益者,同时也让应用开发者面临艰难抉择:要么只能使用低成本、低性能的模型,但这显然无法满足用户期望;要么承担高昂的推理成本,冒着极大的风险开发应用。

李开复博士预测,到2025年,一种新模式将有望打破这一僵局——随着新一代人工智能算法的优化、更先进推理技术以及更具成本效益芯片技术的发展,AI推理成本有望实现每年十倍的降低。

  • 端侧应用将迎爆发

随着计算成本的大幅降低,更轻便的终端应用将迅速增长。东兴证券的研究报告指出,人工智能终端市场潜力巨大,覆盖了个人电脑、智能手机、可穿戴设备等多个领域,人工智能终端在短期、中期和长期均显示出明显的增长趋势。

© 版权声明

相关文章

暂无评论

暂无评论...