Ai工具库 - 9na导航网收集Ai人工智能项目
注册
当前位置:首页 » 新闻资讯

DeepSeek开启新篇章:AI端侧推理创新引领智在终端新机遇

2025-03-12 38

每年春季的“新机潮”中,今年DeepSeek无疑成为了焦点。短时间内,几乎所有主流消费终端厂商都迅速完成了DeepSeek的接入。荣耀、OPPO、魅族、vivo、小米等纷纷宣布自家的AI助理上线了DeepSeek-R1及其满血版,就连OPPO新发布的旗舰大折叠手机Find N5也强调了对DeepSeek的支持。

车圈同样受到了DeepSeek的“鲶鱼效应”影响。一个月内,吉利、比亚迪、奇瑞、岚图、长城、理想等超过20家车企宣布接入DeepSeek,这成为了汽车与AI加速融合的一个重要切面。在这股热潮之下,技术洪流汹涌澎湃,AI正迈入推理创新时代,这一趋势认知来自高通。

DeepSeek的影响力从AI领域向外辐射,从算法创新逐渐演变成对每个人生活工作的潜在影响。消费终端作为关键桥梁,将这种影响传递给普罗大众。因此,在当前节点,对AI端侧趋势进行梳理显得尤为重要。高通最新发布的白皮书《AI变革正在推动终端推理创新》就梳理出了四大趋势:先进AI小模型已具备卓越性能;模型参数规模正在快速缩小;开发者能够在边缘侧打造更丰富的应用;AI正在成为新的UI。

那么,AI推理时代对于终端将产生哪些影响呢?通过这份行业分析,我们可以有更清晰的认识。

DeepSeek这条“鲶鱼”的出现,首先改变了行业内大模型端侧的趋势。在ChatGPT爆火后,高通就提出了混合AI的概念,强调AI处理必须分布在云侧和终端进行,才能实现AI的规模化扩展并发挥其最大潜能。这一概念几乎适用于所有生成式AI应用和终端领域。

在过去,节省成本是推动混合AI架构的主要因素之一。由于一次AI问答所需的成本是传统搜索的1000倍,混合AI通过和终端设备协同算力的方式,降低了云端计算的成本,同时兼顾了个性化、隐私保护等需求。然而,这也导致部分AI体验被阉割。因为当时推理Scaling Law尚未被提出,模型能力与参数规模呈强烈正相关,尽管厂商们陆续推出小型号模型适应端侧需求,但性能和精度水平仍受到限制。

高通在过去几年中,通过发布的第三代骁龙8、骁龙X Elite和骁龙8至尊版等平台,开始强化终端芯片对生成式AI能力的支持。手机、PC厂商们在此基础上进一步发力,陆续推出本地支持AI能力的新机,AI端侧应用迎来了一波小趋势。不仅手机助手更加智能化,还衍生出了AI一键消除路人、AI语音通话总结等原生AI端侧应用。

可以说,在过去几年中,端侧AI已经搭建好了初步的框架和地基。而DeepSeek-R1的出现,就像一股强劲的东风,让这股新趋势进一步爆发。它通过从模型层面为端侧AI的成本问题提供了全新解决思路,通过使用思维链推理数据和非推理数据微调,并进行蒸馏,实现了将推理能力赋予到小规模稠密模型上。这意味着高质量且小规模的模型并非不可能实现,而且这样的模型可能比人们预想中的还要多、还要实惠。

高通对当下趋势进行了梳理,并在白皮书中给出了四大值得参考的方向。其中第一点就是快速进化的AI模型。现在,不仅模型质量在进一步提高,开发方式也在变得更便捷。经过多年探索,AI领域内已经形成了诸多针对不同模型需求的范式。

从全行业范围来看,模型参数规模正在快速缩小。量化、剪枝、蒸馏等技术使得大模型的性能可以很好地迁移到小模型上。基于通义千问模型和Llama模型的DeepSeek蒸馏版本,在GPQA基准测试中取得了与先进模型相似或更高的分数。

此外,让模型更“浓缩精华”也是正在发生的趋势。根据Epoch AI整理的数据,2024年发布的大规模AI模型中,超过75%的模型参数在千亿规模以下。

随着高质量模型的激增,开发者有了更多选择,边缘侧的AI应用正在渗透到普通用户的日常用机习惯中。比如文档摘要、AI图像生成和编辑以及实时语言翻译,已经成为如今AI手机上的常见功能。影像方面更是可以利用AI进行计算摄影、物体识别和场景优化。这些都得益于AI推理在终端侧的广泛普及。

更进一步的是,AI正在成为新的UI。随着大模型入驻手机、PC,传统的屏幕交互正在被变革、颠覆。个性化多模态AI智能体可以简化人机交互流程,高效地跨越各种应用完成任务。比如荣耀去年火出圈的“一句话点咖啡”就是一个例子。未来,在机器人、无人机以及其他自主设备上,AI也有望实现实时决策,在动态的真实环境中实现精确交互。

随着AI进入推理时代,终端侧的创新与应用落地被进一步激发,AI格局甚至都将就此发生改变。那么,AI推理时代需要什么呢?

DeepSeek-R1的蒸馏模型在问世不到两周时间内就被争相接入各种终端,令不少业内人士惊叹不已。而值得关注的是,大部分接入的终端产品都是“高通芯”。在DeepSeek搅动风云之前,高通就已经进行了前瞻预判:AI计算处理将从云端向边缘侧扩展。

高通围绕终端能力、性能需求、隐私和安全需求以及商业模式等核心问题,进行了深入的技术布局。首先,高通致力于开发高性能、高能效的芯片设计,包括定制CPU、NPU、GPU和低功耗子系统等,构成了其行业领先的系统级芯片(SoC)产品的基础。这些SoC能够直接在终端侧提供高性能、高能效的AI推理。

其次,高通覆盖了所有关键边缘细分领域的可扩展性。不仅是手机、PC,在XR头显和眼镜、智能汽车以及工业互联网等诸多终端场景中,高通的身影无处不在,并代表着最先进的技术水平。在这些场景中,高通始终在更加积极、极致地融入和提升AI能力。

此外,高通还构建起了完备的生态系统策略。通过高通AI软件栈、高通AI Hub和开发者协作,为不同边缘终端领域的模型部署提供工具、框架和SDK,赋能开发者在边缘侧加速AI智能体和应用的落地。

毫无疑问,大模型从云端扩展到终端的过程中蕴藏着巨大的机会。而机会总是率先青睐有准备的人。在AI推理创新时代的开端,以高通为代表的技术上游已经站上潮头,推动着整个行业加速发展。更多的创新创造正在涌流,终端侧的智能新可能已经在2025年初现曙光。

相关推荐

微信扫一扫

qrcode

58209013

22270@163.com

回顶部