DeepSeek更新R1推理AI模型：开源MIT许可+6850亿参数，已上线Hugging Face

2025-05-30

1.0 K

国内AI企业DeepSeek于近日通过官方微信公众号宣布，其R1推理AI模型的更新版本已正式上线开发者平台Hugging Face，并开放免费下载与商业使用权限。此次更新虽被官方定义为“小幅升级”，但凭借其庞大的参数规模与开源策略，再次引发行业关注。
核心升级：MIT开源许可+6850亿参数

开源友好性：更新后的R1模型采用MIT许可证，允许用户自由商用、修改及分发，降低了企业与开发者部署AI技术的门槛。
参数规模：R1模型参数总量达6850亿，较此前版本进一步扩容，但官方未公开具体技术细节（如架构优化、训练数据等）。
部署门槛：由于模型体积庞大，普通消费者级硬件（如个人电脑）难以直接运行，需依赖专业级GPU或云服务资源。

发布形式：Hugging Face平台仅含核心权重

目前，R1模型在Hugging Face上的公开版本仅包含配置文件与模型权重（即核心参数），未提供详细的技术文档或训练日志。这一策略可能旨在保护核心算法的隐私性，同时为开发者提供基础运行框架。
市场背景：R1曾“叫板”OpenAI，性能引关注

今年早些时候，DeepSeek凭借初代R1模型“一夜成名”。该模型在推理任务、代码生成等场景中展现出与OpenAI同类产品（如GPT系列）相当的性能，一度被视为国产AI技术的突破性成果。此次更新虽未强调颠覆性改进，但开源策略与参数扩容或进一步巩固其技术影响力。
行业影响：开源大模型竞争白热化

技术普惠：MIT许可下，R1可能被广泛应用于学术研究、企业定制化开发等领域，加速AI技术落地。
硬件依赖：6850亿参数的规模对计算资源提出更高要求，或推动云计算厂商与硬件制造商的合作深化。
竞争压力：随着Meta（Llama系列）、Mistral等开源模型持续迭代，DeepSeek需在性能与生态建设上持续发力。

未来展望：DeepSeek的下一步

尽管官方未透露后续计划，但市场猜测DeepSeek可能进一步优化R1的推理效率、降低硬件需求，或推出针对垂直领域的轻量化版本。此外，其开源策略是否会吸引更多开发者共建生态，将成为观察重点。

结语
DeepSeek R1的更新标志着国产AI大模型在开源领域的持续探索。在参数规模与商业友好性的双重加持下，这款模型能否在全球AI竞争中占据一席之地，值得持续关注。