梁文锋不语，只是一味“小更新”

摘要：

DeepSeek深夜发布小更新，新版本在编程、推理能力方面大幅提升。另有行业人士认为，本次无论模型尺寸还是适配的上下文长度都有大幅提升，猜测这可能意味着R2的上线时间又要推迟了。

凤凰网科技出品

作者｜姜凡

编辑｜董雨晴

今日凌晨，DeepSeek再度有了新动作——DeepSeek-R1-0528模型于Hugging Face平台正式开源。

在发布之前几个小时，DeepSeek小助手在官方交流群中发布低调发布了一则通知：DeepSeek R1模型已完成小版本的试升级，客户可前往官方网页、App以及小程序进行测试体验（开启深度思考模块）。值得一提的是，此次升级后，API接口及运用方法均维持原状，未作改动。

对的，没看错，官方说的还是“小版本”升级，不是人们期待已久的大版本R2发布。

相似的情况在今年3月也发生过，DeepSeek对V3模型开展过小版本升级。当时，官方率先在交流群内发布相关消息，而后才公布具体的更新详情。

实际上，关于DeepSeek-R1-0528，DeepSeek官方暂未发布基准测试成绩。不过，大家可别单纯地认为它真如官方所言，只是一次“小”迭代。

在代码测试平台Live CodeBench中，DeepSeek-R1-0528取得了73.1分的成绩，排名第四。其得分接近OpenAI的o3（75.8分）和o4-mini（80.2分），在性能表现上可直接与OpenAI的o3相媲美。社区推测可能是原计划中的R2模型提前以R1升级版形式推出。

0号新闻网 G8MwAAAABJRU5ErkJggg==” style5=” width: 640px; height: 729px;” alt=”梁文锋不语，只是一味“小更新”” />

另外在一些行业人士看来，参数量攀升至685B，上下文达到164K，是大幅增加，“应该是原本的R2，但效果不及内部预期没升级版本号”，AI博主Orange AI称。

而从实际体验效果来看，经过多方客户的反馈，普遍表明DeepSeek – R1 – 0528在编程能力、逻辑推理能力以及交互能力等多个方面都取得了很大的进步。

在X平台上，有网友总结了更新后的几个亮点：

1、允许像谷歌模型一样进行深度推理

2、文本生成优化：更自然，格式更好

3、独特的推理风格：不仅飞快，而且更深度

4、长时思考：单任务处理时长可达30-60分钟

值得一提的是，这可是能是唯一一个目前能正确做对「9.9 – 9.11」谁更大“难题”的模型。

凤凰网科技也尝试着让DeepSeek跑了两个程序试试。

第一个prompt：生成一个天气预报卡片，选中单个卡片时有动态效果，如下雨、晴天等等。

图｜来源于凤凰网科技

第二个prompt：设计一个饮食记录卡，记录每天的食品摄入，并标记相应的卡路里，以及建议的运动计划，允许设计一些扁平化的按钮。

图｜来源于凤凰网科技

不过也有行业从业者反馈，由于prompt输入的不同，不同运用者生成的效果差异较大，一些人将其代码能力类比Claude3.7，还有更广泛层面客户反馈称“感觉幻觉率下降了”、“文字水平有一些提升”。

从这次更新来看，DeepSeek还在往越来越好用的路上走，留给其他国产闭源大模型的时间真的不太多了。

很多人不知道，骁龙和ChinaJoy的第七年：站上C位，不负访客所望 | 凤凰V现场