苏州钰尚传媒-商业品牌企业运营服务商-专业高端视频拍摄服务、商业品牌宣传片制作、企业产品广告片TVC微电影拍摄、活动会议跟拍、AI视频短剧制作、纪录专题片拍摄、媒体宣传发布推广、品牌宣传软文发布、苏州广告标识牌设计制作、钰尚文化传媒——合作咨询 联系微信:esay8168 ,联系:电话18888186853微信同号

扫微信二维码

联系

电话18888186853微信同号




这里是文章模块栏目内容页
DeepSeek突发更新:不是V4但惊喜很多 编程实测来了

快科技2月11日消息,这个春节全网都在等DeepSeek发布最新大模型DeepSeek V4,但是现在来看大版本不一定会在春节期间发布,今天DeepSeek悄然更新了新版本,亮点不少。

根据DeepSeek自己的介绍,这次更新主要是提升了上下文能力,达到了1M,而之前的DeepSee V3系列也就是128K。

有了1M上下文,DeepSeek可以一次性处理《三体》三部曲这样体量的超长文本,这点已经得到了很多网友的实测证实。

DeepSeek突发更新:不是V4但惊喜很多 编程实测来了

其他方面的能力是之前就有的,DeepSeek也没有提及更详细的信息。

值得注意的是,DeepSeek在回答完这个问题之后还特别加了一段,强调它就是最新的DeepSeek模型,没有特定的子名称,不是V3也不是R1,彷佛在刻意强调这个模型的不同,但又不让人产生这就是V4 Preview预览版的联想。

DeepSeek突发更新:不是V4但惊喜很多 编程实测来了

但是从网友的反馈来看,这次DeepSeek的小更新实际上能力提升很大,知名大模型测试博主@karminski-牙医已经发布了一个快速测试,主要测试了编程方面的一个大象牙膏的测试项目。

结论就是肉眼可见美学, 建模, 物理模拟, 代码性能都有提升, 甚至还有小惊喜,这个就是比之前发布的任何版本都SOTA,也就是当前最优的大模型(当然主要是指DS的版本)。

目前还不确定DeepSeek的这个新模型是不是完全体,因为有网友测试这两天很热门的50米距离上去洗车是走路还是开车去的问题上,DeepSeek新模型给出的回答不一,有人说正确,有人说不行。

()

(来源:站长之家)
免责声明:本站文章部分内容为本站原创,另有部分容来源于第三方或整理自互联网,其中转载部分仅供展示,不拥有所有权,不代表本站观点立场,也不构成任何其他建议,对其内容、文字的真实性、完整性、及时性不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容,不承担相关法律责任。如发现本站文章、图片等内容有涉及版权/违法违规或其他不适合的内容, 请及时联系我们进行处理。
传媒行业的商业全面服务 与您共创美好未来
合作共赢
  • 交互式网络传媒领域
  • 资源丰富,体系完善
  • 创造更加精准、有效的,线上线下互动品牌整合服务
  • 多年传媒行业尽管,见证品牌及产品的蜕变、递增和成长
创造优势
苏州钰尚传媒-商业品牌企业运营服务商最新资讯
致力于传媒行业领域的专业公司