快科技4月29日消息,DeepSeek正在网页端和App端灰度测试识图模式,用户可上传图片并让DeepSeek进行内容理解、描述和分析,填补了在多模态方面的空白。
该模式与快速模式、专家模式并列,作为独立的一级入口存在,说明DeepSeek正在将视觉理解作为核心能力而非辅助功能进行布局。

部分用户已可正常使用,另一些用户虽能看到入口,但会收到识图模式暂不可用,请稍后再试的提示”。
从产品界面看,用户进入识图模式后,页面显示使用识图模式开始对话,输入框旁出现图片上传按钮。
从实测情况来看,目前开放的主要是图片理解能力,即看图、读图、分析图,涵盖视觉问答、图片理解和截图分析等场景,尚未看到图像生成、视频理解或跨模态生成能力上线。
这意味着现阶段识图模式更接近视觉语言模型(VLM)的范畴,而非完整的多模态生成工具。
()
(来源:站长之家)
免责声明:本站文章部分内容为本站原创,另有部分容来源于第三方或整理自互联网,其中转载部分仅供展示,不拥有所有权,不代表本站观点立场,也不构成任何其他建议,对其内容、文字的真实性、完整性、及时性不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容,不承担相关法律责任。如发现本站文章、图片等内容有涉及版权/违法违规或其他不适合的内容, 请及时联系我们进行处理。