DeepSeek全量上线识图模式？能辨认鹅腿阿姨的“绿色鸭腿”

44 阅读 0 评论 0 点赞

今朝DeepSeek官方暂未宣布公开介绍，在模型界面显示的也仍然是“图片懂得功能内测中”，有猜测此次是全量测试推送。不过，今天DeepSeek多模态团队负责人陈小康在社交媒体上提到的口气是，视觉模式已在网页和应用上正式上线，“尝尝这双新眼睛”。

值得一提的是，就在5天前，陈小康还紧跟热点，将鹅腿阿姨的“绿色鸭腿”发给DeepSeek辨认，从答复来看，DeepSeek能辨认出这不是鹅腿，同时提出这个绿色有可能是食物安然隐患。“假如昔时有DeepSeek，本年是不是就没有‘鸭骗战斗’了。”他奚弄。

在这一评论区里，有效户提问为什么还用不上视觉功能，当时陈小康答复，“灰度（测试）只有少量用户能用到”。本年4月底，DeepSeek识图模式启动灰度测试，在5月进行了一次大年夜范围开放，但不罕用户仍然没用上，直到此次似乎是面向所有效户开放测试了。

DeepSeek的识图后果若何？第一财经记者上手感触感染了一下，不合情境下的后果不合。

发给DeepSeek一张关于上海外滩的建筑图，问这是哪里，DeepSeek在用时16秒后就给出了正常谜底，分析出了四个重要的建筑，并且还答出了白色拱桥“大年夜概率是乍浦路桥”，是经典摄影角度。

不过，换成这几天热点的佛得角守门员沃齐尼亚，DeepSeek就不必定能认出来了。DeepSeek用了一分多钟进行深度思虑，思虑过程几回提到佛得角，但对应不上具体的球员，最后给出了一个完全缺点的谜底。

这或许是因为沃齐尼亚此前并不出名，大年夜模型练习数据里并不涉及，同时DeepSeek的识图模式没有联网搜刮的功能，是以无法辨认当下的热点人物。

记者留意到，在社交平台，有早就被灰度测试覆盖到的用户反馈，DeepSeek的识图才能跨越了国产模型的平均程度，但和海外顶级模型比拟，在复杂图片懂得、细节推理等方面还有差距。

具体来看，假如是日常截图、报错信息、表格、论文、网页内容这类场景，DeepSeek的识图根本够用，且速度很快。但假如是较为复杂的图片，如多层逻辑流程图、复杂的数据图表精确率会开端降低。但上述用户认为，推敲到价格和开放程度，DeepSeek仍然值得一用。

当时外界猜测很多，有的认为DeepSeek还未预备好，有的则认为是论文泄漏信息太多了。在论文中，DeepSeek认为，今朝的多模态模型在复杂义务上崩溃，不是因为看不见（感知鸿沟），而在于“指不准”（引用鸿沟）。多模态智能的将来，不只是 “看见更多像素”，而是构建说话与视觉之间精准、无歧义的指代桥梁。

就在4月30日，DeepSeek曾宣布了一篇关于多模态技巧申报《Thinking with Visaul Primitives》（《用视觉原语思虑》），阐释了多模态技巧背后的细节。但很快大年夜家发明，官方连夜删除了多模态仓库和论文原文，打开Github界面已经是“404”状况。

今朝DeepSeek还未公开宣布识图模式上线，关于这一模式的技巧细节以及更多消息，还需等待官方的介绍。

点赞(0) 打赏

本文分类：互联网
本文标签：AI 人工智能 DeepSeek全量上线识图模式？能识别鹅腿阿姨的“绿色鸭腿”
浏览次数：44 次浏览
发布日期：2026-06-22 08:42:19
本文链接：https://www.fqpy.com/internet/15826

上一篇 > DeepSeek识图模式上线但认不出来自家老板梁文锋
下一篇 > 英伟达ACE SDK仅需8G显存 AI队友会聊天、会打枪、会搜设备

DeepSeek全量上线识图模式？能辨认鹅腿阿姨的“绿色鸭腿”

评论列表共有 0 条评论

发表评论取消回复

DeepSeek全量上线识图模式？能辨认鹅腿阿姨的“绿色鸭腿”

Manus收购案重大年夜起色，传腾讯出手

卖马桶的卡了AI脖子，这是什么新时代爽文？

上市期近 Anthropic 7月9日举办IPO前财务会

杨立昆：马斯克的xAI已掉败 只能靠出租算力来收回成本

评论列表 共有 0 条评论

发表评论 取消回复

杨立昆：马斯克的xAI已掉败只能靠出租算力来收回成本

评论列表共有 0 条评论

发表评论取消回复