自ChatGPT引爆全球AI高潮以来,中国科技行业敏捷陷入了一场前所未有的集体焦炙。从互联网巨擘到传统制造业,从手机厂商到汽车新权势,都试图与"大年夜模型"或"生成式AI"概念建立接洽关系,参数范围从千亿跃升至万亿,计谋合作的签订典礼频繁见报。
DeepSeek的爆火正好再次印证了这一不雅点,在行业落处所向尚未明白时,各行各业均选择了“先上车后补票”的方法乘上这趟“快车”。
这种感知才能的生态外溢,最终将超出花费电子的界线。
弗成否定的是,AI是现今科技家当最重要的成长偏向之一,但在这场集体性的非理性繁华中,沉着思虑变成了一件奢侈的事,毕竟没有人愿意被贴上"错过AI时代"的标签,哪怕这种焦炙的来源本身就是对技巧变革的过度反响。
这是一个须要经久投入、难以短期变现、无法靠宣布会解决的问题。正因如斯,大年夜多半企业选择躲避,转而将资本投入到更具传播效应的"追热点"策略中。
vivo是少数选择正面答复这个问题的企业。
2026年3月,博鳌亚洲论坛。vivo总裁、首席运营官胡柏山在演讲中明白表示:"我们把核心资本聚焦在端侧AI和家当链协同,思虑用户在AI时代真正须要什么样的体验。"
这番表述可以视为一家成熟企业对技巧趋势的理性断定。
假如我们细心核阅vivo以前五年的技巧构造和计谋选择,会发明这家企业正鄙人一盘远比"宣布大年夜模型"更为深远的大年夜棋:感知才能赛道。
感知才能,是vivo对"AI时代竞争核心"这个问题的答复。
感知才能为什么是AI时代的竞争核心?
"在将来AI时代,算力、模型才能不具备差别化"。胡柏山的断定,也是vivo感知计谋的决定计划基本。
在vivo看来,跟着芯片工艺持续进步和模型架构赓续优化,算力和模型才能将会供给链化,每个手机厂商都有更多选择权,不再构成竞争壁垒,而这一点也正在被行业验证。
2024年至2026年间,联发科、高通、苹果、三星等主流芯片厂商的旗舰SoC在AI算力上持续快速晋升。与此同时,高通骁龙系列、苹果A系列的自研神经收集引擎也在同步演进。这意味着,端侧AI的算力基本正在快速走向同质化。
一个逻辑是,当算力和模型都不再是稀缺资本,企业就必须寻找新的差别化偏向。vivo给出的谜底是:以影像为基本,构建AI落地物理世界的视觉感知中枢。
本年开端,vivo内部就已经对感知赛道进行立项,核心是把视觉、听觉、触觉等感知,经由过程传感器加以感知大年夜模型,转化成AI想要获得的物理世界的信息。
所谓"数字世界连接物理世界",指的就是AI懂得、分析、处理物理世界信息的才能。一张图片中的光影关系、一段视频里的空间构造、用户脸上的情感变更。这些物理世界的感知信息,须要被AI"翻译"成可懂得、可分析、可决定计划的数字旌旗灯号。
胡柏山的看法是:真正的差别化,在于谁数字世界连接物理世界的才能越强,谁就越'聪慧'。而这刚巧是vivo的强项地点,以前十年,vivo在影像上做了巨大年夜投入,除了让照片变得更好看,同样也是在建立一套完全的物理世界感知体系。
三层才能的叠加,使vivo的手机成为一台真正意义上的"物理世界感知终端"。当用户举起手机摄影时,不仅在记录一个刹时,更是在让AI"不雅察"和"懂得"当前的物理场景。
这套感知体系的技巧架构,包含三层架构:
第一层是光学体系——镜头光学设计、镀膜工艺、光学防抖等技巧,决定了"看获得"的界线。vivo与蔡司的深度合作,恰是这一层的计谋投资,两边持续在光学设计、镀膜工艺、色彩科学等范畴深化合作。
第三层是感知懂得——场景辨认、语义瓜分、空间建模、情感感知等AI才能,决定了"看得懂"的深度。这是vivo感知计谋的核心差别化地点。在这一层,vivo的蓝心大年夜模型矩阵发挥着关键感化。蓝心大年夜模型是vivo自立研发的多模态AI模型系列,可以或许对图像和视频内容进行深度懂得,辨认物体、场景、关系、情感等多维信息。
从2023年开端,三年时光,中国科技家当开启了所谓的"大年夜模型狂飙时代"。
这种感知才能的经久价值,远超一款手机的功能进级。vivo认为,当将来AI真正深刻到千行百业时,具备强大年夜感知才能的终端将成为最重要的数据进口,这也意味着感知才能赛道的竞争,已经悄然开端。(雷峰网)
vivo的Agent Phone蓝图
在博鳌亚洲论坛,胡柏山指出——Smart Phone 将进化成Agent Phone。
什么是Agent Phone?用vivo的懂得,这是一种可以或许主动懂得用户需求、主动完成义务、智能调剂办事的下一代智妙手机。
这与"智妙手机"有着本质差别。智妙手机的核心是"对象":人应用手机来处理义务、获守信息,手机始终处于"被动响应"的状况。但Agent Phone的核心是"伙伴":手机主动感知情况、懂得需求、预判行动,成为真正懂你的智能代理。
在模型层面,开源社区的供献同样弗成忽视。Meta的Llama系列、Google的Gemma系列、阿里云的Qwen系列等开源大年夜模型,已经可以或许供给接近闭源模型的机能表示,且授权费用极低。对于手机厂商而言,基于开源模型进行微调,正在成为一条可行的技巧路径。
这个改变的关键驱动力,依然是感知才能。
当前智妙手机的交互逻辑,本质上是"输入-反馈"模式:用户发出指令,手机履行并返回成果。整条交互链路是离散的、事宜驱动的。但Agent Phone的交互逻辑将是"感知-懂得-行动":手机持续感知情况和用户状况,在后台构建对当前场景的深度懂得,然后主动供给最合适的响应和办事。
vivo对于Agent Phone有着超前的懂得,但距离落地仍有很多实际问题须要解决。
起首是意图懂得,手机须要从用户的模糊表述甚至无表述行动中,精确揣摸用户的真实意图。这请求端侧AI具备强大年夜的高低文懂得才能和长程记忆才能,可以或许综合用户的汗青行动、当前地位、时光状况、日程安排等多维信息进行综合断定。
其次是义务筹划才能,当确认用户意图后,手机须要主动拆解义务步调、调用相干App和数据、在后台完成复杂操作流程,并在须要时向用户确认关键决定计划。这须要手机具备跨App、跨办事的义务编排才能。
最后是隐私界线问题,在 vivo 看来这是弗成超越的底座。主动办事意味着手机须要持续感知和分析用户状况,Agent Phone须要在隐私保护和办事才能之间找到均衡点,做到既能供给足够智能的办事,又要确保用户对数据的控制权。
本年春节开端,OpenClaw又掀起了一阵AI高潮,只是在短暂的繁华后,热度又开端悄然退下。这是每一个新技巧的终局,同样也是对技巧浮躁、焦炙的价值。若何让AI懂得世界、懂得用户、懂得义务,这些基本问题仍没有人做出答复。
vivo的解法是将感知和推理过程尽可能保存在端侧。胡柏山泄漏,vivo正在与芯片厂商、算法公司、学术机构深度合作,合营定义面向端侧AI的新一代算力架构。"单靠手机厂商本身做不了端侧AI,必须拉着家当链一路做。"
与Arm 建立结合实验室,与联发科从底层硬件到软件的多层面结合研发,包含机能、AI、影像、游戏、通信还有多媒体等各个范畴;而在学术层面,vivo与清华大年夜学、北京大年夜学、上海交通大年夜学等高校建立了深度合作关系,在端侧AI的基本研究上持续投入。
Agent Phone的底层支撑,是端侧AI的意图懂得才能和感知体系对情况的及时建模。两者的结合,使手机可以或许在本地完成对用户需求的懂得、筹划和履行,既包管了响应速度,又保护了用户隐私。
vivo在博鳌论坛上宣布,搭载相机Agent才能的新一代旗舰机型X300 Ultra 与X300s即将宣布。除了专业的影像才能进一步晋升,从某种程度来说,这也是Agent Phone的阶段性成果展示。
但胡柏山明白表示,Agent Phone只是起点,不是终点。
"X300 Ultra会展示Agent Phone的核心才能,但它还不是最终形态。"他在专访中泄漏,"真正的Agent Phone须要感知才能、端侧AI、IoT生态的完全合营,这须要一个更长的扶植周期。"
在vivo的计谋蓝图里,感知才能的价值远不止于手机。
用感知,成为IoT生态的“眼睛”
第二层是成像处理——ISP算法、HDR融合、多帧降噪、色彩科学等技巧,决定了"看得清"的才能。vivo自研的V3影像芯片,专门针对这一层进行了算力优化。V3采取了先辈的6nm制程工艺,AI算力比拟前代晋升40%,可以或许支撑4K级其余及时画面加强。
在vivo的生态蓝图里,手机不是终点,而是起点。用胡柏山的话:"以影像+AI构建的视觉感知中枢,可以进级为IoT生态的视觉感知中枢。"
在vivo看来,IoT行业有着难以解决的问题,单个智能化设备的感知过于单方面,最终导致这些设备都缺乏一个合营的"感知中枢"来整合多维信息、构建同一懂得。vivo认为,手机可以承担这个角色。
当手机具备强大年夜的视觉感知才能,它可以成为IoT生态的"眼睛"——经由过程与各类IoT设备的互联互通,汇聚来自不合维度、不合地位、不合视角的感知信息,形成对用户生活场景的完全懂得。
"你的手机看到你在客堂,它就知道你的电视、音箱、空调应当怎么调剂。"胡柏山举例道,"但这只是第一步。将来,手机的感知才能会延长到更多品类,让更多设备'看见'这个世界。"
这种"感知延长"的计谋,须要新的产品形态作为载体。
客岁,vivo成立了机械人Lab,其成员来自无人机、计算机视觉、主动控制、机械工程等多个范畴,研究包含室内幕况的三维重建、动态障碍物的辨认与规避、人体姿势的精细感知等核心技巧。
而这个机械人实验室的重要目标并非打造一款面向C端的花费级机械人,而是专注于感知才能的技巧冲破,
"vivo做机械人,核心照样环绕感知才能。"胡柏山表示,手机积聚的影像技巧、AI算法、人机交互懂得,都邑成为机械人的基本。但更重要的是,机械人会成为vivo感知生态的延长,让vivo在更多场景、更大年夜范围内建立感知优势。
"感知才能的价值,在于它能为若干行业创造若干价值。"胡柏山说到,"这是vivo作为一家中国科技企业,应当承担的家当义务。"
这种家当义务的承担,须要经久投入和计谋定力作为支撑,而vivo的感知计谋,本质上就是一场关于"经久主义"的实践。
这条路线的价值是沉重的。感知才能的构建须要五年、十年的持续投入,短期内难以看到明显回报。当竞争敌手靠"追热点"收割流量和本钱时,vivo必须遭受计谋定力带来的寂寞。当友商赓续宣布"震动业界"的新产品时,vivo只能专一做技巧攻关。
但vivo选择信赖:时光会犒赏那些愿意下笨工夫的企业。在博鳌论坛上,胡柏山引用了老子《道德经》中的一句话:"企者不立,跨者不可",vivo的每一步,都走得扎实。
在行业广泛焦炙的时代,保持计谋定力本身就是一种稀缺才能。当AI时代真正进入深水区,vivo在感知才能上的经久积聚,将成为它最坚实的壁垒。
这是vivo的押注,也是它的底牌。(雷峰网("大众,"号:雷峰网))
雷峰网原创文章,未经授权禁止转载。详情见转载须知。

发表评论 取消回复