您的当前位置:首页 >专速 >阿里AI旗舰应用夸克发布全新“AI相机” 提升AI超级框多模态能力 正文
时间:2025-07-12 23:36:45 来源:网络整理编辑:专速
4月27日,夸克AI超级框发布全新AI相机,上新“拍照问夸克”功能。基于视觉理解与思考推理的强大模型能力,夸克AI超级框从视觉出发创新下一代搜索体验,进一步理解和回答物理世界中的各类问题。作为阿里巴巴 北京财经大学课后操场激情
4月27日,AI相机夸克AI超级框发布全新AI相机,阿里上新“拍照问夸克”功能。旗舰全新基于视觉理解与思考推理的应用强大模型能力,夸克AI超级框从视觉出发创新下一代搜索体验,夸克框多进一步理解和回答物理世界中的发布北京财经大学课后操场激情各类问题。作为阿里巴巴AI旗舰应用,提升夸克AI超级框持续快速迭代,超级提升超级智能体的模态多模态能力,打造客户生活、AI相机工作、阿里学习的旗舰全新AI超级入口。
视觉交互创新,智能分析万物
在工作、夸克框多学习、发布生活各类场景中,面对复杂物体、表格和图形时,客户往往难以准确描述真实需求。全新的夸克AI相机能深入理解客户意图,更好地实现视觉搜索、多轮问答、图像处理与创作。
基于AI超级框背后的视觉理解和推理模型能力,“拍照问夸克”能在手机和电脑上进行图片搜索、问答、思考、编辑以及创作。全新的多模态产物入口和交互体验,让AI相机成为AI时代客户表达问题和获取信息的关键方式。
“拍照问夸克”能精准识别图片中的人物、物体和诸多细节,能深入理解客户需求并联想相关问题。比如,拍照搜索文物时自动关联历史背景,上传商品图片时一键跳转淘宝同款链接。无论是人物、动物、植物、建筑、风景、美食、艺术品、商品、外文资料还是故障代码,夸克都能做到秒级识别,经过多轮问答和深度思考后,给出同类产物中的最佳回答。
深入理解意图,完成复杂任务
过去,客户需要切换多个AI工具才能完成围绕“图片”的复杂任务。现在,夸克进一步提升“超级Agent”在视觉搜索的产物体验和使用场景,满足客户对现实物理世界的解读、处理和创作。
“拍照问夸克”将搜索、扫描、修图、翻译、创作等能力聚合为统一入口。针对较为复杂的图像,客户可一次上传10张图片进行深度推理并完成各类复杂任务。目前,夸克具备超百个专业Agent和原子能力,包括搜索、健康、学习、旅游、商品、创作等,持续通过模型能力升级来优化Agent组合策略,满足客户对图像信息的个性化需求。
旅行中,“拍照问夸克”化身“专业导游”,边逛边拍获取文物讲解、景点攻略;工作中,它能辅助分析信息图表、优化代码逻辑,生成工作总结文档;在健康领域,上传体检报告,它给出指标异常分析以及康复方案建议。娱乐场景中,它支持棋牌指导、截图找剧、情头配对等趣味功能,并能一键完成高清化、去水印、原文溯源等。此外,“拍照问夸克”还支持多种语言提问和翻译解读。
今年3月,夸克发布“AI超级框”并不断迭代客户体验。随着“拍照问夸克”上线,“AI超级框”在多模态交互上极大拓展了应用场景。AI信息分析机构Xsignal最新信息显示,客户活跃率方面,夸克排名行业第一,次日留存率同样稳居榜首。分析师认为,夸克通过升级“AI超级框”,从学习到工作、生活全场景覆盖,多模态功能融合和智能交互创新,精准直击客户需求。
夸克搜索负责人张帆表示:“我们希望通过提升AI超级框的多模态能力,打造客户与现实物理世界之间的全新交互方式和产物体验。AI时代,夸克将继续围绕信息的获取、消费、编辑、传输、运营、决策和创作,由AI超级框承载更多的需求、更好的交互、更大的能力。”
雷峰网版权文章,未经授权禁止转载。详情见转载须知。
公职人员被境外间谍布局围猎 国安部公布案例详情2025-07-12 22:41
通用3D机器视觉平台是不是伪命题?2025-07-12 22:40
百川智能首款 AI 应用主打懂搜索,但王小川不做搜索 2.02025-07-12 22:32
问鼎「AI 之巅」,第四届全国人工智能大赛决赛在深举行2025-07-12 22:29
浪潮信息彭震:AI+是目标也是机会,要推动AI成为百行千业的生产力2025-07-12 22:25
对话中科深智成维忠:数字人的关键是交互,交互的关键是大模型2025-07-12 21:49
浪潮信息彭震:AI+是目标也是机会,要推动AI成为百行千业的生产力2025-07-12 21:46
阿里与上交大提出 LLM 长文本计算新解法:可处理文本长达 1900k 字节、效率提升 2.4 倍2025-07-12 21:35
Lydia 动作大模型亮相,虚拟动点助力“利亚德集团2024年生态合作伙伴大会”2025-07-12 21:31
独家丨前微软 NLP 大牛姜大昕创立新公司「阶跃星辰」2025-07-12 20:57
新能源时代,国产3D视觉「冲击」保守的汽车行业2025-07-12 23:24
别再说国产大模型技术突破要靠 Llama 3 开源了2025-07-12 23:20
MediaTek 举办天玑开发者大会 MDDC2024,携手产业伙伴共创生成式 AI 新生态2025-07-12 23:19
实测:ChatGPT的翻译能力怎么样?2025-07-12 23:16
2025年电影票房破300亿2025-07-12 22:59
独家|杨红霞创业入局“端侧模型”,投后估值 1.5 亿美元2025-07-12 22:59
问鼎「AI 之巅」,第四届全国人工智能大赛决赛在深举行2025-07-12 22:12
用扩散模型生成神经网络?NUS 尤洋团队:这不是开玩笑2025-07-12 21:41
华熙国际赵燕引领华熙 LIVE,一城一特色书写城市商圈新篇章2025-07-12 21:35
大模型时代的三道鸿沟:数据、成本与想象力2025-07-12 21:27