意库资讯网 意库资讯网

当前位置: 首页 » 热门动态 »

七连发!云栖大会上,阿里多款重磅产品亮相

湖北日报讯 (通讯员林俊特)9月24日,2025云栖大会现场,阿里云接连发布了七款大模型技术产品。七款技术产品覆盖语言、语音、视觉、多模态、代码等模型领域,在模型智能水平、Agent工具调用以及Coding能力、深度推理、多模态等方面均实现突破。

在大语言模型中,阿里通义旗舰模型Qwen3-Max全新亮相。Qwen3-Max是通义千问家族中最大、最强的基础模型,拥有极强的Coding编程能力和Agent工具调用能力,性能跻身全球前三。

下一代基础模型架构Qwen3-Next及系列模型也正式发布,实现模型计算效率的重大突破。Qwen3-Next针对大模型在上下文长度和总参数两方面不断扩展的未来趋势而设计,长文本推理吞吐量提升10倍以上,为未来大模型的训练和推理的效率设立了全新标准。

在专项模型方面,千问编程模型Qwen3-Coder重磅升级,代码生成和补全能力极强,可一键完成完整项目的部署和问题修复。

在多模态模型中,视觉理解模型Qwen3-VL重磅开源,在视觉感知和多模态推理方面实现重大突破。Qwen3-VL拥有极强的视觉智能体和视觉Coding能力,不仅能看懂图片,还能像人一样操作手机和电脑,自动完成许多日常任务。输入一张图片,Qwen3-VL可自行调用agent工具放大图片细节,通过更仔细的观察分析,推理出更好的答案;看到一张设计图,Qwen3-VL 就能“所见即所得”地完成视觉编程。

全模态模型Qwen3-Omni惊喜亮相,可像人类一样听说写,应用场景广泛,未来可部署于车载、智能眼镜和手机等。用户还可设定个性化角色、调整对话风格,打造专属的个人IP。

通义万相是通义大模型家族中的视觉基础模型,此次推出Wan2.5-preview系列模型,涵盖文生视频、图生视频、文生图和图像编辑四大模型。通义万相2.5视频生成模型,能生成和画面匹配的人声、音效和音乐BGM,进一步降低电影级视频创作的门槛。此次,通义万相2.5还全面升级了图像生成能力,可生成中英文文字和图表,支持图像编辑功能,输入一句话即可完成P图。

阿里云CTO周靖人发布通义百聆

此次云栖大会上,通义大模型家族还迎来了全新的成员——语音大模型通义百聆。百聆发布了语音识别大模型Fun-ASR和语音合成大模型Fun-CosyVoice。Fun-ASR具备强大的上下文理解能力与行业适应性;Fun-CosyVoice可提供上百种预制音色,可以用于客服、销售、直播电商、消费电子、有声书、儿童娱乐等场景。

自2023年开源第一款模型以来,通义大模型在全球下载量突破6亿次,衍生模型突破17万个,已发展成为全球第一开源模型。除了惠及AI开发者,通义衍生模型的开发机构还覆盖海内外国知名企业,包括苹果、英伟达、微软、DeepSeek和字节跳动等。截至目前,通义大模型已服务超100万客户。沙利文报告显示,2025年上半年,在中国企业级大模型调用市场中,通义位列第一。

未经允许不得转载: 意库资讯网 » 七连发!云栖大会上,阿里多款重磅产品亮相