阿里云发布通义千问2.5 第三方测评得分追平GPT-4 Turbo,完美世界最新消息,完美世界最新信息

《 完美世界 002624 》

财务数据 | 十大股东 | 历史市盈率 | 龙虎榜

热点题材 | 分红股息 | 历史市净率 | 资金流

阿里云发布通义千问2.5 第三方测评得分追平GPT-4 Turbo
2024-05-09 13:01:00
今日在阿里云AI峰会上,通义千问2.5正式发布。同时,公司方面公布最新数据,通义大模型通过阿里云服务企业超9万,通义开源模型累计下载量突破700万。
  在阿里云AI峰会现场,公司方面宣布,小米旗下的人工智能助手“小爱同学”已与阿里云通义大模型达成合作,强化其在图片生成、图片理解等方面的多模态 AI 生成能力,并在小米汽车、手机等多类设备落地;微博、众安保险、完美世界游戏等企业也宣布接入通义大模型,将大模型应用于社交媒体、保险、游戏等领域。
  据悉,此前新东方、同程旅行、长安汽车、西部机场集团、亲宝宝等企业也都与通义大模型达成合作。
  阿里云方面向新华财经表示,模型性能全面赶超GPT-4 Turbo,在中文大模型方面业内领先。同时,通义千问最新开源的1100亿参数模型在多个基准测评收获最高得分,超越Meta的Llama-3-70B,成为开源领域表现最佳的模型之一。
  阿里云方面提供的数据显示,相比通义千问2.1版本,通义千问2.5的理解能力、逻辑推理、指令遵循、代码能力分别提升9%、16%、19%、10%,中文能力方面持续领先。在国内的第三方测评平台OpenCompass上,通义千问2.5得分追平GPT-4 Turbo,并列第一。
  通义还发布了最新款开源模型,1100亿参数的Qwen1.5-110B,该模型在MMLU、TheoremQA、GPQA等基准测评中超越了Meta的Llama-3-70B模型;在HuggingFace推出的开源大模型排行榜Open LLM Leaderboard上,Qwen1.5-110B冲上榜首。
  从阿里云方面了解到,通义的多模态模型和专有能力模型也具备业界顶尖影响力。通义千问视觉理解模型Qwen-VL-Max在多个多模态标准测试中超越Gemini Ultra和GPT-4V,目前已在多家企业落地应用;通义千问代码大模型CodeQwen1.5-7B则是HuggingFace代码模型榜单Big Code的头名选手,还是智能编码助手通义灵码的底座。
  据悉,通义大模型问世一年多来,发展出了业界领先的文生图、智能编码、文档解析、音视频理解等能力,企业客户和开发者可以通过API调用、模型下载等方式接入通义,个人用户可从通义APP、官网和小程序免费使用通义家族全栈服务。
(文章来源:新华财经)
免责申明: 本站部分内容转载自国内知名媒体,如有侵权请联系客服删除。

阿里云发布通义千问2.5 第三方测评得分追平GPT-4 Turbo,完美世界最新消息,完美世界最新信息

sitemap.xml sitemap2.xml sitemap3.xml sitemap4.xml