界面新闻记者 | 宋佳楠
4月2日 ,全球最大的AI开源社区Hugging Face更新大模型榜单,阿里通义千问的端到端全模态大模型Qwen2.5-Omni占据榜首,DeepSeek-V3-0324和群核的SpatialLM-Llama-1B紧随其后 ,杭州公司包揽全球开源模型榜单前三。
通义千问的Qwen2.5-Omni能同时处理文本、图像 、音频和视频等多种输入,并能实时输出文本,进行自然语音合成 。在多模态融合任务OmniBench等测评中,它的性能表现刷新业界纪录。
与那些参数动辄数千亿的闭源大模型不同 ,Qwen2.5-Omni参数规模仅为7B,尺寸小巧,这使得全模态大模型在端侧设备和产业场景中的广泛部署成为可能。
自发布以来 ,该模型迅速在全球开发者和企业中掀起下载和部署的热潮,加速了更多智能应用的落地 。截至目前,阿里已向全球开源200多款模型 ,千问衍生模型数量突破10万,超越美国Llama系列,成为全球最大的开源模型族群。
位居第二的DeepSeek-V3-0324 ,同样有着不错的表现。它在理解复杂指令、逻辑推理以及知识运用等方面较为突出,还针对中文搜索、写作能力以及前端代码生成任务等进行了优化。在此次登上全球开源模型总榜前三之前,DeepSeek-V3已经在AI圈内名声大噪 ,吸引了众多开发者和研究人员的关注 。
排名第三的SpatialLM-Llama-1B,是群核科技自主研发的空间理解模型。群核科技由黄晓煌 、陈航和朱皓于2011年在杭州创办 ,三人具有浙大、清华等背景。
SpatialLM-Llama-1B克服了对物理世界几何与空间关系理解的局限 。例如该模型通过一段视频,可生成符合物理规律的3D场景布局,有望为建筑设计、室内装修、虚拟场景搭建等领域带来改变。
事实上 ,2月Hugging Face发布的开源大模型榜单,排名前十的均为基于阿里通义千问(Qwen)开源模型二次训练的衍生模型。在Hugging Face 2024年的开源模型下载中,Qwen模型系列中的Qwen2.5-1.5B-Instruct下载量占总下载量的26.6% ,是全球下载量最高的开源模型之一 。
Hugging Face作为全球最大的AI开源社区,成立于2016年,专注于NLP(自然语言处理)技术 ,总部位于美国纽约。其发布的榜单测试维度覆盖阅读理解 、逻辑推理、数学计算、事实问答等多个方面,是衡量开源模型性能的重要参考。
对于开源模型的发展态势,零一万物创始人李开复近日在接受界面新闻记者采访时提及 ,未来越来越多的基座模型会开源,下一阶段的竞争,就是谁能做最好的开源模型 。
在李开复看来,全世界每家大模型公司现在只会焦虑自己是否过度依赖闭源模型。相反 ,主动拥抱DeepSeek等开源模型,尽早做出差异化打法的公司,可以每天睡得很安稳。
此次杭州公司包揽全球开源模型榜单前三 ,在证明自身技术实力与创新能力之时,也有助于吸引更多人才与资源,从而推动中国AI产业竞争格局朝着更加多元化 、创新化的方向发展 。
AI早报 | 阿里通义千问站上全球开源模型榜首;DeepSeek新专利公布|界面新闻 · 科技
科技早报 | DeepSeek据悉力求提前发布R2模型;阿里云视频生成大模型万相2.1开源|界面新闻 · 科技
阿里通义千问与DeepSeek开源两款新模型|界面新闻 · 快讯
科技早报 | 阿里发布开源全新模型;Manus被质疑“饥饿营销+套壳炒作”|界面新闻 · 科技
阿里凌晨开源新模型:性能对标DeepSeek-R1,参数仅为其1/20|界面新闻 · 科技
各大科技公司争相建AI数据中心,阿里蔡崇信称已看到泡沫苗头|界面新闻 · 科技
还没有评论,来说两句吧...