3月24日,针对媒体对蚂蚁百灵大模型训练成本的报道,蚂蚁集团方面回应界面新闻称,蚂蚁针对不同芯片持续调优,以降低AI应用成本,目前取得了一定的进展,也会逐步通过开源分享。
此前有报道称,蚂蚁集团正使用中国制造的半导体来开发AI模型训练技术,这将使成本降低20%。知情人士称,蚂蚁集团使用了包括来自阿里巴巴和华为的芯片,采用混合专家(MoE)机器学习方式来训练模型。他们表示,蚂蚁集团获得了与采用英伟达H800等芯片训练相似的结果。
其中一位知情人士称,蚂蚁集团仍在使用英伟达的产品进行人工智能开发,但目前其最新模型主要依赖于包括AMD产品和中国芯片在内的替代产品。
该技术成果论文《每一个FLOP都至关重要:无需高级GPU即可扩展3000亿参数混合专家LING大模型》已在预印版Arxiv平台上发表。
除了自研性能领先的大模型以外,该技术论文最大的突破在于提出了一系列创新方法,以提升资源受限环境下AI开发的效率与可及性。实验表明,其3000亿参数的MoE大模型可在使用国产GPU的低性能设备上完成高效训练,性能与完全使用英伟达芯片、同规模的稠密模型及MoE模型相当。
作为国内较早布局AI大模型的厂商,蚂蚁自研的百灵大模型2023年已通过备案,重点布局在生活服务、金融服务、医疗健康等场景的应用。
大模型训练成本降低20% ,蚂蚁集团回应自研大模型训练降本|界面新闻 · 科技
计算成本低于DeepSeek?蚂蚁集团回应自研大模型用国产AI芯片训练|界面新闻 · 科技
科技早报 | 蚂蚁集团回应自研大模型训练降本20%;腾讯领投智元机器人|界面新闻 · 科技
原菜鸟CFO刘政加入蚂蚁集团,担任新CFO|界面新闻 · 科技
李彦宏谈DeepSeek:历史上的创新都来自于成本降低,大模型成本每年降低90%以上|界面新闻 · 快讯
哈啰联合创始人杨磊拿下永安行控制权,蚂蚁集团套现2亿|界面新闻 · 科技
科技早报 | 美的回应强制下班;智元机器人发布首个通用具身基座大模型|界面新闻 · 科技
杭州国资出手后,大模型“六小虎”智谱再获珠海华发集团5亿投资|界面新闻 · 科技
还没有评论,来说两句吧...