界面新闻记者 | 宋佳楠
2月18日午间,马斯克旗下xAI公司的新一代大模型Grok 3正式发布。发布会采用视频直播形式 ,观看人数超过100万人,马斯克本人也出现在直播间 。
据马斯克介绍,Grok3在很短的时间内实现了功能比Grok2强大一个数量级 ,Grok-3和Grok-3 mini在多方面性能上都超过或媲美Gemini、DeepSeek和ChatGPT等对手。
xAI工程师则表示,虽然Grok起步较晚,但在MMLU得分上以超快的速度追上了ChatGPT ,Grok 3所涉及的训练是Grok 2的10倍,目前Grok 3已经在xAI内部运行了2周。MMLU是一个用于评估语言模型在多种任务上语言理解能力的基准测试 。
此外 ,xAI推出名为Deepsearch的Grok-3智能搜索引擎。xAI工程师强调,Deepsearch是xAI的第一代广泛代理工具,它不仅帮助工程师 、研究人员和科学家编写代码 ,也能帮助每个人回答日常遇到的问题。
马斯克在现场演示了Grok 3的搜索能力,如问“下一次的星舰发射是什么时候 ”,Grok 3会像DeepSeek一样 ,显示模型正在做什么,包括浏览的网页、思考的过程,并确认网页上的信息是否可信 ,再得出一个相关的结论 。最终,大模型以列表形式预测了下一次星舰的发射期。
值得注意的是,该搜索引擎在深度思考过程中还会显示不同的次任务,这种功能据称比现在的搜索引擎更为强大,可节省更多时间 ,因对搜索引擎的算法和逻辑重新进行了设计。
对于用户何时可以体验到“地球上最聪明的人工智能”,马斯克称会首先向预定用户开放。由于模型仍在不断更新和改进中,苹果应用商店上线的Grok版本会相对落后 ,而网页版更新最为及时 。据其透露,Grok 3语音模式可能在一周后推出。
直播末尾,马斯克和xAI工程师现场回答了网友提问。当被问及是否会开源时 ,马斯克给出了肯定的答案,称每次做下一个版本时会开源上一个版本,几个月后会开源Grok 3 。对于颇为敏感的“Grok 3是男性还是女性”问题 ,马斯克称,性别是模型自己定义的,还提醒“不要爱上Grok ”。
谈及开发Grok 3最难的部分 ,马斯克表示是训练模型和100%的逻辑推理过程,那种复杂程度就像随时随地预测宇宙的发展情况。
如果Grok 3的推理能力真如视频中所讲的那样强大,可能推动AI从 “生成答案” 向 “逻辑推导” 升级 。
xAI公司成立于2023年7月,此前已推出过Grok-1、Grok-1.5 、Grok-1.5 Vision、Grok-2等大模型产品。其中 ,Grok-1是迄今参数量最大的开源大语言模型;Grok-1.5具有改进的推理能力和128k的上下文长度;Grok-1.5 Vision是首个多模态智能模型;Grok-2在Chatbot Arena榜单排名第18位。
不过,当前大模型行业竞争态势无比激烈 。在Grok 3发布当日,奥特曼在X上表示 ,“对于高要求的测试者来说,试用GPT-4.5带来的感受AGI的体验,远比我预期的要深刻得多! ”这似乎在预示着 ,GPT-4.5已经进入测试阶段,距离正式发布也不会太远了。
而在2月初,谷歌也发布了一系列新模型 ,包括Gemini 2.0 Flash、Gemini 2.0 Flash-Lite以及新一代旗舰大模型Gemini 2.0 Pro实验版本。面对竞争对手,Grok 3能否占据主导地位还需进一步观察 。
可以确定的是,包括OpenAI 、谷歌等AI巨头在内 ,近期都已感受到了来自中国大模型公司DeepSeek带来的冲击波,以往坚持闭源的OpenAI也有了进一步开源的迹象。2月18日,奥特曼在X上发起投票,问大家希望下一个OpenAI开源的大模型是哪种?是o3-mini还是手机上可运行的大模型?或是在为开源某个大模型做预热。
科技早报 | 马斯克的Grok 3即将发布;腾讯回应微信接入DeepSeek|界面新闻 · 科技
OpenAI连更首日:“满血版”o1和“天价”ChatGPT Pro登场|界面新闻 · 科技
科技早报 | 台积电2纳米制程芯片下半年量产;马斯克的Grok语音模式上线|界面新闻 · 科技
马斯克宣布新一代大模型Grok 3将于2月18日发布,称其为“地球上最聪明的人工智能”|界面新闻 · 科技
DeepSeek成GDC开幕式关键词,2025年或是智能体元年|界面新闻 · 科技
ChatGPT正式登陆苹果设备,更聪明的Siri来了|界面新闻 · 科技
纵目科技被“断电封楼”,智能驾驶洗牌潮还在持续|界面新闻 · 科技
英伟达反复强调“DeepSeek出现证明需要更多AI芯片”|界面新闻 · 科技
还没有评论,来说两句吧...