设为首页|收藏本站|

西兔生活网

登录注册

西兔生活网 › 华人生活 › 都市圈 › 马斯克突发Grok 1.5！上下文长度至128k，推理能力大幅提 ...

回复发帖

开启左侧

[科技] 马斯克突发Grok 1.5！上下文长度至128k，推理能力大幅提升

[复制链接]

38908 0

脚后跟 发表于 2024-3-29 10:22:06 | 只看该作者

上一主题

下一主题

丰色西风发自凹非寺
量子位 | 公众号 QbitAI
就在刚刚，马斯克Grok大模型宣布重大升级。
难怪之前突然开源了Grok-1，因为他有更强的Grok-1.5了，主打推理能力。
来自xAI的官方推送啥也没说，直接甩链接。主打一个“字少事大”（旺柴）

马斯克突发Grok 1.5！上下文长度至128k，推理能力大幅提升第1张图片

新版本Grok有啥突破？
一是上下文长度飙升，从8192增长到128k，和GPT-4齐平。
二是推理性能大幅提升，数学能力直接涨点50%之多、HumanEval数据集上得分超过GPT-4。
消息一出，评论区立刻就躁起来了。

马斯克突发Grok 1.5！上下文长度至128k，推理能力大幅提升第2张图片

具体跑分结果如何，咱们立马来看。
Grok-1.5来了

首先，对于上下文窗口。
这次是一把直接提升到之前的16倍，来到128k量级。
这也就意味着Grok可以处理更长和更复杂的提示，同时保持其遵循指令的能力。
在“大海捞针”（NIAH）测试中，Grok-1.5在128K token的上下文中完美检索嵌入的文本。
整个图一水儿的蓝色（100%的检索深度）：

马斯克突发Grok 1.5！上下文长度至128k，推理能力大幅提升第3张图片

其次，推理方面。
Grok-1.5处理编程和数学相关任务的能力大幅提升，全面超越Grok-1、Mistral Large、Claude 2。
数学方面，Grok-1.5在MATH基准测试上得分50.6%，超越中杯Claude 3 Sonnet；GSM8K上得分90%。
编程方面，Grok-1.5在HumanEval基准测试上得分74.1%，超越中杯Claude 3 Sonnet、Gemini Pro1.5、GPT-4，仅次于大杯Claude 3 Opus。

马斯克突发Grok 1.5！上下文长度至128k，推理能力大幅提升第4张图片

看起来，Grok这次的实力也是不可小觑。
Grok系列与其他大模型相比还有一个特色，不使用通用的Python语言+Pytorch框架。
据官方介绍，Grok 1.5采用分布式训练架构，使用Rust、JAX、Kubernetes构建。
为了提高训练可靠性和维持正常运行时间，团队提出了自定义训练协调器，可自动检测到有问题的节点，然后剔除。
除此之外，他们还优化了checkpointing、数据加载和训练重启等流程，最大限度地减少故障停机时间。
这，才速速有了现在的Grok 1.5～
更多信息官方也暂时还没有披露。
可以确定的是，新版本未来几天会先推送给早期测试者。并按照“老规矩”，很快将在平台上线。

马斯克突发Grok 1.5！上下文长度至128k，推理能力大幅提升第5张图片

有网友表示，Grok进步真的相当迅速。

马斯克突发Grok 1.5！上下文长度至128k，推理能力大幅提升第6张图片

有人甚至称马斯克这是发了另一个“GPT-4等效模型”，喊着：
OpenAI搞快点啊。

马斯克突发Grok 1.5！上下文长度至128k，推理能力大幅提升第7张图片

你期待新版本的Grok吗？

上一篇：阿里巴巴正在收缩投资版图
下一篇：“国产越野车的老祖宗”终于换代了，全新一代BJ212实车曝光

标签：马斯克 kishu 马斯克grimes 马斯克doge推文马斯克pager

@
免
责
声
明

1.西兔生活网 CTLIVES 内容全部来自网络;
2.版权归原网站或原作者所有;
3.内容与本站立场无关;
4.若涉及侵权或有疑义，请点击“举报”按钮，其他联系方式或无法及时处理。

举报

分享

0人收藏支持反对淘帖

关联主题

突发：马斯克Grok开源！

回复

使用道具举报

返回列表

脚后跟中级会员

0关注

1粉丝

39帖子

热门图文

《不够善良的我们》吐槽：薛定谔看了都想把猫叫回去

《不够善良的我们》吐槽：薛定谔看了都想把

以色列再次发起“斩首”行动

以色列再次发起“斩首”行动

两位高管遭免职、关闭部分尾部门店，永辉超市三年亏逾80亿元

两位高管遭免职、关闭部分尾部门店，永辉超

杜锋一举动暗示孙铭徽可能离队，与周琦、胡明轩组国产三巨头？

杜锋一举动暗示孙铭徽可能离队，与周琦、胡

蓝厂“灭霸”突然曝光，这价格有点狠啊

蓝厂“灭霸”突然曝光，这价格有点狠啊

越来越贵的李宁，终于跌落神坛

越来越贵的李宁，终于跌落神坛

排行榜

日
周
月

1

鸡蛋大小！广州多地降下冰雹，“天空数次闪

鸡蛋大小！广州多地降下冰雹，“天空数次闪出巨大火光”，广州龙卷风上热搜

4月27日 15时左右广东省广州市白云区钟落潭镇发生龙卷风随后，“广州龙卷风”相

1001361

2

日本扩大出口管制范围：项庄舞剑，意在沛公

日本扩大出口管制范围：项庄舞剑，意在沛公！

日本扩大出口管制范围：项庄舞剑，意在沛公！近日，日本经济产业省宣布将半导体和

1000110

3

万科，破鼓万人捶

万科，破鼓万人捶

万科的麻烦源源不断。在前段时间遭遇合作项目小股东举报后，万科管理层陷入道德危

9998420

4

斗破新爆料，萧炎再得一外挂，韩月秀大长腿

斗破新爆料，萧炎再得一外挂，韩月秀大长腿，沈云杀手锏曝光

斗破苍穹年番第94集的新爆料已经出来了，从新出爆料来看，信息量真不少。从萧炎再得一

994510

5

外媒：“以方愈加担心国际刑事法院对以高官

外媒：“以方愈加担心国际刑事法院对以高官发逮捕令”，内塔尼亚胡发声

【环球网报道】据路透社报道，以色列媒体报道称，“以方愈加担心国际刑事法院可能会以

994442

6

朱松纯：通用人工智能是新质生产力典型代表

朱松纯：通用人工智能是新质生产力典型代表，中国正向世界提供解法

核心要点：今年全国两会，“新质生产力”成为大热词。政府工作报告在部署2024年工作

992240

7

红外相机拍摄到野生大熊猫交配画面

红外相机拍摄到野生大熊猫交配画面

　　4月27日晚，布设在大熊猫国家公园白水江园区的一台红外相机拍摄到野生大熊猫交配

9881315

8

日元持续贬值，日本央行却“按兵不动”，传

日元持续贬值，日本央行却“按兵不动”，传递出什么信息？

日元对美元汇率失守158关口，创出了1990年5月以来的新低。这个汇率背后，意味着1

981570

9

《惜花芷》大结局才明白，花家风光大嫁的四

《惜花芷》大结局才明白，花家风光大嫁的四个女儿，只有她最清醒

花芷口不择言，在皇帝面前说了皓月的许多坏话，成功惹怒了皇帝。皇帝龙颜大怒，加上之

979380

10

央行下场买卖国债，放水刺激经济，股市楼市

央行下场买卖国债，放水刺激经济，股市楼市会涨吗？

4月23日，财政部发文：支持在央行公开市场操作中逐步增加国债买卖，充实货币政策工

975630

1

鸡蛋大小！广州多地降下冰雹，“天空数次闪

鸡蛋大小！广州多地降下冰雹，“天空数次闪出巨大火光”，广州龙卷风上热搜

4月27日 15时左右广东省广州市白云区钟落潭镇发生龙卷风随后，“广州龙卷风”相

1001361

2

巴勒斯坦“入联”遭美阻挠，联合国一票否决

巴勒斯坦“入联”遭美阻挠，联合国一票否决权机制是否还合理？

民智评论作者：姜姝，民智国际研究院研究助理原标题：《深陷大国权力竞争泥潭的

1000305

3

日本扩大出口管制范围：项庄舞剑，意在沛公

日本扩大出口管制范围：项庄舞剑，意在沛公！

日本扩大出口管制范围：项庄舞剑，意在沛公！近日，日本经济产业省宣布将半导体和

1000110

4

出口了却无法收款，卢布跌至2023年10月以来

出口了却无法收款，卢布跌至2023年10月以来的最低水平

内容提要：卢布兑美元再度跌破94，纳比乌琳娜左支右拙，无能为力。友好国家惧怕美国

9998920

5

万科，破鼓万人捶

万科，破鼓万人捶

万科的麻烦源源不断。在前段时间遭遇合作项目小股东举报后，万科管理层陷入道德危

9998420

6

辛芷蕾为玩梗道歉，单方面艾特杨洋被嘲太“

辛芷蕾为玩梗道歉，单方面艾特杨洋被嘲太“茶”，《花少》变味了

《花儿与少年5》收官两个月后，《花少与少年》好友季全新来袭，备受期待的“北斗七行

999354

7

3个半小时，点球10-11，夺冠热门出局，黑马

3个半小时，点球10-11，夺冠热门出局，黑马起死回生+创造历史！

2024年卡塔尔U23亚洲杯踢出了3个半小时惨烈1战！8进4的淘汰赛对决，以点球大战踢了12

999329

8

郊区房价虽然便宜，但是买房时距离市中心，

郊区房价虽然便宜，但是买房时距离市中心，最好不要超过30公里

城市的成长总是伴随着向外拓展的足迹，从一环二环的繁华，蔓延至五环六环。每个新环线

998900

9

制裁中国银行？耶伦最新表态

制裁中国银行？耶伦最新表态

【文/观察者网熊超然】当地时间4月25日，美国财政部长耶伦在接受路透社采访时称，美

9987119

10

抵制成功！田馥甄退出天津演出，直言很遗憾

抵制成功！田馥甄退出天津演出，直言很遗憾，网友：很高兴你不来

厉害了，网友们抵制田馥甄成功了。 4月27日，田馥甄天津演出的主办方发文，表示由于

9978520

1

陈震：出于礼貌和雷军的合影2月就删了，现

陈震：出于礼貌和雷军的合影2月就删了，现在却被用来造谣借题发挥

三言科技 3月31日消息，今日，陈震发文回应删雷军合照一事，他表示和雷军的合影2月5

1002832

2

主角脸对女演员有多重要？看《无限超越班》

主角脸对女演员有多重要？看《无限超越班》的郑合惠子和王梓薇就知道了

看完这期《无限超越班》，最大的感受就是从来没觉得“主角脸”对于一个演员来说如此重

1002282

3

鸡蛋大小！广州多地降下冰雹，“天空数次闪

鸡蛋大小！广州多地降下冰雹，“天空数次闪出巨大火光”，广州龙卷风上热搜

4月27日 15时左右广东省广州市白云区钟落潭镇发生龙卷风随后，“广州龙卷风”相

1001361

4

20岁谷爱凌惊艳颁奖礼，穿“黄金战袍”气场

20岁谷爱凌惊艳颁奖礼，穿“黄金战袍”气场足，与马斯克相谈甚欢

当地时间4月13日晚，谷爱凌（Eileen Feng Gu）出现在了于加利福尼亚州洛杉矶电影学

10012220

5

花费53万竞买法拍房，拖延近一年多难收房;

花费53万竞买法拍房，拖延近一年多难收房;律师：所有权自拍卖成交裁定送达

“现在对方不腾房，过不了户，这对我来讲太不公平！”王先生称自己通过法院公开拍卖，

10012120

6

轰20很快对外公布，台中将：轰20完全隐形，

轰20很快对外公布，台中将：轰20完全隐形，穿透一二岛链专打航母

根据台媒《中时电子报》报道，中国下一代战略轰炸机轰20很快将会对外公布，台中将表示

10008120

7

大算力芯片，正在拥抱Chiplet

大算力芯片，正在拥抱Chiplet

在和业内人士交流时，有人曾表示：“要么业界采用Chiplet技术，维持摩尔定律的影

1000742

8

“木头姐”谈特斯拉目标价，说对了吗

“木头姐”谈特斯拉目标价，说对了吗

本文作者王煜全，海银资本创始合伙人最近一个科技投资领域的风云人物“木头姐”Cathi

10003812

9

巴勒斯坦“入联”遭美阻挠，联合国一票否决

巴勒斯坦“入联”遭美阻挠，联合国一票否决权机制是否还合理？

民智评论作者：姜姝，民智国际研究院研究助理原标题：《深陷大国权力竞争泥潭的

1000305

10

不许对台军售！以往是美制裁中国，中方首次

不许对台军售！以往是美制裁中国，中方首次反制冻结美企在华资产

中国对美国反制式的制裁，到底有没有用？ 4月10日，美国商务部下属机构工业和安全局发

10002718

活跃网友

财神驾到

主题数：2074，精华帖：0

绿林道的

主题数：1520，精华帖：0

一抹伤

主题数：1250，精华帖：0

哇哇的哭

主题数：1038，精华帖：0

冷香丸

主题数：693，精华帖：0

返回顶部快速回复上一主题下一主题返回列表APP下载手机访问

Copyright © 2016-2028 CTLIVES.COM All Rights Reserved. 西兔生活网 小黑屋| GMT+8, 2024-4-29 01:33