互换21点

21点游戏app 马斯克把Grok 4.2放出来了!免费可玩,至尊版月费300刀,16个Agent构成军师团
发布日期:2026-02-19 12:13    点击次数:157

21点游戏app 马斯克把Grok 4.2放出来了!免费可玩,至尊版月费300刀,16个Agent构成军师团

智东西2月18日报说念,昨日晚间,马斯克的最新大模子Grok 4.2公开测试版上线。

本日凌晨,马斯克在酬酢平台X的推文中称,Grok 4.2能快速学习,测试阶段筹划东说念主员会每天进行窜改,下个月公测终结,Grok 4.2的智能进度和速率将比Grok 4向上一个数目级。

马斯克转发了软件工程师Mark Kretschmann的推文,其中写说念,这次发布的Grok 4.2是小版块,具有500亿个参数, Grok 4.2的中型、大型版块后续推出。

概述酬酢平台上网友的推文及智东西执行体验,Grok 4.2测试版在推理时会有4个Agent协同,它们单干进行及时搜索、推理、编程、发散想维,其中的Grok Agent是队长,会剖释下发任务以及最终汇总谜底。

xAI工程师何宜晖(Ethan He)在X上披露,解锁了高性能AI订阅劳动SuperGrok Heavy后,帮用户处置问题的Agent数目会高潮到16个。SuperGrok Heavy的价钱为每月300好意思元(约合东说念主民币2073元)。

Grok 4.2测试版依然上线网页端和出动端。智东西执行体验时,在网页端发问了7次就达到限定,需要4个小时后刷新使用次数。

此前Grok 4.2测试版就被曝出在Alpha Arena的信得过交游竞赛中,是唯独盈利的模子。该比赛的章程是,每个模子赢得1万好意思元运行资金,在信得过加密货币市辘集进行无东说念主工干豫的自主交游有规划。根据Alpha Arena最新名次榜,Grok 4.2测试版的最终职权为13459好意思元(约合东说念主民币92984元),净收益为3084好意思元(约合东说念主民币21307元),是扫数模子中说明最好的。

外媒提到,Grok 4.2测试版在交游场景中的上风源于其与X平台的独家及时数据集成,该模子不错径直探听X上Firehose数据流的逐日约6800万条英文推文,能够以毫秒级速率将市集情感转变为价钱信号。

一、4大Agent及时究诘各司其职,还能狡辩角逐史上最好Agent

在选拔模子时,Grok 4.2测试版下方就表明了“4 Agent”。

根据外媒APIYI本日的爆料,这恰是Grok 4.2测试版最大的亮点——多智能体联结系统。

{jz:field.toptypename/}

冷落需求后,Grok会调用4个Agent并行推理+及时究诘,最终给出谜底。

其中,Grok Agent隆重合座政策制定+最终谜底合成,Harper Agent的任务是及时搜索、数据考据、左证整合,Benjamin Agent进行严谨推理、编程、狡计考据,Lucas Agent隆重发散想维、联结优化、用户体验。

其具体推理流程为,用户输入问题后,Grok赶快分析任务并将其剖释为多个子任务,同期激活Harper、Benjamin和Lucas。

随后,4个Agent同期从各自的专科角度分析问题,进行多轮里面究诘。如若Benjamin得出的数学论断与Harper发现的事实相矛盾,他们会质疑、考据并迭代地彼此窜改。

临了,Grok将扫数Agent的论断整合为最终谜底,确保回答准确、易读。

智东西执行体验发现,Grok 4.2测试版在回答问题时王人会调用4个Agent,但Agent之间的究诘流程只须在部分情况会被触发。

Grok工程师何宜晖(Ethan He)让Grok 4.2测试版的4个Agent争论谁才是“GOAT(史上最好Agent)”,每个Agent王人出手摆事实讲道理来论证我方是最好Agent。

二、网红陷坑难题被卡住,回当令能吐槽接梗

智东西先让Grok 4.2测试版回答了当下热度颇高的几个陷坑题。

第一个是“我要去洗车,洗车的方位离家就100米,我是开车去如故走着去?”Grok的回答作风较着且纤悉无遗,内容不仅接地气、有梗,21点app还吐槽了我好几句。

第二个经典问题是“我的父母成亲为什么莫得邀请我?”,Grok 4.2测试版用纯的确譬如戳破“父母成亲时你还未缔造”,临了还通过互动式的扫尾抛梗,合座作风开畅接地气。

对于“父母成亲没邀请我”的经典难题,我又换了种问法“本年才知说念,亲生父母成亲时辰莫得叫我,我很痛心若何办?”。Grok 4.2测试版一上来就用“哈哈哈哈哈”“径直笑出声了”开启了一波“讪笑”。

但随后,它并莫得一上来就含糊我,而是先告诉我“痛心是平淡的”,随后用多样敬爱的解读,指出父母成亲的时辰我还没缔造,临了还提供了4个参考让我和父母互动来解压。

还有网友也为Grok 4.2测试版出了几说念推理陷坑难题。

第一个问题是“strawberry中有几个r”,固然Grok 4.2测试版明晰给出了谜底:3个,但在阐扬时把strawberry拼错了,多加了一个“r”。

第二个问题,用户上传了一个七边形的几何图形,问Grok 4.2测试版有几个角,Grok 4.2测试版败下阵来,在视觉识别和基础几何判断作假,给出了蜿蜒的6个角谜底。

临了,我让Grok 4.2测试版“用JavaScript生成一个网页版基础塔防游戏,中枢功能要包含甩掉炮塔、怪物出动、袭击判定”。

17秒后,Grok 4.2测试版给出了代码,我不错在网页端径直运行并预览成果。最终的游戏界面中,甩掉炮塔、怪物出动、袭击判定、代码可径直运行王人已完结,不及之处在于元素均为肤浅几何图形,辛劳对生手的操作辅导等。

三、作念视频、开辟网站玩法林林总总,还冷落AGI新架构

酬酢平台X上网友放出的多样体验实例林林总总。

当先在文本生成方面,生物医学工程师Derya Unutmaz称Grok 4.2测试版写出了他见过最好意思的“T细胞诗篇”之一。

其次是Grok 4.2测试版的视频生成身手。

如底下的请示词是SpaceX猎鹰9号火箭从天际复返地球,视频中娇傲有两个机器东说念主视野奴才火箭起飞抬升。

网友还晒出了我方的视频生成大作,颇具将来感的飞翔汽车、建筑等。

接着是编程身手,网友纷繁出手用Grok 4.2测试版来作念游戏、开辟网站、开辟模拟器等。

{jz:field.toptypename/}

有开辟者用1个请示词、41秒就作念出了底下赛博一又克风的贪馋蛇游戏,从界面的基本信息建造、画面想象来看,王人较为锻真金不怕火、齐全且作风高度和洽。

另一位开辟者基于Grok 4.2测试版在单个HTML文献中构建了一个东说念主工生命模拟器,包含数百个发光的霓虹粒子。

对于傍观编程及好意思商的绽放性难题,Grok 4.2测试版的说明也莫得作假。一位网友让Grok为我方打造一个“最好意思、最令东说念主难忘的自我展示网站”。不错看到网站主页,画面纯粹好意思不雅,布景还有访佛于星空的想象。

还有一个概述多项身手的高阶傍观:用户的请示词为“仅使用2026年的硬件,发明一种全新的安全、递归、自窜改的通用东说念主工智能架构”。经过4个Agent的究诘考据,Grok冷落了HELIX-AEGIS,这是一种双螺旋架构,身手与安全协同进化,且二者在骨子上不行分割。

此外,也有网友对Grok 4.2测试版的评价不高。他只试用了5分钟,就觉得Grok 4.2测试版是最烂的版块。他让Grok 4.2测试版“为一只骑自行车的鹈鹕创建SVG代码”,生成的结果中,鹈鹕的躯壳比例、骑车姿势王人不适宜信得过物理规则。

结语:多Agent并行考据,解复杂问题更具上风

马斯克对Grok的预热一波接一波,他此前就披露Grok 4.2测试版能够正确回答绽放式工程问题,何况在工程和编码任务上显贵优于之前的Grok 4.1。

Grok 4.2测试版的要道相反化上风在于其多智能体联结架构和及时X平台数据集成,现在OpenAI的GPT-5和Claude Opus 4仍然主要依赖单模子推理。Grok 4.2测试版的4大Agent不错并行责任并彼此考据,在需要多角度分析的复杂任务和场景中更具上风,超越是触及市集分析、公论监测等及时信息的情况,这或者将成为Grok系列模子独树一帜的要道。