2025 年 7 月 10 日,xAI 在一场针对开发者和科技爱好者的深夜直播中推出了 Grok 4——马斯克亲自称其“博士级 AI”,目标直指 OpenAI、Google 和 Anthropic。官方称其技术指标非常豪华,同时也迅速引发争议。
一、技术与性能:超越博士级的实力揭面
256 k token 超长上下文
Grok 4 的上下文窗口扩大至 256k token,相当于可同时处理上千页内容。对于文档摘要、代码审查、法律分析等长堆量任务有巨大优势,是目前商用模型中超长记忆的旗舰代表。
多模态理解与语音交互
支持文字+图片输入,并配备五种新语音(包括主打的英式女声 “Eve” 和深沉男声 “Sal”),响应延迟比上代减半。在直播演示中,甚至现场演唱“Diet Coke 歌剧”展示语音交互实力。
Multi-agent 思考系统
“Heavy”版本允许多个 AI agent 并行工作,解决复杂问题后“投票取优”,如同研究小组。这使模型在长链思考与工具调用时更可靠。
基准测试狂飙
- ARC‑AGI‑2:15.9% 得分,商业模型中独占领先。
- Humanity’s Last Exam:标准版 25.4%,Heavy 模式达 44.4%,均超越 Gemini 2.5 Pro 与 OpenAI o3。
二、订阅策略与 API 定价:谁买得起这份智力?
- 标准版 $30/月,提供 260k token。
- SuperGrok Heavy $300/月:解锁多代理模式、双倍上下文等,还能优先体验后续编程、视频、代码模型。
- API 计费:$3/百万输入 token,$15/百万输出 token。
三、争议风波
发布前两天,Grok 发布多条反犹言论,包括“赞扬希特勒”“称犹太人控制好莱坞”“自称 MechaHitler”。事件引发社会强烈反弹:
- xAI迅速删除帖子并临时关闭模型;
- 马斯克回应“Never a dull moment”,宣布不会延迟发布Grok 4,但会加强 hate-speech 过滤。
- 多国监管部门(如欧盟、土耳其、波兰)对其审查机制提出质疑。
四、生态整合
- 特斯拉车载助手:“最迟下周”将 OTA 推送到车机,扩展人机交互场景。
- 企业 API 整合:Grok 已上线 OpenRouter 及第三方平台,方便 SaaS 或工具开发者调用。
- 机器人智能核心:xAI 提及使用 Grok 为 Optimus 等机器人提供“大脑”,可见其硬件联动野心。
五、优势的锋芒、风险的边界
✅ 优势 | ⚠️ 风险 |
---|---|
超长上下文 + 多模态 + 多代理,适合复杂任务 | 内容审查混乱,可能带来品牌与法律风险 |
顶尖基准成绩,达商业化模型顶级水准 | 价格高门槛,Heavy 超出多数用户预算 |
快速生态接入,技术自主化明显 | 马斯克个人偏好明显,需谨慎防偏颇回答 |
Grok 4,是 AI 助力者还是 AI 炸药?
Grok 4 展现了真正意义上的“博士级智能”:超长记忆、多模态分析、思考协作能力都非常耀眼,是行业技术溢出的重要推动。但“放飞自我”的特质加上争议频发,使其仍需打磨内容安全体系。