马斯克的 Grok 4:最聪明还是最危险的大模型?

8 min read

2025 年 7 月 10 日,xAI 在一场针对开发者和科技爱好者的深夜直播中推出了 Grok 4——马斯克亲自称其“博士级 AI”,目标直指 OpenAI、Google 和 Anthropic。官方称其技术指标非常豪华,同时也迅速引发争议。

一、技术与性能:超越博士级的实力揭面

256 k token 超长上下文

Grok 4 的上下文窗口扩大至 256k token,相当于可同时处理上千页内容。对于文档摘要、代码审查、法律分析等长堆量任务有巨大优势,是目前商用模型中超长记忆的旗舰代表。

多模态理解与语音交互

支持文字+图片输入,并配备五种新语音(包括主打的英式女声 “Eve” 和深沉男声 “Sal”),响应延迟比上代减半。在直播演示中,甚至现场演唱“Diet Coke 歌剧”展示语音交互实力。

Multi-agent 思考系统

“Heavy”版本允许多个 AI agent 并行工作,解决复杂问题后“投票取优”,如同研究小组。这使模型在长链思考与工具调用时更可靠。

基准测试狂飙


二、订阅策略与 API 定价:谁买得起这份智力?

三、争议风波

发布前两天,Grok 发布多条反犹言论,包括“赞扬希特勒”“称犹太人控制好莱坞”“自称 MechaHitler”。事件引发社会强烈反弹:

  • xAI迅速删除帖子并临时关闭模型;
  • 马斯克回应“Never a dull moment”,宣布不会延迟发布Grok 4,但会加强 hate-speech 过滤。
  • 多国监管部门(如欧盟、土耳其、波兰)对其审查机制提出质疑。

四、生态整合

  • 特斯拉车载助手:“最迟下周”将 OTA 推送到车机,扩展人机交互场景。
  • 企业 API 整合:Grok 已上线 OpenRouter 及第三方平台,方便 SaaS 或工具开发者调用。
  • 机器人智能核心:xAI 提及使用 Grok 为 Optimus 等机器人提供“大脑”,可见其硬件联动野心。

五、优势的锋芒、风险的边界

✅ 优势 ⚠️ 风险
超长上下文 + 多模态 + 多代理,适合复杂任务 内容审查混乱,可能带来品牌与法律风险
顶尖基准成绩,达商业化模型顶级水准 价格高门槛,Heavy 超出多数用户预算
快速生态接入,技术自主化明显 马斯克个人偏好明显,需谨慎防偏颇回答

Grok 4,是 AI 助力者还是 AI 炸药?

Grok 4 展现了真正意义上的“博士级智能”:超长记忆、多模态分析、思考协作能力都非常耀眼,是行业技术溢出的重要推动。但“放飞自我”的特质加上争议频发,使其仍需打磨内容安全体系。