GPT-5.4(Thinking / Pro)模型/发布最强专业工作模型,融合GPT-5.3-Codex编码能力,1M上下文窗口,首个内置计算机使用能力的主线模型,支持build-run-verify-fix循环,错误率比GPT-5.2降低33%。2026/3/5
Nano Banana 2(Gemini 3.1 Flash Image)模型/发布结合Nano Banana Pro高级功能与Flash速度,支持多语言文本渲染、5角色一致性、最高4K分辨率,成为Gemini应用默认图像模型。2026/2/26
Claude Sonnet 4.6模型/发布成为claude.ai默认模型,1M上下文窗口(Beta),SWE-Bench约80%,比Sonnet 4.5快30-50%,定价$3/$15百万tokens。2026/2/17
Claude Opus 4.6模型/发布更强编码、调试和长时代理能力,1M上下文窗口(Beta),14.5小时任务完成时间创纪录,在Terminal-Bench 2.0和Humanity’s Last Exam上领先,定价$5/$25百万tokens。2026/2/5
Claude Cowork 研究预览上线产品/工具面向非技术用户的桌面AI代理,被称为"Claude Code for the rest of your work",可自动管理文件、整理下载、生成费用报表等,初始面向Max订阅用户开放。2026/1/12
Claude Skills 功能增强功能/产品Skills功能(10月推出)变得更易部署、发现和构建,支持团队和企业级组织管理,提供合作伙伴构建的技能目录,采用开放标准(Agent Skills)。2025/12/18
Gemini 3 Flash模型/发布Google 最大的模型升级,全球可用。在SWE-bench Verified上达到78%的代理编码得分,超越2.5系列和Gemini 3 Pro。2025/12/17
GPT-5.2(Instant/Thinking/Pro)模型/发布OpenAI最先进的AI模型,提供三个版本:Instant(更快的写作和信息查询)、Thinking(更适合编码和规划)、Pro(困难问题最准确答案)。知识截止日期为2025年8月。2025/12/11
Nano Banana Pro模型/发布基于 Gemini 3 Pro 构建的 AI 图像生成和编辑模型,提供增强的推理能力、多语言文本渲染、多图像合成(最多14张图像,5个人物一致性)和专业级图像编辑(最高4K分辨率)。集成到 Gemini 应用、Adobe Firefly 和 Photoshop。2025/11/20
GPT-5.1-Codex-Max 发布模型/更新OpenAI 发布前沿代理编码模型 GPT-5.1-Codex-Max,在软件工程、数学和研究等领域的长时代理任务上进行了训练,支持跨多个上下文窗口的项目级重构、深度调试和多小时代理循环,加速开发周期。2025/11/19
GPT-5.1 Pro 上线(升级自 GPT-5 Pro)模型/更新在写作、数据科学和商业分析等复杂工作场景下表现更好,测试用户特别认可其更清晰、更相关、结构更好的回答;GPT-5.1 Pro 向全部 ChatGPT Pro 用户开放,GPT-5 Pro 在未来 90 天内作为旧版保留。2025/11/19
Gemini 3 发布并即刻进驻核心产品模型/发布Google 推出 Gemini 3,将其集成到搜索等核心产品,并通过 Gemini Agent 与 Antigravity 平台展示更强推理与自动化能力。2025/11/18
GPT-5.1(Instant / Thinking)模型/发布更温暖、更智能的AI;GPT-5.1 Instant支持自适应推理,GPT-5.1 Thinking更快更持久,新增Professional、Candid、Quirky对话风格。2025/11/12
Claude Code for Web 发布产品/平台推出网页版Claude Code,Pro和Max用户可在浏览器中管理多个AI编码代理,并新增高级沙箱功能(减少84%权限提示)。2025/10/20
Claude Code 重大更新:检查点、VS Code扩展、Agent SDK功能/产品推出检查点系统(可即时回退)、原生VS Code扩展(测试版)、Claude Agent SDK,并集成Claude Sonnet 4.5作为默认模型。2025/9/29
Gemini 2.5 Flash 和 Flash-Lite 更新版模型/更新改进的代理工具使用能力,在 SWE-Bench Verified 基准测试中提升5%(48.9% → 54%)。2025/9/25