截至 2026 年 4 月 5 日,全球人工智能领域正处于从“大语言模型”向“通用人工智能(AGI)”及“物理AI”跨越的关键阶段。过去 48 小时内,行业动态集中在具身智能硬件突破、多模态实时推理模型以及 AI 监管体系的进一步深化。
以下是核心进展摘要:
核心新闻条目
OpenAI 启动下一代前沿模型“GPT-5/Strawberry”推理能力测试 OpenAI 近期在内部小范围开启了代号为“Strawberry”的新一代模型推理测试。该模型旨在通过自我博弈和强化学习显著提升数学推理与科学发现能力,被视为迈向 AGI 的重要里程碑。同时,OpenAI 宣布成立了新的“安全与保安委员会”,以评估新模型开发过程中的潜在风险。
Mistral 发布 220 亿参数代码大模型 Codestral 25.01 总部位于巴黎的 Mistral AI 再次更新其代码专用模型系列。Codestral 25.01 在 80 多种编程语言中表现卓越,尤其在 Python、Java 和 C++ 的 FIM(中间填充)任务中超越了同等规模的竞争对手。该模型旨在通过极低的延迟和 256k 的超长上下文窗,进一步优化企业级自动化编程体验。
微软 Build 2024 后续效应:Copilot+ PC 全面进入现货市场 微软推出的首批 Copilot+ PC 正式在全球多个市场现货发售。这些设备搭载了高通 Snapdragon X 系列芯片及专属 NPU,支持本地运行超过 40 亿参数的小型语言模型(SLM)。此外,实时翻译视频和增强型“Recall”(回顾)功能已在最新 Windows 版本中全面启用,标志着端侧 AI 时代的到来。
谷歌 Gemini 1.5 Pro 推出“超长上下文推理”新功能 谷歌 DeepMind 宣布对其 Gemini 1.5 Pro 进行重大更新,现已支持对长达数小时的视频或数万行代码库进行“即时全量索引”。新加入的“多步推理引擎”允许模型在回答复杂查询时,自主拆解任务并调用外部搜索和计算工具,极大降低了复杂任务中的幻觉率。
具身智能突破:Figure 02 机器人完成工厂级复杂装配测试 Figure AI 联合 OpenAI 展示了其第二代人形机器人 Figure 02 的最新进展。通过集成的多模态大模型,机器人实现了对人类语音指令的实时语义理解,并在宝马工厂的测试中成功完成了精度要求极高的柔性装配任务,展示了 AI 与物理世界深度交互的可能性。
欧盟《人工智能法案》(EU AI Act)分阶段实施细则公布 随着法案进入实质执行期,欧盟公布了针对“通用 AI 模型(GPAI)”的详细合规指南。所有在欧运营的顶级 AI 企业(如 Anthropic、Meta、Google 等)必须在 90 天内提交其训练数据的版权合规报告及灾难性风险评估说明,这预示着 AI 行业透明度将进入新高度。
英伟达发布 Blackwell 系列芯片的后续架构预览 为了应对 AGI 级算力需求,英伟达在最新的行业研讨会上披露了其下一代算力集群的设计方案。新架构旨在将大模型推理能效比提升 10 倍以上,并重点强化了对“液冷数据中心”和“芯片间光子互连”的原生支持,以支撑万亿参数规模模型的实时多模态交互。