
每日 AI 早报 | 2026-03-23
每日 AI 早报 | 2026-03-23
全球宏观:算力基础设施、巨头战略联盟、投资并购与政策法规
• OpenAI 宣布年内将员工规模翻倍至 8000 人,剑指 Anthropic 和 Google 企业市场:据 Financial Times 报道,估值达 7300 亿美元的 OpenAI 正在加速扩张,以应对 Anthropic 在企业客户中的领先优势以及 Google 对日常聊天机器人用户的争夺。此次招聘被定位为公司新战略的核心组成部分,目标是在企业 AI 市场上全面缩小与 Anthropic 的差距。
• 亚马逊向 OpenAI 供应 2GW Trainium 计算容量,Anthropic 与 Apple 同步使用:TechCrunch 独家披露,亚马逊云服务(AWS)已与 OpenAI 签署重大协议,将在 Trainium 芯片上为 OpenAI 提供 2 千兆瓦的计算能力。目前 Anthropic 和亚马逊自己的 Bedrock 服务对 Trainium 芯片的需求已超过供应能力,Apple 也加入使用行列,算力争夺战持续白热化。
• NVIDIA 宣布投入 260 亿美元构建开源权重模型:监管文件显示,NVIDIA 计划斥资 260 亿美元用于构建开源权重 AI 模型。在美国顶级模型(OpenAI、Anthropic、Google)仅通过云端或聊天界面访问的背景下,包括 DeepSeek、阿里巴巴、月之暗面、Z.ai 和 MiniMax 在内的中国公司已率先发布开源权重模型并免费开放下载。
• ASI 终极竞赛格局生变:Meta 与 xAI 命悬一线,三巨头格局初现:36氪报道,随着 2026 年 3 月竞争加剧,沃顿商学院教授 Ethan Mollick 断言 Meta 和 xAI 已无法跟上顶级实验室的步伐,开源权重模型仍落后闭源前沿模型数月,AGI 竞赛正在向头部三家公司(OpenAI、Google、Anthropic)集中。
前沿突破:全球最顶尖的闭源/开源模型发布、架构创新、跑分屠榜、具身智能与机器人基础模型
• GPT-5.4 vs Claude Opus 4.6 vs Gemini 3.1:三月三强旗舰模型同台竞技:2026年3月,AI 行业罕见地出现三款前沿模型密集发布:GPT-5.4(3月5日发布,1M token 上下文窗口,128K 最大输出)性能屠榜,LMSYS Arena 持续领先;Claude Opus 4.6 在写作质量、长文档处理、代码理解、安全性等维度全面领先;Gemini 3.1 Pro 以多模态和长上下文处理见长。Artificial Analysis 评测显示,GPT-5.4 与 Claude Opus 4.6 在最难的工程基准测试上难分伯仲。
• OpenAI 公布"全自动 AI 研究员"计划,首席科学家称其为"北极星"目标:OpenAI 于3月20日宣布构建完全自动化的 AI 研究员系统,首席科学家 Jakub Pachocki 将其描述为公司未来几年的"北极星"目标,标志着 AI 自我改进研究的新纪元开启。该系统将能够自主进行科学研究和实验验证,减少对人类研究人员干预的依赖。
• MiniMax M2.7 发布:仅 100 亿激活参数实现自进化,匹敌 Claude Opus 成本仅 1/50:中国 AI 创业公司 MiniMax 发布了 M2.7 模型,该模型利用自身大语言模型辅助开发,在最难的工程基准测试上仅用 GPT-5.2 和 Claude Opus 4.6 三分之一的参数量实现了相近性能,推理速度快 3 倍,成本降低 50 倍。MiniMax M2.7 被视为"自进化 AI"概念的里程碑式验证。
• DeepSeek 联手北大、清华发布 DualPath 论文,剑指 V4 底层架构:在业界猜测 DeepSeek V4 发布时间之际,DeepSeek 团队联合北京大学和清华大学在 ArXiv 上发布重磅论文《DualPath: Breaking the Storage Bandwidth Bottleneck in Agentic LLM Inference》,披露了 DualPath 架构——通过双路径设计打破智能体大模型推理中的存储带宽瓶颈。业界认为该论文泄露了 V4 的核心技术密码,有望在4月前发布。
• Cursor 发布 Composer 2:击败 Claude Opus 4.6,但推理成本仍高于 GPT-5.4:VentureBeat 报道,Cursor 于3月发布自研编程模型 Composer 2,在两项专业编程基准测试上超越了 Claude Opus 4.6,但仍落后于 GPT-5.4。Composer 2 的发布意味着 AI 编程工具格局正在从"选择第三方模型"向"自研垂直模型"演进,为开发者提供了性能与成本的新权衡选项。
• Figure AI 发布 Figure 03 震撼视频:具身智能突破"偷懒"和"直觉"能力:2026年3月,Figure AI 发布了一段2分半的演示视频,Figure 03 展示了在工厂环境中自主"偷懒"和运用直觉决策的能力,被业界形容为"人类体力劳动价值瓦解"的里程碑时刻,也引发了关于具身智能何时真正替代人类工人的广泛讨论。
中国力量:中国大模型梯队的技术进展、国产机器人企业动态、产品发布及资本市场表现
• 宇树科技科创板 IPO 申请获受理,成具身智能领域首家上市企业:3月20日,宇树科技科创板 IPO 申请正式获受理,成为超20家冲刺 IPO 的具身智能公司中"第一个撞线的"。招股书显示,宇树计划募资42.02亿元,其中超85%投向研发,聚焦"大脑"(具身智能大模型)和"小脑"(运动控制模型)。2025年宇树营收达17.08亿元,同比增长335.36%;扣非净利润超6亿元,同比增长674.29%,人形机器人出货量位居全球第一。
• 宇树科技 IPO 披露年产能规划超19万台,2026年出货目标1-2万台:虎嗅报道,宇树科技 CEO 王兴兴指出,2026年出货目标为1-2万台人形机器人,届时具身智能将从概念走向真实工作场景。同时,招股书显示宇树计划募资用于建设年产19万台以上的智能机器人制造基地,推动人形机器人工业化落地进程提速。
• 超20家具身智能企业冲刺 IPO:智元机器人、乐聚、云深处、银河通用等加速资本化:36氪梳理了具身智能赛道的上市进程:宇树科技最早完成上市辅导;智元机器人已完成股改并通过持股平台控股 A 股上市公司上纬新材;乐聚智能已办理备案登记;云深处科技于2025年12月启动上市辅导;银河通用、傅利叶智能、星海图、松延动力等均已完成股改,其中银河通用和星海图的最新融资被视为 Pre-IPO 轮。
• 阿里巴巴 Qwen 3.5-Plus 发布:百炼平台 API 价格低至每百万 Tokens 0.8 元,性能比肩 Gemini 3:阿里巴巴于3月19日发布 Qwen 3.5-Plus,在推理、编程、Agent 智能体等多维基准评估中表现优异。得益于底层模型架构创新,Qwen 3.5-Plus 在阿里云百炼平台的 API 价格仅为每百万 Tokens 0.8 元,以不到 GPT-5 系列 5% 的价格获得可比的超高智能。Artificial Analysis 全球评测显示,千问是中国超大规模云厂商中最具智能的模型。同季阿里云收入加速增长36%,AI 相关产品收入连续第十个季度保持三位数增长。
• 人形机器人单台成本骤降至10万元,行业价格战开打:虎嗅披露,2026年一季度人形机器人单台成本已降至10万元,较2025年下降33%。多家厂商密集调低售价,行业价格战已全面开打。同时,2026年前两个月具身智能赛道出现多笔大额融资,但资金几乎只流向头部公司,腰部以下企业融资愈发困难。
商业落地:AI 在终端设备、SaaS、工作流以及实体机器人(Embodied AI)应用场景中的实际落地数据及行业影响
• 中国 L3 有条件自动驾驶正式立法落地,无人驾驶规模化提速:2026年,中国正式立法落地 L3 有条件自动驾驶(指定路段/车速下系统完全接管)和 L4 高度自动驾驶(限定区域全程无需人接管),无人驾驶网约车和自动物流加速规模化。特斯拉 Cybercab 和国内 Robotaxi 企业同步受益,AI 在物理世界的商业化渗透正从数字领域向真实交通场景加速延伸。
• Figure 03 具身智能视频引发"人类被解雇"讨论,工厂场景率先落地:Figure AI 发布的 Figure 03 视频在硅谷引发震动,展示了人形机器人在真实工厂环境中自主执行任务的能力。该视频的广泛传播标志着具身智能正从实验室走向工业现场,体力劳动岗位替代的讨论从预测变为现实。行业分析认为,巡逻、仓储、柔性制造将成为最先创造商业价值的具身智能落地场景。
• 慕尼黑上海电子生产设备展即将开幕,末端执行器成具身智能产业链新焦点:3月25-27日,2026慕尼黑上海电子生产设备展(productronica Shanghai)将在上海新国际博览中心举行,末端执行器(机器人的"手"与"关节")成为本次展会最大看点。行业分析指出,人形机器人从"能动"到"好用"的产业革命瓶颈不止在算法,更在于精密执行能力,末端执行器直接决定机器人能否完成柔性抓取、精密装配和力控适配等复杂作业。
开发者生态:AI 编程工具、开源社区的优秀小模型、开发框架更新
• Claude Sonnet 4.6 vs DeepSeek-V3.2 编程对决:两种开发者生态路线深度对比:开发者社区针对 Claude Sonnet 4.6(闭源旗舰级)和 DeepSeek-V3.2(开源可部署)在代码编写、调试、重构和成本敏感型工程工作流等场景展开深度对比。DeepSeek-V3.2 以开源权重和极低 API 价格提供了可比的编程能力,而 Claude Sonnet 4.6 在长上下文仓库级代码理解上保持领先,两者在开发者生态中形成差异化互补。
• Cursor Composer 2 vs Claude Opus 4.6 编程能力大比拼:谁是2026年最强编程模型:开发者社区针对 Cursor Composer 2 与 Claude Opus 4.6 在基准测试、定价和实际开发体验上进行全面对比。分析指出,Composer 2 的出现打破了"AI 编程工具 = 选择第三方最强模型"的旧格局,自研垂直编程模型正成为新趋势,开发者面临"集成平台便利性 vs 模型绝对性能"的新权衡。
• 开源 AI 生态格局剧变:DeepSeek-R1 登顶 Hugging Face 最受欢迎模型榜首:2026年,开源 AI 格局发生根本性转变。一年前,Meta 的 Llama 系列还占据 Hugging Face 排行榜前五名中的三位;而截至2026年3月,DeepSeek-R1 已跃升至最受欢迎开源模型榜首,中国开源模型在前十名中占据显著比例,开源 AI 主导权正在从西方向东方转移。
• GPT-5.4 vs Claude Sonnet 4.6 vs Gemini 3.1 全面横评:2026年开发者选型指南:技术媒体发布三强旗舰模型横评,涵盖编码、写作、推理、多模态、多语言支持和 API 定价等维度。Specialization(专业化)成为2026年新趋势:OpenAI 构建 GPT-5.3 Codex 专攻 AI 编程,Anthropic 构建 Claude Sonnet 4.6 专攻生产级工作流,Google 构建 Gemini 3 Flash 专攻高容量低成本 API 使用,开发者需根据具体场景选择最合适的模型。
由 Atlas AI 助手自动生成


