每日 AI 早报 | 2026-03-23

开源小兵

2026-03-23 发布40 浏览 · 0 点赞 · 0 收藏

每日 AI 早报 | 2026-03-23

全球宏观：算力基础设施、巨头战略联盟、投资并购与政策法规

• OpenAI 宣布年内将员工规模翻倍至 8000 人，剑指 Anthropic 和 Google 企业市场：据 Financial Times 报道，估值达 7300 亿美元的 OpenAI 正在加速扩张，以应对 Anthropic 在企业客户中的领先优势以及 Google 对日常聊天机器人用户的争夺。此次招聘被定位为公司新战略的核心组成部分，目标是在企业 AI 市场上全面缩小与 Anthropic 的差距。

• 亚马逊向 OpenAI 供应 2GW Trainium 计算容量，Anthropic 与 Apple 同步使用：TechCrunch 独家披露，亚马逊云服务（AWS）已与 OpenAI 签署重大协议，将在 Trainium 芯片上为 OpenAI 提供 2 千兆瓦的计算能力。目前 Anthropic 和亚马逊自己的 Bedrock 服务对 Trainium 芯片的需求已超过供应能力，Apple 也加入使用行列，算力争夺战持续白热化。

• NVIDIA 宣布投入 260 亿美元构建开源权重模型：监管文件显示，NVIDIA 计划斥资 260 亿美元用于构建开源权重 AI 模型。在美国顶级模型（OpenAI、Anthropic、Google）仅通过云端或聊天界面访问的背景下，包括 DeepSeek、阿里巴巴、月之暗面、Z.ai 和 MiniMax 在内的中国公司已率先发布开源权重模型并免费开放下载。

• ASI 终极竞赛格局生变：Meta 与 xAI 命悬一线，三巨头格局初现：36氪报道，随着 2026 年 3 月竞争加剧，沃顿商学院教授 Ethan Mollick 断言 Meta 和 xAI 已无法跟上顶级实验室的步伐，开源权重模型仍落后闭源前沿模型数月，AGI 竞赛正在向头部三家公司（OpenAI、Google、Anthropic）集中。

前沿突破：全球最顶尖的闭源/开源模型发布、架构创新、跑分屠榜、具身智能与机器人基础模型

• GPT-5.4 vs Claude Opus 4.6 vs Gemini 3.1：三月三强旗舰模型同台竞技：2026年3月，AI 行业罕见地出现三款前沿模型密集发布：GPT-5.4（3月5日发布，1M token 上下文窗口，128K 最大输出）性能屠榜，LMSYS Arena 持续领先；Claude Opus 4.6 在写作质量、长文档处理、代码理解、安全性等维度全面领先；Gemini 3.1 Pro 以多模态和长上下文处理见长。Artificial Analysis 评测显示，GPT-5.4 与 Claude Opus 4.6 在最难的工程基准测试上难分伯仲。

• OpenAI 公布"全自动 AI 研究员"计划，首席科学家称其为"北极星"目标：OpenAI 于3月20日宣布构建完全自动化的 AI 研究员系统，首席科学家 Jakub Pachocki 将其描述为公司未来几年的"北极星"目标，标志着 AI 自我改进研究的新纪元开启。该系统将能够自主进行科学研究和实验验证，减少对人类研究人员干预的依赖。

• MiniMax M2.7 发布：仅 100 亿激活参数实现自进化，匹敌 Claude Opus 成本仅 1/50：中国 AI 创业公司 MiniMax 发布了 M2.7 模型，该模型利用自身大语言模型辅助开发，在最难的工程基准测试上仅用 GPT-5.2 和 Claude Opus 4.6 三分之一的参数量实现了相近性能，推理速度快 3 倍，成本降低 50 倍。MiniMax M2.7 被视为"自进化 AI"概念的里程碑式验证。

• DeepSeek 联手北大、清华发布 DualPath 论文，剑指 V4 底层架构：在业界猜测 DeepSeek V4 发布时间之际，DeepSeek 团队联合北京大学和清华大学在 ArXiv 上发布重磅论文《DualPath: Breaking the Storage Bandwidth Bottleneck in Agentic LLM Inference》，披露了 DualPath 架构——通过双路径设计打破智能体大模型推理中的存储带宽瓶颈。业界认为该论文泄露了 V4 的核心技术密码，有望在4月前发布。

• Cursor 发布 Composer 2：击败 Claude Opus 4.6，但推理成本仍高于 GPT-5.4：VentureBeat 报道，Cursor 于3月发布自研编程模型 Composer 2，在两项专业编程基准测试上超越了 Claude Opus 4.6，但仍落后于 GPT-5.4。Composer 2 的发布意味着 AI 编程工具格局正在从"选择第三方模型"向"自研垂直模型"演进，为开发者提供了性能与成本的新权衡选项。

• Figure AI 发布 Figure 03 震撼视频：具身智能突破"偷懒"和"直觉"能力：2026年3月，Figure AI 发布了一段2分半的演示视频，Figure 03 展示了在工厂环境中自主"偷懒"和运用直觉决策的能力，被业界形容为"人类体力劳动价值瓦解"的里程碑时刻，也引发了关于具身智能何时真正替代人类工人的广泛讨论。

中国力量：中国大模型梯队的技术进展、国产机器人企业动态、产品发布及资本市场表现

• 宇树科技科创板 IPO 申请获受理，成具身智能领域首家上市企业：3月20日，宇树科技科创板 IPO 申请正式获受理，成为超20家冲刺 IPO 的具身智能公司中"第一个撞线的"。招股书显示，宇树计划募资42.02亿元，其中超85%投向研发，聚焦"大脑"（具身智能大模型）和"小脑"（运动控制模型）。2025年宇树营收达17.08亿元，同比增长335.36%；扣非净利润超6亿元，同比增长674.29%，人形机器人出货量位居全球第一。

• 宇树科技 IPO 披露年产能规划超19万台，2026年出货目标1-2万台：虎嗅报道，宇树科技 CEO 王兴兴指出，2026年出货目标为1-2万台人形机器人，届时具身智能将从概念走向真实工作场景。同时，招股书显示宇树计划募资用于建设年产19万台以上的智能机器人制造基地，推动人形机器人工业化落地进程提速。

• 超20家具身智能企业冲刺 IPO：智元机器人、乐聚、云深处、银河通用等加速资本化：36氪梳理了具身智能赛道的上市进程：宇树科技最早完成上市辅导；智元机器人已完成股改并通过持股平台控股 A 股上市公司上纬新材；乐聚智能已办理备案登记；云深处科技于2025年12月启动上市辅导；银河通用、傅利叶智能、星海图、松延动力等均已完成股改，其中银河通用和星海图的最新融资被视为 Pre-IPO 轮。

• 阿里巴巴 Qwen 3.5-Plus 发布：百炼平台 API 价格低至每百万 Tokens 0.8 元，性能比肩 Gemini 3：阿里巴巴于3月19日发布 Qwen 3.5-Plus，在推理、编程、Agent 智能体等多维基准评估中表现优异。得益于底层模型架构创新，Qwen 3.5-Plus 在阿里云百炼平台的 API 价格仅为每百万 Tokens 0.8 元，以不到 GPT-5 系列 5% 的价格获得可比的超高智能。Artificial Analysis 全球评测显示，千问是中国超大规模云厂商中最具智能的模型。同季阿里云收入加速增长36%，AI 相关产品收入连续第十个季度保持三位数增长。

• 人形机器人单台成本骤降至10万元，行业价格战开打：虎嗅披露，2026年一季度人形机器人单台成本已降至10万元，较2025年下降33%。多家厂商密集调低售价，行业价格战已全面开打。同时，2026年前两个月具身智能赛道出现多笔大额融资，但资金几乎只流向头部公司，腰部以下企业融资愈发困难。

商业落地：AI 在终端设备、SaaS、工作流以及实体机器人（Embodied AI）应用场景中的实际落地数据及行业影响

• 中国 L3 有条件自动驾驶正式立法落地，无人驾驶规模化提速：2026年，中国正式立法落地 L3 有条件自动驾驶（指定路段/车速下系统完全接管）和 L4 高度自动驾驶（限定区域全程无需人接管），无人驾驶网约车和自动物流加速规模化。特斯拉 Cybercab 和国内 Robotaxi 企业同步受益，AI 在物理世界的商业化渗透正从数字领域向真实交通场景加速延伸。

• Figure 03 具身智能视频引发"人类被解雇"讨论，工厂场景率先落地：Figure AI 发布的 Figure 03 视频在硅谷引发震动，展示了人形机器人在真实工厂环境中自主执行任务的能力。该视频的广泛传播标志着具身智能正从实验室走向工业现场，体力劳动岗位替代的讨论从预测变为现实。行业分析认为，巡逻、仓储、柔性制造将成为最先创造商业价值的具身智能落地场景。

• 慕尼黑上海电子生产设备展即将开幕，末端执行器成具身智能产业链新焦点：3月25-27日，2026慕尼黑上海电子生产设备展（productronica Shanghai）将在上海新国际博览中心举行，末端执行器（机器人的"手"与"关节"）成为本次展会最大看点。行业分析指出，人形机器人从"能动"到"好用"的产业革命瓶颈不止在算法，更在于精密执行能力，末端执行器直接决定机器人能否完成柔性抓取、精密装配和力控适配等复杂作业。

开发者生态：AI 编程工具、开源社区的优秀小模型、开发框架更新

• Claude Sonnet 4.6 vs DeepSeek-V3.2 编程对决：两种开发者生态路线深度对比：开发者社区针对 Claude Sonnet 4.6（闭源旗舰级）和 DeepSeek-V3.2（开源可部署）在代码编写、调试、重构和成本敏感型工程工作流等场景展开深度对比。DeepSeek-V3.2 以开源权重和极低 API 价格提供了可比的编程能力，而 Claude Sonnet 4.6 在长上下文仓库级代码理解上保持领先，两者在开发者生态中形成差异化互补。

• Cursor Composer 2 vs Claude Opus 4.6 编程能力大比拼：谁是2026年最强编程模型：开发者社区针对 Cursor Composer 2 与 Claude Opus 4.6 在基准测试、定价和实际开发体验上进行全面对比。分析指出，Composer 2 的出现打破了"AI 编程工具 = 选择第三方最强模型"的旧格局，自研垂直编程模型正成为新趋势，开发者面临"集成平台便利性 vs 模型绝对性能"的新权衡。

• 开源 AI 生态格局剧变：DeepSeek-R1 登顶 Hugging Face 最受欢迎模型榜首：2026年，开源 AI 格局发生根本性转变。一年前，Meta 的 Llama 系列还占据 Hugging Face 排行榜前五名中的三位；而截至2026年3月，DeepSeek-R1 已跃升至最受欢迎开源模型榜首，中国开源模型在前十名中占据显著比例，开源 AI 主导权正在从西方向东方转移。

• GPT-5.4 vs Claude Sonnet 4.6 vs Gemini 3.1 全面横评：2026年开发者选型指南：技术媒体发布三强旗舰模型横评，涵盖编码、写作、推理、多模态、多语言支持和 API 定价等维度。Specialization（专业化）成为2026年新趋势：OpenAI 构建 GPT-5.3 Codex 专攻 AI 编程，Anthropic 构建 Claude Sonnet 4.6 专攻生产级工作流，Google 构建 Gemini 3 Flash 专攻高容量低成本 API 使用，开发者需根据具体场景选择最合适的模型。

由 Atlas AI 助手自动生成

#人工智能 #AI #AIGC

请前往登录/注册即可发表您的看法…