本周AI大事件:Deepseek拼命“省钱”,Byte有意“接

(图像由人工智能生成)创建者:陈陈 |网易科技在短短7天之内就失去了4位高管,顶尖工程师有组织地涌向OpenAi和meta。这个即将年满50岁的科技巨头还没有疲倦。看看其他玩家,他们的行动比上一个更加激进:OpenAI 仍然担心谷歌在用户增长方面的追赶;中国阵营呈现了令人印象深刻的“双面突破”:Deepseek v3.2的出现,利用硬核数据产出顶级模型“宝贝价”;字节跳动采取了一种古怪的做法,打算让AI完全“接管”你的手机系统。至于经验丰富的黄仁勋,他没有参与模型层的斗争,而是悄悄推出了CUDA 13.1,利用软件生态为nvidia筑起更深的技术墙。 。本周末业界最令人惊讶的消息莫过于彭博社爆料苹果公司即将迎来成立50周年的同时,也伴随着前所未有的人事剧变。这不仅仅是简单的工作变动,更多的是“后就业时代”对苹果未来的信任危机。 ——高层震撼,关键老将集体告别。过去一周,苹果先后失去了AI主管、交互设计主管、总法律顾问、政府事务主管。直接向CEO蒂姆·库克汇报的四位高管相继离职,打破了苹果管理层十多年来的长期稳定。最受关注的是一手创造了苹果自研芯片神话的硬件技术高级副总裁Johny Srouji,他也表达了辞去工作去做饭的愿望。斯鲁吉是苹果硬件的护城河架构师。当他离开时,对苹果技术基础的影响将是不可逆转的。尽管库克竭尽全力以高薪留住他,权威“二号人物”的身世,在竞争接连不断、管理层老化的背景下,这位可敬的老将的命运并没有得到解决。 —— 马厩,Openai和Meta中流淌着年轻的血液。如果说高管辞职是一种“自然新陈代谢”,那么AI领域的人才流失就是一种“失血性休克”。本周,苹果人工智能负责人 John Giannandrea 由于该项目进展缓慢而辞职,但这只是冰山一角。面对谷歌和OpenAi的强力围攻和打压,苹果内部AI团队被曝“崩溃”:负责Siri和Chatgpt竞品的工程师入职数周内辞职,AI模型负责人庞若明率领团队投奔Meta,代号j595、愿景为“Openai”的桌面机器人团队顶尖工程师。在残酷的“硅谷人才AI大战”中,苹果似乎正在从“人才黑”堕落。空洞到“人才输送站”在苹果陷入泥潭的同时,AI霸主英国,威达在技术护城河上又增添了一大筹码。本周末,英伟达发布了CUDA 13.1,并推出了自2006年CUDA平台诞生以来“最大规模、最全面的更新”——CUDA瓦片编程模型。简单来说,CUDA瓦片是英伟达为AI时代量身定制的“降维”工具。 CUDA瓦片允许开发者以“数据块(Tile)”为单位进行编程,编译器会自动处理底层细节:AI计算的核心是张量。虽然Nvidia GPU配备了强大的张量内核和TMA(张量内存加速器),但CUDA瓦片抽象化了这些复杂性,让开发者可以轻松地利用硬件的全部性能。Nvidia此举不仅仅是软件升级,更是定义了。人工智能编程的新标准。借助 CUDA Tile,NVIDIA 进一步降低了高性能 AI 开发的门槛,让 Python 开发者和高级开发者能够像使用 Numpy 一样轻松获取底层计算能力。当竞争对手还在努力追赶NVIDIA的硬件性能时,黄仁勋已经开始了软件生态系统的全面升级。新的编程范式将进一步巩固开发者生态系统,让英伟达在AI时代的统治地位更加牢固。 2、重型工具:Deepseek v3.2以超高性价比惊艳亮相。本周,Deepseek 发布了 Deepseek v3.2 和 Deepseek v3.2-speciale,这两个 MOE(混合专家)开放权重模型,拥有 6850 亿个参数,在推理和代理任务中表现出了良好的性能,而且特别有效。其中Deepseek v3.2-speciale主攻深度推理,在国际数学奥林匹克等推理基准测试中取得了SOTA成绩ad(IMO)金牌级别,准确率96%,而“终极人体分析”准确率30%。在一些基准测试中,它还击败了 Gemini 3.0 Pro 和 GPT-5-high。标准推理模型 Deepseek v3.2 在强化推理和后续指令方面表现良好,在 SWE-Bench Verified 中达到 73.1%,Tau-Bench(代理任务基准)达到 80.3%。 Deepseek v3.2发布后,作为投资者在社交媒体上的回应称:“很少突破,但每次突破都会引起很大轰动。”网红科技博主@GM8XX8周末发表长评,表示Deepseek v3.2系列的发布不仅是性能榜单上的数值提升,更代表了Deepseek在架构和训练方面的重大突破。他将Deepseek v3.2实现“抢角”的能力总结为三点:1.架构核心:清晰的注意力机制和稀疏文本优化; 2. 培训升级:深度融合强化学习(RL); 3. Speciale Variant:将验证机制转化为训练的驱动力。 @GM8XX8总结说,Deepseek v3.2系列的主要意义在于完成架构的系统集成。它将强上下文、大规模强化学习、合成代理和形式验证 (MATH-V2) 集成到统一的强化学习框架中,标志着模型架构从外部评估向可扩展的、验证者引导的审计训练系统的转变。 《连线》发表评论文章称,Deepseek的“硬核”路线与另一字节跳动巨头的策略形成鲜明对比,也体现了中国AI行业的多样性。 ——Deepseek:走高,模型效率才是王道。考虑到芯片供应的限制,Deepseek从一开始就注重模型效率和成本控制,并专注于打造占用更少训练资源、更低运营成本的开源。为开发者提供的ost。这是中国人工智能企业在“计算军备竞赛”中采取的新的突围战略,追逐技术高度和终极效能。 ——BYEDANCE:广泛、集成的应用才是王道。字节跳动采取了完全不同的策略,通过月活跃用户超过1.4亿的“豆宝”抢占操作系统(OS)层面的入口。在推出“豆宝输入法”之后,字节更进一步,发布了可以集成到移动操作系统中的豆宝AI代理,使其能够控制其他应用程序。目标是取代苹果的Siri,实现“应用内实现”。这表明字节跳动有意避免军备竞赛,而是利用其庞大的用户基础将AI工具深度嵌入到人们的日常生活中。 (AI生成的图像)Wired认为,用户规模相似(AI应用月活跃用户超过1.4亿)的两家领先的中国公司尊重分别代表了中国人工智能发展的两个方向:一组专注于大型模型切割的突破和高效优化(DeepSeek),另一组则深度参与AI能力与现有生态系统的深度融合,争夺深度用户输入和场景执行(ByTedance)。 3、行业动态:谷歌、亚马逊开花结果,OpenAi发布“红色警报” 1、谷歌Gemini 3 Deep Thinking本周推出深度思考模式,谷歌迅速向超级订阅者推送深度思考模式。通过并行推理和长链思维,在处理多步分析任务时,尤其是在代码生成和复杂逻辑约简方面,大大提高了准确性,展现了业界领先的能力。 X用户@theaimestari直言,为了AI技术的准确性,有望改变游戏规则。 2. 亚马逊《Re: Invent Explosion: NOVA 2》全面首发。 AWS推出了No本周一口气推出了 va 2 型号系列,包括 Lite、Pro、Sonic 和 Omni。 · Nova 2 Pro:专为智能代理设计,代码理解能力符合Claude 3.5十四行诗。 · Nova 2 Omni:全循环模型,统一支持图像、文本、语音、视频处理,支持100万个token上下文。尽管业界对亚马逊AWS的大举持积极态度,但许多用户表达了不同的看法。德勤全球云战略官 David Linthicum 周末在 X 发文称,亚马逊在 Re:Invent 2025 大会上推出的 NOVA 2 系列和全栈代理平台(Bedrock、AgentCore)在技术上令人印象深刻,但在战略上却隐藏着“隐藏风险”。 Lincicum认为,平台提供的强大模型、原生集成和一站式“切代理”服务在短期内非常高效。但他警告称,企业应该警惕因新业务而与AWS“捆绑”的风险。xt 5到10年。 Linthicum 的建议: · 使用 NOVA 2 Tactical:在价值明确的场景中利用其便利性。 · 避免长期搭售:不应允许任何卖家控制代理的长期架构。 · 投资通用抽象层技术:企业应投资模型无关的接口、开放可移植的模式以及跨云观察,以确保未来的人工智能能力由业务战略驱动,而不是受单一云服务提供商路线图的限制。 3、谷歌近期的一系列大动作直接引发了OpenAi的强烈反应。 OpenAI CEO Altman 发布了“红色警报”(Code Red)内部备忘录,以应对 Google Gemini 快速发展带来的竞争压力,特别是对其市场份额的蚕食(Gemini 用户增长了 30%,Chatgpt 增长放缓至 5%)。他要求公司回归到coreAI模型的完善和基础功能上来,重新减少对非功能性的投资。行业报告暗示,OpenAI 可能会在下周发布 GPT-5.2 作为竞争回应,传闻该模型在整体智能方面更加智能。有关 Gemini 3 Pro 的更多信息。 。 4、视频与多模态:科灵AI和Runway Gen-4.5引领AI视频生成领域的潮流。两家公司本周还发布了旗舰更新。 1. Runway推出Gen-4.5模型视频:
这个新的Sota模型在文本到视频排名的人工分析方面处于领先地位,表现优于Google VEO 3等竞争对手。其主要特点包括改进的动态运动、更加物理真实感(例如物体运动的重量、动量和力、流体动力流体流动)以及对电影风格的精细控制。 2、科灵AI发布多项更新:·科灵视频2.6首次支持原生音频生成,实现语音和声音同步,分辨率高达1080p,加入全视听生成模型行列由 VEO 3. Flow 管理,有助于实现角色和物体的一致性以及持久视频内容的创建。 · Avatar 2.0推出,增加了更具表现力的面部动画、口型同步准确性和现实世界相似度,并支持生成长达5分钟的长视频。 5、行业综述:微软、苹果发布多款新机型——机型: · Mistral:Mistral 3 机型家族发布,包括 675B 参数 MOE 机型 Mistral Large 3 和三款支持本地部署的多模态 Ministral 3 机型。后者在理解方面表现良好。 · ARCEE:美国公司发布了Trinity系列开源加权MOE模型,其中包括用于代理流的Trinity-Mini。 · Openagi:推出了LUX AI Agent,据说在AI Agent计算机操作方面是SOTA,可以控制Slack、Excel等桌面应用程序。 · 微软:发布开源轻量级语音合成模型Vibevoice-Realtime-0。5B,专门针对实时应用进行了优化。 · NVIDIA:在 Neurips 大会上,它宣布了用于语音处理、AI 安全评估和自动驾驶流程的开源 AI 工具和模型的更新,其中包括 Drive alpamayo-R1,这是第一个用于 AV Research 的开放推理 VLA 模型。 · Apple:发布了Starflow-V,这是第一个用于高质量视频生成的端到端标准化流,承诺比基于扩散的方法具有更清晰的帧连贯性和更快的采样速度。 ——软硬件:·亚马逊:正式发布下一代Trainium 3 AI芯片,并宣布推出AI工厂外,结合NVIDIA GPU或trainium芯片,为商业AI集群提供本地化系统。 · 雅虎:推出了人工智能系统,可以生成近乎实时的足球比赛分析并提供叙述性摘要。 ——市场: · Anthropic:收购了 JavaScript Runtime Team Bun,以支持 Claude Code 的扩展和改进,并表示年度l 克劳德码使用量突破10亿美元。 · Openai:收购了 Thrive Holdings 的股份,以扩大其在会计、supportIT 和工作流程自动化等业务领域的足迹。 · Nvidia 和 Synopsys:宣布建立合作伙伴关系,利用加速计算和人工智能工具彻底改变工程和芯片设计流程。 · 法律行动:《纽约时报》针对破产提起版权侵权诉讼,指控人工智能系统未经许可抓取和传输受版权保护的内容。