News

Guangdong BAIDU Special Cement Building Materials Co.,Ltd
— 新闻中心 —

本周人工智能大事件：谷歌凭借“红眼”夺回王

史诗般的一周！ AI的进化被硬按下了“快进键”。 Google、Openai、Xai三大巨头似乎已经约好了，同时亮出了自己的“卡车牌”。尤其是谷歌，此时可以说是真的“红眼”了，誓要夺回王座。话不多说，让我和大家一起回顾一下这疯狂的一周，看看诸神之间的战斗到底有多残酷。 1、强力工具：谷歌双子座3全家桶轰炸场毫无疑问，本周的对手属于谷歌。 Gemini 3 Pro的发布标志着AI时代翻开了新篇章，在多模态推理和整体性能方面树立了新标杆。 1、Gemini 3 Pro：双重推理能力这是迄今为止最先进的多模态AI推理模型。 · 卓越的性能：在推理、数学、编码和视觉理解等基准测试中达到 SOTA（最先进）水平。 · 数据突发：在最新的 ARC-IGI-2 基准测试中t，“深度思考”模式的Gemini 3 Pro得分高达惊人的45%！这是之前所有人工智能模型得分的两倍多。 · 实战势不可挡：在分析视频或用户界面代码等实际应用中，性能超过基准数据。 2. Nano Banana Pro：图像生成的“精致狂人”Nano Banana开始了专业级进化。这一次不再是“小伎俩”了。谷歌基于Gemini 3 Pro开发的这种图像生成模型注重“准确性”和“真实感”。 · 4K级画质：支持高达4K分辨率的高保真渲染。 · 文本渲染流畅：文本渲染错误率从56%下降到8%。 · 超强命令跟随能力：支持混合生成多达14张参考图像，适合创建复杂的信息图形、产品原型、建筑图和漫画。目前付费用户可以在Gemini App中使用，开发者也可以通过API。 3.Antigravity：AI原生编程IDE。 AI编程IDE（集成开发环境）堪称重新定义编程。看来程序员的生产力工具要被取代了。 Antigravity IDE不仅具有代码补全、内联编辑等标准功能，还引入了强大的代理功能。 · 多代理工作流程：专注于错误修复代理、文档代理，甚至集成浏览器。 · 代理管理器：开发者可以像员工一样管理AI。虽然 Gemini 3 Pro 本身受支持，但其他型号也兼容。谷歌的宝座基本坐稳。据报道，上个月竞争对手 Openai 的研究人员听说谷歌开发了一种新的 AI，而且这种新的 AI 在技术上似乎已经超越了 OpenAi。首席执行官萨姆·奥尔特曼在一份内部备忘录中承认：“我们知道还有很多工作要做，但我们正在迎头赶上。”他特别警告员工，“我前然而，冰冻三尺非一日之功。本周，谷歌首席执行官桑达尔·皮查伊(Sundar Pichai)在推特上发了一条五个字母的信息：“Iykyk”（我明白了）。配图是人工智能生成的美味多汁的芝士汉堡。看似俏皮的欺骗背后，却是谷歌重返科技前沿的反抗宣言。它表明，在对双子座3的了解中，真相终于回到了正确的轴线上。 - 奶酪在肉饼上完美融化，普通人可能认为这没什么大不了的，但在科技巨头眼中，这代表着人工智能技术的重大飞跃。但这张图表明Gemini 3可以解决这个问题。如果人工智能能够准确地知道去哪里本周市场给出了最直接的反馈：谷歌股价被夸大到历史新高，市值一跌就超越了微软。科技媒体BI认为，这是皮查伊长达十年的“AI优先”战略终于开花结果。正如斯里尼瓦桑评论的那样：“谷歌真的是‘放下一切’专注于AI了。” Gemini 3 标志着他们取得领先的时刻。皮查伊不仅让谷歌收入翻倍达到1000亿美元，更将公司带到了技术和商业上前所未有的高度。” 2、强敌包围：Openai和Xai的逆袭虽然谷歌先进，但AI领域的对手绝非幼稚。 1、Openai：GPT-5.1来了。OpenAI在2017年还发布了GPT-5.1-CODEX-MAX和GPT-5.1 Pro灵工，显然不愿意让Google独领风骚 · Codex-Max：专为长周期软件工程设计，可以。处理任务长达24小时，并且可以自动压缩上下文。 SOTA 分数是在 Swe-lancer 等基准测试中获得的。 · Pro升级：CHATGPT Pro升级为GPT-5.1 Pro，被称为“研究级”模式，推理能力大幅提升。 ChatGPT还向全球所有用户开放群聊功能，这意味着您可以邀请朋友与AI聊天。用户评论：经过一周的 GPT-5.1 Pro 体验，程序员普遍将 GPT-5.1 评为拥有怪物级能力的最强大模型。惊人的推理深度，适合复杂的任务，但具有安全的pag-filter输出过多且有时僵硬的痛点； Codex-Max执行长任务的效率提高了30%，但上下文管理需要优化。 2. Xai：Grok 4.1 正在快速发展。马斯克的行事风格非常激进。 Grok 4.1 及其快速版本已于本周发布。 · Grok 4.1：情商大幅提升和创意写作。其思维模式在Lmarena中得分1483，仅次于Gemini 3 Pro。 · Grok 4.1 Fast：提供 200 万个 token 的上下文窗口。它不仅价格便宜，还配备了强大的AGE TOOLS API（代理工具接口），支持联网、搜索X帖子、代码执行等，定位为“最适合深度研究的AI代理”。用户评论：“不孤单”的Grok 4.1已经达到了大多数领先模型只能通过“思维链”模型才能达到的智能水平。 3、硬核工具和开源生态 Meta Sam 3 & Sam 3D：堪称视觉领域的重磅炸弹。 Meta发布了第三代“Segment All”模型（SAM 3），可以检测并分割视频中的任何内容。新的 SAM 3D 还可以将单个静态图像转换为 3D 模型。该技术已经在Facebook的“实时预览”功能中使用。用户评论：生成速度很快，但是当对象较多时生成后，生成的文件尚不可下载。 AI2人工智能研究院发布了完全开源的OLMO 3模型版本），不仅开放了权重，还开放了完整的训练流程和数据，真正让开源社区受益。用户评价：主模型的性能与QWEN 2.5处于同一水平。 Design设计模式：有效利用Gemini 3 Pro的能力，仅用一段文字即可构建色彩搭配、布局精美的复杂UI界面。用户普遍评价：半小时即可完成设计作品。没有AI的痕迹，没有千篇一律的紫色渐变，效果确实不错。 Google WeatherNext 2：谷歌发布的新一代AI天气模型将集成到Pixel和搜索手机中，使其更加准确、分辨率更高。用户热评：AI预测速度快于周期变化。 4. 机器人技术与科学前沿巽他y Robotics Memo：Sunday Robotics是一家由斯坦福大学中国团队创立的具身智能公司，推出了一款名为Memo的人形机器人。它没有复杂的五爪手，而是采用了双爪设计，但它可以练习洗碗、洗衣服、倒咖啡等家务活。利用基本的ACT-1“零数据”模型，该公司希望通过低成本培训降低机器人的门槛。热门用户评论：为什么机器人公司热衷于制造可怕的小玩意？只是这些机器人中的一个，备忘录，看起来它不会在我睡梦中被杀死。您可能认为“看起来不致命”是家用机器人的主要考虑因素，但事实似乎并非如此。努力工作吧！ GPT-5助力科学研究：OpenAi发布了一篇论文，展示了GPT-5在数学、物理和生物领域的应用。它还帮助研究人员发现了四个以前未解决的数学问题的证明。用户评论：这篇80页的论文就像一记警钟，唤醒了科学界。 5、商业趋势与政策 NVIDIA势在必行：NVIDIA最新季报营收达到570亿美元，超出了华尔街的预期。 CEO黄仁勋直言：“Blackwell芯片供不应求，AI无处不在。”用户热门评价：利润率50%的生意！这是世界上的事吗？ Genspark获重大融资：智能AI搜索公司Genspark完成2.75亿美元B轮融资，估值12.5亿美元。用户热烈评价：仅30人的团队，短短6个月估值达到10亿美元。两个政策世界：美国白宫正在准备联邦政府夺取人工智能监管权，防止各州“各行其是”；尽管欧盟正在放宽限制并推迟高风险人工智能模型的合规期限，但其目标是放松限制关于创新。 6.深度观察：AI音乐隐藏的担忧Deezer和ipsos最近联合进行的一项调查揭示了一个有趣的现象：97%的听众无法区分人类创作的音乐和人工智能生成的音乐。目前，每天有超过5万首AI音乐提交到Deezer平台。虽然大家都支持“AI生成”这个标签，但有51%的人担心流媒体平台未来会充斥着低质、通用的“AI口水歌”。人类的创造力会被大量的人工智能消灭吗？这取决于我们每个人的选择。用户评论：某说唱歌手突然发现自己的性能还不如GPU。结论：你需要做什么？本周让我们对未来有了清晰的愿景：AI不再是聊天玩具，而是真正进入了“强推理”和“代理执行”阶段。如果你是开发者，请尽快尝试antigravity和codex-max；如果你对于设计师来说，Nano Banana Pro 可以成为一个新的生产力插件；如果ikaw是普通用户，记得体验一下ChATGPT群聊功能。在这个技术爆炸的时代，唯一的危险就是停止学习。（辰辰）

News

本周人工智能大事件：谷歌凭借“红眼”夺回王

Tel

Mail

Map

Share

Contact