第207章 AI界的反应 二
与此同时,圣克拉拉,英伟达总部。
黄仁勋正穿着他那件标志性的皮衣,在会议室里来回踱步。
他的面前,同样摆着那篇论文。
“你们怎么看?”老黄停下脚步,目光如电,扫视着在座的技术高管。
“Jensen(黄仁勋英文名),这个算法对我们的CUDA生态是个挑战。”一位首席架构师面色凝重,“它大量使用了min、max这种非线性算子,而且数据依赖性很强,无法像矩阵乘法那样进行大规模并行流水线优化。在H100上跑这个,SM单元的利用率可能连20%都不到。”
“也就是说,我们的显卡,在这个算法面前,变成了‘废铁’?”老黄的声音很冷。
“不能说是废铁,但确实……性价比极低。”
老黄沉默了。
作为“AI军火商”,他最怕的不是竞争对手,而是“技术路线的变更”。
英伟达之所以能躺着赚钱,是因为全世界都在用Transformer,都在做矩阵乘法。他只要把矩阵乘法做到极致,就能垄断市场。
但现在,有人想换个玩法。
这才是英伟达最担心的事情。
英伟达的护城河,从来不仅仅是硬件性能,而是CUDA生态。数百万开发者习惯了调用cuBLAS、cuDNN这些高度优化的库来构建模型。如果一种新算法绕过了这些库,甚至需要全新的硬件支持,那么英伟达的垄断地位就会出现裂痕。
“AMD那边有什么动静?”老黄问道。
“MI300系列的架构比较灵活,他们在标量计算单元上保留了更多的资源,理论上跑SLRM会比我们稍微从容一些。”技术部主管回答,“而且,他们最近在积极接触PyTorch团队,试图推动对非矩阵算子的原生支持。”
“不能给他们机会。”老黄的眼神变得冷峻。
他走回座位,双手撑在桌面上,下达了一系列指令。
“第一,软件层面。立即启动cuSLRM项目。抽调最精锐的CUDA工程师,针对SLRM的核心算子进行手写汇编级优化。我要让全世界看到,即使是跑几何逻辑,英伟达的GPU依然是最快的。”
“第二,硬件层面。Blackwell架构的设计已经冻结,来不及大改。但在下一代Rubin架构中,必须预留专门的‘逻辑推理单元’。我们要把这种非线性计算,也变成硬件原生的指令。”
“第三,生态层面。”老黄顿了顿,语气中透出一丝商业巨头的狠辣,“联系PyTorch和TensorFlow的维护团队,以‘技术合作’的名义,提供专项资金和人力,帮助他们优化基于CUDA的SLRM实现。我们要确保,当开发者想要尝试这个新算法时,他们最先想到的、最好用的工具,依然是跑在英伟达显卡上的。”
“我们要用生态的厚度,去淹没任何试图另起炉灶的尝试。”
……
然而,就在谷歌和英伟达这两大巨头,如同两头被惊醒的巨兽,准备调整姿态在新的赛道上狂奔时,一张早已编织好的大网,无声地收紧了。
“老板,情况有点不对劲。”
谷歌的情报分析师冲进会议室,脸色苍白,同时也带回了让整个硅谷窒息的消息。
“怎么了?是不是中国那边也有动作?”皮查伊敏锐地问道。
“不止是有动作……”分析师深吸一口气,投屏了几张截图。
那是GitHub上几个不起眼的开源项目,更新时间显示在一周前。
- OpenLPU-Compiler(开源逻辑处理单元编译器)
- SLRM-Pytorch-Extension(SLRM专用算子库)
- Chinese-Logic-Graph(中文逻辑知识图谱构建工具)
虽然这些项目还很初级,甚至有些简陋,代码提交记录也显示只是刚刚起步的“占坑”行为。
但它们背后的提交者ID,却让皮查伊感到一阵窒息。
-华为昇腾
-寒武纪
-阿里达摩院
“还有这条新闻,”分析师调出一条不起眼的快讯,“上周,中国科技部批准了‘新一代认知智能计算架构’重点专项,合作方囊括了中国几乎所有的半导体和互联网巨头。据可靠消息,海丝的下一代LPU芯片,已经进入了秘密流片阶段……”
会议室里,死一般的寂静。
“怎么可能?!”
一向沉稳的杰夫·迪恩都忍不住失声惊呼:“论文才发出来半个月,他们怎么可能动作这么快?简直就像是……早就拿到了答案一样!”
短暂的震惊之后,皮查伊强迫自己冷静下来。
他仔细审视着那些开源项目的进度,紧皱的眉头逐渐舒展,嘴角甚至勾起了一抹冷笑。
“慌什么。”
皮查伊手指敲击着桌面,恢复了CEO的自信,“虽然他们反应很快,但你们看这些代码,逻辑混乱,优化极差。离真正的成品,至少还有半年的距离。”
“我们落后的时间,最多只有一个月。”
“一个月而已。”皮查伊眼中闪烁着光芒,“凭借谷歌的技术积累和人才储备,一个月的时间,完全可以追回来!甚至,我们可以做得比他们更好,更完美!”
他猛地站起身,下达了指令:
“传令下去,DeepMind全力攻关SLRM算法优化!法务部立刻出动,把SLRM架构下所有可能的优化路径,全部申请专利!我们要用专利墙,把中国人的路堵死!”
“这场仗,才刚刚开始!”
……
然而,皮查伊的豪言壮语还未落地,现实就给了硅谷一记响亮的耳光。
仅仅三天后。
当谷歌和英伟达的法务团队,拿着连夜整理好的几百项“核心专利申请书”冲向专利局时,却绝望地撞上了一堵铜墙铁壁。
“驳回。”
“驳回。”
“全部驳回。”
看着专利局发回的一连串通知,皮查伊气得直接摔了手里的咖啡杯。
“为什么?!理由是什么?!”
“老板……”法务主管声音颤抖,“晚了。都晚了。”
“所有关键的技术节点——从‘基于Gumbel-Box的逻辑门电路设计’,到‘几何算子的指令集定义’,再到‘专用编译器的中间表达’……所有通往‘最优解’的路径,都已经被那几家中国企业注册得密不透风!”
“申请时间,清一色都是在论文发表后的那一周内!”
“该死!他们是预谋好的!这是一个陷阱!”
皮查伊瘫坐在椅子上,脸色铁青。
这意味着,谷歌如果想要使用最高效、最完美的SLRM架构,就必须向中国企业缴纳高昂的专利费。
如果不交钱,他们就只能退而求其次,去走那些歪路、绕远路。
比如,用更复杂的“多层感知机”来模拟几何嵌入,或者用效率更低的“软门控”来替代硬截断。
这就像是当年3G时代的专利战重演。
只不过这一次,攻守之势异也。当年是高通掌握了CDMA的核心专利,逼得其他人交钱;而现在,轮到镁国巨头尝尝被“专利卡脖子”的滋味了。
这种“次一级”的方案,虽然也能跑通,但代价是惨痛的——效率至少低了30%,能耗高了50%。
与此同时,英伟达总部。
看着技术团队提交的测试报告,黄仁勋的脸色比皮查伊还要难看。
“这直接抹平了我们在制程上的优势!”
老黄指着数据图,手指都在颤抖。
“我们用最先进的3nm工艺制造的芯片,跑这种‘魔改版’的次优解算法,其综合能效比……竟然只能勉强打平中国用10nm工艺制造的原生LPU芯片?!”
“这简直是……耻辱!”
会议室里一片死寂。
无论是谷歌还是英伟达,他们都很清楚,自己别无选择。
如果不跟进,万一SLRM真的是通向AGI的钥匙,他们就会彻底掉队,最后不得不全部采用华国的方案;如果跟进,就只能捏着鼻子,一边骂娘,一边去研发这种注定“低人一等”的魔改芯片。
硅谷的夜,从未如此寒冷。
……
(https://www.66kxs.net/book/4792/4792324/39778370.html)
1秒记住66小说网:www.66kxs.net。手机版阅读网址:m.66kxs.net