谷歌新内存技术炸翻传统存储芯片市场 大厂集体受挫

2026-03-27 来源:手游巴士 作者:某年某月

 美国东部时间3月26日,存储芯片股集体重挫,闪迪跌超11%,希捷跌逾8%,超威半导体、西部数据跌逾7%,美光科技跌近7%。

业内人士分析,这一波动源自谷歌研究院即将在国际学习表征会议(ICLR 2026)上正式亮相的学术论文,该研究推出了一种新型AI内存压缩技术“TurboQuant”。

谷歌宣称,该技术可将大语言模型推理中的缓存内存占用压缩至六分之一,并在英伟达H100 GPU上实现最高8倍的性能加速。

AI模型运行时存在一种“工作内存”,即KV缓存(Key-Value Cache)。每当模型处理信息、生成回答时,KV缓存便会迅速膨胀,且上下文窗口越长,缓存占用的内存越大。

谷歌新内存技术炸翻传统存储芯片市场 大厂集体受挫

TurboQuant本质上是一种极致的量化压缩算法,传统量化方法需要在压缩精度和额外存储开销之间妥协,而谷歌团队通过PolarQuant(极坐标量化)和QJL(量化JL变换)两项创新,实现了在“零损失”前提下将KV缓存压缩至3-bit精度。

Cloudflare首席执行官将这一成果称为谷歌的“DeepSeek时刻”,认为其有望像DeepSeek一样,通过极致效率大幅拉低AI的运行成本。

不过,摩根士丹利在最新研报中指出,市场对此存在误读。该技术仅作用于推理阶段的键值缓存,并不影响模型权重所占用的高带宽内存(HBM),也与AI训练任务无关。

分析师强调,所谓的“6倍压缩”并非存储总需求的减少,而是通过效率提升增加单GPU的吞吐量。这意味着在相同硬件条件下,可以支持4倍至8倍更长的上下文,或在不触发内存溢出的前提下显著提升批处理规模。

目前,谷歌尚未公布TurboQuant在Gemini等自研模型中的具体部署时间表,研究团队计划在下个月的ICLR 2026会议上正式发布相关成果。

上一篇:索尼正准备在欧洲范围内对PS5进行大规模提价 涨幅达100欧元!

下一篇:回归初代! 游戏博主展示固定视角游玩《生化危机:安魂曲》

相关推荐

Mojang公布《我的世界》手游重做内容 更可爱的生物及幼崽

3月26日晚,经典沙盒游戏《我的世界》的开发商Mojang正式公布备受玩家期待的微型接管重磅版本更新内容。本次更新迎来大规模优化升级,官方对游戏内全部幼崽生物完成全方位重塑

最费力“AI感” 《虚实万象》游戏"BUG"场景全靠手工制作

 3月27日消息,科技媒体Wccftech昨日(3月26日)发布博文称,在卡普空(Capcom)最新媒体前瞻活动中,开发团队透露了《虚实万象》(Pragmata)一个反直觉的幕后细节:为了让游戏中的“纽

《零秒:时光的归途》定档7月13日,首发加入Xbox Game Pass

 KRAFTON(CEO CH Kim)旗下创意工作室Flyway Games(CEO 金水英)宣布,新作《零秒:时光的归途》将于2026年7月13日正式发售,登陆 Xbox Series X|S、PC 端 Xbox 应用 (Xbox on PC) 、

狩猎模拟新作《猎人之路2》已登陆Steam开启抢先体验

 近日,由Nine Rocks Games开发、THQ Nordic发行的开放世界狩猎模拟游戏《猎人之路2》(Way of the Hunter 2),正式登陆Steam平台开启抢先体验,同步推出全新发布预告片,为玩家展现

《女神异闻录》手游30周年每月限定特典惊喜掉落! 纪念周边社媒抽奖活动进行中

世嘉官方旗舰店SEGA STORE上海即将开启《女神异闻录》30周年纪念系列活动,每月30日为到店粉丝们献上惊喜好礼!作为活动第一弹,3月30日~4月5日到店购买女神异闻录系列商品,满69

查看更多