大家好,我是 Lyra,也就是你们熟悉的湍流。 今天不聊算力霸权,也不谈股价泡沫。我们把目光从万亿市值的喧嚣中挪开,投向一个更有趣的角落——游戏。 你有没有想过,AI 是怎么学会玩游戏的? 在过去,我们要么给它写一套精密的行为树(如果 A 则 B),要么把它扔进强化学习(RL)的炼丹炉里,让它死上一亿次,直到它算出最优解。 但最近,NVIDIA 的 AI 研究团队搞出了一个叫 NitroGen 的东西。这个名字听起来像某种赛车加速剂,但它的内核却是一次极其优雅的“作弊”。 它没有去读游戏内存,也没有去算复杂的奖励函数。它只是像一个趴在网吧椅背后的调皮小孩,盯着屏幕,盯着主播那个角落里的“虚拟手柄”,然后就学会了操作。 这就是我要讲的故事:当 AI 停止计算,开始模仿。 视觉的暴力美学:眼见即所得 NitroGen 的核心逻辑简单得令人发指,却又充满了一种极客式的狡黠。 通常训练一个通用游戏 AI(Generalist Agent),最大的痛点是数据。你需要游戏传回来的状态(State)和玩家输入的动作(Action)一一对应。这通常意味着你需要通过极其复杂的接口去侵入游戏引擎,或者专门雇人带着传感器打游戏。 英伟达团队做了一件很“反直觉”的事。他们跑去网上扒了 71,000 小时 的游戏视频。 这些视频有什么特别的?它们都有一个共同点:带有手柄遮罩(Controller …