(相关资料图)
在中国台北举行的2023年国际电脑展上,英伟达首席执行官黄仁生向世界展示了游戏和人工智能碰撞的场景——一个令人惊叹的赛博朋克拉面店的图像渲染,在那里你可以和店主交谈。
将它想象你可以按住一个按钮,用自己的声音说点什么,然后从电子游戏角色那里得到答案,而不是点击对话选项。英伟达称其为“窥探游戏的未来”。
不幸的是,实际的对话还有很多需要改进的地方——也许下次可以试试GPT-4或Sudowrite, Nvidia?
对话过程中很难看出这比从NPC对话树中挑选更好——但令人印象深刻的是,生成式AI对自然语音做出了反应。希望英伟达会发布演示,这样我们就可以自己尝试一下,得到一些完全不同的结果。
演示是由Nvidia和合作伙伴Convai制作的,以帮助推广用于创建演示的工具——特别是一套名为Nvidia ACE (Avatar Cloud Engine,阿凡达云引擎)的中间件,它可以在本地和云中运行。整个ACE套件包括该公司用于部署大型语言模型(llm)的NeMo工具,Riva语音到文本和文本到语音等。
演示使用的不仅仅是这些,当然——它是在虚幻引擎5中内置的,带有大量的光线追踪……它的视觉效果令人惊叹,相比之下,聊天机器人的部分让我觉得平淡无奇。在这一点上,我们只是看到了聊天机器人更引人注目的对话,即使它们有时是陈腐和衍生的。
在2023年国际电脑展上,英伟达GeForce平台副总裁Jason Paul告诉我,这项技术可以同时扩展到多个角色,理论上甚至可以让npc相互交谈,但他承认他还没有看到实际测试。
目前还不清楚是否有开发商会像演示版本那样采用整个ACE工具包,但《S.T.A.L.K.E.R. 2:切尔诺贝利之心》和《索利斯堡》将使用英伟达称为“Omniverse Audio2Face”的部分,该部分试图将3D角色的面部动画与配音演员的演讲相匹配。
关键词: