安博体育官方版APP下载_安博体育网页版
    主页 / 资讯 / 新闻 / 只是! Google宣布了Genie 3:AI在Sora之后的热门歌曲,开设了新的世界模型

只是! Google宣布了Genie 3:AI在Sora之后的热门歌曲,开设了新的世界模型

2025-08-20 10:56


Xin Zhiyuan报告编辑:KingHz [Xin Zhiyuan简介]这里的Genie 3!这可能是与“模拟世界”最近的AI魔术。在仅一句话中,它可以提出一个动态的新闻,互动世界 - 角色可以互动,水会溅出,甚至一分钟前牢记细节。 DeepMind的研究人员深入指出:Genie 3是迈向AGI的重要一步。 Genie 3是有史以来最受欢迎的模型之一。只有在文本中,它才能实时出现一个完全互动的,相当普遍的世界。这不仅是深度的结晶,而且是迈向AGI和体现药物的主要步骤。但是Genie 3是如何发展的?世界的未来模式是什么?刚才,Google DeepMind的研究科学家Jack Parker Holder和研究总监Shlomi Fuchter分享了他们对与A16Z的采访的看法。这次对话给了Genie 3的第一手展望。主持人贾斯汀·摩尔(Justine Moore)在推特上发了推文:“ Genie 3带来了互联网。“他总结了深入讨论的关键点:Genie3是两个深度项目之间建立伙伴关系的结果(VEO 2和Genie 2)。实时的,交互式世界模型有许多潜在的应用。但是,应用并不是研究的主要驱动力 - 它们自然而然地从用户模型中脱离了型号。培训数据目前没有“最终模型”,即同时,veo 3和Genie 3的所有功能。每秒的帧,具有720p的分辨率。E,Google DeepMind一直在研究模拟环境中的研究。 Genie 3是他们最新,最强大的“世界模型”,也是迈向通用人工智能(AGI)的重大步骤,因为它允许AI代理使用无限丰富的模拟训练。去年,他们推出了第一个主要世界模型,Genie 1和Genie 2,可以为代理商提供绝对新的环境。此外,他们继续通过几代视频世代(例如VEO 2和VEO 3)来提高对直观物理的理解。这些模型已经在世界上开发了各种模拟功能。 Genie 3是支持实时联系的Google世界的第一个模型,同时改善了一致性和现实主义。 Genie 3在视频生成期间创造了突破性,世界一致性,内容的差异,特殊记忆和其他方面。它还允许个人创建自己的游戏世界,铁路加固代理商,机器人研究等。所有这些应用程序通常都来自基本能力:只需几句话就可以开发一个完整的世界。 PCritical New功能是:特殊记忆。示例:角色拿起刷子绘画墙壁,然后他移到墙壁的另一侧进行绘画,然后返回到他的原始位置,而先前的刷子的痕迹仍然存在。特殊记忆是DeepMind Group设计的故意目标,但最终效果预计不会是好的。即使是Genie 3的内部成员也参与了Genie 3,他们第一次看到上面墙上绘画的例子就无法相信。他们需要一遍又一遍地观察它,并通过框架检查框架,以确认它实际上是由模型形成的。 Genie 3具有很高的速度 - Same:建筑物左侧的树木总是完全接触,尽管它们有时进入视野和Thanlost,Genie 2已经有了一些“记忆Capabilities". But at that time, there were so many exciting models released around the AI world, such as the Veo 2 model, which also released several days. Moreover, the main point of Google's sale at that time is "new worlds can generate", so it does not emphasize the ability of memory. When it comes to Genie 3, Google Deepmind has made more determination in "memory", clearly taking "enhanced memory capabilities" as one of its main goals. The goals set at that time are:记忆一分钟,实际上,这些目标是矛盾的,但是,他们仍然感到惊讶,直到他们看到最终的样本时,他们仍然会遇到过详细介绍。表示”以下是市场上的几种方法,例如使用NERF或高斯脱落来通过开发3D的清晰世界结构来实现一致性。这些方法很好,并且可以与某些应用程序合作。但是他们坚持让模型“通过框架生成框架”,这对于总体一般通用的能力和多元化世界的灵活性更有用。智力似乎似乎像其他编队模型一样继续发生,并且在规模上,效果实际上会改善,而不是Lihe并不是秘密。尽管这不如理解推理能力方面的语言模型的性能,但Genie 3仍然具有令人惊讶的行为。例如,如果角色在门附近,则模型可以“认为”角色应打开门。现在可以在一定程度上表达与人类直觉相对应的这种行为。此外,语言理解继续改善MED变得越来越现实,视觉效果更自然。从Genie 2到Genie 3的改进是显而易见的,尤其是在“模拟现实世界能力”中。例如,物理效果 - 例如水模拟和光变化,它们都是惊人的。现在,即使是非专业人士也认为观看后的onea真实视频。这真是太神奇了。在Genie 2期间,尽管模型可以显示事物的行为,但您仍然可以看到“它是由AI形成的,而不是真实的”。当前的视频很难说出真相和假货,而且发展确实很棒。在“差异 - 局部差异”问题中:例如,该模型需要了解在沙子,滑雪,浇水,运动和物理反馈中的行走应该有所不同。 Google团队发现,其中许多行为是按规模和数据范围带来的“紧急情况”。换句话说,他们不为这些行为进行特殊的培训或设计,而是RAther“学习”了模型本身。它通过足够丰富的培训数据掌握了“世界”的常识。在大多数情况下,表现良好。例如,以下示例:滑雪时,角色在下降时会变得更快,当试图爬升,放慢速度甚至不上升时;进入水后,角色通常开始游泳或飞溅。当接近Puder时,模型通常可以让角色戴着雨靴。这些行为在现实世界中的人类理解中非常自然,而且非常多。它们是通过模型本身学习的,这确实使人们感到神奇。还有一个有趣的权衡:它可以在全球范围内保持“身体一致性”,同时诚实地实现用户的及时单词。对于视频模型,“低概率事件”很困难,但是Genie 3仍在执行。这正是:即使对于现实中一些不太可能的场景,精灵3也可能会让您感到沉浸,RathER不仅仅是像您周围环境这样的烦人视频。在“教学跟随/文本化”中,Genie 3也有所改善,这主要是由于在DeepMind(尤其是VEO项目)中移动和共享知识方面的经验。这种类型的跨团队合作是DeepMind的优点。世界模型是在现实世界中最快的代理途径。 Genie 3朝着这一目标迈出了一大步。那么Genie 4和Genie 5的新功能是什么?基本的现实主义和未来的接触,但总的来说,精灵3团队总是一回事:使模型本身尽可能强大,使其更大的影响,然后离开与其他团队创建应用程序的机会。他们说,NG Genie 3模型最终将开放。未来确实令人兴奋,但它必须承认,世界的模型仍然远非“真正地模仿现实世界”。例如,我们离某人进入世代和l距离Et他做他想做的任何事情。要使虚拟世界的现实主义和自由接近现实,还有很多工作要做。有很多应用程序,关键是您是否可以准确模仿世界并将人们放到这里。也许您还可以从“第三观点”观察自己,也可以使用与身体接触的虚拟智能。他们还透露,真理和关系是未来的关键。当今机器人技术领域中最大的瓶颈之一是数据:可以收集的数据有限。 Genie 3可以产生几乎无尽的场景,因此机器人可以意识到虚拟世界,而无需限于可以在现实中收集的视频。这个想法真的很令人兴奋。最后一个问题:人们生活在某种模拟中吗?这个问题被问到了几次,并收到了一个“哲学”答案:如果它实际上是一个模拟,它已经用完了完全不同的硬件。如果人们真的生活在模拟世界中当然不会在当前的硬件中运行。因为我们的世界在继续,而不是数字化。所有理解都是在进行的信号。也许,在音量级别上会有一些“硬件限制”,但至少它与我们当前的计算机完全不同。量子中的未来计算机也许是运行我们模拟世界的真正平台。参考:https://www.youtube.com/watch?v=twgjhc7djrohttps://x.com/mascobot/status/19567695417590948 59https 59https://superson.video/twdjhc7djjhc7djrhtpss: //x.com/venturetwins/status/1956769043668725919 特别声明:上面的内容(包括照片或视频(如有))已由自媒体平台“ NetEase”的用户上传和发布。该平台仅提供信息存储服务。 注意:上面的内容(包括照片和视频(如果有))已由NetEase Hao用户上传和发布,该用户是社交媒体平台,仅提供信息存储服务。

服务支持

我们珍惜您每一次在线询盘,有问必答,用专业的态度,贴心的服务。

让您真正感受到我们的与众不同!