做最好的区块链网

tronlink下载|OpenAI 推出 Sora:人工智能文本转视频生成器

随着 Sora 的推出,OpenAI 刚刚在人工智能 (AI) 和视频创作领域取得了突破。 生成式 AI 模型能够通过简单的文本提示生成长达一分钟的视频,类似于 ChatGPT 的工作原理。

索拉的主要特点

据 OpenAI 称,Sora 可以制作具有多个角色的高度详细且复杂的场景。 每个角色都可以在动态背景和复杂的摄像机运动中表现出充满活力的情绪和动作。 所有这些都是通过对自然语言软件的深入认知而成为可能的。

为了展示文本转视频模型的潜力,OpenAI 在 X 上发布了一段完全由 Sora 制作的视频。 这段真人视频显示,一对夫妇在冬天的背景下走在东京一些商店前的人行道上。

OpenAI 在 Sora 的官方网页上表示:“我们正在教授人工智能理解和模拟运动中的物理世界,目的是训练模型帮助人们解决需要现实世界交互的问题。” “Sora 可以生成长达一分钟的视频,同时保持视觉质量并遵守用户的提示。”

“Sora 能够生成具有多个角色、特定类型的运动以及主题和背景的准确细节的复杂场景,”它补充道。 “该模型不仅了解用户在提示中提出的要求,还了解这些东西在物理世界中的存在方式。”

不过,首席执行官萨姆·奥尔特曼 (Sam Altman) 领导的公司尚未确定《Sora》的发布日期。

OpenAI在Sora遇到的挑战

推荐阅读 1

如果 XRP 一年内每天有 5 亿美元的 ETF 流入,其市值可能会达到 23 美元,市值为 1.29T 美元

10小时前 2

日本计划允许风险投资直接投资加密货币初创公司

11小时前

OpenAI 承认当前版本的 Sora 存在一些弱点,需要在公开发布之前解决。 其中包括模拟复杂场景的物理问题,因为它在理解因果的特定逻辑方面存在局限性。 它提供的一个例子是一个视频,描绘了一个人咬饼干,但下一个场景可能会导致饼干根本没有咬痕。

它还可能对空间指令感到困惑,这可能会导致一些简单的方向细节(例如左右)的混淆。 同样,它仍然容易出现错误信息、偏见和有害内容。

此外,该技术公司目前正致力于在 Sora 中编码 C2PA 元数据,并将其打包为 OpenAI 产品。 这样,检测分类器就可以知道某个视频是否是由 Sora 生成的,同时防止平台上误导性内容的归属。

广受欢迎的 ChatGPT 的制造商确保它目前正在吸引世界各地的政策制定者、教育工作者和艺术家,以从他们那里获得尽可能多的关于他们所关心的问题的意见,并确定新技术的可能用例。

OpenAI 警告说:“尽管进行了广泛的研究和测试,我们仍无法预测人们将使用我们的技术的所有有益方式,也无法预测人们将滥用我们的技术的所有方式。” “这就是为什么我们相信,随着时间的推移,从现实世界的使用中学习是创建和发布越来越安全的人工智能系统的关键组成部分。”

其制造商认为 Sora 是生成式人工智能模型理解如何模拟现实世界场景的重要基础。