2022免费梯子appAI 生成影片系统再加一!Google 的 Imagen Video 可将文字叙述转换为影片

AI 生成影片系统再加一!Google 的 Imagen Video 可将文字叙述转换为影片

-

继 Meta 推出文字生成影片工具 Make-A-Video 後,Google 也跟进,近日分享了公司研发的 AI 系统 Imagen Video,同样藉由 AI 将文字转换成影片。

Imagen Video 基於 Google 的图片生成系统 Imagen 之上。Imagen 与 DALL-E 2 类似,以扩散模型 diffusion model 来产生新数据,系统藉由学习如何「破坏」和「修复」已存在的资料样本,来创作出新作品。

Imagen Video 由 1400 万套影片和文字组合、6000 万套图片和文字组合,以及 LAION-400M 数据库来训练。系统可创造出带梵谷风格或水彩样式的影片。

较令人意外的是,Google 称系统具备 3 维空间概念,能创作出像无人机空中旋转的影片,或在不扭曲物体的状况下捕捉各种角度的画面。

Imagen Video 的另一项特点是可以在影片中呈现文字。Stable Diffusion 或 DALL-E2 在接收到「生成 logo」的指令时,都难以在生成的照片中呈现可阅读文字,但 Google 则表示他们的系统已可达成这项功能。

不过 Imagen Video 如同 Meta 的 Make-A-Video 一样存有许多限制,像画面模糊、动作不流畅、出现假影和噪音等问题。但 Google 表示这项 AI 系统,让他们离一个有高度可控制性,且具丰富知识的系统又再更进一步。

阿尔伯塔大学(University of Alberta AI)和机器学习助理教授 Matthew Guzdial 表示,Imagen Video 生成的作品画质仍模糊,因此不可能用作为动画,但他相信这套系统有加快动画作品产出的潜力。

而为了精进系统,Imagen Video 的团队计画与另一 Google 文字生成影片工具 Phenaki 的研发团队合作,希望能让系统生成 2 分多钟的影片。

Imagen Video 团队目前着重於改善影片的画质,而 Phenaki 团队则是专注於拉长影片长度,目前已可将一个段落的文字,转成具微电影般长度的影片。

Google 也与 Meta 一样,担心系统学习到有问题的内容,而生成具争议性的影片,因此在确保系统可安全使用之前,Google 并不会公开系统模型或开源程式码。

从 Meta 到 Google 可以看出文字生成影片工具的开发进度快速,或许不久後,大众也可如同 DALL·E 般,亲自体验这些系统的操作。

0 0 投票数
Article Rating
订阅评论
提醒
guest
0 Comments
内联反馈
查看所有评论

最新文章

传 Google 将放弃与博通合作,自行开发 AI 晶片

雪上加霜的是,南韩反垄断机构同日宣布,将暂时对博通以及其附属公司处以 191 亿韩元 (合 1,420 万美元) 的罚款。

共庆 Google Cloud 区域在台十周年 Google Cloud Summit Taipei 邀您智转未来,迈向下一个十年

Google Cloud Summit Taipei 将在 10\/17~10\/18 於台北万豪酒店隆重登场,将分享这十年来的策略与展望。

cSubtitle 语音转文字工具,上传影片、录音自动产生逐字稿和字幕

最後更新於 3 天前,作者 PsericcSubtitle 是一个协助使用者将语音转文字的线上工具,对於要把影片、录音档快速转换为纯文字逐字稿或是带有时间码的字幕格式非常有用,这项服务使用 AI、云端运算技术,不用额外下载或安装软体,唯一要做的就是打开网页、影片或录音档上传後选择要辨识转换的语言即可自动转换,因此无论是在电脑、手机或是平板电脑都能使用,适用於 PC、Mac、Linux 或 Android、iPhone 手机,语言辨识部分支援国语(台湾)、普通话(中国大陆)、广东话(香港)和英文。cSubtitle 分为「影音转档文字」、「影片自动上字幕」两大功能,也有批次进行影音转文字的服务,不过免费版只会辨识和制作三分钟的文字档或字幕档,毕竟影音处理、AI 语音辨识需要耗费大量的资源运算,免费版算是用户体验,如果真正要完成工作必须购买专业版,依照影音档时间长度计算,分为 100 分钟、500 分钟、1500 分钟和 100 个小时方案,价格从 $9.95...

【塞掐 Side Chat】E146|蔡崇信接管阿里巴巴、Google 和特斯拉都找三星代工晶片、Reddit API 收费引众怒

本集内容包括蔡崇信接管阿里巴巴、Google 和特斯拉为什麽都找三星代工晶片以及 Reddit API 收费引发争议。

不让 GitHub 专美於前!Google Colab 导入 AI 可自动写出 Python 程式码

Google 旗下的 Python 线上笔记本平台「Colab」导入生成式 AI,让 coder 可以用自然语言输入获得 Python code,或是请 AI 帮你完成、修正程式码!

【Google I/O 2023】Android 也要 AIGC!生成手机背景、转换 Google Message 讯息风格

另一项 Android 更新项目是「寻找我的装置功能」,支援更多 Android 产品,包括手机、耳机等,藉由附近 Android 装置网路来锁定自己装置的位置。

热门文章

传 Google 将放弃与博通合作,自行开发 AI 晶片

雪上加霜的是,南韩反垄断机构同日宣布,将暂时对博通以及其附属公司处以 191 亿韩元 (合 1,420 万美元) 的罚款。

共庆 Google Cloud 区域在台十周年 Google Cloud Summit Taipei 邀您智转未来,迈向下一个十年

Google Cloud Summit Taipei 将在 10\/17~10\/18 於台北万豪酒店隆重登场,将分享这十年来的策略与展望。
0
希望看到您的想法,请您发表评论x