在星期三上午的YouTube大事件中,最主要的吸引力当然是人工智能。该公司宣布将谷歌DeepMind的AI视频生成模型Veo整合到YouTube Shorts中,让创作者生成高质量背景以及六秒视频片段。
在谷歌2024年的I/O开发者大会上,Veo被公布为一款尖端的视频生成模型。这项技术直接竞争OpenAI的Sora,以及其他竞争对手的视频生成模型,如Pika、Runway和Irreverent Labs。它可以以各种电影风格创作1080p视频片段。
在Shorts中使用的Veo将是对YouTube AI“梦境屏幕”功能的重大升级,该功能于2023年推出,允许创作者使用文本提示在Shorts中生成背景。YouTube认为Veo模型将进一步增强视频背景生成过程,使创作者能够制作更令人印象深刻的视频片段。Veo的一个关键优势是它能够编辑和混合先前生成的素材。
此外,这将是创作者首次为Shorts生成独立的六秒视频片段。当创作者选择“创建”并输入提示时,Dream Screen将生成四幅图像。然后他们选择一张照片将其转换为视频。
新功能将帮助创作者为视频添加填充画面,实现更流畅的过渡,使整体故事更连贯。例如,创作者可以在观光视频开头加入纽约市天际线等画面,以增加更多背景信息。
公司将在今年晚些时候将Veo整合到Dream Screen中。Shorts上的作品将使用DeepMind的SynthID技术进行水印标记,标识其为AI生成。
除了Veo整合,该公司还宣布了一系列新功能即将登陆YouTube,包括“珠宝”和礼物,观众可以在直播过程中发送的数码商品。这一功能看起来类似于TikTok的“礼物”。珠宝旨在为观众提供与创作者互动的新方式,并积极参与直播。该功能将开始在美国的垂直直播中推出。
YouTube还扩展了其自动配音工具,支持法语、意大利语、葡萄牙语和西班牙语等更多语言。值得注意的是,它正在测试“表达性语音”,或者将创作者的语调、语音和环境声音转移到配音中,创造更自然的体验。
该公司正在将其社区中心的可用性扩展到更多频道,让创作者和关注者能够相互交流,包括分享帖子和互相回复。
此外,公司在今天的活动中透露,创作者现在可以利用人工智能在YouTube Studio内协助构思视频创意。他们还可以制作AI生成的缩略图,并使用新的AI辅助评论回复关注者。
hbspt.forms.create({ region: "na1", portalId: "44101848", formId: "09f96578-8d24-4d8a-8e9f-7700cff83c29" });