当前位置: > 行业资讯 >

行业资讯

快手可灵大模型可生成最长约3分钟视频

发布时间:2024-06-26 文章来源:北京日报客户端
  6月21日,快手可灵视频生成大模型宣布推出图生视频功能,支持根据不同文本内容,将静态图像转化为生动的5秒视频。同时,可灵支持对已生成的视频一键续写和连续多次续写,每次续写都能将视频延续约5秒,最终可实现长达3分钟的视频。
 
  6月6日,可灵视频生成大模型上线。据介绍,可灵大模型为快手AI团队自研,基于快手在视频技术方面的多年积累,采用Sora相似的技术路线,结合多项自研技术创新,效果对标Sora。记者看到,可灵大模型不仅具备概念组合能力和想象力,还能够生成大幅度的合理运动、模拟物理世界特性。其生成的视频分辨率高达1080P,且支持自由的宽高比。此前,网友展示的可灵生成的“吃面条”视频,自然流畅,一度火爆出圈。
 
  记者了解到,目前,用户可在快手旗下的快影APP申请使用可灵大模型,进行文生视频的创作。凭着比肩Sora的视频效果,可灵邀测帐号一号难求。截至6月21日,已有超过14万人排队申请测试。由于目前“可灵”只向国内用户开放邀测,有大量国外网友以发中文、制作表情包等形式花式求号。
 
  基于可灵大模型,更多应用方向也已经或即将落地。记者注意到,基于肢体驱动的“AI舞王”功能已在快手和快影APP成功落地,用户只需上传一张全身或半身照片,即可体验一键跳舞的乐趣。近期还将上线“AI唱跳”新玩法,可以同时驱动表情和肢体动作,仅需一张照片就能生成唱跳“爱你”的生动视频。
 
  今年2月15日,OpenAI发布“文生视频”模型Sora,可以创建长达60秒的视频,其中包含高度详细的场景、复杂的摄像机运动以及多个角色,也可以根据静态图像制作动画,引发行业关注,Sora也一度成为国产大模型的对标方向。
 
  “国内厂商在对标Sora的过程中,技术积累是一个关键因素。”中国数实融合50人论坛专家洪勇表示,这要求国内团队不仅要掌握类似的深度学习技术,还要有能力进行创新。
 
  对图生视频大模型而言,视频时长为什么重要?在数字化领域专家、中关村物联网产业联盟副秘书长袁帅看来,模型在生成视频的一致性、动态性和连贯性等方面的表现,是衡量模型性能的重要指标。同时,模型在生成视频时长、分辨率等方面的能力,也是衡量模型实用性的重要因素,也能反映出模型在实际应用中的稳定性和可靠性。
    〖 浏览次数: