2024-04-16 02:10

AI王炸?字节版MJ和Sora,实力几何?丨AI 内测

文章来源:AI鲸选社


众多周知,字节跳动在All in AI。毕竟2023年净利润3000亿(字节否认了),要为自己准备下一阶段的发展动力。

此前鲸选盘点过字节推出的很多AI 产品,大多是AI对话类。在文生图和文生视频领域,字节目前似乎在倾力打造Dreamina,这款AI产品对标国外的Midjourney和Sora,难度不小。

最近Dreamina在放内测资格,到底哥为你带来一手测评。

 文生图片能力,还有努力的空间

文生图片很多时候不仅考验生成视频的精细度,也考验对文字的理解能力,我们就做一个“耳朵是蝴蝶翅膀的大象”。

从生成结果看,完全没有体现出来文字想要表达的创意。


我们看到有上传参考图的功能,所以上传了这张比较有名的创意图。


我们选择了主要参考点是主体,Dreamina识别出了这张图的主体是大象。


我们在选择写实风格,有了参照图后,生成的图片终于理解了文字的意思, 不过这图片,怎么感觉像抠图后加上背景生成的呢?

文生视频能力,不是Sora路线

我们先看看Dreamina社区中,一些文生视频的案例。


是不是还挺酷炫,要知道Sora生成水杯破裂的视频,是不能够了解破裂过程应该如何呈现,而Dreamina这个视频,则是理解了物理规律,还加上了想象力的翅膀。

到底哥以为文生视频能力会很酷炫,直到我看到了它的参考图。



我瞬间意识到,Dreamina应该和Pika等AI视频的路线相似,就是图片关键帧动起来,所以并不是对文字的真正理解,以及视频画面的原生,而是几秒钟的关键帧运动。

所以我们接着拿蝴蝶大象做生成测试,没有意外,视频也没有体现文字的意思,还是一只大象动了几秒钟。



一位同样从事Sora产品跨国开发的负责人,告诉AI鲸选社,这是Dreamina跨域和泛化问题还没处理好。

虽然Dreamina还存在一些问题,但其从头研发,并且比Sora更早开放测试,证明其还是有决心和潜力做更好,期待其迭代版本。

本文链接:https://www.aixinzhijie.com/article/6845422
转载请注明文章出处

评论
登录 账号发表你的看法,还没有账号?立即免费 注册
下载
分享
收藏
阅读
评论
点赞
上一篇
下一篇