2024-04-18 06:27

一堆60分的AIGC产品,能撑起美图的未来吗?丨鲸选深测

文章来源:AI鲸选社


图片来源:由无界AI生成
图片来源:由无界AI生成


作为鲜有的AIGC上市且盈利的公司,美图的AIGC发展之路非常值得关注。


上图是美图的核心产品矩阵,底座是美图自研的大模型MiracleVision(奇想智能)。摊子铺的非常大,布局几乎涵盖了主流的AIGC赛道,但也面临着每个赛代的实力玩家竞争。

比如美图在图片设计赛道与国外AI知名公司Canva狭路相逢,在文生图片领域面临Midjoueney等重磅产品的竞争;AI口播开拍和国内的闪剪、heygen等名玩同赛道竞速;文生视频whee面临国外的Sora,国内字节的Dreamina等大咖夹击。

尽管在2023年该公司的业绩略有改善,但相比2019年的市值巅峰,很多人担心美图市值跌破100亿。如今,美图秀秀将希望寄托在大型AI模型上,能全面出击,全面胜利吗?

AI生图:人像效果尤佳,其他有差距


AI生图功能在美图秀秀APP中就能体会到,充会员后每天有六十次图片生成机会。


鲸哥从不同风格都测试了美图绘画的AI生成能力,首先测试的是动漫风格。

prompt:水中捧着爱心的小女孩,梦幻的色彩,杰作,高质量,动漫风 


左:美图生成,右:midjourney生成
左:美图生成,右:midjourney生成


首图为美图生成,第二张为Midjouney生成。两相比较,MJ更“梦幻”,美图的更卡通,有点儿童化。

再测试一下游戏特效风

prompt:赛博朋克,霓虹都市,机器人,无人驾驶,游戏概念设计,高分辨率,杰作


左:美图生成,右:midjourney生成
左:美图生成,右:midjourney生成


谈到“cyberpunk”,这方面的图片素材肯定不会少。看出图效果,整体审美和画面细节上,美图都略显动漫,且美图生成的几张待选图片,都有一个明确的人物或机器人作为画面主体,占据了视觉中心。MJ则不同,生成的图片更有城市的破败感,视觉角度更多样,想象空间也更丰富。

还需注意的是,诸如“末日”、“战争”、“死亡”、“焦土”等略带负面意味的浪漫意象,均无法通过美图的审核机制,一定程度上给图片的生成可能性打了折扣。

来看看3D效果:

prompt:戴着超大耳机的可爱女孩,3D渲染,超高分辨率,丰富的细节


左:美图生成,右:midjourney生成
左:美图生成,右:midjourney生成


输入这条prompt的原意是测试美图的3D效果能力,却不经意间测出了美图在人像生成上的优势。从上面两幅图来看,虽然MJ在审美上更胜一筹,可美图秀秀的3D肖像效果却是无可挑剔。可能因为其本身作为中国最大的照片修图工具之一,美图秀秀拥有大量的人像图片素材来训练。

带着这个猜测,我们继续测试一下MJ和美图的人像效果

prompt:一位写实的青年真人男律师肖像,戴眼镜,半身照,身着西装,浅灰色背景,丰富的画面细节


左:美图生成,右:midjourney生成
左:美图生成,右:midjourney生成


果然,这一轮比拼中,美图生成的肖像更写实,细节更丰富。而MJ生成的肖像就近似油画风格了,鲸哥调了几遍生成的图片写实效果仍然不够。

那是不是美图的写实效果就比MJ好呢?

prompt:金毛猎犬在水下追逐网球的照片,特写肖像,专业摄影,惊人分辨率


左:美图生成,右:midjourney生成
左:美图生成,右:midjourney生成


不尽然。从图片效果看,MJ的图片分辨率高得吓人,生成的金毛和水中姿态都好看。美图生成的金毛虽然写实,却有点失真了,毛发的细节不太正常,而且出现了很多个网球,没有体现出“追逐“这一动作。看来,美图是在人像写实效果上做的更好,普通的写实效果图不一定能比过midjourney。

最后,测一测中国风风格:

prompt:孤舟蓑笠翁,独钓寒江雪,中国风,水墨画风格,杰作


左:美图生成,右:midjourney生成
左:美图生成,右:midjourney生成


从出图效果看,MJ是真的理解了“中国风”和“水墨画”,美图虽然做的也不错,画出了远中近风景,就是隐藏了些卡通风。

AI视频:风格多样,值得鼓励


在文生视频上,美图也下了功夫,推出了文生视频产品Whee。文生视频毫无疑问是最难啃的赛道,因为生成的视频内容为三维现实,就连OpenAI的Sora都没办法完全理解现实的逻辑。



我们首先拿Sora出圈的东京女子街头漫步的prompt测试一下Whee的文生视频效果如何:

prompt:一位时尚女性走在东京的街道上,街道上到处都是暖色调的霓虹灯和动画城市标志。她身穿黑色皮夹克、红色长裙和黑色靴子,手拿黑色皮包。她戴着太阳镜,涂着红色唇膏。她走起路来自信而随意。街道潮湿而反光,与五颜六色的灯光形成镜面效果。许多行人走来走去。


OpenAI Sora(未公测,案例视频)
OpenAI Sora(未公测,案例视频)


美图同款提示词生成视频
美图同款提示词生成视频


字节Dreamina生成的视频
字节Dreamina生成的视频


从生成的视频来看,Sora做得最好,但是没公测;字节的Dreamina生成了相应的视频,景色和人物都比较逼真,镜头感也有一定的呈现,特别的是时尚女性有点胖。

Whee的文义理解做的不错,“黑色皮夹克、红色长裙、黑色靴子”这么细致的服装都能识别得出来,”暖色调的霓虹和动画城市标志“也算过得去(橙色是暖色调)。

但是,视频中的女子和路人几乎没有移动,女子虽然移动了,但并不协调。整体来看,更像生成了一张图片,然后让图片变形了一下。

在应用界面里,Whee提供了很多种不同的视频风格,如鎏金珠宝、3D卡通、外景商拍、特效人像、自然纪录片等。在国内,能针对性提供不同的AI视频风格的,Whee可能还是头一个。像鎏金珠宝、外景商拍、特效人像这些风格,都可以直接商用,我们当然要测试一下。



让我们试试“鎏金珠宝”风格:

prompt:人像摄影、1女子、手上的紫色戒指、纯色背景、4K分辨率、时尚风格、简洁大气、柔和自然光、光滑亮丽



得夸一下美图秀秀的文义理解能力,”女子、紫色戒指、纯色背景“都能准确生成,但对于最大的生成难题——手,美图也没能解决,认真看会发现只有四根手指。而且视频的生成时间很短,只有1s,近似于一张图片。

另外还得夸一下Whee在文生视频时的“智能联想”功能,只需要输入几个关键词,就可以自动帮你补全prompt,上面的prompt就是由智能联想而成。

再试试“外景商拍”风格:

prompt:高级广告、香水喷洒、至尊香水瓶、华丽宴会、4K超清、奢华风格、金碧辉煌、聚光灯照射、玻璃光滑



“外景商拍”风格做的很好,看起来跟广告没有区别了,还能做到视角的旋转,难度不小。估计以后这种商业性质的AI视频生成产品会越来越多,因为需求大,难度较生成电影级别的镜头也低很多。

最近很火的AI视频动漫化,美图秀秀也没有错过。鲸哥之前做过一次Goenhance测评,这次加上美图wink和国产新锐啵啵动漫,一起做个横评。


啵啵动漫整体还原度、手势表情各方面都表现不错,美图这个付费版生成的效果有些惊喜,就是转动漫的人像比本人还美,不得不说美图在人像方面的实力。但细节确实有问题,比如这个视频经典的比方框手势显示不出来,以及视频中偶尔一只胳膊没了。



目前看,Goenchace能提供多种多种动漫风格,而美图秀秀能提供多种“变身”效果:



上面使用的是变身效果”烟花“,可以看到视频主体一开始为真人霉霉,摘墨镜的瞬间释放烟花,随后视频就动漫化了,赏心悦目。

AI数字人:仍待进步


目前,AI公司都困于盈利,顶尖的paper发了一堆,商业化却都做的不好。就算是ChatGPT,目前也没摸索到好的商业化方式,只能通过增值服务和API接口的方式赚钱。



在那么多的AI商业化尝试中,数字人直播带货被证明是最赚钱的。所以在这一块,美图也没闲着,推出了其AI口播视频工具“开拍”。据悉,”开拍“月活跃用户数已突破35万。

地址:https://www.kaipai.com/home



操作上,只需输入人像照片和口播内容,就能让人像开口说话。鲸哥将咱们公众号“鲸选pro“的文章《阿里为什么投了那么多大模型?》中的片段输入进去,看看效果如何:

视频中的口播内容如下,感兴趣的朋友可以点击原文章链接阅读:

大模型公司虽然都是独角兽级别(10亿美元估值)。看起来很贵,但对于阿里来说,依然很便宜,尤其在当下阿里PE仅有15,市值被严重低估之际。 这也许是更懂财务的阿里董事长蔡崇信的安排。我们从上图中两条折线的差值,看到代表资本性支出规模这一数值的变化,阿里是想继2017年后再度开启投资盛事世,当时投资新零售等,现在投资大模型,为集团投出来一个未来。就像雅虎投资阿里巴巴,最后阿里巴巴的股权价值已经超过了没落的雅虎本身。所以,阿里会成为下一个万亿市值的微软,还是投资火主业虚弱的雅虎?



嘴型是衡量AI数字人能力的最核心指标。虽然视频中的女生的确”开口说话“了,但嘴型与输入的视频内容并不一致,较显生硬。数字人是最卷的赛道,这个水平属于不入流。

美图秀秀的另一款数字人生成工具Dream Avatar,目前在APP Store就可以下载,主打”数字明星“、”数字替身“,其实就是可以让视频里的真人变为虚拟人,同时保持其动作不变。

操作不复杂,只需要输入视频,选择有人物的关键帧,再选择替换的数字替身就可以了。

鲸哥输入了一条2s的霉霉视频:




效果如下:



替换得还算可以,但是需要注意,输入的视频最好只有一个镜头。鲸哥尝试将上文动漫化之前的霉霉视频输入,因为有远、中、近景的变化,AI没办法很好地识别出是同一个人,在替换时也只将其中一个镜头的霉霉进行了替换,还影响到了其他的镜头,堪称大型翻车现场。。。

Dream Avatar想走的应该是柳夜熙、厘里那样的虚拟偶像路线,致力于让每个人都能在未来的元宇宙里拥有一个属于自己的数字形象。但当下谈实现元宇宙还言之过早,连AI的普及都还需时日,元宇宙就更得等到更久之后了。在当下,比起数字人直播带货,Dream Avatar商业化要难的多啊。

AI设计:功能齐全,用途广泛


作为国内头部的AI修图工具,美图秀秀肯定不会放过设计赛道。



美图秀秀专门推出了”美图设计室“,移动端和网页端同步上线,其中有AI模特、AI logo、AI商品图、AI海报、AI写真等多种功能。



鲸哥首先尝试了一下AI海报,输入Logo、活动主题、活动时间、活动地点、邀请函内容、二维码之后就可以自动生成。下面是效果图:





对于海报,网络上拥有的模板和素材实在太多,生成效果好倒也不惊讶。但对于普罗大众来说,这依然是个很实用的功能。

美图为用户提供了不同的AI模特,并配备不同的场景,用户上传真人照片即可使用AI模特功能:









上传服装图,选择模特+造型,就可以生成效果图:







至于AI商品则更简单,鲸哥上传了自己的一双德比鞋,选择了一个模板,一幅商品图就出来了:



美图还手把手教你写prompt,提示用户一个完整的prompt公式应该为“产品主体+场景+元素/光影+风格/分为/画质”,如上图的prompt就是“放在大理石上,被花草植物环绕,白色鲜花,浅色配色,高级感”。

这个功能非常有用,以后淘宝小商家在上传自己店铺的商品图时,就能省去繁琐的拍摄步骤,直接用AI了。

结语


无论是新兴行业,还是既定行业中出现的新机会,进入时机都是很关键的。

美图杀进生产力工具赛道气势虽足,但AI还是新手。美图AI生态中的智能修图、AI商拍、数字人、文生视频、文生图等产品,单独拎出来都是一个独立的赛道,每个赛道上都充斥着大厂和创业公司,能否胜出还是未知数。

站在AI的肩膀上,美图能否更具有竞争力,还需市场说了算。

本文链接:https://www.aixinzhijie.com/article/6845454
转载请注明文章出处

评论
登录 账号发表你的看法,还没有账号?立即免费 注册
下载
分享
收藏
阅读
评论
点赞
上一篇
下一篇