一堆60分的AIGC产品，能撑起美图的未来吗？丨鲸选深测

图片来源：由无界AI生成

作为鲜有的AIGC上市且盈利的公司，美图的AIGC发展之路非常值得关注。

上图是美图的核心产品矩阵，底座是美图自研的大模型MiracleVision（奇想智能）。摊子铺的非常大，布局几乎涵盖了主流的AIGC赛道，但也面临着每个赛代的实力玩家竞争。

比如美图在图片设计赛道与国外AI知名公司Canva狭路相逢，在文生图片领域面临Midjoueney等重磅产品的竞争；AI口播开拍和国内的闪剪、heygen等名玩同赛道竞速；文生视频whee面临国外的Sora，国内字节的Dreamina等大咖夹击。

尽管在2023年该公司的业绩略有改善，但相比2019年的市值巅峰，很多人担心美图市值跌破100亿。如今，美图秀秀将希望寄托在大型AI模型上，能全面出击，全面胜利吗？

AI生图：人像效果尤佳，其他有差距

AI生图功能在美图秀秀APP中就能体会到，充会员后每天有六十次图片生成机会。

鲸哥从不同风格都测试了美图绘画的AI生成能力，首先测试的是动漫风格。

prompt：水中捧着爱心的小女孩，梦幻的色彩，杰作，高质量，动漫风

左：美图生成，右：midjourney生成

首图为美图生成，第二张为Midjouney生成。两相比较，MJ更“梦幻”，美图的更卡通，有点儿童化。

再测试一下游戏特效风：

prompt：赛博朋克，霓虹都市，机器人，无人驾驶，游戏概念设计，高分辨率，杰作

左：美图生成，右：midjourney生成

谈到“cyberpunk”，这方面的图片素材肯定不会少。看出图效果，整体审美和画面细节上，美图都略显动漫，且美图生成的几张待选图片，都有一个明确的人物或机器人作为画面主体，占据了视觉中心。MJ则不同，生成的图片更有城市的破败感，视觉角度更多样，想象空间也更丰富。

还需注意的是，诸如“末日”、“战争”、“死亡”、“焦土”等略带负面意味的浪漫意象，均无法通过美图的审核机制，一定程度上给图片的生成可能性打了折扣。

来看看3D效果：

prompt：戴着超大耳机的可爱女孩，3D渲染，超高分辨率，丰富的细节

左：美图生成，右：midjourney生成

输入这条prompt的原意是测试美图的3D效果能力，却不经意间测出了美图在人像生成上的优势。从上面两幅图来看，虽然MJ在审美上更胜一筹，可美图秀秀的3D肖像效果却是无可挑剔。可能因为其本身作为中国最大的照片修图工具之一，美图秀秀拥有大量的人像图片素材来训练。

带着这个猜测，我们继续测试一下MJ和美图的人像效果。

prompt：一位写实的青年真人男律师肖像，戴眼镜，半身照，身着西装，浅灰色背景，丰富的画面细节

左：美图生成，右：midjourney生成

果然，这一轮比拼中，美图生成的肖像更写实，细节更丰富。而MJ生成的肖像就近似油画风格了，鲸哥调了几遍生成的图片写实效果仍然不够。

那是不是美图的写实效果就比MJ好呢？

prompt：金毛猎犬在水下追逐网球的照片，特写肖像，专业摄影，惊人分辨率

左：美图生成，右：midjourney生成

不尽然。从图片效果看，MJ的图片分辨率高得吓人，生成的金毛和水中姿态都好看。美图生成的金毛虽然写实，却有点失真了，毛发的细节不太正常，而且出现了很多个网球，没有体现出“追逐“这一动作。看来，美图是在人像写实效果上做的更好，普通的写实效果图不一定能比过midjourney。

最后，测一测中国风风格：

prompt：孤舟蓑笠翁，独钓寒江雪，中国风，水墨画风格，杰作

左：美图生成，右：midjourney生成

从出图效果看，MJ是真的理解了“中国风”和“水墨画”，美图虽然做的也不错，画出了远中近风景，就是隐藏了些卡通风。

AI视频：风格多样，值得鼓励

在文生视频上，美图也下了功夫，推出了文生视频产品Whee。文生视频毫无疑问是最难啃的赛道，因为生成的视频内容为三维现实，就连OpenAI的Sora都没办法完全理解现实的逻辑。

我们首先拿Sora出圈的东京女子街头漫步的prompt测试一下Whee的文生视频效果如何：

prompt：一位时尚女性走在东京的街道上，街道上到处都是暖色调的霓虹灯和动画城市标志。她身穿黑色皮夹克、红色长裙和黑色靴子，手拿黑色皮包。她戴着太阳镜，涂着红色唇膏。她走起路来自信而随意。街道潮湿而反光，与五颜六色的灯光形成镜面效果。许多行人走来走去。

OpenAI Sora(未公测，案例视频)

美图同款提示词生成视频

字节Dreamina生成的视频

从生成的视频来看，Sora做得最好，但是没公测；字节的Dreamina生成了相应的视频，景色和人物都比较逼真，镜头感也有一定的呈现，特别的是时尚女性有点胖。

Whee的文义理解做的不错，“黑色皮夹克、红色长裙、黑色靴子”这么细致的服装都能识别得出来，”暖色调的霓虹和动画城市标志“也算过得去（橙色是暖色调）。

但是，视频中的女子和路人几乎没有移动，女子虽然移动了，但并不协调。整体来看，更像生成了一张图片，然后让图片变形了一下。

在应用界面里，Whee提供了很多种不同的视频风格，如鎏金珠宝、3D卡通、外景商拍、特效人像、自然纪录片等。在国内，能针对性提供不同的AI视频风格的，Whee可能还是头一个。像鎏金珠宝、外景商拍、特效人像这些风格，都可以直接商用，我们当然要测试一下。

让我们试试“鎏金珠宝”风格：

prompt：人像摄影、1女子、手上的紫色戒指、纯色背景、4K分辨率、时尚风格、简洁大气、柔和自然光、光滑亮丽

得夸一下美图秀秀的文义理解能力，”女子、紫色戒指、纯色背景“都能准确生成，但对于最大的生成难题——手，美图也没能解决，认真看会发现只有四根手指。而且视频的生成时间很短，只有1s，近似于一张图片。

另外还得夸一下Whee在文生视频时的“智能联想”功能，只需要输入几个关键词，就可以自动帮你补全prompt，上面的prompt就是由智能联想而成。

再试试“外景商拍”风格：

prompt：高级广告、香水喷洒、至尊香水瓶、华丽宴会、4K超清、奢华风格、金碧辉煌、聚光灯照射、玻璃光滑

“外景商拍”风格做的很好，看起来跟广告没有区别了，还能做到视角的旋转，难度不小。估计以后这种商业性质的AI视频生成产品会越来越多，因为需求大，难度较生成电影级别的镜头也低很多。

最近很火的AI视频动漫化，美图秀秀也没有错过。鲸哥之前做过一次Goenhance的测评，这次加上美图wink和国产新锐啵啵动漫，一起做个横评。

啵啵动漫整体还原度、手势表情各方面都表现不错，美图这个付费版生成的效果有些惊喜，就是转动漫的人像比本人还美，不得不说美图在人像方面的实力。但细节确实有问题，比如这个视频经典的比方框手势显示不出来，以及视频中偶尔一只胳膊没了。

目前看，Goenchace能提供多种多种动漫风格，而美图秀秀能提供多种“变身”效果：

上面使用的是变身效果”烟花“，可以看到视频主体一开始为真人霉霉，摘墨镜的瞬间释放烟花，随后视频就动漫化了，赏心悦目。

AI数字人：仍待进步

目前，AI公司都困于盈利，顶尖的paper发了一堆，商业化却都做的不好。就算是ChatGPT，目前也没摸索到好的商业化方式，只能通过增值服务和API接口的方式赚钱。

在那么多的AI商业化尝试中，数字人直播带货被证明是最赚钱的。所以在这一块，美图也没闲着，推出了其AI口播视频工具“开拍”。据悉，”开拍“月活跃用户数已突破35万。

地址：https://www.kaipai.com/home

操作上，只需输入人像照片和口播内容，就能让人像开口说话。鲸哥将咱们公众号“鲸选pro“的文章《阿里为什么投了那么多大模型？》中的片段输入进去，看看效果如何：

视频中的口播内容如下，感兴趣的朋友可以点击原文章链接阅读：

大模型公司虽然都是独角兽级别（10亿美元估值）。看起来很贵，但对于阿里来说，依然很便宜，尤其在当下阿里PE仅有15，市值被严重低估之际。这也许是更懂财务的阿里董事长蔡崇信的安排。我们从上图中两条折线的差值，看到代表资本性支出规模这一数值的变化，阿里是想继2017年后再度开启投资盛事世，当时投资新零售等，现在投资大模型，为集团投出来一个未来。就像雅虎投资阿里巴巴，最后阿里巴巴的股权价值已经超过了没落的雅虎本身。所以，阿里会成为下一个万亿市值的微软，还是投资火主业虚弱的雅虎？