2023-02-03 14:09

ChatGPT与五巨头:AI新纪元谁最有优势?

AI之势 发布在 AIGC
9.3万

编者按:2022 年,由于 DALL-E、MidJourney 等文本生成图像模型以及文本生成模型 ChatGPT 在消费者当中出现现象级流行,很多人都开始预测 2023 将是 AI 之年,也许我们将真正进入 AI 的新纪元。但是谁最有可能在这个新纪元执牛角呢?从五大巨头分析开始也许是个很好的起点。文章来自编译。

图片来源:由无界版图AI工具生成

2022 年的故事是人工智能的涌现,首先是图像生成模型,包括 DALL-E、 MidJourney 以及开源的 Stable Diffusion,然后是 ChatGPT ,第一个取得重大突破的文本生成模型。在我看来,这是技术进入了新纪元。

不过,要确定那个新纪元可能会如何演进,做一件事情会很有用,那就是回顾一下 26 年前有史以来最著名的战略书籍之一:克莱顿·克里斯滕森(Clayton Christensen)的《创新者的困境》(The Innovator's Dilemma),尤其是关于不同类型创新的这段话:

大多数新技术都会推动产品性能的改善,我将这些技术称为“延续性技术”。一些延续性技术可能不具有连续性,或者在本质上具有突破性,而其他一些则在本质上属于渐进性技术。所有的延续性技术所具有的共同点就是,它们都是根据主要市场的主流消费者一直以来所看重的性能层面来提高成熟产品的性能。特定行业的大多数技术进步从本质上说都具有延续性……
颠覆性技术给市场带来了与以往截然不同的价值主张。一般来说,颠覆性技术产品的性能要低于主流市场的成熟产品,但它们拥有一些边缘消费者(通常也是新消费者)所看重的其他特性。基于颠覆性技术的产品通常价格更低、性能更简单、体积更小,而且通常更方便消费者使用。

回过头看,通过观察既有公司在创新进入市场后的表现,似乎很容易就能确定创新是属于延续性的还是颠覆性的:如果创新是延续性的的话,那么既有公司会变得更强大;如果属于颠覆性,那大概是初创公司收割掉大部分价值。

不妨思考一下之前的技术纪元:

  • PC 对几乎所有的既有者都具有颠覆性;这些相对便宜和低功耗的设备在能力或利润几乎没法跟小型机相比,跟大型机比就更不用说了。这就是为什么 IBM 乐于把自己的 PC 分别外包给英特尔(芯片)和微软(操作系统),这样他们就可以推出产品并满足他们的企业客户;PC 变得更快了,不过,统治市场的变成了英特尔和微软,因为这个市场令之前的一切都相形见绌。
  • 互联网几乎是全新的市场创新,也因此是由全新的公司定义的,以至于这些公司连既有企业都颠覆了,连跟技术关系不大的行业也受牵连,尤其是那些与信息相关的行业(也就是媒体)。这是谷歌、Facebook、在线交易市场与电子商务等的时代。所有这些应用都跑在由 Windows 和英特尔驱动的 PC 上。
  • 云计算可以说是互联网的一部分,但我认为它应该自成一派。它也极具颠覆性:商品化的 x86 架构淘汰了专用的服务器硬件,大量 SaaS 初创企业开始剥离既有企业的功能,把它做成了企业。值得注意的是,云计算的核心基础设施主要还是由前几个时代的赢家建造的:其中包括亚马逊、微软以及谷歌。微软尤其引人注目,因为该公司还把自身传统的软件业务变成了 SaaS 服务,部分是因为这家公司已经将上述软件业务变成了订阅模式。
  • 移动最终被两家老牌公司把持了:也就是苹果和谷歌。不过,这并不意味着它没有颠覆性:苹果的新 UI 范式要求不要把手机看作是小型 PC(微软的看法);谷歌新的商业模式要求不要将手机看作是卖操作系统的直接利润中心,而是把它看作是自身广告业务的护城河。

关于这段历史,值得注意的是,我上面所说的假设并不完全正确;颠覆性创新确实一直都出自市场的新进入者,但这些新进入者未必就是初创公司:在以前的技术纪元,某些最大的赢家是利用现有业务进入新领域的现有公司。与此同时,克里斯滕森理论的其他原则也成立:微软之所以在移动领域陷入困境,是因为移动具有颠覆性,但 SaaS 最终是延续性的,因为它的商业模式已经与之一致。

鉴于现有公司在新纪元取得的成功,在思考人工智能的影响时,最明显的一个起点就是这五巨头:苹果、亚马逊、Facebook、谷歌和微软。


苹果


关于技术战略,我已经引用过最著名的一本书;而这方面最著名的文章之一是 Joel Spolsky 的《Strategy Letter V》,里面的这句话更是鼎鼎大名:

聪明的公司会设法将其产品的互补品商品化。

这句话的上下文是 Spolsky 在解释为什么大公司会投资开源软件:

调试好的代码不是免费的,不管它是专有的还是开源的都一样。 即便你不为它付钱,它也有机会成本,而且还有时间成本。 开源有数量有限的志愿编程人才帮干活,而每个开源项目都要跟其他开源项目竞争同样一批有限的编程资源,只有最性感的项目才真正拥有比自己所需更多的志愿开发人员。 总而言之,我对那些试图证明免费软件的经济性的人印象不深,因为在我看来,他们犯了零除错误。
开源也逃不脱经济的引力法则。 我们从 Eazel、ArsDigita,以及之前被称为 VA Linux 等许多其他尝试身上就能看出这一点。 但还有些事情是开源界很少有人能真正理解的:许多非常大的上市公司,尽管其责任是股东价值最大化,但仍然投入大量资金来支持开源软件,通常的形式是给大型程序员团队付费让后者做开源软件。而互补品原则可以解释这一现象。
再次地:当某产品的互补品价格下降时,对该产品的需求就会增加。一般而言,公司的战略利益是让自己的互补品价格尽可能的低。而理论上可维系下去的最低价格顶多是“商品化价格”——也就是当你有一堆的竞争对手可提供无明显区别的商品时出现的价格。 所以:聪明的公司会设法将其产品的互补品商品化。如果你能做到这一点,对你的产品的需求就会增加,然后你可以多收钱多挣钱。

苹果投资开源技术,最著名的是用于苹果操作系统的 Darwin 内核以及 WebKit 浏览器引擎;后者符合 Spolsky 的处方,因为要确保 web 与苹果的设备配合良好,这样就能让苹果的设备更有价值。

与此同时,苹果在 AI 方面的努力基本上都是做专有:传统的机器学习模型用于推荐、照片识别和语音识别等方面,但这些对苹果的业务并未产生重大影响。不过,苹果确实从开源世界收到了一份不可思议的礼物:Stable Diffusion。

Stable Diffusion 之所以引人注目,不仅因为它是开源的,还因为它的模型出奇的小:发布的时候,它已经可以在一些消费级的显卡上运行;几周之内,它就已优化到可以在 iPhone 上运行的程度。

值得称赞的是,苹果抓住了这个机会,其机器学习团队上个月发布了以下这则公告:

今天,我们很高兴在 macOS 13.1 和 iOS 16.2 发布针对 Stable Diffusion 的 Core ML 优化,我们还提供了部署到带苹果芯片设备的示例代码……
不管是什么 app,其中一个关键问题是 Stable Diffusion 模型在什么地方跑。有很多原因可以解释为什么在设备侧部署 Stable Diffusion 比部署到服务器的做法更可取。首先,终端用户的隐私可以受到保护,因为用户作为模型输入提供的任何数据都保留在用户自己的设备上。其次,在第一次下载之后,用户不需要连接互联网就可以使用这个模型。最后,在本地部署模型能让开发人员减少或消除服务器方面的成本。
针对 Stable Diffusion 优化 Core ML ,简化模型的转换,可以让开发者更容易以保护隐私和经济可行的方式,在自己的 app 整合这项技术,并使其在苹果的芯片上获得最佳性能。此次发布的版本包含了一个 Python 包,使用 diffusers 和 coremltools ,可将 Stable Diffusion 模型从 PyTorch 转换到 Core ML,我们还提供了一个 Swift 包来部署该模型。

值得注意的是,这个公告有两部分:首先,苹果优化了 Stable Diffusion 模型本身(这是可以的,因为它是开源的);其次,苹果更新了自己的操作系统,这主要得益于苹果的一体化模式,所以可以针对苹果自己的芯片做出调整。

此外,可以肯定的是,这只是一个开始:尽管苹果多年来一直在自己的芯片上推出所谓的“Neural Engine”,但那种人工智能专用硬件是根据苹果自身的需求做出优化的;看来将来苹果的芯片也会针对 Stable Diffusion 做出调整,这个时间即便不是今年也可能是明年。与此同时,Stable Diffusion 本身可以内置到苹果的操作系统之中,并为任何 app 开发者提供易于访问的 API。

所以苹果将来有可能将“足够好”的图像生成功能内置到苹果的设备里面,使得任何开发者都可以使用上,避免了现在大火的 Lensa 所需的那种后端基础设施。而且,推而广之的话,这个世界的赢家最终看起来会很像应用商店时代的赢家:苹果获胜是因为它具备集成和芯片优势,拥有可以用来提供差异化的 app,而小型独立 app 开发商则可拥有 API ,以及建立新业务的分销渠道。

另一方面,输家将是那些集中式的图像生成服务,如 Dall -E 或 MidJourney,以及提供支撑的云提供商(还有迄今为止强化上述 Stable Diffusion 的 app,如 Lensa )。 苹果设备上的 Stable Diffusion 不会占领整个市场,这是肯定的——Dall-E 与 MidJourney 都要“好”于 Stable Diffusion,至少在我看来是这样的,而且除苹果设备以外的世界当然还非常广阔,但内置的本地化功能会影响到集中式服务与集中式计算最终的可达市场。


亚马逊


亚马逊跟苹果一样,也在自己的各种应用里用上了机器学习;不过,图像和文本生成在直接面向消费者的用例似乎不太明显。重要性业已凸显的是 AWS,这个云服务已经在售卖对云端 GPU 的访问权。

其中部分是用于模型的训练,Stability AI的创始人兼首席执行官 Emad Mostaque 表示,Stable Diffusion 的训练用了 256 块 Nvidia A100 ,一共跑了 150000 小时,市场价格是 600000 美元(低得惊人!)。不过,更大的用例是推理,即模型生成图像(或文本,在 ChatGPT 的情况下)的实际应用。但凡用户用 MidJourney 生成图像或用 Lensa 生成头像,推理都是在云端的 GPU 上运行的。

亚马逊在这一领域的前景如何?要取决于多种因素。首先,也是最明显的一点是,到头来这些产品在现实世界的用处有多大。不过,除此之外,苹果在开发本地生成技术方面取得的进展也可能会产生重大影响。但是,亚马逊本身就是一家芯片制造商:虽然迄今为止它的大部分努力都集中在自家的 Graviton CPU 上,但这家公司也可以为 Stable Diffusion 等模型开发自己的专用硬件,并在价格上展开竞争。尽管如此,AWS 还是在两面下注:对于 Nvidia 的产品来说,亚马逊的云服务也是主要合作伙伴之一。

短期内亚马逊的大问题在于衡量需求:没有足够的 GPU 就是浪费赚钱机会;但是,买太多闲置不用,对于试图限制成本的公司来说将是一项重大成本。与此同时,这还不是最糟糕的错误:AI 面临的挑战之一是推理需要花钱;换句话说,用 AI 做东西是有边际成本的。

我怀疑,就开发吸引人的人工智能产品而言,边际成本这个问题的挑战尚未被充分认识。虽然云服务总是会有成本的,但人工智能生成的离散性需要不断迭代才能实现产品市场匹配,而这会给资金支持带来挑战性;ChatGPT 之所以成为迄今为止最成功的突破性产品并非偶然,一方面它对最终用户是免费的,同时 OpenAI 既开发了自己的模型,又与微软就计算能力达成了一项甜心协议。如果 AWS 必须靠低价出售 GPU 的话,从长远来看有可能会刺激更多的使用。

值得注意的是,这些成本应该会随着时间的推移而下降:虽然芯片本身也会变得更快、更高效,但模型也会变得更高效,一旦市场上有足够的产品可以最大限度地利用云服务,云服务的投资就应该能收到规模回报。尽管如此,除了上述在本地运行推理的可能性以外,全栈集成会产生多大影响仍然是一个悬而未决的问题。


Meta


我已经在 《Meta Myths》一文中详细说明了为什么我觉得 AI 对 Meta 来说是一个巨大机会,值得这家公司投入巨额资本支出:

Meta 本身拥有庞大的数据中心,但这些数据中心主要用于 CPU 计算,这是 Meta 的服务所需要的。CPU 计算也是驱动 Meta 的确定性广告模式以及它用于推荐网络内容的算法所必需的。
不过,破解 ATT 的长期解决方案是建立起概率模型,这种模型不仅能确定谁应该成为目标(说句公道话,其实 Meta 已经在使用机器学习了),而且还可以了解哪些广告成功转化了,哪些广告没有获得转化。这些概率模型得用大量的 GPU 搭建,如果是用 Nvidia 的 A100 卡的话,这些 GPU 的成本将达五位数;在确定性广告效果更好的世界里,这样的成本也许太过昂贵,但 Meta 已经不在那个世界里了,不投资于更好的定向广告和衡量手段是很愚蠢的。
此外,同样的做法对 Reels 的持续增长至关重要:推荐来自整个网络的内容比仅推荐家人朋友的内容要困难得多,尤其是因为 Meta 的打算是不仅要推荐视频,还要推荐所有类型的媒体,然后穿插一些你关心的内容。人工智能模型在其中也会发挥关键作用,而开发这些模型的设备需要花费很多钱。
不过,从长远来看,这项投资应该会收到回报。首先,这对于我刚才讲的更好的定向广告以及更好的推荐是有好处的,这应该会让收入增长重启。其次,一旦这些人工智能数据中心建成,其维护和升级成本应该会大大低于原先建设时候的初始成本。第三,除了谷歌之外,其他公司都没法进行如此大规模的投资(而且,谷歌的资本支出也要增加,这一点并非巧合)。
最后一点也许是最重要的:ATT 给 Meta 造成的伤害比任何其他公司都要大,因为它本来拥有迄今为止规模最大、最精细的广告业务,但从长远来看,这应该会加固 Meta 的护城河。这种水平的投资对于像 Snap 或 Twitter 或任何其他在数字广告领域处于劣势的公司来说根本是做不来的(就算 Snap 依赖的是云提供商而不是自己的数据中心也不行);再加上 Meta 的定向广告可能开始远离该领域(谷歌之外),而当 Reels (降低价格)的广告位将大量增加时,那些广告商为什么还要跑到别的地方去呢?

Meta 在 AI 方面发力要想收到效果,不仅仅要开发出基础模型,还有一个重要因素是要持续地针对个人用户对模型做出调整;这会对容量提出很高的要求,Meta 必须弄清楚如何经济高效地实现定制化。不过,由于 Meta 产品的集成度越来越高,这会起到一些帮助作用:虽说该公司也许已让高通为自己的 VR 头显提供芯片,但 Meta 仍在继续开发自己的服务器芯片;该公司还发布了针对自身工作负载将 Nvidia 和 AMD 芯片抽象出来的工具,但 Meta 似乎同时也在开发自己的 AI 芯片。

观察一下图像和文本生成等事物会对 Meta 产生什么样的长期影响会很有趣:Sam Lessin 提出了一个个假设,他认为算法性时间线的终极游戏是 AI 内容;在谈到元宇宙时,我也提出了一样的看法。换句话说,虽然 Meta 现在投资 AI 是为了提供个性化推荐,但这个想法与 2022 年的突破相结合,则是通过 Meta 渠道提供的个性化内容。

目前而言,观察一下 Meta 的广告工具的演变会很有趣:生成文案与图像并进行 A/B 测试这整个过程都可以用 AI 来完成,在大规模提供这些能力方面,没有公司做得比 Meta 更好。请记住,Meta 的广告主要是针对漏斗的顶部:目标是吸引消费者,让他们注意到以前不知道的产品或服务或 app;这意味着会有很多未命中的情况——绝大多数的广告都不能实现转化——但这也意味着有很大的实验和迭代空间。这似乎非常适合人工智能:是的,生成也许有边际成本,但这些边际成本远低于人类来做的成本。


谷歌


《创新者的窘境》的出版时间是 1997 年;那一年,伊士曼柯达的股票达到了 94.25 美元的最高价,而且理由似乎很充分:就技术而言,柯达处在完美位置。该公司不仅主导了当时的胶片技术,还发明出下一波的浪潮:数码相机。

问题可归结为商业模式:柯达通过提供卤化银胶片赚了很多钱,利润率很高;另一方面,数码相机是数字化的,这意味着这种相机根本不需要胶卷。因此,柯达的管理层在说服自己方面非常有动力:数码相机只会是给业余爱好者用的,而且只有当价格变得非常便宜时他们才会用,这肯定要花很长的时间。

事实上,柯达的管理层是对的:从数码相机发明到数码相机销量超过胶片相机的销量,一共用了 25 年多的时间;数码相机用于专业应用还需要更长的时间。柯达在此期间赚了很多钱,并派发了数十亿美元的股息。而且,虽然该公司在 2012 年破产,但那是因为消费者已经可以拿到更好的产品:先是数码相机,最终是内置摄像头的手机。

可以肯定的是,认为这是一个圆满结局的想法属于理想思维:大多数人都觉得柯达是失败的,因为我们希望企业可以基业长青。从这个角度来看,柯达是一个警示故事,说明了一家创新公司是如何放任自己的商业模式将自己引向最终厄运的,即便它的厄运换来的是消费者得到了更好的东西的结果。

前面说的这些都是引子,我们接下来就来谈谈谷歌和人工智能。谷歌发明了 transformer,这是最新人工智能模型关键的技术支柱。据传谷歌本身就有一款远优于 ChatGPT 的对话式聊天产品。谷歌声称其图像生成能力优于 Dall-E 或市面上任何一家公司。不过,谷歌也只是说说而已,因为它没有推出任何实际产品到市场上。

这并不奇怪:长期以来,在用机器学习来改进搜索和其他面向消费者的产品(并通过 Google Cloud 以服务形式提供该技术)方面,谷歌一直是领导者。可是,搜索一直依赖人类作为最终的仲裁者:谷歌会提供链接,但用户通过点击来决定哪个链接是正确的。这一点也延伸到广告领域:谷歌的产品是革命性的,因为它不是按展示次数(价值很难确定,尤其是在 20 年前)向广告商收费,而是按点击次数收费;广告商试图接触的人将决定他们的广告是否足够好。

七年前,在《谷歌与战略的局限性》一文中,我谈到了在人工智能的世界里谷歌的业务所面临的难题:

在昨天的主旨演讲中,在重述了我在 2014 年底所描述的 PC-Web-Mobile 时代技术史后,谷歌 CEO Sundar Pichai 宣布,我们正在从移动优先的世界转向人工智能优先的世界;这就是他们引入 Google Assistant 的背景。
那是在 iOS 6 推出的前一年,在那一版的 iOS上,苹果首次以 Siri 的名义引入了 AI 助手的想法;用户第一次(理论上)可以通过语音来进行计算。一开始它的效果不是很好(可以说现在也还不怎样),但是它对一般而言的计算以及确切而言的谷歌的影响都很深远:从你可以专门腾出眼睛和手到设备上的情况,到几乎所有地方,只要可以计算就可以用语音交互,即便这种交互形式限制了你可以做的事情。助手的主动性必须比搜索结果页面强很多;光是提供可能的答案是不够的:相反,助手需要给出正确的答案。
这对谷歌技术来说是一个可喜的转变;从一开始,谷歌的搜索引擎就包含了一个“手气不错”(I’m Feeling Lucky)的按钮,谷歌创始人拉里·佩奇非常有信心他们的搜索引擎可以提供你想要的准确结果,虽然昨天的 Google Assistant 的演示是录制的,但它的结果,尤其是在上下文感知方面,要比市场上的其他助手令人印象深刻得多。更广泛而言,在作为谷歌助手技术基础的人工智能和机器学习方面,很少有人质疑谷歌是明显的领导者。
不过,一项业务关系到的不仅仅是技术,谷歌在助手方面尤其存在着两个重大缺陷。首先,正如我在 2022 年的 Google I/O 之后所解释的那样,该公司在进入市场方面存在差距:助手只有在可用时才有用,对于数亿 iOS 用户而言,这意味着需要下载和使用独立的 app(或开发用户愿意投入大量时间的体验,比如 Facebook 这种)。
其次,谷歌还存在一个商业模式问题:“手气不错”按钮导致相关搜索没法让谷歌赚到钱。毕竟,如果用户不必从搜索结果里面去选择的话,用户就没有机会去点击广告,从而也没机会去选择(谷歌为了吸引用户注意力而在广告商之间制造的)竞争的赢家。Google Assistant 也有同样的问题:广告往哪里放?

那篇文章假设 Google Assistant 会作为独家提供产品,用来给谷歌手机提供差异化优势;结果表明这个假设是错误的,但分析的基础仍然有效。在过去七年的时间里,谷歌的主要商业模式创新一直是将更多的广告塞到搜索里,这种策略在移动设备上特别有效。而且,说句公道话,谷歌最赚钱的搜索类型,比如旅游、保险等,无论如何也许都不太适合聊天界面。

不过,这只会让谷歌管理层更加担心,即在特定的搜索环境下,生成式人工智能可能代表一种颠覆性创新,而不是延续性创新。颠覆性创新比不上现有的,至少在开始时是这样的;这就是为什么它很容易被管理者忽视的原因,只要告诉自己,他们当前的产品更好(这个倒没错),就可以避免思考商业模式的挑战。当然,问题是颠覆性产品会变得更好,而另一边现有产品却变得越来越臃肿,越来越难用——这听起来很像谷歌搜索当前的发展轨迹。

我不是说谷歌巅峰已过。我之前曾经下过这样的结论,但错得离谱。不过,犯错的往往是时间问题:是,谷歌是拥有自己的云服务,而 YouTube(谷歌旗下的) 的主导地位似乎有增无减,但即便多年来搜索一直在制造现金和利润,它的巅峰轨迹似乎已经很清晰了。


微软


与此同时,微软似乎处在最佳位置。像 AWS 一样,它也有一个卖 GPU 的云服务;它还是 OpenAI 的独家云提供商。是的,提供云服务支持是非常昂贵,但考虑到 OpenAI 似乎具备进入这个被顶级科技巨头占据的榜单的内道优势,这也意味着微软正在投资那个新时代的基础设施。

与此同时,Bing 就像 iPhone 发布前夕的 Mac:是,它是贡献了相当多的收入,但与占统治地位的玩家相比,Bing 只有它的零头,而且放在微软的整体背景下也相对微不足道。如果把类似于 ChatGPT 的结果整合到 Bing 里面,Bing 原有商业模式可能就会冒风险,但同时也可以给 Bing 争取到巨大市场份额的机会,这么看的话,赌一下还是非常值得的。

与此同时,The Information 的最新报道称,GPT 最终会出现在微软的生产力应用里面。AI 编码工具 GitHub Copilot(也是基于 GPT 的)想出了如何让自己成为帮手而不制造麻烦(也就是不要成为大眼夹!)的方法,从而取得了成功。微软打算要将此复制到自己的其他工具上。

重要的是添加新功能(也许要收费)与微软的订阅商业模式完美契合。值得注意的是,该公司曾经被认为是颠覆受害者的典型代表,但从全面的角度来看,微软不仅诞生于颠覆,而且还处在有利位置,有可能达到新的高度。

关于 AI 的潜在影响还有很多可以讲的,但这篇文章已经很长了。从新公司的角度来看,OpenAI 显然是最有趣的:OpenAI 有可能成为所有其他 AI 公司的基础平台,这最终意味着除了 OpenAI 以外,AI 的经济价值可能会相当低;这也是可以看好谷歌的理由,因为就 OpenAI 的“AWS”来说,他们最有可能成为“微软”。

除了图像生成之外,还有另一种可能性,那就是文本生成领域会冒出大量开源模型。在这个世界里,人工智能已经变成了一种商品:这可能是对世界影响最大的结果,但矛盾的是,就对个体公司的经济影响而言,这是最微弱的影响(我怀疑最大的机会会出现在准确性至关重要的行业:既有者将因此对人工智能的投入程度不够,就像柯达对数字相机的投资不足、忘记了这门技术会变得越来越好一样)。

确实,最大的赢家有可能是英伟达和台积电。Nvidia 对 CUDA 生态体系的投资意味着该公司不仅拥有最好的 AI 芯片,还拥有最好的 AI 生态体系,并且该公司正在对扩大该生态体系进行投资。不过,这已经并将继续刺激竞争,尤其是像谷歌的 TPU 等内部芯片的竞争;不过,至少在可预见的未来,每个人都要找台积电生产芯片。

然而,最大的影响可能完全不在我们的视野范围之内。之前 Nat Friedman 在访谈中告诉我 Riffusion 的事情。这个东西利用了 Stable Diffusion ,可以通过可视化的声波图将文本生成音乐,这让我想知道当图像真正变成商品时还有哪些其他可能。现在文本是通用界面,因为自文字发明以来,文本一直是信息传递的基础;可是,人类是视觉动物,人工智能在图像创建和解释方面的可用性,可能会以我们无法预测的方式从根本上改变传达信息意味着什么。

目前,我们的预测必须要施加更多的时间限制,要适度一点。这可能是人工智能时代的开始,但哪怕是在科技领域,新时代也需要十年或更长时间才能改变周围的一切。

译者:boxi。

本文链接:https://www.8btc.com/article/6801700
转载请注明文章出处

评论
登录 账号发表你的看法,还没有账号?立即免费 注册
下载
分享
收藏
阅读
评论
点赞
上一篇
下一篇