文章来源：树龙谈

作者：贺树龙

图片来源：由无界AI生成

2021年下半年，英诺天使基金合伙人王晟开始认真研究大模型，想找一个大模型项目投点钱。

当时美国硅谷出现了一批大模型相关的项目，发展很迅猛。比如年初成立的Jasper，在市场上非常火爆，它只需一个简单提示，就能生成各种风格的营销文案，当年就赚了3000万美元。而Jasper的底层系统，来自于OpenAI在一年前推出的大语言模型GPT-3。

王晟留意到了GPT-3，觉得这个方向或许隐藏着大机会。虽然当时生成式AI的质量还不太理想，但他觉得对于投资而言，或许到了一个合适的时点。

但当时国内做大模型的创业团队不多。2021年底，英诺天使基金在清华大学设立了一个奖学金项目，支持计算机系的学生做研究，2017级博士岂凡超申请了这个项目。王晟意外发现，岂凡超正在做的大模型项目，正好就是他想投的方向。
2022年4月，临近毕业，岂凡超对王晟透露了想创业的想法，王晟果断决定投资，深言科技成立了。

天使轮之后，岂凡超开始为下一轮融资做准备，三个月内谈了四五十家VC，没有一家愿意投资。“大家都看不懂，不知道什么是大模型。”王晟对我回忆。

9月下旬的一个周五，王晟拉着岂凡超跟红杉资本的一个合伙人吃了顿饭，三天后就收到了详谈的邀约，岂凡超聊完拿到了红杉的TS（投资意向）。

英诺天使基金合伙人王晟

行业看起来一切如常，但一些嗅觉敏锐的投资人，已经提前感受到了大模型行业即将到来的波涛汹涌。

2个月后的11月底，OpenAI正式推出ChatGPT，因为效果惊艳，整个科技圈大为震撼。一时间，AI大模型爆火，科技公司纷纷跟进，整个投资圈一蜂窝冲上去看大模型项目。深言科技在随后又拿到了腾讯、好未来、春华资本、三七互娱等机构的投资。

2023年的“百模大战”中，VC对着十来家大模型公司猛投，项目估值一时被拉到很高，很多投资机构陷入迷茫。按照王晟的话说，“大家第一看不懂，第二不敢投，第三投不到。对于绝大多数早期投资机构而言，已经没法玩了。”

英诺天使基金通过提前布局，拿到了这波大模型竞赛的船票。此外，英诺天使基金还投资了一些做基础设施和应用的项目。王晟告诉我，投资一年多时间，深言科技的估值涨了十几倍。

如今，大模型热潮还在继续。前不久，我跟王晟进行了一次深聊，他对我讲了投资大模型的历程、经验和感受，也分享了他对大模型创业投资的一些观察和见解。以下是正文：

01、大模型估值有泡沫，比的是“市梦率”

问：英诺什么时候将AIGC确定为一个重要的投资方向？

王晟：我们其实投AI不算晚，之前就在AI赛道花了很多时间。国内第一波AI浪潮差不多从2013年开始，诞生了AI四小龙（商汤、旷视、依图、云从），我们从2016年开始投资，投中了文远知行、智行者、中科原动力等项目，后来投了一些图像视频类的AI公司，再就是这一波大模型。

问：大模型项目估值很高，动辄几十亿人民币，这是不是对关注早期投资的基金不太友好？

王晟：早期基金就得投的早。2022年11月底OpenAI推出ChatGPT之后，很多VC才去学习，提升认知，开始找项目。实际上你今天看到的项目，绝大多数都是在那之后出现的，而我们在那之前就开始布局了。

问：在ChatGPT出现之后，还有哪些项目是适合早期投资的?

王晟：几乎没有。

问：为什么？

王晟：我觉得市场跟大家看到的情况不一样。2023年整个AI投资是两端收敛，资金端20多家VC投资很活跃，资产端就几十个项目融了很多钱，两边都没有泛化，这个市场还不够繁荣。

中基协统计全市场VC有1.2万家，实际出手的可能连200家都不到，活跃的也就20来家，剩下的都是在看热闹，跟着摇旗呐喊。因为大家第一看不懂，第二不敢投，第三投不到。一堆创业者各种鼓吹项目多厉害，其实根本没人投。

问：为什么会呈现两端收敛的格局？

王晟：创新有周期，当多个方面的基础科学研究达到一个阈值，就会出现天才企业家把科研成果转化成技术创新，带动一个新的技术范式。

一个新的技术范式出现之后，首先要做infra（基础设施），就像建一个商场，先得通水通电有电梯，但做infra不会泛化，因为需要大笔投资，能玩得起的玩家不多。如果infra本身还不完善，去做应用毫无意义，会被基础设施的升级碾压掉。

另外，今天能做的所有创新都是受限的，涌现出优秀的创业者和产品经理还需要时间。2007年iPhone出现，移动互联网浪潮开启，但很多重要的应用隔了好几年才出现，拼多多是2015年，抖音是2016年，而ChatGPT从推出到现在也就一年时间，没人知道它的能力边界在哪里。

问：所以要在恰当的时间段内做恰当的事。

王晟：是的。过去两年行业在大力构建infra，还没到大量做创新项目的时间点，今年会有一些能够迅速提升生产力的应用涌现出来，目前一个共识是，2023年是大模型元年，2024年是Agent元年，但还不是AI应用的元年。所有投资人都是在这种规律周期里做符合周期的事情。

问：你说的拿到投资的几十家创业公司，是以大模型为主吗?

王晟：大模型可能不到十个，其实大部分是infra，比如芯片算力、无损网络、光模块。我们也投了端侧的算力芯片，但我们不太相信在数据中心这种通用的GPU上，能跑出来一个初创公司，因为硬件特别不适合VC投很多钱。

问：所以投大模型的主要还是资金实力雄厚的大机构和巨头公司？

王晟：目前看来是这样，除非你投的早，因为对天使投资来讲投的早很重要。

问：现在市场上号称有200多个大模型，你认为有水分吗？

王晟：我认为能属于头部的也就十几家。

问：头部的几个项目估值飞涨，有的高达百亿人民币，你觉得是否存在高估？

王晟：肯定是高估了。商汤现在是300多亿港币，而曾经有3000亿。现在大模型的估值拉到这么高，都是市梦率，可能未来会拉到更高，但最终还是要看如何落地，能不能避免上一波AI在落地上无法找到特别有效的商业场景的情况。

问：现在行业里怎么估值？

王晟：大家会基于未来的收入，给十几倍二十倍的PS（市销率），现在实际给到的都是大几十倍甚至上百倍的PS。没收入的就拍脑袋给个数。

问：作为早期投资人，面对这种局面会不会焦虑？

王晟：没什么可焦虑的，因为我们投了深言科技。这是目前为止，所有大模型项目中收益率最高的投资。这些大模型公司我们想投都能投的进去，只不过有些我们选择没出手。

问：为什么不出手？

王晟：我们的单笔投资跟项目的估值匹配度不好，这不是说我们投不进去。其实对于绝大多数早期投资机构而言，已经没法玩了，大量的VC首先不知道该往哪个方向投，其次大家一窝蜂都上的时候，他也不知道谁厉害，然后他也找不到这些人，即便找到了人家可能没兴趣让他投，他也投不进去。我们没有这些问题。

问：王小川的百川智能之前很火，你们有接触吗？

王晟：2022年4月初，我跟王小川一起吃过一顿饭，他欢迎我们投资，但确实太贵了。当时是亲友轮，估值5亿美金，英诺的典型投资一般是1000万人民币，这在5亿美金的盘子里确实不太匹配。

所以我觉得早期投资机构需要认知早，做判断早，不能在VC一哄而上的时候才反应过来，那就已经不是早期投资人能参与的了。在市场达成共识之前出手，价格就会可控，共识达成后价格会上涨很快。

02、投资大模型，最核心还是看人

问：你们怎么判断哪个项目能跑出来？

王晟：核心看团队做大模型的能力。中国跟美国有一个很大的差异，投资人往往会迫切要求项目落地到具体的应用场景，拿到订单获得收益，只讲商业模式是不被认可的，但另一方面中国的用户和企业都不愿意付费，很少能像OpenAI那样获得很高的年收入。但是投资人可以认可一个团队做好大模型的能力，我们相信大模型跟某些行业深度结合之后，可能会创造出巨大价值。

问：所以投资人看的不是现在的商业模式，而是一种能力和可能性。

王晟：对，你可以理解2022年投的大模型项目都没有商业模式，大家也说不清楚怎么赚钱。

问：哪些方面的能力对一个大模型团队至关重要？

王晟：最核心的还是人，所有公司都是如此。你有了最好的人才，就能够吸引投资，有钱了就能买算力，再去吸引更好的人才，飞轮就能滚动起来。

问：什么背景或者类型的人才是最被看好的？

王晟：我觉得这是动态的。一开始学术水平高的团队更有优势，大家比的是科研能力，LLaMA开源之后，大家对大模型的认知迅速被拉齐，这个时候拥有更强工程能力、融资能力的团队更容易赢。

问：中国创业者从LLaMA开源学到了什么？

王晟：如果自己从零到一练大模型，过去累积的经验、科研能力、方法是非常重要的，或许某些方面在技术上不难，但它是一个综合的、涉及到很多技巧和方法的事情，一旦有个点被卡住了，靠自己可能需要花一两年时间才能解决。Meta过去这些年积累的大模型技术，本来都是不传之秘，结果一开源，迅速把很多认知拉平了，这意味着很多坑不用再踩，那些在大厂做过巨大系统工程的人，优势就体现出来了。

问：接下来可能会怎么演变？

王晟：我认为LLaMA接下来应该也是开源的，可能是多模态，仍然保持很高的水准。当再过几年，开源大模型能力封顶的时候，更大的挑战就来自于做产品的能力。那时对一个团队最大的挑战不是科研，也不是工程，而是整个系统的运营能力，那可能就是王慧文的时代。

问：这么说的话，王慧文入场太早了？

王晟：我觉得王慧文有一点做错了，他角色错了。他下场的阶段是拼技术、科研、工程，他的优势在后期的市场和运营，未来对他更友好。

问：有些大模型企业是在开源模型上做创新，还有一些是套壳，你认为这两种有没有机会？

王晟：有这么三类企业：第一类是真正有能力做大模型的企业，第二类是基于开源大模型做微调、部署，第三类是调用外部大模型的API接口。后两种属于大模型应用公司，要特别专注于应用场景，侧重于发现需求，做好产品，因为它的价值在于把模型用好，把需求满足好，我觉得机会也不小。

Infra完善之后，就会出现很多应用。但受限于我们的想象力，这些应用都是基于过去的，现在用新技术来做迁移，把新的技术范式当成做创新转变的手段，所以几百个大模型，很多都是大公司甚至上市公司在做，他们实际上是试图用大模型赋能原有业务，优化业务链、工具链、工作流。

问：但有些公司似乎只吆喝不行动。

王晟：有些上市公司口号喊得响，可能是为了拉股价。实打实做大模型的企业，在二级市场很少。技术范式迁移的过程中，其实没有创业公司太多机会，因为大厂占据了场景、客户、数据，创业公司只能等创新，需要时间去涌现。

问：之前大家都说要做中国的OpenAI，你觉得现在有公司能配得上这个称号吗？

王晟：我觉得目前还没有。

问：差距有多大？

王晟：现在国内头部的大模型差不多都在GPT-3.5的水平，最顶尖的距离GPT-4和Gemini可能还有两年的差距。一方面在语言能力，另外在多模态方面差距挺远。差距能否缩小，就要看这一次大模型技术范式的天花板有多高，包括多模态能不能也变成生成式，我觉得未来会变成生成式多模态大语言模型。假如LLaMA不开源，我们今天的水平可能比现在还要差，会被国外的大模型公司大幅甩下。

问：现在很多大模型会说自己在某个指标上超越了GPT，在一些排行榜夺冠，这能代表模型的真实水平吗？

王晟：现在的榜单多而杂，基本原理是给AI出题，但我们发现有些榜单的题目和答案都是错的，所以打分越高，可能意味着模型能力越差。对于投资机构而言，刷榜的得分不重要，什么样的团队能做什么事，其实大家都知道，重点还是看人。

03、大厂做大模型没有优势，机会属于创新者

问：行业里一种观点，认为基础大模型交给大厂做就好了，没必要重复造轮子，你怎么看？

王晟：这是屁股决定脑袋。我认为大力度的颠覆式创新，应该由初创企业来做，而不是由某些业务上的垄断者来做，因为作为既得利益者，第一它做不好，第二不利于整个创新的生态。

问：表面看起来，大厂有很多优势。

王晟：我觉得没有什么优势。

问：他们会讲，有云计算、人才、资源。

王晟：熊彼特讲创新，其实不是颠覆式创新，而是创造性破坏。创新会对旧势力造成沉重打击，所有不创新的企业都会被破坏掉，而大厂就代表旧势力、旧的生产力、旧的范式，创新本身就是要颠覆他们的。大厂愿意做的都是当一个东西看起来成熟时，跳出来抢夺胜利果实。渐进式创新、无法形成特定壁垒的项目，很容易被大厂打击，爆发式创新、具有飞轮效应的项目，只要飞轮转动起来，大厂就很难将它干掉。