王小川还是不甘心

2024-02-19 16:16:10 来源：市界作者：

搜狗创始人王小川，携旧部在2023年高调“卷土重来”。

一年过后，背负着年底前“做出国内最好的大模型”的KPI，王小川交了一份初期答卷。

2024年春节期间，王小川发布了自己的龙年愿景，他表示：“与互联网时代的应用相比，大模型时代的应用将是一个新物种。以前我们更多的是造工具，但现在，我们造的新物种，更像一个人类的伙伴，人类对伙伴的要求，不会要求它像工具一样精确，更希望让它与人类合作。”

▲（王小川）

2024年1月29日，王小川创办的大模型公司百川智能，发布了超千亿参数的大语言模型Baichuan 3。百川方面强调，在多个权威通用能力评测中，Baichuan 3都展现了出色的能力，尤其在中文任务上更是超越了GPT-4。

百川智能也在一年之间估值就超10亿美元，成为国内估值增长最快的大模型创业之一。对王小川来说，当初因搜狗卖身腾讯，而没能做成的事终于在这里得到了延续。

王小川“不甘心”。正如他在创办百川智能时所说：“搜狗未尽的使命，在机器掌握了语言后终于可以实现了。”

01、完成“搜狗未竟的使命”

事情还得回到2023年4月，沉寂两年的王小川，在位于清华大学东门外十字路口的搜狐网络大厦，召开了一场媒体见面会，宣布与前搜狗COO茹立云联合成立大模型创业公司百川智能，并拿到了5000万美元的启动资金。

搜狐网络大厦曾是搜狗的大本营，王小川可谓“旧地重游”。当时，这里汇聚了AI创业的群星，美团联合创始人王慧文成立的大模型公司——光年之外，办公地点就选在这里；估值目前已超百亿元的智谱AI，也在楼里安营扎寨。巧合的是，这三家公司的管理者，都是师出清华的同门。

正当不少人以为王小川要就此上演“归来记”时，他却笑言“不跟他们在这里卷”，最终带队转战到了搜狐对面的大厦，双方一路之隔。

毕竟，王小川虽然起家于搜狐，但这里也留下了他的遗憾。现在，他要来完成自己的技术理想了。

在2023年ChatGPT刚刚变得火热时，王小川就按捺不住，激动地发了一条朋友圈：“OpenAI的胜利，是技术理想主义的胜利。”

互联网圈一直津津乐道的，是当年“天才少年”王小川在搜狐十几个月就干出了搜狗搜索，后来拿出了“浏览器+输入法+搜索”的“三级火箭”方法论，并在马云、马化腾、周鸿祎、张朝阳等大佬中游走，一番合纵连横，推动搜狗独立在纽交所上市的故事。

但实际上，王小川一直念兹在兹的是一个基于AI的技术梦。

在他看来，搜索引擎的意义重大。它是能够改变人们互动方式、进而改变互联网世界的力量。而人工智能和搜索，是天然联系在一起的，搜索引擎本身就能对海量的数据进行处理和匹配，这就是AI。

王小川是个执着的人。每次搜狗的发布会，他都在侃侃而谈技术。2016年他就说，搜索的未来是人工智能时代的明珠。那时有人问他搜狗为什么要转型做AI，他当时不好发作，但直到一年后他提起来，还愤愤不平地说，自己听完“一肚子火”。

2017年初，搜狗的问答机器人汪仔登上了《一站到底》的舞台。不过这些在综艺上的宣传噱头都是表象，搜狗真正要做的，是想将搜索升级到对话系统、问答系统和翻译系统。王小川相信，加大投入后，搜狗会推出颠覆性的产品。

2017年11月，搜狗登陆美股，上市当日市值突破50亿美元。王小川意气风发，他在内部信里说，接下来“唯一的悬念是搜狗能否在搜索领域实现颠覆，能否在人工智能领域引领重大的创新”。

但接下来的四年，搜狗并没能讲出一个激动人心的AI故事。归根结底，无论是搜索还是AI，都需要极大的投入，但当时的搜狗，“三级火箭”的流量红利已经吃得差不多了，从2018年之后公司营收增长开始放缓，增长率从2017年的38%下降至2019年的4%，在2020年营收更是首次出现同比下滑。

与此同时，门户网站的光辉时期已过，处于艰难求生境地的搜狐，自然也无法给予搜狗资金支持。

搜狐创始人张朝阳动起了卖掉搜狗的心思。2013年投资了搜狗的腾讯，也在2020年提出全资收购搜狗。思考了380多天后，王小川忍痛放手，在2021年10月15日宣布卸任搜狗CEO。

这对搜狗获取腾讯流量是件好事。但对于王小川当初的技术理想来说，却未尝不是一种失败。他离开搜狐，也拒绝加入腾讯，独归江湖。

转折点在2023年来临。王小川在媒体报道中表示，他在2023年1月用了ChatGPT之后，突然感觉到“变天了”。这种大语言模型能够用最自然的方法，根据提问作出回答，“不得了，通用人工智能时代已经到来了。”

当年的搜狗为了问答，也做了百亿参数模型，但即便使上了十八般武艺，也没能实现今天大模型的效果。一旦有了大模型的加持，在搜索增强方面，将大有所为。

王小川回忆，当时就有身边的朋友对他说，“你特别适合做大模型”。因为，这正好需要用到搜索、输入法等相关的AI能力。

这话对王小川来说，也不知是激励还是辛酸。王小川说，当时他回想了一下，自己过去干了20多年搜索，却从来没人和他说过：“小川，你适合做搜索。”

于是，王小川重出江湖，要实现他的AI“初心”，弥补搜狗的遗憾。

百川智能旗下，重新聚集的就是原来“搜狗系”人马。除了茹立云之外，前搜狗CMO洪涛、前搜狗搜索总经理陈炜鹏也已回归。当初在搜狗时，王小川和茹立云、洪涛、前搜狗CTO杨洪涛曾并称为“四大天王”，现在，其中的三位已经再度聚首。

截至去年10月，百川智能员工已超170人，公司技术联合创始人陈炜鹏曾表示，搜狗之前各个业务线最优秀的干将如今已基本集结完毕。王小川也说，搜狗老班底互相之间有信任，会更优先归队。

在大模型如何发挥价值上，王小川也再度强调了“搜索”，他提出“搜索增强”的解决方案。搜索增强可以将大模型的能力与搜索引擎相结合，给大模型“投喂”更精准、更深入的搜索结果，有助于减少错误答案，即所谓的“幻觉”现象。

“从国内来看，搜索增强是大模型走向实用的第一步，甚至是最关键的一步，没有搜索增强的大模型在企业里是没法落地的。”王小川在新年愿景里，也再次强调了这一点。

“我最动心的是，能和一群有理想的人，用极致的技术驱动创造出颠覆性的智能产品。”在百川智能成立时的公开信中，王小川如是写道。

02、创业急转弯

众所周知，王小川和百度董事长、CEO李彦宏一直“不来电”。创业之后，王小川再度调侃了李彦宏和百度的文心一言，随后百度回嘴说，“王小川脱离一线太久，确实跟我们不在一个宇宙，自然对国内人工智能技术的发展缺乏了解。”

这句话戳中了王小川的“痛点”。第二天凌晨他就发布一条微博怼了回去：“什么样的平行宇宙里，才能做到让一个脱离一线15年的人，去怼一个脱离一线1.5年的人。”一时间，空气里充满了火药味。

▲（2005年，推出搜狗搜索的王小川成为搜狐最年轻的副总裁）

但这确实也是很多人所关注的一点：毕竟，王小川已经离开科技行业一年多了，这段时间里，他做什么去了？

王小川其实一直在创业，只不过他的经历，在不少人眼里，和人工智能以及大模型，离得有点儿远。

在离开搜狗时，王小川说，之后将关注生命科学和医学，“为大众健康做贡献”。

彼时，医疗健康产业正站上风口。在2020年时，我国大健康产业规模已经突破10万亿元，根据“健康中国”战略，到2030年产业总规模将达到16万亿。然后，他在2021年出手投资了肠道医疗技术开发商“热心肠研究院”；以及专注于口腔人工智能医疗的公司DeepCare羽医甘蓝，该公司通过深度学习，推出了口腔影像AI分析系统。

从2021年到2022年，王小川连续注册了三家名字带“五季”的公司，包括北京五季科技有限公司、北京五季健康咨询有限公司和五季医学科技有限公司。后来有市场传闻称，当时王小川是准备做智能硬件，打造一款治疗打鼾的智能枕头；但在2023年初，王小川用了2周时间，就做出了决定，放下这个创业项目，去做大模型。

根据天眼查信息，茹立云也曾在五季医学科技有限公司持股。去年9月，茹立云退出股东行列，全身心跟随王小川创业。而“留守”在这家公司的另一位自然人股东，就是搜狗“四大天王”的最后一位杨洪涛。

从医疗健康到大模型，王小川在创业路上，猛然打了个急转弯。

作为从互联网创业时代走过的“老兵”，王小川灵敏地嗅到了“技术变革”的气息。过去，从搜索到人工智能，搜狗一直处于百度的下风，王小川也没有摆脱李彦宏的“阴影”。现在，他终于看到了一次率领团队、再度挑战旧秩序的机会，这是他必须抓住的契机。

但之前创业的公司也尚未见眉目，再度转向人工智能，在外界看来，王小川似乎是一直在追逐风口。

王小川自己并不这么认为。他在后来接受媒体采访时表示，自己当年读研期间做的课题，就是跟基因测序拼接算法相关的。因此，他也好奇“如何用数学模型去刻画生命”，而人工智能的发展，同样也是激发了他的想法，想用深度学习的方法去理解生命科学。

尽管有了这一番解释，但AI技术实际上还远没有走到如此地步。即使是大语言模型，解决的还是人和机器如何对话的问题。

除此之外，业界最想了解的问题就是：大模型创业“前无古人”，在搜狗之后，王小川这次要怎么讲、以及能不能讲好一个全新的AI故事？

03、百川智能，一路急奔

在创业之初，王小川和其他创业者一样，都集中在研发通用大模型上。其中的逻辑也很简单：既然OpenAI是这么起家的，那么国内也一定要有自己的底座大模型。但大模型赛道已逐渐变得拥挤：到去年10月时，国内已涌现了238个大模型；自2023年8月第一批国产大模型通过备案起，截至今年2月，已经有40余款大模型获批对外开放。

“百模大战”中，百川智能做得究竟怎么样？为了打一场和搜狗不同的“翻身仗”，占领先机，王小川带领百川一路跑得非常“急”。

依靠搜狗时积累的工程能力、王小川的清华技术背景和大佬人脉，百川智能已经成为国内在2023年诞生的为数不多大模型“独角兽公司”之一。根据去年10月百川智能公开的信息，其年内累计融资已达3.5亿美元。《晚点LatePost》估计，当前其估值约达18亿美元。此外的三家估值超10亿美元的公司分别是通用大模型公司MiniMax、智谱AI和李开复的零一万物，它们共同成为大模型创企中杀出的“黑马”。

成立后半年内，百川智能接连发布了baichuan-7B/13B、Baichuan2-7B/13B四款开源可免费商用大模型及两款闭源大模型；平均每28天就会发布一款新的大模型。

最引人注目的是，百川智能对“引领开源”的强调。“Baichuan2-7B以70亿参数，在英文评测级上能与130亿参数的LLaMA2（Meta AI正式发布的新一代开源大模型）持平。”王小川在去年9月发布该产品时表示，“我们现在可以获得比LLaMA更友好且能力更强的开源模型，能够帮助扶持中国整个生态的发展。”

这也直接把国内大模型竞争“卷”向了一个新的高度。越来越多的通用大模型开源，参数也越来越大。去年年中，阿里云也加入战团，成为首家开源的国内大厂。去年12月，阿里云又宣布开源通义千问720亿参数模型Qwen-72B。

但大模型能否如手机的安卓系统一样，上演一出开源“逆袭”的故事，还是个未知数。

2023年11月、12月相对沉寂的百川智能，在今年1月底又突然发布了超千亿参数大模型Baichuan 3。超千亿参数模型在训练过程中对高质量数据，训练稳定性、训练效率的要求都高出几个量级，而从Baichuan大模型1.0的发布到如今3.0，百川只用了9个月时间。王小川给自己的“KPI”压力之大，可见一斑。

王小川在创业时的交流会上，就给公司构建起了初步的目标：年底前预计会发布对标GPT-3.5的大模型，并有信心“做到国内最好”，还要做到搜索增强、多模态的增强。

Baichuan 3显然目标是全面对标GPT-3.5、追赶GPT-4的。百川智能没有透露模型参数量，相比之下，GPT-3.5是1750亿参数。百川方面表示，在多个权威通用能力评测如CMMLU、GAOKAO和AGI-Eval中，Baichuan 3都展现了出色的能力；而在CMMLU、GAOKAO、HumanEval和MBPP等多个中文评测榜单上，更是超越了GPT-4。

在创业时，王小川曾称，百川智能将同时发展通用和垂类模型，尤其是在医疗等知识层面重点增强。可以看到，王小川在商业模式上，当时也有了自己的思考，先在具体场景里做优化、积累行业用户，构建生态，先把模式跑通。在行业选择上，王小川则是万变不离其宗，除了搜索老本行，他投资多年的医疗领域有了用武之地，进入了首选名单。

对于Baichuan 3，百川方面也强调了其在医疗领域内的能力。Baichuan3的医疗数据集Token数超千亿，医疗能力逼近GPT-4。在对逻辑推理能力及专业性要求极高的MCMLE、MedExam、CMExam等权威医疗评测上的中文效果，Baichuan 3同样超过了GPT-4，是中文医疗任务表现最佳的大模型。

赶在新年前面世的超千亿大模型，可以说是王小川和百川智能给自己年初的目标，做的一个“年终总结”。

但这份成绩显然还有待继续提高。毕竟，目前也没有一款大模型可以成为公认的“国内最好”。就在不久前的1月16日，智谱AI也发布全国产的新一代基座大模型GLM-4，整体性能已逼近GPT-4。最引人注目的是，智谱AI还发布了定制化的个人GLM大模GLMs和GLMStore，全面对标OpenAI的GPT商店。

同时，对于大模型，资本的热情已在渐渐消退。“下一阶段，估计很少有人再会投这种基座大模型了，而是会把注意力放到各行业的应用上去。”一位投资人告诉「市界」。大模型融资创业的窗口也接近关闭，一位大模型创业者吐槽说，自己一段时间密集见了30多家投资机构，却没有人出手投资。

资本热度已经逐渐减退，而大众感兴趣的“颠覆时刻”，似乎还没有真正意义上到来。通用大模型纷纷开放后，下一步又将“卷”些什么？同时，市场也迫切希望，能够早日看到大模型们清晰的商业化路径。

市场曾有声音判断，2024年将是AI应用迎来爆发。“AI原生时代，我们需要100万量级的AI原生应用，但是不需要100个大模型。”李彦宏也在近期表示。

王小川不止一次在公开场合提到过“超级应用”。他认为，中国的机会或许不是技术科研上比美国跑得快，而是在应用上跑得更快。即“理想上慢半步，落地上快一步”。去年6月，他去美国硅谷走了一圈，发现OpenAI正在尝试把1000万颗GPU连在一起，训练一个大规模的模型。回来之后，这句话就被他调整成了“理想上慢一步，落地上快三步”，在产品应用上要跑得更快了。

但百川智能的超级应用仍然“在路上”。2023年的年底时，王小川在公开活动中还表示，针对C端的超级应用，预计会在2024年推出，“主要针对健康、快乐、个人助理方向”。

很多企业也发现，即使AI应用出现，大模型时代的应用模式，也和移动互联网时代不同。这仍是一条需要探索的路径。像去年火爆一时的妙鸭相机，就跳过了“免费获取早期用户市场”阶段，在推出的第一天就开始收费，但很快其热度也下降了。

对于大模型公司来说，现在探讨如何稳定造血还为时过早，目前还是处于卡位战的阶段。而在“百模大战”的下半场，淘汰赛也即将开始。

2015年那波AI浪潮中，就诞生过业界公认的AI“四小龙”。后来，四小龙中的商汤科技、云从科技都已经成功登陆资本市场。但是，以它们为代表的那一代AI创企，也普遍都经历过估值过高之后，商业化变现艰难等问题，很多公司直到现在还在苦恼盈利难题。

经历过这些的投资人们，面对大模型时出手更为谨慎，更加重视公司实现自我造血的能力。而无论是国内还是海外，大模型技术和产品都还处于探索期，从数据安全、应用场景到商业模式，都充满着不确定性，所有人都在摸着石头过河。

王小川这次创业，“押上”了自己的名字。他要实现昔日梦想，也要谨慎地避免重蹈覆辙。不过幸好，生成式AI大幕才拉开不久，未来舞台还足够广阔。

责任编辑：肖苏琦