导航菜单
首页 >  清华大学计算机科学与技术考研多少人  > 清华系17人,撑起中国大模型创业半壁江山

清华系17人,撑起中国大模型创业半壁江山

原创 程 茜 智东西

AI大模型狂潮之下,老炮和大牛们是如何攒局的?

作者 | 程茜

编辑 | 心缘

智东西8月23日报道,过去三个月,生成式AI浪潮变数丛生,国内AI大模型产业也连爆大事:

6月29日美团宣布完成对AI大模型独角兽企业光年之外的收购,搜狗创始人王小川创立的AI大模型创企百川智能连发3款开源大模型;此前被光年之外收购的AI大模型创企OneFlow(一流科技)的创始人袁进辉也于本周证实,一流科技团队将瞄准大模型推理成本问题重新创业。

有趣的是,这些处于国内AI大模型竞赛焦点的主人公们——美团创始人王兴、光年之外创始人王慧文、搜狗&百川智能创始人王小川、一流科技创始人袁进辉——都是清华学子。

在如火如荼开展的AI大模型竞赛中,清华学子可谓“抢尽”了风头,除了王慧文、王小川等互联网“老炮”高调入场外,还有多位清华学院派教授、清华毕业生躬身入局。据智东西不完全统计,近期活跃的AI大模型创企中,拥有清华背景的创始人至少有17位,涉及11家企业。清华系创业团队俨然正撑起国内AI大模型创业浪潮的半壁江山。

▲近期活跃在国内大模型浪潮中的清华系创企(整理自公开信息)

01.

大佬创业:90年代清华师兄弟

互联网“老炮”高调入局

很多年后,人们回忆起国内这场盛况空前的AI大模型创业潮时刻:有两个人的名字一定会率先浮现在眼前,那就是王慧文和王小川。就在今年2月和4月,这两位互联网老炮接连官宣创业,剑指大模型。

除了这些共同点外,王小川和王慧文这对师兄弟曾于1996、1997年先后毕业于清华大学。

1、王慧文:2个月成独角兽,没产品成最大隐患

最先官宣创业的是王慧文。2月中旬,王慧文6天连发5条朋友圈,从表明态度到“500万美元带资进组求组队”、发“AI英雄榜”,最终AI大模型创企光年之外成型。

王慧文的创业之路总能看到美团创始人王兴的身影。1997年,王慧文考进清华大学电子工程系,因缘际会与王兴成为上下铺兄弟。戏谑的是,他们二人形影不离的原因是,成绩优异的王慧文进入清华大学后发现在众多佼佼者中自己只能算个“学渣”,因而与成绩相近的王兴惺惺相惜。

▲王慧文(右一)和王兴(中间)

毕业后两人几经波折,最终在美团“胜利会师”。读研期间,王慧文和王兴双双退学瞄准了彼时在美国兴起的社交网络,打造出风靡大学生群体的校内网后陷入商业化困境,随后选择出售校内网实现财富自由,两人分开创业。2010年,王慧文加入美团,再次与王兴联手。2020年,42岁、身价120亿人民币的王慧文选择从美团退休。

这次,王慧文又出山,入局AI大模型。官宣创业后,顶尖人才、高额融资纷至沓来。前有北京智源人工智能研究院副院长刘江、被称为“搜狗输入法之父”的马占凯等加入,后有王兴、快手创始人宿华掏钱投资。成立两个月后,光年之后迅速跃升独角兽,估值达10亿美元。

这背后,不是技术出身的王慧文开始紧锣密鼓地召集人才,4月,光年之外完成收购同为清华系创企一流科技。这家创企的创始人是师从中国人工智能奠基者张钹院士的袁进辉。

在此之后,手持丰厚资本、技术的光年之外业务布局即将走上正轨,成为AI大模型创业焦点的王慧文,6月底之际却被曝出已经因病离岗,随后,王兴入局,光年之外被美团全权收购。

目前来看,王慧文的AI大模型创业之路已经画上了终局,此后他是否会重返“战场”仍是个未知数,但成立半年之久的光年之后在产品端尚无进展官宣的当下,就几经波折,这或许已经成为这家头顶数道光环的大模型创企的最大风险。

2、王小川:百余天官宣3个大模型,投资阵容豪华

反观与王慧文受关注度几乎持平的王小川,4个月时间就拿出三款大模型,并开启了大模型商业化的探索。

鼎鼎有名的清华大学计算机系的96级毕业生,是国内互联网产业第一波弄潮儿,他们参与并见证了中国互联网发展的每一个时刻,堪称“互联网梦之队”。王小川就是其中之一。

▲百川智能创始人兼CEO王小川

1996年,成绩优异、对计算机感兴趣的王小川被特招入清华大学计算机系,这一待就是七年。从计算机专业到生物方向,从国内青年社区平台ChinaRen到搜狐,王小川的技术才华施展的范围逐渐扩大,但他的物理空间却几乎没有离开过五道口,王小川也被称为“清华东门守门员”。

王小川也把百川智能安家到了五道口。今年4月,王小川联手前搜狗COO茹立云成立百川智能,官宣入场大模型创业,更有多位搜狗团队老员工主动申请带资加入,据王小川在第三个大模型发布时透露,目前百川智能中前搜狗员工的比例占到30-40%。

成立一个月后,百川智能就拿到了来自腾讯、小米、金山、清华大学资产管理有限公司、好未来等十余家机构的联合投资,这样的豪华投资阵容鲜有先例。

四个月时间,百川智能已经发布参数量130亿的通用大语言模型Baichuan-13B-Base、对话模型Baichuan-13B-Chat及其INT4/INT8两个量化版本、530亿参数规模的Baichuan-53B,覆盖开源到闭源。下一步,王小川要在大模型开源的基础上,以搜狗曾经的超级应用经验为基础,找到大模型的超级应用以及比肩GPT能力的大模型。

▲百川大模型演示案例

王慧文、王小川都是曾经缔造中国互联网的清华学子,隐退多年后,又在大模型浪潮下躬身入局。除了这两位互联网老炮外,还有众多清华系教授、学生在这场硝烟弥漫的大模型赛道中格外扎眼。

02.

学院派:五位教授领衔

孵化多个大模型创企

清华大学当之无愧是国内AI大模型赛道的人才宝地,现有的学术力量风头正盛,五位教授领衔的AI大模型创业浪潮正在徐徐拉开帷幕。

在人工智能领域,不得不提的就是智源研究院这一响当当的名头。2018年,智源研究院正式成立,将北京大学、清华大学、中国科学院、百度、字节跳动等人工智能产业的头部院校、企业的顶尖人才聚集到一起。

当OpenAI的GPT-3发布后,智源研究院率先发起大模型项目,唐杰、刘知远、黄民烈、杨植麟……等清华大学知名AI学者纷纷投身其中,他们共同构成了后来悟道大模型的研发团队。

这些AI大牛也成为了这波大模型创业浪潮中的核心力量。

1、唐杰:核心成员曾参与知名大模型研发,融资拿到手软

智谱AI、智源研究院、月之暗面、循环智能,这些身处大模型热潮中心的公司,都与清华大学计算机系教授唐杰关系匪浅。

唐杰教授光环加身,他既是清华大学计算机系知识工程实验室(KEG)带头人,同时是智源研究院学术副院长、悟道项目负责人。

▲唐杰(图源:清华大学)

事实上,最开始唐杰并不相信机器智能会超越人,他的主要研究方向是数据挖掘和知识工程,而大规模预训练模型的出现,让他看到了机器智能超越人的可能性。

2020年OpenAI甩出GPT-3,搅动了整个人工智能产业。随后,2020年10月,智源研究院率先确定了大模型研究战略方向,时任智源副院长的唐杰带领团队在2021年发布了悟道1.0和2.0模型。同时,悟道2.0凭借万亿级参数规模创下中国首个、全球最大的世界纪录。

与此同时,KEG实验室孵化的智谱AI,其核心团队也多为悟道大模型的研发人员,今年7月,刚刚收购光年之外的美团独家投资了智谱AI,融资金额达数亿人民币。目前,智谱AI中英双语开源模型ChatGLM、代码生成模型CodeGeeX等大模型及应用产品矩阵。

除唐杰本人外,他鼎鼎大名的得意门生杨植麟也入局大模型,从清华毕业的杨植麟在美国卡内基梅隆大学师从苹果和谷歌的AI大牛。6月12日,杨植麟剑指大模型的新创企月之暗面亮相,刚成立就迅速拿到红杉、真格机构投资,市场估值达3亿美元。不过,杨植麟头顶的光环远不止于此,早在2016年,杨植麟就创立了专注于自然语言理解的循环智能,还曾参与华为盘古大模型研发。

月之暗面其他三位联合创始人中张宇韬和周昕宇也毕业于清华,张宇韬与杨植麟同为唐杰的学生。

2、孙茂松:从信息处理到法律大模型,创企数量、涉足种类都处前列

清华大学人工智能研究院教授孙茂松是自然语言处理与社会人文计算实验室(THUNLP)的负责人,刘知远师承孙茂松。相比于唐杰教授,孙茂松和刘知远团队的创业公司

相关推荐: