文 | 周鑫雨
编辑 | 邓咏仪
距李开复发出AI英雄帖,过去了整整106天。
(相关资料图)
2023年3月19日,创新工场董事长兼CEO李开复在朋友圈宣布“亲自筹组Project AI 2.0,一个致力打造AI 2.0全新平台和AI-first生产力应用的全球化公司”。
3个月后,7月3日,Project AI 2.0终于揭开了业务和团队画像的一角。创新工厂官宣Project AI 2.0新公司“零一万物”,并上线官网(01.AI)。
创新工场表示,零一万物是其“塔尖孵化”的第7家公司。
所谓的“塔尖孵化”,是创新工场投资具有短板的初期公司的战略,特点是在创业者和学术圈之间建立紧密的人才、技术等方面的联系,涵盖甄别技术趋势、设定技术主题、挖掘技术人才、跟踪行业最新动态等环节。3月,宣布完成亿元人民币Pre-A轮融资的澜舟科技,就是创新工场采取塔尖孵化模式的公司。
自研大模型,是零一万物切入AI赛道的方向。为此,零一万物搭建了专供大模型训练、调优和推理的实验平台,资源储备包括数千卡GPU集群。
面对“重复造轮子”的质疑,零一万物用目前国内大模型赛道存在的两个问题做出了回应:一,许多声称效果类似ChatGPT 的开源模型,都只局限于简单对话,无法适应稍微泛化或复杂的任务;二,依赖开源生态不利于对大模型技术原理的研究,自身能力天花板容易被他人定义。
为了提高模型能力,零一万物采取了拆解技术路线、分步攻克的策略,包括7大模块:
1、定义模型能力天花板的预训练框架(Pre-train)技术;
2、精进模型实现能力的 Post-train(训练后)技术;
3、支撑模型高效训练的 AI Infra技术;
4、更多元化多介质的多模态模型技;
5、平台中间件及工具链技术;
6、推理部署技术;