字节大模型策略：自研加平台

(资料图片)

这周，字节跳动旗下云计算服务火山引擎推出方舟大模型平台，引入了智谱 AI、MiniMax 等 7 家创业公司 / 研究机构的大模型，对外出售服务。相关公司和机构在火山引擎活动会场开设展台，创始人或联合创始人到场宣布未来会和火山引擎有更深入的合作。

为了吸引创业公司把模型放在火山引擎上，字节跳动把抖音等业务的空闲计算资源极速调度给火山引擎，并比同行更低的价格出售算力服务。火山引擎总裁谭待说中国大多数大模型公司都用火山引擎训练，在火山引擎上做推理也顺理成章。

今年初，为了抓住人工智能大模型的机会，字节跳动组建了至少三个团队开发大模型，找英伟达下单超 10 亿美元的 GPU，两年前卸任 CEO 的创始人张一鸣也开始看相关论文，与一些团队交流心得。

投入大量资源的字节跳动，目标不只是像 OpenAI 那样开发出大模型，还希望凭借丰富的 GPU 储备建立一个平台，作为中间商帮创业公司训练、出售大模型。

按照谭待的说法，他们将来还会引入更多大模型，字节跳动自研的大模型，除了应用到业务中，也会放在平台里对外销售。他说这么做基于两个判断：大模型市场不会出现少数几个大模型通吃的局面、企业会用多个模型开发应用或改造业务。

“超级大模型效果好，性价比不高，不是所有问题都需要超级模型”，谭待接受采访时说，再加上不同行业解决问题不同，模型训练数据也不一样，因此会有针对特定行业或者不同参数量（决定成本）的大模型存在。

大模型是中国云计算公司的机会已经形成行业共识。但它们抓机会的方式有差别——百度和阿里都是先自研大模型，然后对外提供服务。腾讯现在还没有发布自研模型，马化腾说 “不急于一时”，腾讯先做的是建立平台，吸引行业方向的大模型进驻，对外提供服务。（贺乾明）