热门资讯> 正文
2023-06-27 21:50
大数据企业Databricks近日宣布,公司同意以约13亿美元的价格收购生成式人工智能初创公司MosaicML,此举旨在抓住企业快速增长的需求,帮助它们建立自己的ChatGPT类产品。
总部位于旧金山的数据存储和管理初创公司Databricks表示,这笔交易将其支持人工智能的数据管理技术与MosaicML的语言模型平台相结合,使企业能够利用专有数据自己构建低成本的语言模型。目前,大多数企业依赖于第三方语言模型,这些模型是根据在线访问的大量公开数据训练的。
MosaicML同样位于旧金山,于2021年推出,将成为Databricks旗下的一项独立服务。MosaicML联合创始人兼首席执行官纳文•拉奥(Naveen Rao)表示,该公司一直致力于降低使用生成式人工智能的成本,从每个模型的数千万美元降至数十万美元。MosaicML有62名员工,到目前为止已经筹集了6400万美元。
生成式人工智能应用程序旨在根据用户的自然语言提示生成原始文本、图像和计算机代码。自去年11月人工智能初创公司OpenAI推出在线生成式人工智能聊天机器人ChatGPT以来,人们对这项技术的兴趣激增。
Anthropic和OpenAI等公司将现成的语言模型授权给企业,然后企业在其基础上构建生成式人工智能应用程序。在对这些模型的强劲商业需求的推动下,生成式人工智能市场急剧扩大,为MosaicML等初创公司创造了机会,这些公司表示,他们可以提供类似的人工智能模型,但成本更低,并且可以根据公司的数据进行定制。
Databricks首席执行官Ali Ghodsi表示:“如果你从零开始建立一个模型,你知道你在给它提供什么。”Ghodsi认为,现成的模型因为已经接受了互联网数据的训练,所以可以随时使用,但它们充满了可能扭曲结果的无关信息。他说,许多公司还担心在外部供应商构建的模型中共享数据的隐私和安全问题。
一些机器学习专家和人工智能供应商表示,像ChatGPT这类大型语言模型的计算和合成能力胜过小型模型,后者在特定领域具有强大的功能,但总体上能力有限。此外,毕马威美国人工智能负责人克里希纳(Sreekar Krishna)表示,在数据管理和确定哪种模型最适合某些用途方面,仍然存在持续的挑战。
Databricks拥有lakehouse(湖仓一体)技术,旨在为人工智能应用程序准备和管理业务数据,同时将数据、分析和人工智能编程工具统一在一个系统中。Databricks通过出租分析、人工智能和其他基于云的软件来赚钱,去年该公司收入超过10亿美元。
根据市场分析公司PitchBook Data的数据,到今年年底,全球生成式人工智能市场的支出预计将达到426亿美元,到2026年,复合年增长率将达到32%,该领域支出将触及981亿美元。该公司表示,对生成型人工智能初创公司的风险投资从2022年全年的48亿美元增长到2023年前五个月的127亿美元。
Databricks是十年前由加州伯克利的一群数据科学家创立的,在2021年8月进行了一轮16亿美元的融资后,目前在私募市场的估值为380亿美元。
生物制药服务公司Syneos Health的首席信息和数字官拉里·皮克特(Larry Pickett)表示,目前培训一个专业健康数据模型的成本估计在100万至200万美元之间。分析人士表示,这类“特定领域”模型对公司来说可能比ChatGPT更有用,因为它们拥有更多的行业术语和专业知识。
但皮克特预计,通过使用更小的、预先训练好的模型,Syneos Health的花费可以大大减少,“而不是在OpenAI拥有的整个数据语料库上进行构建。”他说,其中一些模型已经可以在开源库中使用。
免责声明:以上内容仅代表作者的个人立场和观点,不代表华盛的任何立场,亦并非旨在提供任何投资意见。有关内容不构成任何专业意见、买卖任何投资产品或服务的要约、招揽或建议。本页面的内容可随时进行修改,而本公司毋须另作通知。本公司已尽力确保以上所载之数据及内容的准确性及完整性,如对上述内容有任何疑问,应征询独立的专业意见,本公司不会对任何因该等资料而引致的损失承担任何责任。以上内容未经香港证监会审阅。