MosaicML成立仅2年,每名员工的价值达到了2100万美元,所以它能够以13亿美元的价格出售。

'MosaicML成立仅2年,每名员工价值2100万美元,以13亿美元出售。'

MosaicML以13亿美元的价格被Databricks收购

最近,大数据巨头Databricks以约13亿美元的价格收购了初创公司MosaicML,这是今年上半年最大的收购案之一。MosaicML成立仅2年时间,拥有60多名员工,其高估值引人注目。那么,是什么支撑了MosaicML的高估值呢?

Databricks收购MosaicML,推动生成式AI技术民主化

Databricks近期正式宣布以约13亿美元的价格收购生成式AI初创公司MosaicML,旨在为企业构建类ChatGPT工具的服务。此次收购将使MosaicML成为Databricks Lakehouse平台的一部分,合并两家公司的技术和资源,为企业提供统一的数据资产管理平台。通过使用自有数据进行生成式AI模型的构建和保护,企业能够更好地掌握生成式AI技术。

MosaicML成立于2021年,是一家非常年轻的生成式AI公司,目前只公开披露过一轮融资,员工仅62人。在上一轮融资中,其估值为2.2亿美元,而此次被Databricks收购后的估值直接跃升了6倍。可以说,此次收购是今年以来生成式AI领域内最大的一笔交易。在此之前,云计算巨头Snowflake刚刚宣布收购了另一家生成式AI公司Neeva。可以看出,大型企业对生成式AI初创公司的并购热潮正在开启。

Databricks起源于UC伯克利,作为一家数据存储和分析巨头,其估值已达到310亿美元。该公司帮助大型公司如AT&T、壳牌和Walgreens等处理数据。近年来,Databricks成为全球最受欢迎的Data Infra公司之一。该公司开源的大模型Dolly旨在以更少的参数实现类似于ChatGPT的效果。在云计算普及后,Databricks的“湖仓一体”理念对一批大数据初创企业产生了深远影响。去年,Databricks公布的年收入超过10亿美元,并于2021年8月完成最新一轮融资,估值达到380亿美元。

MosaicML MPT系列模型的优势

MosaicML的MPT系列模型是基于HuggingFace PretrainedModel基类而开发的,并与HuggingFace生态系统完全兼容。其中,MPT-7B模型是MosaicML最受欢迎的模型之一,拥有数十亿个参数,可处理超过2,000种自然语言处理任务。该模型的优化层包括FlashAttention和低精度层范数等,可使其比传统训练方法快2-7倍。MPT系列模型具备资源的近线性可伸缩性,确保数十亿参数的模型可以在几小时内训练,而不是过去的几天。此外,MosaicML还发布了新的可商用的开源大语言模型MPT-30B,拥有300亿参数,并且性能优于GPT-3。

MPT系列模型的优势在于高效性和低成本。使用大量数据进行“训练”的人工智能模型的复杂度急剧上升,如今训练一个模型至少要花费数百万美元,中小型企业很难承受这样的成本。而MosaicML的MPT系列模型可以以更低的成本和更高的效率训练自己的语言模型,从而可以更轻松地应用生成式AI技术,实现更好的业务表现。值得注意的是,大多数开源语言模型只能处理最多几千个tokens的序列,但借助MosaicML平台和8xA100-40GB的单个节点,用户可以轻松微调MPT-7B以处理高达65k的上下文长度。这种处理极端上下文长度适应的能力来自ALiBi,这是MPT-7B中的关键架构选择之一。

例如,《了不起的盖茨比》的全文不到68k个Token。在一个测试中,模型StoryWriter阅读了该书并为其生成了一个尾声。该模型的“打字”速度约为每分钟105个单词。虽然StoryWriter微调的上下文长度为65k,但模型能够处理更长的输入,例如在该书的测试中达到了84k个标记。

生成式AI技术的普及

生成式AI技术是人工智能的一种分支,利用大量数据和深度学习算法,能够自动生成原始文本、图像和计算机代码等内容。这种技术的出现,使人们能够更便捷地处理和分析数据,更好地服务于人类的需求。生成式AI技术已经广泛应用于自然语言处理、图像识别和虚拟现实等领域。例如,在自然语言处理领域,GPT-4已成为最受欢迎的生成式AI模型之一,可用于生成文章、翻译语言和回答问题等任务。在图像识别领域,StyleGAN2能够生成高质量的图像,可应用于游戏开发、影视制作和虚拟现实等领域。

MosaicML的CEO Naveen Rao曾表示,自2018年以来,使用大量数据进行“训练”的人工智能模型的复杂度急剧上升,训练一个模型现在至少要花费数百万美元,中小型企业很难承受。而Databricks收购MosaicML后,企业可以利用Databricks的Lakehouse平台和MosaicML的技术,以较低的成本和更高的效率训练和构建自己的生成式AI模型。预计在Databricks和MosaicML的平台和技术支持下,企业训练和使用大语言模型的成本将显著降低,降至数千美元左右。这将为生成式AI技术的普及提供便利。

Databricks收购MosaicML的意义

Databricks收购MosaicML的主要目的是加速生成式AI技术的发展和民主化。通过整合两家公司的技术和资源,Databricks能够更好地满足客户需求,提供更高效、更便捷的解决方案。具体来说,这次收购将带来以下几个方面的改变:

  1. 更高效的大语言模型:Databricks收购MosaicML后,将集成MPT系列模型到其Lakehouse平台中,为客户提供更高效、更低成本的大语言模型。这有助于企业更好地处理自然语言处理任务,提高业务效率和准确性。

  2. 更快的模型训练速度:MosaicML的MPT系列模型具有快速训练的特点,能够帮助Databricks提供更快速的模型训练服务。这对于需要快速响应市场需求的企业尤为重要,可以帮助他们更好地满足客户需求。

  3. 更高的民主化程度:Databricks收购MosaicML也意味着生成式AI技术的民主化程度将进一步提高。MosaicML的MPT系列模型能够让中小型企业更轻松地训练自己的语言模型,从而更好地应用生成式AI技术,实现更好的业务表现。这有助于推动生成式AI技术的发展和应用,促进人工智能技术的普及和发展。

综上所述,Databricks收购MosaicML的意义不仅在于加速生成式AI技术的发展和民主化,还在于整合两家公司的技术和资源,为客户提供更高效、更便捷的解决方案。生成式AI技术在人工智能领域的重要性不断增加,Databricks收购MosaicML的举动也彰显了企业对该领域的重视和投资。大型科技公司对生成式AI技术的兼并和收购步伐不断加快,如Anthropic和OpenAI等公司将现成的语言模型授权给企业,然后企业在其上构建生成式AI应用程序。在对这些模型强劲需求的推动下,初创公司如MosaicML获得了机会。通过Databricks收购MosaicML等举措,生成式AI技术有望进一步普及,并推动人工智能技术的发展。