简体
  • 简体中文
  • 繁体中文

热门资讯> 正文

Databricks推出DBRX,高效开源模型的新标准

2024-03-27 20:00

DBRX使组织能够高效地构建生产质量的生成式AI应用程序,并使他们能够控制其数据

旧金山,2024年3月27日/美通社/--数据和人工智能公司Databricks今天宣布推出DBRX,这是一个通用的大型语言模型(LLM),在标准基准上优于所有已建立的开源模型。DBRX使每个企业的定制、高性能LLM的培训和调整变得大众化,因此他们不再需要依赖少数封闭的模型。今天上市的DBRX使世界各地的组织能够经济高效地构建、培训和服务他们自己的定制LLM。

Databricks联合创始人兼首席执行官Ali Ghodsi表示:“在Databricks,我们的愿景一直是让数据和人工智能大众化。我们正在通过向每一家企业提供数据情报来做到这一点--帮助他们理解和使用他们的私人数据来构建自己的人工智能系统。DBRX就是这一目标的结果。”我们对DBRX感到兴奋有三个关键原因:第一,它在最先进的行业基准上击败了开源模型。其次,它在大多数基准上都超过了GPT-3.5,这应该会加速我们在整个客户群中看到的趋势,因为组织用开源模型取代了专有模型。最后,DBRX使用混合专家架构,使得该模型在每秒令牌数量方面非常快,而且服务起来非常经济实惠。总而言之,DBRX正在为开源LLMS设定一个新的标准--它为企业提供了一个基于自己的数据构建定制推理能力的平台。“

DBRX在行业基准中超过开源模型

DBRX在语言理解、编程、数学和逻辑等标准行业基准测试方面优于现有的开源LLMS,如Llama270B和Mixtral-8x7B。(见图1)

DBRX在相关基准上的表现也优于GPT-3.5。(见图2)

要深入了解模型评估和性能基准,以及要了解DBRX在内部使用案例(如SQL)方面如何与GPT-4质量竞争,请访问The Mosaic Research博客。

DBRX为高效开源LLMS设定了新标准

DBRX由Mosaic AI开发,在NVIDIA DGX Cloud上进行训练。Databricks使用专家混合(MOE)架构优化了DBRX的效率,该架构构建在Megablock开源项目之上。由此产生的模型具有领先的性能,并且计算效率是其他领先的LLM的两倍。

DBRX为开源模型设置了新的标准,为所有企业启用了可定制和透明的生成性AI。Andreessen Horowitz最近的一项调查发现,近60%的人工智能领导者对增加开源使用或在微调开源模型与封闭源代码模型的性能大致匹配时切换感兴趣。在2024年及以后,企业预计使用将从封闭转向开放源码。Databricks认为,DBRX将加速这一趋势。

组织受益于数据智能平台上的DBRX的企业级功能

与Databricks Mosaic AI的统一工具配合使用,DBRX可帮助客户快速构建和部署安全、准确且受治理的生产型AI应用程序,而不会放弃对其数据和知识产权的控制。客户受益于Databricks数据智能平台上的内置数据管理、治理、沿袭和监控功能。

支持引号

埃森哲首席人工智能官关兰表示:“在埃森哲,我们处于实施生成式人工智能解决方案的前沿--使用先进的技术,通过我们的基础模型定制服务,根据我们客户的独特需求定制开源模型。”“更复杂的开放源码模型的可用性可以提供新的机会,为我们的客户在企业的各个部分带来有意义的结果。”

艾伦人工智能研究所(AI2)首席软件工程师德克·格罗内维尔德表示:“我们正处于人工智能的一个重要转折点,需要一个由研究人员、工程师和技术专家组成的社区来更好地理解它,并推动有意义的创新。这就是为什么我们在AI2的团队致力于通过开放模型开发来推进产生式人工智能的科学,并很高兴看到像DBRX这样的新模型为该行业带来了更大的透明度、可访问性和协作性。”

Block Data&ML平台工程负责人Jackie Brosamer表示:“在Block,我们使用生产性人工智能工具来增强我们的客户能力,并通过自动化工作流程为Block员工节省时间。我们期待着探索DBRX的功能,以增强我们的人工智能辅助代码生成和上下文驱动的知识检索能力。”

纳斯达克人工智能和数据服务主管Mike O‘Rourke表示:“在我们一些最重要的数据系统上,数据库是纳斯达克的关键合作伙伴。在管理数据和利用人工智能方面,他们继续走在行业前列,我们对DBRX的发布感到兴奋。强劲的模型性能和有利的服务经济的结合是我们在纳斯达克增加对生成式人工智能的使用时所寻求的那种创新。”

Prosus Group数据科学高级总监Paul van der Boor表示:“作为世界上最大的技术投资者之一,Prosus认识到了生成性人工智能的变革性力量。我们期待着DBRX的发布及其潜力,使更多的企业能够构建安全、便携和高性能的定制模型。”

Replit人工智能副总裁Michele Catasta表示:“我们已经与Databricks的Mosaic AI团队密切合作,构建了定制的LLM,使下一个十亿软件开发人员能够更容易地使用代码。随着强大的新DBRX开源模型的发布,我们预计将加速采用安全的生成式AI模型,这些模型是根据组织自己的数据定制的。”

ISG旗下Ventana Research的执行董事戴夫·门宁格表示:“我们的研究表明,企业计划将一半的人工智能预算用于生产性人工智能。”他们面临的三大挑战之一是数据安全和隐私。通过他们的端到端数据智能平台和DBRX的引入,Databricks使企业能够构建受治理、安全和根据其业务上下文定制的生产性人工智能应用程序,同时保持对其知识产权的控制和所有权。

Zoom基因人工智能科学部负责人朱晨光表示:“Zoom一直在利用LLMS的力量来支持像我们的AI Companion这样的新平台功能。我们期待着评估DBRX的潜力,使我们的核心用例更快、更具成本效益地培训和提供定制的生成式AI模型。”

可用性

DBRX在GitHub和拥抱脸上免费提供,用于研究和商业用途。从今天开始,企业可以在Databricks平台上与DBRX交互,在检索增强生成(RAG)系统中利用其长上下文功能,并根据自己的唯一数据构建定制的DBRX模型。DBRX还可以在AWS和Google Cloud上使用,也可以通过Azure数据库直接在Microsoft Azure上使用。

DBRX还有望通过NVIDIA API Catalog提供,并受NVIDIA NIM智能推理微服务支持。

要了解更多关于DBRX的信息,请访问Mosaic AI研究博客或参加DBRX网络研讨会,2024年4月25日上午8:00 PT。

关于Datbricks Datbricks是一家数据和人工智能公司。全球超过10,000家组织—包括康卡斯特、康泰纳仕、葛马拉以及超过50%的财富500强—依赖于数据智能平台来统一和民主化数据、分析和人工智能。Databricks总部位于旧金山,在全球各地设有办事处,由Lakehouse、Apache Spark ™、Delta Lake和MLflow的创始人创立。如需了解更多信息,请关注LinkedIn、X和Facebook上的Dataricks。

新闻联系:www.example.com

查看原创内容下载多媒体:www.example.com

来源数据库

风险及免责提示:以上内容仅代表作者的个人立场和观点,不代表华盛的任何立场,华盛亦无法证实上述内容的真实性、准确性和原创性。投资者在做出任何投资决定前,应结合自身情况,考虑投资产品的风险。必要时,请咨询专业投资顾问的意见。华盛不提供任何投资建议,对此亦不做任何承诺和保证。