简体
  • 简体中文
  • 繁体中文

热门资讯> 正文

阿里“通义千问”上线测试!AI大模型时代竞逐加速?

2023-04-10 08:20

继百度文心一言之后,国内又一巨头也开始测试AI大模型了——阿里正式加入ChatGPT这场大型竞赛!

通义千问

4月7日,阿里云宣布自研大模型“通义千问”开始邀请用户测试体验。

目前,该模型主要定向邀请企业用户进行体验测试,用户可通过官网申请(tongyi.aliyun.com),符合条件的用户可参与体验。

 据悉,阿里达摩院在NLP自然语言处理等前沿科研领域早已布局多年,并于2019年启动大模型研发。

2021年,阿里先后发布国内首个超百亿参数的多模态大模型M6及被称为“中文版GPT-3”的语言大模型PLUG,此后还训练实现了全球首个10万亿参数AI模型。

此次“通义千问”的上线,仅为产品企业邀测,目前尚未正式发布。

不过,小编在第一时间研究了一番。对于为什么会取这个名字,“通义千问”给出的回答是:

这个名字来源于两个方面,“通义”意味着该模型具有广泛的知识和普适性,可以理解和回答各种领域的问题。作为一个大型预训练语言模型,“通义千问”在训练过程中学习了大量的文本数据,从而具备了跨领域的知识和语言理解能力。 

“千问”代表了模型可以回答各种问题,包括常见的、复杂的甚至是少见的问题。它表达了通义千问致力于满足用户在不同场景下的需求,无论问题多么复杂或者独特。综合起来,“通义千问”这个名字表达了这款人工智能语言模型的强大功能和广泛适用性。 

从该模型的功能来看,“通义千问”表示,其基于大量训练数据,在对话理解能力、代码写作能力、多语言支持等方面有着不错的表现。

比如在创作能力上:

整体来看,“通义千问”在对话中能够理解和回答各种主题的问题,能有提供更自然、流畅的对话体验。此外,它具有多种编程语言的理解和生成能力。比如,小编在提问“能否绘画一张表现今天天气的图时”,它还提供了实现这张图的代码。

而且除了中文,它还支持其他多种语言的使用需求,如英语、日语、法语、西班牙语、德语等。

ChatGPT竞逐赛如火如荼?

作为阿里达摩院自研的一款强大人工智能语言模型,“通义千问”除了上述优势之外,事实上也仍然存在一些目前AI普遍存在的局限性。比如:

无法理解涉及情感、文化等因素的问题:尽管“通义千问”可以处理大量的文本数据,但是对于一些特定领域的问题,它可能难以理解,因为这些问题涉及到大量的情感、文化和历史等因素,这些因素可能在语言表达和理解中没有被充分考虑。 

数据质量的影响:“通义千问”是在海量文本数据上训练而成的,但是数据质量可能会受到诸如语言不规范、数据格式不统一等因素的影响。这些因素可能会对模型的准确性和适用性产生负面影响。 

缺乏对特定领域的理解:尽管“通义千问”可以回答各种领域的问题,但是在某些特定领域,它可能缺乏足够的背景知识和研究,因此难以提供准确的答案。 

训练难度和时间:“通义千问”是一个大型模型,训练它需要消耗大量的计算资源和时间。这也意味着,在某些情况下,如果问题太复杂或者数据太多,模型可能无法快速地进行训练和学习。 

综上来看,“通义千问”还是需要不断的改进和完善。

目前,由ChatGPT展开的全球AI竞赛已经进入了激烈的比拼阶段,国内外许多知名的科技公司和投资机构也是在摩拳擦掌中。

放眼国内,据不完全统计,当下已经开放AI大模型的主要有:百度公司的文心一言、阿里巴巴达摩院的通义千问

腾讯公司的绝影、华为公司的昇腾、商汤科技的汤圆、旷视科技的Face++、依图科技的图腾等。

更值得关注的是,接下来大模型发布会也会密集来袭。

从目前市场消息统计来看,华为、商谈、阿里、AIGC Chain、同花顺、科大讯飞、谷歌、微软等都将在近期举行关于AI产品的发布会。

纵观市场,在AI大模型探索之路上,国内外的科技巨头们正在快马加鞭、你追我赶;而在国内这场大模型竞赛战场上,开战的号角已经吹响,谁能鏖战至最后取得胜利是值得期待的。

免责声明:以上内容仅代表作者的个人立场和观点,不代表华盛的任何立场,亦并非旨在提供任何投资意见。有关内容不构成任何专业意见、买卖任何投资产品或服务的要约、招揽或建议。本页面的内容可随时进行修改,而本公司毋须另作通知。本公司已尽力确保以上所载之数据及内容的准确性及完整性,如对上述内容有任何疑问,应征询独立的专业意见,本公司不会对任何因该等资料而引致的损失承担任何责任。以上内容未经香港证监会审阅。

风险及免责提示:以上内容仅代表作者的个人立场和观点,不代表华盛的任何立场,华盛亦无法证实上述内容的真实性、准确性和原创性。投资者在做出任何投资决定前,应结合自身情况,考虑投资产品的风险。必要时,请咨询专业投资顾问的意见。华盛不提供任何投资建议,对此亦不做任何承诺和保证。