简体
  • 简体中文
  • 繁体中文

热门资讯> 正文

“诉讼时间到!”马斯克:微软非法使用推特数据进行AI训练

2023-04-20 12:26

社交媒体公司推特的现任老板埃隆·马斯克周三(4月19日)指控微软公司非法使用推特的数据来训练其人工智能(AI)模型,还警告要起诉这家软件巨头。

该事件还要从微软的一则“封杀令”开始说起。

就在马斯克威胁起诉之前,有媒体周三报道称,微软将把推特从其广告平台中移除,微软的这一平台是一个面向广告主的社交媒体规划和调度工具,广告买家能够在该平台管理他们所有的社交媒体账户。

而微软官网上发表声明称,从2023年4月25日开始,该平台将不再支持推特。

image

随后,马斯克发推道,“他们(微软)非法使用推特数据进行训练,诉讼时间到。”

image

数据所有权之争

事实上,马斯克的诉讼警告反映了AI领域中的一个趋势,也就是数据所有权正迅速成为生成式人工智能(AIGC)热潮中一个激烈的新“战场”

随着大型科技公司正在努力开发类似OpenAI公司GPT的尖端AI模型,越来越多的数据所有者试图对AI模型的数据获得收取使用费,从中“薅一把羊毛”。

像GPT这样大型语言模型(LLM)的训练往往需要TB级的海量数据,所以其中一大部分都是从Reddit、StackOverflow、推特等网站上获取的。

来自社交网络的数据对于AI的训练来说很有价值,因为这些社交平台上充斥着各种非正式的、多回合的对话。

不过,随着这些新的AI模型逐步从实验室和大学研究所进入企业界,数据所有者开始向AI开发商提出要求。

“美国贴吧”Reddit本周早些时候表示,将开始向使用其应用程序编程接口(API)的企业收费,该接口则提供了下载和处理人与人之间对话的相关数据。

环球音乐集团(Universal Music Group)也已发出警告,阻止AI服务从其受版权保护的歌曲中抓取旋律和歌词。

此外,知名图库Getty Images正在起诉Stable AI公司的开源AI艺术生成器Stable Diffusion,指控该公司通过复制Getty Images上的内容来训练AI。

免责声明:以上内容仅代表作者的个人立场和观点,不代表华盛的任何立场,亦并非旨在提供任何投资意见。有关内容不构成任何专业意见、买卖任何投资产品或服务的要约、招揽或建议。本页面的内容可随时进行修改,而本公司毋须另作通知。本公司已尽力确保以上所载之数据及内容的准确性及完整性,如对上述内容有任何疑问,应征询独立的专业意见,本公司不会对任何因该等资料而引致的损失承担任何责任。以上内容未经香港证监会审阅。

风险及免责提示:以上内容仅代表作者的个人立场和观点,不代表华盛的任何立场,华盛亦无法证实上述内容的真实性、准确性和原创性。投资者在做出任何投资决定前,应结合自身情况,考虑投资产品的风险。必要时,请咨询专业投资顾问的意见。华盛不提供任何投资建议,对此亦不做任何承诺和保证。