币界网报道:
维基媒体基金会宣布与多家人工智能公司建立新的合作伙伴关系,这些公司将能够利用维基百科的内容来训练和驱动其人工智能模型。这家非营利组织希望在不断变化的网络行为中巩固其长期可持续性。
这些协议是通过维基媒体企业版(Wikimedia Enterprise)签署的,该平台是维基媒体基金会面向大规模内容再利用者和分发者的商业产品。新签约的合作伙伴包括 Ecosia、微软、Mistral AI、Perplexity、Pleias 和 ProRata。他们将与亚马逊、谷歌和 Meta 等现有合作伙伴携手合作。
“在人工智能时代,维基百科及其人类创建和维护的知识从未像现在这样有价值,”该基金会在一份声明中表示。陈述.
“它的知识库为生成式人工智能聊天机器人、搜索引擎、语音助手等提供了强大的支持。维基百科是训练大型语言模型所使用的最高质量的数据集之一。”
该公告是为庆祝维基百科成立25周年而推出的更新的一部分。
该在线百科全书是全球访问量排名前十的网站之一,也是其中唯一一家由非营利组织运营的网站。据该基金会称,其收录的6500多万篇文章,以300多种语言发布,每月浏览量近150亿次。
然而,它已发出警告,交通模式正在发生变化。10月份,它说维基百科的人工访问量同比下降了8%,这主要是因为用户更多地依赖人工智能生成的摘要,而不是直接访问网站。如今,近60%的谷歌搜索在没有点击的情况下就结束了,页面上的搜索结果往往来自维基百科的内容。
人工智能与出版商
这些交易正值人工智能公司如何获取训练数据引发广泛讨论之际。大型语言模型通常使用海量的在线资料进行训练,这种做法招致了作者、出版商和其他版权所有者的批评,他们认为未经许可使用受版权保护的作品构成侵权。
其中,Reddit也参与其中。几套诉讼虽然该公司已与谷歌等公司达成许可协议,但并未与人工智能公司合作使用其内容来训练模型。
周四,主要图书出版商阿歇特图书集团和圣智集团宣布,两大图书出版商阿歇特图书集团和圣智集团将举行联合发布会。已提交一项加入针对谷歌的现有集体诉讼的动议,该诉讼指控谷歌在构建其Gemini人工智能平台的过程中实施了“历史性的版权侵权”。诉讼称,谷歌在其人工智能训练过程中未经适当授权复制了书籍。该案最初由一群作者于2023年提起。
OpenAI面临着类似案例原告包括《权力的游戏》作者乔治·R·R·马丁。
娱乐公司也在施压。12月中旬,迪士尼发送谷歌向迪士尼发出停止侵权通知函,指控其侵犯版权。与此同时,迪士尼却与OpenAI达成了一项单独的授权协议,涵盖数百个用于人工智能生成视频的角色。迪士尼还向其他人工智能公司发出了类似的通知,并与其他大型电影公司联手,对图像生成公司Midjourney提起诉讼。
同月,一个由作家、演员和技术专家组成的联盟发射一个新的行业组织成立,旨在推动制定可强制执行的标准,规范人工智能在娱乐行业的训练和使用方式。超过500位知名人士支持这项倡议,其中包括娜塔莉·波特曼、凯特·布兰切特、本·阿弗莱克、吉尔莫·德尔·托罗和塔伊加·维迪提。
欧盟委员会也打开对谷歌是否违反欧盟竞争规则,未经公平补偿或同意,使用出版商和 YouTube 的内容来支持其人工智能服务,构成正式的反垄断调查。
版权所有者最终能否获得救济尚不确定。美国联邦法官近期对Meta和Anthropic公司做出了部分胜诉判决,裁定它们使用受版权保护的书籍训练人工智能模型属于合理使用,但同时批评这两家公司永久保存盗版作品库。