《纽约时报》并不是唯一一家拒绝 OpenAI 抓取其网站以帮助训练为 ChatGPT 提供支持的大型语言模型 (LLM) 的出版商或公司。
8 月,《纽约时报》更新了服务条款,规定未经许可,外部人员不得抓取其任何受版权保护的内容来训练机器学习或人工智能系统。与许多版权所有者一样,《纽约时报》有理由担心 ChatGPT、Google Bard 和 Microsoft Bing 等聊天机器人可能会在未经许可或无偿的情况下接受其作品的培训。这种情况被形容为悬在人工智能软件公司头上的版权“利剑”。
据《卫报》报道,现在将 CNN、路透社、天辰游戏平台芝加哥论坛报和澳大利亚的一些新闻网站添加到出版商名单中,这些出版商也在 8 月份选择阻止 OpenAI 的网络爬虫(称为 GPTBot)扫描其页面 。
路透社发言人告诉《卫报》:“由于知识产权是我们业务的命脉,因此我们必须保护我们内容的版权。”
如果版权所有者已经关注 Open AI 和其他 AI 公司一段时间了,为什么现在会发生这一切呢?因为在 8 月份, OpenAI 开始让网站运营商阻止其网络爬虫 窃取信息。OpenAI 提出了这一建议,正如它所说:“允许 GPTBot 访问您的网站可以帮助 AI 模型变得更加准确,并提高其总体功能和安全性。”
有趣的是,不只是媒体公司不想被抓取。《卫报》称 OriginalityAI 是一家“检查人工智能内容是否存在”的公司,该公司正在追踪世界前 1000 个网站中哪些网站正在阻止 OpenAI 的 GPTBot。截至 8 月 29 日,拒绝的公司名单 包括亚马逊、Shutterstock、Quora、Wikihow 和 Indeed。
以下是人工智能领域其他一些值得您关注的事情。
ChatGPT 在 AI 语音份额方面处于领先地位
据 GlobalData 称,尽管人们担心 OpenAI 可能会如何训练其模型,天辰游戏平台并且尽管美国联邦贸易委员会对 ChatGPT 如何处理个人隐私进行了调查,但 ChatGPT “主导”了社交媒体平台上有关法学硕士的讨论。
该研究公司表示,ChatGPT“在 Twitter 和 Reddit 等平台上拥有令人印象深刻的 89.9% 的话语权”。另外六位最受提及的法学硕士是谷歌的巴德 (5.7%);Meta 的LLaMA (1.6%);Anthropic的克劳德(1.1%);以及谷歌的PaLM(0.8%)、BERT(0.5%)和LaMDA(0.4%)。
围绕 ChatGPT 的社会情绪总体上也是积极的,尽管影响者“强调了道德监督、事实核查以及社会科学家和伦理学家的投入的必要性,以使人工智能系统与人类价值观保持一致。同时,一些影响者认为人工智能的幻觉可能会导致创造力和理解人类对话,”GlobalData 说。“有影响力的人士讨论了 GPT 如何有潜力重新定义生产力并挤压钟形曲线,因为它可以弥合认知和表达之间的差距,从而实现创造性表达。”