OpenAI GPT-4被曝充斥大量版权内容占比达44%

来源：网络　浏览：60次　时间：2024-03-12

近日，专门从事大型语言模型（LLMs）评估的Patronus AI公司发布了一份引人注目的报告。报告指出，在测试的四款主流AI模型中，OpenAI的GPT-4模型生成的带有版权文字的提示数量最多，占比高达44%。这一发现引发了业内外对AI模型在版权内容处理方面的关注和讨论。

Patronus AI在报告中测试了OpenAI GPT-4、Anthropic Claude 2、Meta Llama 2以及Mistral AI的Mixtral这四款模型。测试中，Patronus AI使用了CopyrightCatcher工具来分析这些模型对主流版权书籍相关提示的反应。测试方法是通过向模型发出提示词，要求其输出版权书籍中指定段落或第一段的内容。

测试结果显示，OpenAI的GPT-4模型在生成内容中，涉及版权文字的比例最高，达到了44%。相比之下，Anthropic的Claude 2模型表现最为谨慎，仅在16%的完成提示中生成了受版权保护的内容，并且该模型还以无法获得版权材料为由，拒绝回答所有关于首段的提示。

Meta的Llama 2模型在10%的提示中提供了受版权保护的内容，而Mistral AI的Mixtral模型提供了6%的版权内容，更倾向于完成首段提示，占比达到38%。

这一报告的发布引发了业界对AI模型在版权问题上的广泛讨论。有专家指出，AI模型在生成文本时可能会无意中侵犯版权，尤其是在处理未经授权的材料时。因此，对于使用AI模型生成内容的企业和个人而言，确保内容的合法性和合规性至关重要。

Patronus AI公司表示，他们将继续对AI模型在版权问题上的表现进行监测和评估，并呼吁相关企业和机构共同关注这一问题，推动AI技术的健康发展。

OpenAI GPT-4被曝充斥大量版权内容 占比达44%

推荐站点

OpenAI GPT-4被曝充斥大量版权内容占比达44%