AI的知识产权问题：美国专利、商标、版权制度与大模型训练中的侵权争议

2025年7月29日
讀畢需時 5 分鐘

已更新：2月2日

随着生成式人工智能在创作、设计与内容生成等领域的广泛应用，其所产生的作品对美国现行的专利、商标和版权制度提出了前所未有的挑战。同时，AI公司在训练大型语言模型过程中对海量素材的抓取与使用，也引发了关于版权侵权与合理使用的密集法律争议。本文旨在梳理相关政策动向与重点司法案例，分析AI创作在现行法律框架下的归属问题，以及AI训练数据使用所面临的合规风险与判例启示。

一、AI的知识产权问题——创作作品对美国专利、商标与版权制度的影响

美国版权局（U.S. Copyright Office）明确指出，如果作品中的传统创作元素由机器生成、而非由人类完成，该作品将不被视为具有“人类作者身份”，因此无法获得版权保护。换言之，即使用户仅通过简单指令促使生成式AI创作出复杂作品，也不构成受版权保护的条件。只有当人类在作品中做出了选择、编辑、结构安排等实质性创意贡献时，该作品才有可能被视为“AI辅助创作”，从而具备注册资格。截至2024年2月，版权局已经注册超过100件AI辅助作品，并强调申请人有义务披露AI使用情况。若未如实披露，可能导致注册被取消。

此外，在专利系统中，AI全自动生成的大量出版物虽可能缺乏可实施性或技术启示性，但仍可能被引用为现有技术，对专利申请造成巨大负担。随着AI生成技术不断进化，其生成内容将更有可能被视为具有可实施性的公开技术信息，从而对整个专利审查体系带来新的挑战。

在专利领域，美国专利商标局（USPTO）重申现行法律仍要求专利发明人必须为自然人。在Thaler v. Vidal一案中，联邦巡回法院裁定AI系统不能被列为发明人。这一立场目前仍占主导地位。USPTO建议专利申请人务必清晰记录人类在AI辅助发明过程中的贡献，以应对可能更严格的审查。同时，随着AI被广泛用于专利检索和先前技术分析，相关实务操作也在快速演变。

在商标保护方面，AI生成的图像若涉及未经授权的知名品牌元素，例如迪士尼公主或小黄人角色，则可能构成商标侵权或商标稀释，依据的是《Lanham Act》第1125条。目前，Disney与Universal已对图像生成公司Midjourney提起诉讼，指控其图像系统是“无底线的抄袭机器”，该案尚未裁决，但被普遍认为可能成为界定合理使用、变形性表达与商标侵权之间界限的重要案件。此外，若AI输出内容在品牌标识（如Logo或Slogan）上高度接近真实商标，则法院可能适用Polaroid Corp. v. Polarad Elecs. Corp.确立的“消费者混淆”测试标准进行判断。

另一方面，AI语音生成技术也触及知识产权与人格权的交叉地带。在Lehrman v. Lovo Inc.案中，两位配音演员起诉AI语音公司Lovo在未经许可的情况下使用其声音进行AI训练。尽管法院驳回了与版权和商标相关的多数主张，但保留了有关侵犯“公众形象权”（right of publicity）的指控，并允许原告补充关于AI训练侵犯版权的主张，反映出现行商标与版权法规在AI语境下存在空白地带。

二、AI公司训练大语言模型时涉及的侵权争议

随着大语言模型（LLM）训练对大规模文本素材的依赖日益增强，AI公司与内容权利人之间的版权争议日趋频繁，特别集中在训练过程中是否构成“复制”以及是否构成“合理使用”上。

在Anthropic一案中，加州法官认为其训练Claude模型时使用的数百万本图书素材构成“典型的变形性使用”，因而受“合理使用”原则保护。但法官也指出，Anthropic无权使用盗版副本构建其训练库，因此该案仍需在2024年12月正式开庭审理。

Meta也面临类似指控。一群作者状告其使用LibGen这一海量盗版图书数据库训练Llama模型。尽管法院驳回了大部分指控，但指出原告未能充分阐明AI输出是否削弱了人类作品的市场，也未提交相关实质证据。法官指出，尽管市场替代效应可能是“最具胜算的论点”，但在此案中原告对此几乎未作陈述。

在Thomson Reuters v. Ross Intelligence案中，法院对合理使用四要素进行了分析。尽管Ross仅使用案例中的headnotes作为索引信息，且未直接输出，但法院认定其产品缺乏“变形性”，而且属于商业性质，进而否定了其“合理使用”的主张。法院尤其强调了第四因素，即对原作品市场的影响，并指出若允许Ross的使用方式，将削弱Thomson Reuters向AI开发商授权数据的商业模式。这一判决成为AI训练合理使用抗辩失效的重要先例。

在Authors Guild et al. v. OpenAI一案中，原告主张OpenAI在未获授权的情况下复制并训练使用了完整图书，构成直接与间接侵权，并提出OpenAI删除了版权管理信息，违反《数字千年版权法》（DMCA § 1202）。2024年3月，法院驳回了间接侵权与次要责任相关的部分主张，但允许“直接侵权”核心指控继续推进。

New York Times Company v. Microsoft案则被认为是首起由大型媒体机构针对LLM训练行为提起的重大诉讼。该案指控微软及其合作伙伴OpenAI使用《纽约时报》文章进行训练，并在用户提示下生成与原文几乎一致的输出，严重损害其订阅和内容授权模式。目前案件仍在审理阶段，但其影响力极为广泛，可能直接塑造未来AI内容生成的版权边界。

就法律原则而言，美国版权法第106条指出，即便是短暂的复制，如存储于RAM中的内容，也可构成“复制行为”。而版权法第107条所确立的“合理使用”判断，需结合四项因素综合考量：一是使用目的与性质，特别是是否具有变形性；二是被使用作品的性质；三是所使用部分的数量与实质性；四是使用行为对原作品市场价值的影响。尤其是最后一项，近年来被法院强调为“最关键因素”。

司法判例方面，Google LLC v. Oracle America, Inc.案中，最高法院认为对Java API的使用具有变形性并带来公共利益，构成合理使用。Authors Guild v. Google, Inc.案中，法院认为Google扫描图书用于搜索索引并不替代原文，也构成合理使用。支持AI开发方的观点常将这些先例类比为LLM训练的正当性基础，但权利人则反驳认为LLM的输出内容可能构成替代与复制，从而超越“合理使用”的界限。

综上所述，AI的知识产权问题在现行美国知识产权体系下尚处于法律边界模糊阶段。版权法、专利法与商标法普遍坚持“人类参与”是保护前提，纯AI生成内容难以获得法律承认。与此同时，AI公司在训练过程中大量使用未经授权的素材，正引发日益广泛的诉讼潮。未来，诸如New York Times、Anthropic与OpenAI等案件的判决结果，预计将在界定版权侵权、合理使用、公众利益之间的平衡方面发挥关键作用，也将直接影响生成式AI产业的合规路径与创新空间。

顿时律师事务所

AI的知识产权问题：美国专利、商标、版权制度与大模型训练中的侵权争议

一、AI的知识产权问题——创作作品对美国专利、商标与版权制度的影响

二、AI公司训练大语言模型时涉及的侵权争议

最新文章

留言