top of page
搜尋

生成式人工智能的法律边界:美国专利、商标、版权制度与大模型训练中的侵权争议

  • BDeng
  • 7月29日
  • 讀畢需時 5 分鐘

随着生成式人工智能在创作、设计与内容生成等领域的广泛应用,其所产生的作品对美国现行的专利、商标和版权制度提出了前所未有的挑战。同时,AI公司在训练大型语言模型过程中对海量素材的抓取与使用,也引发了关于版权侵权与合理使用的密集法律争议。本文旨在梳理相关政策动向与重点司法案例,分析AI创作在现行法律框架下的归属问题,以及AI训练数据使用所面临的合规风险与判例启示。


一、AI创作作品对美国专利、商标与版权制度的影响


美国版权局(U.S. Copyright Office)明确指出,如果作品中的传统创作元素由机器生成、而非由人类完成,该作品将不被视为具有“人类作者身份”,因此无法获得版权保护。换言之,即使用户仅通过简单指令促使生成式AI创作出复杂作品,也不构成受版权保护的条件。只有当人类在作品中做出了选择、编辑、结构安排等实质性创意贡献时,该作品才有可能被视为“AI辅助创作”,从而具备注册资格。截至2024年2月,版权局已经注册超过100件AI辅助作品,并强调申请人有义务披露AI使用情况。若未如实披露,可能导致注册被取消。


此外,在专利系统中,AI全自动生成的大量出版物虽可能缺乏可实施性或技术启示性,但仍可能被引用为现有技术,对专利申请造成巨大负担。随着AI生成技术不断进化,其生成内容将更有可能被视为具有可实施性的公开技术信息,从而对整个专利审查体系带来新的挑战。


在专利领域,美国专利商标局(USPTO)重申现行法律仍要求专利发明人必须为自然人。在Thaler v. Vidal一案中,联邦巡回法院裁定AI系统不能被列为发明人。这一立场目前仍占主导地位。USPTO建议专利申请人务必清晰记录人类在AI辅助发明过程中的贡献,以应对可能更严格的审查。同时,随着AI被广泛用于专利检索和先前技术分析,相关实务操作也在快速演变。


在商标保护方面,AI生成的图像若涉及未经授权的知名品牌元素,例如迪士尼公主或小黄人角色,则可能构成商标侵权或商标稀释,依据的是《Lanham Act》第1125条。目前,Disney与Universal已对图像生成公司Midjourney提起诉讼,指控其图像系统是“无底线的抄袭机器”,该案尚未裁决,但被普遍认为可能成为界定合理使用、变形性表达与商标侵权之间界限的重要案件。此外,若AI输出内容在品牌标识(如Logo或Slogan)上高度接近真实商标,则法院可能适用Polaroid Corp. v. Polarad Elecs. Corp.确立的“消费者混淆”测试标准进行判断。


另一方面,AI语音生成技术也触及知识产权与人格权的交叉地带。在Lehrman v. Lovo Inc.案中,两位配音演员起诉AI语音公司Lovo在未经许可的情况下使用其声音进行AI训练。尽管法院驳回了与版权和商标相关的多数主张,但保留了有关侵犯“公众形象权”(right of publicity)的指控,并允许原告补充关于AI训练侵犯版权的主张,反映出现行商标与版权法规在AI语境下存在空白地带。


二、AI公司训练大语言模型时涉及的侵权争议


随着大语言模型(LLM)训练对大规模文本素材的依赖日益增强,AI公司与内容权利人之间的版权争议日趋频繁,特别集中在训练过程中是否构成“复制”以及是否构成“合理使用”上。

在Anthropic一案中,加州法官认为其训练Claude模型时使用的数百万本图书素材构成“典型的变形性使用”,因而受“合理使用”原则保护。但法官也指出,Anthropic无权使用盗版副本构建其训练库,因此该案仍需在2024年12月正式开庭审理。


Meta也面临类似指控。一群作者状告其使用LibGen这一海量盗版图书数据库训练Llama模型。尽管法院驳回了大部分指控,但指出原告未能充分阐明AI输出是否削弱了人类作品的市场,也未提交相关实质证据。法官指出,尽管市场替代效应可能是“最具胜算的论点”,但在此案中原告对此几乎未作陈述。


Thomson Reuters v. Ross Intelligence案中,法院对合理使用四要素进行了分析。尽管Ross仅使用案例中的headnotes作为索引信息,且未直接输出,但法院认定其产品缺乏“变形性”,而且属于商业性质,进而否定了其“合理使用”的主张。法院尤其强调了第四因素,即对原作品市场的影响,并指出若允许Ross的使用方式,将削弱Thomson Reuters向AI开发商授权数据的商业模式。这一判决成为AI训练合理使用抗辩失效的重要先例。


Authors Guild et al. v. OpenAI一案中,原告主张OpenAI在未获授权的情况下复制并训练使用了完整图书,构成直接与间接侵权,并提出OpenAI删除了版权管理信息,违反《数字千年版权法》(DMCA § 1202)。2024年3月,法院驳回了间接侵权与次要责任相关的部分主张,但允许“直接侵权”核心指控继续推进。


New York Times Company v. Microsoft案则被认为是首起由大型媒体机构针对LLM训练行为提起的重大诉讼。该案指控微软及其合作伙伴OpenAI使用《纽约时报》文章进行训练,并在用户提示下生成与原文几乎一致的输出,严重损害其订阅和内容授权模式。目前案件仍在审理阶段,但其影响力极为广泛,可能直接塑造未来AI内容生成的版权边界。


就法律原则而言,美国版权法第106条指出,即便是短暂的复制,如存储于RAM中的内容,也可构成“复制行为”。而版权法第107条所确立的“合理使用”判断,需结合四项因素综合考量:一是使用目的与性质,特别是是否具有变形性;二是被使用作品的性质;三是所使用部分的数量与实质性;四是使用行为对原作品市场价值的影响。尤其是最后一项,近年来被法院强调为“最关键因素”。


司法判例方面,Google LLC v. Oracle America, Inc.案中,最高法院认为对Java API的使用具有变形性并带来公共利益,构成合理使用。Authors Guild v. Google, Inc.案中,法院认为Google扫描图书用于搜索索引并不替代原文,也构成合理使用。支持AI开发方的观点常将这些先例类比为LLM训练的正当性基础,但权利人则反驳认为LLM的输出内容可能构成替代与复制,从而超越“合理使用”的界限。


综上所述,AI生成内容在现行美国知识产权体系下尚处于法律边界模糊阶段。版权法、专利法与商标法普遍坚持“人类参与”是保护前提,纯AI生成内容难以获得法律承认。与此同时,AI公司在训练过程中大量使用未经授权的素材,正引发日益广泛的诉讼潮。未来,诸如New York Times、Anthropic与OpenAI等案件的判决结果,预计将在界定版权侵权、合理使用、公众利益之间的平衡方面发挥关键作用,也将直接影响生成式AI产业的合规路径与创新空间。


(郑重申明: 发布的信息仅供参考,不应视为有关任何主题的法律依据或建议。版权所有,转载需获得顿时律所许可。)

留言

評等為 0(最高為 5 顆星)。
暫無評等

新增評等
  • Twitter
  • Instagram

©2020 by AllBelief Law Firm. 郑重申明: 本网站上所展示的信息仅供参考,不应视为有关任何主题的法律依据或建议。

bottom of page