AI先把创作者搞糊涂了

版权法的核心逻辑是保护人类的创造性劳动。这个逻辑在过去几百年里运转得不错——谁是作者、谁是权利人,虽然也有纠纷,但至少争议的框架是清楚的。AI的出现把这个框架打乱了。

打乱的点主要在两个方向。第一个方向是输入端:你用海量受版权保护的内容训练AI模型,这些内容的原作者有没有权利要求你获得授权或支付报酬。第二个方向是输出端:你用AI生成的内容——一幅画、一首歌、一段文字——这个东西有没有版权,如果有,归谁。

这两个问题目前都没有终极答案,但从法院判例和监管机构发布的指引中,已经可以看清几条在走的方向。了解这些方向不是为了知道「最终答案」,而是为了在当前的模糊地带里控制自己的法律风险。

输出端:AI生成的内容能获得版权保护吗

这个问题的答案,目前在中国和美国有趋同的迹象——都指向同一个判断标准:人类在创作过程中的参与程度。

中国在2023年底由北京互联网法院做出一个引发广泛讨论的判决:一张由AI生成的图片不能被认定为受著作权法保护的作品,因为著作权法保护的是「人类的智力成果」。但法院同时指出,如果人类在AI生成内容的过程中投入了足够多的创造性选择——比如反复调整提示词、人工筛选和修改生成结果——那么最终成果可能因为体现了人的独创性而获得保护。

这个判决实际上建立了一个「光谱」而不是二选一的规则:完全由AI独立生成的内容不受保护,但人类通过AI工具创作的内容可能受保护,关键看人的参与程度。这个分寸在后续的同类案件中还会被反复检验和界定。

美国版权局在2023-2025年间发布了几份指引和裁定,立场与中国法院基本一致:纯AI生成的内容不注册版权,但如果人类对AI生成的内容进行了足够有创造性的选择、编排或修改,该内容中属于人类贡献的那部分可以获得保护。美国版权局的最新立场进一步细化了「人类贡献」的标准——不是随便调了几个参数就算参与,而是需要有实质性的、可以辨认的创造性判断。

对这个规则的实际影响,举一个具体的例子说明。你用AI工具生成了一张产品的宣传图,如果你只是输入了一句简单的描述然后直接使用,这张图在当前规则下很可能不受版权保护——意味着别人也可以拿来用。但如果你在AI生成的基础上做了实质性的修改、添加了原创元素、或者通过多轮精细的提示词引导AI输出符合你设计意图的结果,那么最终作品中有你创造性贡献的部分是受保护的。

输入端:用版权内容训练AI算不算侵权

这个问题的争议激烈程度远高于输出端。因为如果训练环节被认定为需要授权,那整个AI产业的底层逻辑就需要重塑。

目前全球范围内还没有一个终局性的判例来彻底回答这个问题,但有几个趋势值得关注。在美国,多家版权方(包括媒体机构和图像版权平台)已经提起诉讼,指控AI公司将受版权保护的作品用于模型训练构成了侵权。但被告一方的核心抗辩是「合理使用」——即训练AI模型是对已有作品的「转换性使用」,不构成对版权作品的市场替代。这些案件目前还在审理中,判决结果将可能改变整个行业的基础规则。

在中国,关于AI训练数据的版权讨论更多集中在监管层面而不是司法层面。2024年公布的《生成式人工智能服务管理暂行办法》对训练数据的合法性提出了要求,但具体如何界定「合法来源」、训练数据的版权授权机制应该怎么设计,目前还在探索阶段。一个关键的政策信号是,监管层倾向于先规范AI服务提供者的行为(要求服务提供者对训练数据负责),然后才考虑数据提供者之间的版权利益分配。

对使用AI工具的企业和个人来说,输入端风险的现实关注点在于:如果你用AI生成的内容涉嫌与某个特定版权作品「实质性相似」——比如生成的图片与某位摄影师的某张知名作品非常像——那么你可能会面临侵权的风险,不管AI是怎么训练出来的。因此,使用AI生成商业用途内容时,做一次反向图片搜索或内容查重是一个值得养成的习惯。

这个领域的法律还在快速变化

用AI生成内容的人需要知道:你当前做的事,相关的法律规则可能还没有写出来,或者写了但还没有被法院解释清楚。这不是说你可以不管规则——恰恰相反,在规则不明确的时期,保守的做法是:在使用AI生成内容做商业用途时保留你的人类创作过程的记录(提示词、修改过程、筛选标准),以避免在未来规则收紧时处于被动。同时,如果AI生成的内容与某个已知的第三方作品高度相似,不要侥幸——改掉或者不用,比收到律师函之后再处理要简单得多。