更有某厂的 ai 产品发布会上直接出现了打着别家 logo 的图片。事后官方回应,各家的模型都是开源的,本来就可以互通有无。这解释一出,当时就曾引起过一轮关于 ai 作品版权问题的讨论。
“全源图库”其实也不例外,他家文生图和文生视频的功能就是在那段时间集中上线的。ao幼
周其野看着言谨,可以反推出她如何想到从这个角度发掘证据的过程,也可以想像她在这上面下了多大的功夫,但确实是意外的。在今天之前,他没想到她能做到这一步。
言谨仍旧在会议桌对面继续说下去,是对之前展示的所有证据的总结:“根据网信办刚刚发布的《生成式 ai 服务管理暂行办法》,生成式人工智能服务提供者应当依法开展训练数据处理活动,使用具有合法来源的数据和基础模型,不得侵害他人依法享有的知识产权。
“‘全源’ai 的训练素材里有未经授权的图片,苏迩的名字,以及射月计划、oonie 两项商标名称是在‘全源’平台上被高频使用的提示词,最终生成图片和视频也有明显相似的要素,所以原告方认为,被告方‘全源图库’的 aigc 作品侵犯了射月公司和原画作者苏迩的商标权与著作权。”
发言完毕,她关掉话筒,看向对面,等待质证。
庭前会议中的这一步,其实与法庭上的并没有多少不同,无非就是针对三性,合法性,真实性,客观性。而这段视频来自于公开路演,来源完全合法,真实性可考。这些图片是“全源”ai 模型的训练素材,也是总裁的亲口陈述。
既然来源和形式都没办法驳斥,只能提证明目的不认可,针对有无证明力和证明力的大小尽最后一点努力。
郭家阳仍侧首与孙力行讨论,又低低问答几句,才凑到话筒前面说:“‘全源’ai 从预训练,到优化训练,整个训练数据的处理过程都是按照网信办的要求进行的,公司内部设有专门的素材筛查岗位,定期上报检查结果,训练数据的清洁度一直都是达标的。”
但射月公司的内部律师对此类规定也很了解,紧接着反问:“现阶段这个过程都是自查的吧?”
孙力行在那边回答:“现行的行业规范要求的就只是自查。”
言谨纠正:“行业规范暂时的要求是自查。”重音落在“暂时”二字上。
射月公司的内部律师倒是笑了,说:“你们报上去的自查结果是清洁度达标,但我们现在看到的,是你们路演上都出现了未经我们授权的图片啊。”
言谨适时补充:“既然被告主张其训练过程合规,数据清洁度达标,原告方面申请法庭责令其在开庭之前提交相关证据,证明该主张。”
孙力行忽地笑出来,说:“这是要我们拿整个数据库出来自证无罪啊?”
却是法官打断他,说:“这不是自证,是你们是否放弃对原告最后这份证据的质证?如果认为涉及商业秘密,可以要求不公开庭审,或者不公开质证的过程。但如果你们放弃质证,那么法律后果也是很清楚的,法庭只能认定原告方主张的证据内容为真实,‘全源’ai 的训练素材里确实有原告为著作权、商标权权利人的图片,且未经原告授权。”
会议进行到此处,牌面显然对苏迩和射月公司更有利。
倘若没有路演上的那一点破绽,被告方本来可以坚持辩称,他们的训练数据就是干净的。反正谁主张谁举证,举证责任不能倒置,数据库里到底怎么回事,其实也只有公司内部极少数的人才知道。虽然比起著作权侵权,商标侵权对全源来说不好打,但只要把庭审的争议焦点集中在相似性的比对上,那么他们多少还有胜算。
但现在情况一下子扭转,举证压力来到了“全源”这一边。
周其野不禁想起郭家阳打过的那个比方——就像证明天鹅都是白的,要比反证天鹅并不都是白的困难得多。现在,轮到他们面对这个证明“天鹅皆白”的难题了。
时间已经将近傍晚,不出意外的话,这一次庭前会议差不多就该结束了。
但也是这个时候,周其野先提出,被告方希望单独与法官谈话。
于是,桌子对面那几位进了法官的办公室,言谨等人仍旧在会议室里等待。她趁这空档去了趟洗手间,又在走廊上透了会儿气,隔窗望远。
戴左左跟着从会议室里出来,递给她一瓶水,说:“你差不多讲一下午话了,都没怎么见你喝水。”
言谨道了谢接过去,但也只抿了一小口,就盖上了瓶盖,说:“不知道几点才完,不敢多喝。”
左左说:“还真是,一个会开大半天。我上次为上厕所这么焦虑好像还是高中里,数学老师老是占课考试,课间还不让休息。”