所在位置:

首页

>

正文

境内平台使用ChatGPT?至少注意这些

2023年10月18日

来源:中国国际贸易促进委员会北京市分会

2023年10月18日

来源:中国国际贸易促进委员会北京市分会

 

近日,实践中,针对部分调用OpenAI的ChatGPT产品接口的境内平台,部分地区的互联网信息办公室(即网信办)根据《网信部门行政执法程序规定》第三十八条[1]、《生成式人工智能服务管理暂行办法》(“《AIGC暂行办法》”)第十七条[2]、第二十一条[3],与该等境内平台的平台运营方进行了约谈。与此同时,七月底以来,苹果APP Store对中国内地中大量提供类ChatGPT服务的应用进行集中下架,其中不少亦是利用OpenAI提供的API服务所开发的应用,根据部分平台运营方收到的苹果官方下架通知,应用下架的主要原因在于应用与ChatGPT相关,而ChatGPT在中国没有获得运营所必需的许可。

该等实践意味着在《AIGC暂行办法》正式生效后,境内平台利用境外技术支持方提供的服务向中国境内用户提供生成式人工智能服务的合规要求正在逐渐全面跟上。以下,我们针对该等具体合规要求展开讨论,供境内平台的平台运营方在与境外技术支持方进行合作的过程中进行参考。

总体而言,境内平台使用境外生成式人工智能服务主要通过直接调用境外生成式人工智能服务、接入境外生成人工智能服务的可编程接口(即API)等方式实现。以OpenAI为例,根据OpenAI官网的说明,目前OpenAI提供的服务包括ChatGPT、DALL-E等非API服务(non-API consumer services)以及API服务这两种类型。不过,目前OpenAI的前述两种服务均未面向中国内地以及中国香港地区的用户开放;实践中,境内平台主要借助于虚拟专用网络(即VPN)通过中国境外IP地址使用OpenAI提供的服务,该种使用方式本身存在一定的违规风险,例如违规建立或租用虚拟专用网络等国际联网相关风险。

即使境外主体提供的生成式人工智能服务向中国境内用户开放,在境内平台使用该等服务向境内用户提供生成式人工智能服务的情况下,利用生成式人工智能技术向中华人民共和国境内公众提供生成文本、图片、音频、视频等内容服务的组织、个人均属于《AIGC暂行办法》项下的生成式人工智能服务提供者,应当履行生成式人工智能服务提供者的责任与义务。因此,境外主体以及境内平台的平台运营方均属于生成式人工智能服务提供者,应当遵守《AIGC暂行办法》《互联网信息服务深度合成管理规定》(“《深度合成管理规定》”)《互联网信息服务算法推荐管理规定》(“《算法推荐管理规定》”)等中国相关法律法规的规定,倘若存在违规情况,根据《AIGC暂行办法》,国家网信部门有权通知有关机构采取技术措施和其他必要措施对境外的技术支持方予以处置,而该等处置措施极有可能会对使用境外生成式人工智能服务的境内平台造成较大影响。

当前,境内平台使用境外生成式人工智能服务的合规要点主要在资质要求、数据跨境合规、数据训练合规等方面,具体如下:

一、资质要求

(一)算法备案

为满足生成式人工智能服务的透明度要求,根据《AIGC管理办法》《深度合成管理规定》《算法推荐管理规定》,平台运营方、技术支持方均应当履行算法备案的义务。因此,在境内平台使用境外生成式人工智能服务的场景下,境外的技术支持方以及境内的平台运营方均应当进行算法备案,具体而言[4]:

在算法类型方面,境外的技术支持方以及境内的平台运营方均应当选择“生成合成类(深度合成)算法”这一算法类型进行算法备案;

在备案角色方面,境外的技术支持方应当作为深度合成服务技术支持者进行算法备案,境内平台的平台运营方应当作为深度合成服务提供者进行算法备案;

《算法推荐管理规定》进一步明确,如技术支持方以及平台运营方未依法履行备案手续的,由网信部门和电信、公安、市场监管等有关部门依据职责给予警告、通报批评,责令限期改正;拒不改正或者情节严重的,责令暂停信息更新,并处一万元以上十万元以下罚款。

(二) 安全评估

根据《AIGC管理办法》《深度合成管理规定》《算法推荐管理规定》《具有舆论属性或社会动员能力的互联网信息服务安全评估规定》(“《安全评估规定》”),境外的技术支持方、境内平台的平台运营方还应当完成以下两种类型的安全评估:一是按照《安全评估规定》通过全国互联网安全管理服务平台完成具有舆论属性或社会动员能力的互联网信息服务安全评估;二是针对生成式人工智能服务进行新技术新应用安全评估(即双新评估),而关于双新评估的具体流程以及要求仍有待监管部门进一步公开。

根据《安全评估规定》,如技术支持方、平台运营方拒不依法开展安全评估的,网信部门和公安机关将通过全国互联网安全管理服务平台向公众提示其提供的服务存在安全风险。

二、数据跨境合规

在境内平台使用境外生成式人工智能服务的场景下,中国境内用户在境内平台的输入端口提出问题后,该问题会传输到位于境外的技术支持方,技术支持方模型给出相应回答后,该回答便会传输到境内平台的用户端口以实现对问题的反馈。按照该服务模式,境内平台的平台运营方向境外技术支持方传输用户输入数据的过程中,平台运营方有可能涉及将中国境内用户的个人信息传输至境外。

在此种情形下,对于平台运营方而言,平台运营方应当按照《中华人民共和国个人信息保护法》(“《个人信息保护法》”)《数据出境安全评估办法》《个人信息出境标准合同办法》等相关法律法规履行个人信息跨境传输相关的合规要求,包括数据出境安全评估/个人信息保护影响评估、个人信息出境标准合同签订和备案、用户告知等。

对于境外技术支持方而言,在技术支持方与平台运营方签订个人信息出境标准合同的情形下,技术支持方应当履行该等标准合同项下境外接受方的义务,例如确保个人信息的保存期限为实现处理目的所必要的最短时间,保存期限届满的,应当删除个人信息(包括所有备份)。同时,技术支持方还应当按照标准合同的约定,结合其所在国家或者地区的个人信息保护政策和法规,对于该等政策和法规对于技术支持方履行标准合同约定义务的影响进行评估。

根据《个人信息保护法》,如平台运营方、技术支持方违反上述要求,平台运营方、技术支持方将被中国境内的主管部门处以责令改正、给予警告、没收违法所得、罚款等行政处罚;违法处理个人信息的应用程序,将被责令暂停或者终止提供服务;直接负责的主管人员和其他直接责任人员将被处以一万元以上十万元以下罚款。此外,平台运营方、技术支持方还可能因违反技术支持方所在国家或者地区可适用的个人信息保护政策和法规面临相应的处罚风险。

三、数据训练合规

数据是大模型最底层的“原料”,而数据训练是对“原料的使用”,数据训练合规是满足服务生成内容合规的重要前提,技术支持方、平台运营方应当按照《AIGC暂行办法》[5]的要求,开展预训练、优化训练等训练数据处理活动。

在境内平台使用境外生成式人工智能服务的场景下,境内平台运营方应当特别关注数据和基础模型来源合法、知识产权合规以及个人信息保护等方面的要求。具体而言,

(一) 数据和基础模型的来源合法

关于数据和基础模型,一般由境外技术支持方提供基础模型以及该等基础模型的训练数据。为满足相应的合规要求,平台运营方应对于境外技术支持方提供的基础模型和数据来源的合法性进行必要的审查,对技术支持方数据安全保护能力开展尽职调查。在平台运营方与技术支持方签署的相关技术服务合同中,平台运营方可以要求技术支持方对数据和基础模型来源的合法合规性进行陈述保证,明确双方的权利义务,避免因技术支持方所提供的基础模型和/或数据来源合法性问题影响平台运营方业务的持续开展。

(二) 知识产权合规

在模型训练的过程中,在数据收集阶段、数据预处理阶段、结果生成阶段分别可能涉及对于数据的复制、翻译、改编、汇编、信息网络传播等受到著作权法等知识产权相关法律法规规制的行为。而在模型的训练数据库涉及未经授权使用他人享有知识产权的数据及内容的情形下,天然具有知识产权侵权风险。以ChatGPT为例,ChatGPT的数据源包括用户输入内容和训练数据库。其中,用户输入内容包括用户使用ChatGPT等非API服务提供的数据;训练数据库则包括以下三种类型的数据:公有领域内容、通过签订合同获得合法授权的内容、未经授权的信息及内容。倘若技术支持方提供的模型的训练数据库涉及未经授权的信息及内容,在境内平台生成内容与该等信息及内容存在实质性相似的情形下,技术支持方、平台运营方往往并不属于合理使用,从而均有可能承担相应的侵权责任。为降低前述侵权风险,在要求技术支持方确保数据来源合法合规性的同时,我们也建议技术支持方、平台运营方对于生成内容进行一定程度的审核,确保生成内容在表达方面与原始的信息及内容在存在显著区分。

(三)个人信息保护

如前文所述,在部分情形下,用户输入内容将成为技术支持方模型的训练数据。例如,根据OpenAI官网的说明,用户通过ChatGPT、DALL-E等非API服务提供的数据将成为ChatGPT的训练数据,除非用户选择关闭训练模式;而用户通过API提供的数据将不会作为ChatGPT的训练数据,除非用户另行进行授权[6]。而该等用户输入内容中可能包含用户的个人信息。参考全国信息安全标准化技术委员会发布的《信息安全技术 机器学习算法安全评估规范(征求意见稿)》的要求[7],我们建议平台运营方针对将用户个人信息用于数据训练取得用户同意(针对人脸信息等敏感个人信息还应取得用户的单独同意),并向用户提供不使用个人信息用于数据训练的选项;此外,平台运营方、技术支持方还可以考虑对于收集的个人信息进行必要的匿名化处理,以降低数据训练活动对于用户个人权益的影响。

如技术支持方、平台运营方未按照《AIGC暂行办法》的规定开展训练数据处理活动,除《个人信息保护法》《中华人民共和国著作权法》等法律法规明确规定的法律责任以外,技术支持方、平台运营方还可能被处以警告、通报批评、责令限期改正、责令暂停提供相关服务等行政处罚。

四、结语

相较于中国境内的技术支持方,境外的技术支持方在落实相关合规要求的过程中面临更高的不确定性。同时,在涉及境外主体的情况下,技术支持方、平台运营方还可能需要满足其他国家或地区更为严苛的合规要求。因此,我们建议,境内平台与境外的技术支持方开展生成式人工智能服务相关合作时,厘清各方的责任与义务,及时关注所涉国家和地区的监管动态,在合法合规的前提下开展跨境业务合作。

*本文对任何提及“香港”和“香港特别行政区”的表述应解释为“中华人民共和国香港特别行政区”。

脚注:

[1] 《网信部门行政执法程序规定》第三十八条规定,网信部门对当事人作出行政处罚决定前,可以根据有关规定对其实施约谈,谈话结束后制作执法约谈笔录。

[2] 《生成式人工智能服务管理暂行办法》第十七条规定,提供具有舆论属性或者社会动员能力的生成式人工智能服务的,应当按照国家有关规定开展安全评估,并按照《互联网信息服务算法推荐管理规定》履行算法备案和变更、注销备案手续。

[3] 《生成式人工智能服务管理暂行办法》第二十一条规定,提供者违反本办法规定的,由有关主管部门依照《中华人民共和国网络安全法》、《中华人民共和国数据安全法》、《中华人民共和国个人信息保护法》、《中华人民共和国科学技术进步法》等法律、行政法规的规定予以处罚;法律、行政法规没有规定的,由有关主管部门依据职责予以警告、通报批评,责令限期改正;拒不改正或者情节严重的,责令暂停提供相关服务。构成违反治安管理行为的,依法给予治安管理处罚;构成犯罪的,依法追究刑事责任。

[4] 详见《互联网信息服务深度合成管理规定》备案填报指南,链接地址:https://beian.cac.gov.cn/api/file/fileDownLoad?noticeId=notice_4b62813c-b5cd-4bf0-b1ff-5c140decda7f

[5] 《AIGC暂行办法》第七条规定,生成式人工智能服务提供者(以下称提供者)应当依法开展预训练、优化训练等训练数据处理活动,遵守以下规定:(一)使用具有合法来源的数据和基础模型;(二)涉及知识产权的,不得侵害他人依法享有的知识产权;(三)涉及个人信息的,应当取得个人同意或者符合法律、行政法规规定的其他情形;(四)采取有效措施提高训练数据质量,增强训练数据的真实性、准确性、客观性、多样性;(五)《中华人民共和国网络安全法》、《中华人民共和国数据安全法》、《中华人民共和国个人信息保护法》等法律、行政法规的其他有关规定和有关主管部门的相关监管要求。

[6] How your data is used to improve model performance,链接地址:https://help.openai.com/en/articles/5722486-how-your-data-is-used-to-improve-model-performance

[7] 《信息安全技术 机器学习算法安全评估规范(征求意见稿)》第6.1条第g)项规定,相关组织和个人在开发或运营机器学习算法时,应确保所开发或运营的机器学习算法的隐私性,确保处理数据遵守法律和法规要求,保护个人信息和隐私,避免存储、泄漏敏感数据,包括但不限于:1) 未经个人同意,不应使用其个人信息开展机器学习算法相关活动。法律法规规定无需同意的情况除外;2) 对个人信息采用必要的数据脱敏措施。

来源:金杜研究院,本文转载自金杜律师事务所官方网站(https://www.kwm.com/cn/zh/home.html

作者:

  • 张逸瑞,合伙人,知识产权部;业务领域:知识产权、数字资产管理交易和战略运营;邮箱: zhangyirui@cn.kwm.com
  • 冯宝宝,律师,知识产权部
  • 张一凡,律师助理,知识产权部

声明:本篇文章的所有内容仅供参考与交流,不代表金杜律师事务所的法律意见以及对法律的解读。

信息内容来源于贸法通平台 ,报告内容仅供预警与风险提示,供参考之用,不能将其视为做出决策的唯一依据。如有任何意见与信息反馈,请与我们联系。

北京市贸促会法律部

联系人:田博文

电子邮件:tianbowen@ccpitbj.org

电话:010-88070495;13718609060

主办:北京市贸促会     建设运维:北京市贸促会综合事务中心

京1CP证12017809号-3|京公网安备110102000689-3号