您当前位置: 社科研究
加快构建法律人工智能应用体系的四个面向
2023-06-01 09:50:54

摘要:当前我国智慧法院、智慧检务、智慧警务体系初具规模,标志着我国法律人工智能建设领域取得了阶段性成果。随着我国数字中国战略的实施、智能社会的建设加速,加快法律人工智能基础理论、支撑体系、关键技术、创新应用研发,形成具有中国特色的法律人工智能理论体系和应用体系,需要推进智能社会数字法治建设的理论体系和制度体系研究、高品质法律数据集及关键数据基础设施建设、匹配和适合我国智能社会、数字法治场景的法律人工智能算法研发及应用、推动建立国家统一法律人工智能算力网络体系等四个方面采取积极行动。

关键词:法律人工智能;智能社会;数字中国;数字法治;

当前,以ChatGPT为代表的生成式人工智能异军突起,在全球掀起一股人工智能的科技巨浪。计算机专家依据人工智能体的“智力水平”,将人工智能分为“弱人工智能”、“强人工智能”与“超人工智能”,生成式人工智能就属于“强人工智能”(或通用人工智能)的范畴。法律人工智能是人工智能在法律领域的应用分支,其中发端最早、应用最为广泛的当属司法人工智能。

我国虽然不是最早研发法律人工智能的国家,但却是有计划推行法律人工智能,堪称世界法律人工智能应用最广泛的国家——时至今日,自上而下、遍布全国数以千计的智慧法院、智慧检务、智慧警务体系,标志着我国法律人工智能1.0版已经取得了阶段性成果。随着我国数字中国战略的实施、智能社会的建设加速,加快法律人工智能基础理论、支撑体系、关键技术、创新应用研发,形成具有中国特色的法律人工智能理论体系和应用体系,成为当务之急。结合法律人工智能前沿理论与技术,笔者以为,建设2.0版的法律人工智能,应当注意以下四个方面的工作。

首先,推进智能社会数字法治建设的理论体系和制度体系研究。数字法治建设是以全面依法治国和数字中国战略为指引,在法治领域开展智能社会实验的系统化法治建设工程。自20世纪50年代中期人工智能概念提出至今,人类社会已经迈进“数字文明”的崭新时代。在过去的半个多世纪,得到计算社会科学、神经与认知科学、信息传播科学的滋养,特别是机器学习技术、自然语言处理技术、纳米技术、大数据技术等科技体系的支撑,人工智能不仅突飞猛进,而且成为新文明的核心引擎和重要驱动力。当前,在我国实施全面依法治国、数字中国两大战略背景下,我们要抢占世界科技前沿阵地,人工智能、特别是法律人工智能的战略地位和战略价值不容低估!未来,需要立足于数字社会、智能社会的具体场景,研究人工智能时代的法治新理念、新范式及相应的制度建设、立法路线图;研究人工智能场景下的数据治理法律法规体系,提出符合人工智能发展的数据治理法律体系建设方案;研究人工智能算法治理法律法规体系,对算法的透明度、公平性、包容性、可控性、可问责性进行研究,并围绕算法可信、可靠、可用、可控的原则,研究制定人工智能算法治理的立法建议和审计评估制度建设方案等。值得注意的是,除了为数不多的专门数字立法,我国现行法律体系主要是规范自然状态下的社会关系,对于智能社会、数字社会数字法治治理所需要的“数字法律体系”,存在巨大的法律理论与制度规范缺口。

其次,注重高品质法律数据集及关键数据基础设施建设。数据,号称数字时代的“石油”,是数字经济的真正“硬通货”,我国政府已经正式把数据确定为具有资产属性的生产要素。对人工智能技术而言,是否能够提供足够强大的数据集,供智能体进行自主学习和训练,是发展强人工智能技术、推动人工智能技术实现跃升的关键所在。强人工智能或通用人工智能不是弱人工智能的简单集合,二者在训练数据方面存在量级的差别。以OPENAI公司的自然语言处理机器学习技术演进为例,GPT-1的参数量为1.17亿、5GB,GPT-2具有来自800万个文档、40GB的文本数据,而GPT-3具有1750亿个参数、45TB数据集,到了GPT-4就有了1.8万亿个参数、1PB数据集。关于人工智能演进“成长”所需要的数据,除了“量级”保障,另一个关键指标是其“品质”,即可供机器学习的数据集应当是干净的,而非“脏数据”。所谓“脏数据”,通俗的讲,就是无效、错误、没有实际意义的数据,这类数据直接影响数据质量分析的结果。我国法律人工智能的基础数据集是中国法院裁判文书网超过1亿的生效判决、裁定。客观地说,这个数据集来源在世界范围内来看,都是个无与伦比的庞大数据资源,是我国法律人工智能建设的“天然宝库”;然而,由于裁判文书来自全国各地层级不同的法院,对于“类案类判”而言,各地法院的裁决千差万别,这就大大降低了机器学习数据的质量,进而直接影响到未来智能体结论的统一性、准确性、可靠性。如何统一全国各级执法、司法机关的裁判尺度,进而建立一个相对高质量的数据集,是当前我国法律人工智能建设面临的艰巨任务、重大挑战。此外,围绕数据采集、数据交易、数据出境等关键基础设施建设,也需要确立相对统一的标准规范,从而培育统一数字、数据市场、降低交易成本、维护国家数据安全和数字主权。

再次,加快匹配和适合我国智能社会、数字法治场景的法律人工智能算法研发及应用。智能社会,亦即数字社会,是数字时代由数字技术驱动的智慧社会、算法社会,是比信息社会、网络社会更高级的社会形态。有学者提出,数字社会的高级阶段是智慧社会,是高度“被感知、互联互通、数字化和被计算、透明、智能化的社会”,是“无算法不社会”的算法社会。由于算法本质上是一种运算法则、一种指令,这与法律的本质契合:法律是一种命令、规则或规范,如果被违背则将带来某种不利的法律后果。在算法无处不在的数字社会、智能社会中,算法将被赋予类似法律的性质和地位,同时承担与法律相仿佛的职能,这将是无法避免的趋势。哈佛大学教授劳伦斯·莱斯格将产生法律效果的算法形象拟为“代码即法律”(code is law);事实上,“法典”(code)与“代码”在英语中是同一个词汇。众所周知,算法本身带有若干风险,如算法黑箱、算法歧视等等;另一方面,智能社会、数字社会又无处不弥漫着各种算法,这就要求与公众日常生活联系紧密、关乎国计民生与国家安全、关系用户自身隐私、财产、商业利益或其他重要权益等方面的算法,必须符合更高的技术标准和法律标准,必须与智能社会发展水平相适应、相匹配。显然,法律人工智能就属于这类算法。一般来说,法律人工智能总体上面向文化程度与专业化程度较高的用户群体,但鉴于我国公民的数字化素养程度参差不齐,法律人工智能算法的研发,在确保安全、合规的同时,还应当兼顾普适性、泛在性、操作便利性、非歧视等要求。

最后,利用举国体制优势,推动建立国家统一法律人工智能算力网络体系。科技是一把双刃剑,数字社会、智能社会建设面临“数字化”本身带有的一系列特殊困难,如数据孤岛、信息茧房、数字壁垒、数字鸿沟等等。加上数据价值链条上的不同主体具有不同的利益诉求,必然形成数据流通、数据价值传输的巨大障碍,最终影响到算力,致使人工智能无法充分产生应有的效益。我国幅员广阔、人口众多、各地发展水平差异极大,地缘因素同样会造成算力不均衡和人工智能适用的不公平现象。2022年2月我国实施了“东数西算”工程,就是为了改变这种情况而做出的努力。“东数西算”工程意在打通“数”动脉,织就全国算力一张网,有利于提升国家整体算力水平,对于数字中国战略落地意义极为重大。2017年7月国务院发布了《新一代人工智能发展规划》,提出要实现法院审判体系和审判能力智能化;与此同时,最高人民法院、最高人民检察院出台了信息化建设规划,一些地方制定了智慧法院、智慧检察建设方案,成效显著。但由于我国法律人工智能建设领域普遍存在本位主义、地方保护、各自为战、重复建设等现象,严重制约了算力的发挥,也不符合集约化、规模化、绿色化的发展要求。因此,借鉴“东数西算”的成功经验,充分利用举国体制的政治优势,建立全国统一的法律人工智能算力网络体系,形成强大的算力优势、制度优势,对于贯彻落实党的二十大提出的网络强国、数字中国战略具有不可估量的价值和重要意义。

(作者系常州大学史良法学院教授、数字法律科学研究所所长)

来源:中国社会科学网

网站所属:玉溪市社会科学界联合会
单位地址:玉溪市红塔区抚仙路86号高新科技大楼A1301室
域名:http://www.yxshkxj.cn | Email:yxsklkyb@163.com | 电话:0877-2033863
滇ICP备17008377号-1滇公网安备 53040202000256号