当前位置:首页 > 黑猫 > 大数据时代网信行政执法的智能化探索

大数据时代网信行政执法的智能化探索

关键词:   发布时间:2019-08-12 08:00:01

作为一个网信执法的门外汉,接受品新老师邀请时,内心是惶恐的,但作为互联网时代的内容生产者和消费者,又觉得有必要来跟大家分享一下自己在法律科技公司,尤其是从事检法信息化的一些经历,期待能更好地促进网信执法合法、合规,更好地服务好互联网时代的内容生产工作。

网信行政执法现状

在这个万物互联、移动互联的时代,每个人都与网络、网络内容有着千丝万缕的关系。

根据联通大数据发布的移动app使用数据来看,微信、QQ、爱奇艺、腾讯视频、搜狗输入法、支付宝、手机淘宝、新浪微博、UC浏览器、应用宝是人们最常用的十大移动应用,活跃用户数也都是数亿级。每个网络用户使用的app平均也有三四十个。

我们使用的app不仅多,而且在上面耗费的时长也越来越长,甚至出现了“国民总时间”的概念,各个厂商都开始利用各种手段来争夺用户在自己应用上的停留时间。


为了争夺国民总时间,互联网运营者考虑的是要提供什么样的内容才能更吸引人、把人留的时间更长,而这些内容是否妥当可能就不是其考虑的重点了,而这也是国家网信部门设立的重要原因。

根据国务院授权规定,国家互联网信息办公室负责全国互联网信息内容管理工作,并负责监督管理执法。

由此也引发了网信执法的几个特点:

1.监督面广

网信部门对互联网内容进行监管,主要监管网络中如下不良信息:

同时,我们通过检索裁判文书网公开裁判文书中含有互联网内容的案件,发现涉及民间借贷、网络信息传播权、传播权、侵权等内容非常多见。

从网信部门接收违法信息举报类型来看,涉情色方面的信息最多,大概占86%以上,其他涉及侵权、诈骗、赌博、网络敲诈有偿删帖、涉时政有害的也是比较主要的违法信息类型。


2.线索多

根据网信行政执法程序规定,网信执法受理案件线索来源:

(一)在监督检查中发现案件线索的;

(二)自然人、法人或者其他组织投诉、申诉、举报的;

(三)上级机关交办或者下级机关报请查处的;

(四)有关部门移送或者经由其他方式、途径发现的。

其中最大量的就是接受举报,根据网信办公布的数据,每年接受有效举报几千万件,单月就有八九百万件;以北京为例,2018年6月以来,接收的违法信息举报就超过2400万件。


从被举报对象来看,SBAT是重灾区,以2018年11月份来看,新浪、腾讯、百度、阿里、天涯社区位居被举报网站前五名。尤其是新浪以新浪微博和新浪网为主,一家独秀,有效举报就有402.8万,占当月被举报信息的一半左右。

北京情况也是这样,头部企业是出现违法信息的最多场合,比如新浪微博、百度、58同城。


3.执法依据繁杂

上面显示了网信执法部门面临着怎样的一个执法对象市场,那用以执法的依据呢?

网信办官网上政策法规板块公布了49部法规,以行政法规和规范性文件为主。

而且从公布时间来看,也多集中在近五年尤其是近两年发布的,反映出对网络内容监管正在逐步加强立法规范。

我们也检索了一下其他法律知识平台中涉及互联网的法律法规,如在法信上检索标题中含有互联网的,相关的法律法规将近3000部;如果是全文中含有互联网的,则有60000多部。


这样海量的执法依据,网信执法人员是否掌握,或者能否找到更加适合的执法依据?


4.执法标准不统一

上述海量违法信息、繁杂的执法依据,也会产生执法标准是否统一、处理结果是否公平的问题。

从2017年全国网信执法情况来看,仅以全年受理的5263.4万件有效举报作为基数,被约谈、被关停、移送犯罪线索、关闭账号的比例可能只有十万分之几而已。


大量的违法信息是否被处理,被处理的网站、账号是否得到相对公平的处理?是否有选择性执法、运动式执法之嫌?


大数据在检法行业的应用

检法行业面临案多人少、同案不同判的现实需求,如何发挥大数据、信息化的技术优势,向科技要人力,是当下智慧司法建设的初衷。司法过程与工业社会的生产线其实并无二致,法律大数据给司法过程带来的都是要解决司法的效率和质量的问题,这里的质量不仅有个案的合法有效,还包括个案的公平。

有关效率提升

1.语音转化

以科大讯飞为代表的语音识别企业,将语音、文字识别切入司法领域,“解放检察官的双手”,如庭审语音笔录、远程讯问笔录、会议笔录等自动语音识别。阿里语音与华宇合作也以科技法庭的形式进入了很多审判机关。

2.文书生成

之前也有简单的模板可以生成一些基本信息,现在的文书生成,更倾向于一键式文书生成,将基本信息、诉讼经过、案件事实认定、裁判理由等均可以由机器生成。尤其是一些简单、类型化的案件,比如速裁案件,均可以使用一键生成起诉书、审结报告等。

3.远程提讯、庭审

很多地方推广的三远一网工程,解决在途时间较长的问题,“解放检察官的双脚”,通过远程视频、语音转录的方式,来提升办案效率。主要涉及内网、工作网、外网的信息传输交互问题,除语音转录笔录外,基本上没有太多的科技提升。

4.语音问答机器人

语音问答类机器人在很多法院、检察院也在使用。“法信(智答版)”,通过微信小程序/网页版,可以回答法律问题,对问题可以进行语义理解,答案也是来源于法信知识库的权威数据,还可以关联一站式检索、类案推送,提升法律知识检索的效率。

有关质量保障

1.类案推送

如果说前几方面都是为了解决效率问题,后面几类法律大数据的运用主要为了解决公平、质量的问题。比如高检院、最高院一直提倡的同案同判,如何识别出同案或类案,就是当下审判、检察工作的一项重要任务。

类案推送是基于对公开裁判文书的文本挖掘,定义类案的标准(如适用法律、争议焦点、裁判要旨、事实要素、定罪要素、量刑要素等),通过算法识别出类案,并按照一定优先级进行推送。类案识别工作是整个法律人工智能的核心和关键。无论是解决定性还是定量,都需要类案的参考。

2.量刑建议

刑事案件中一个重要的环节就是要解决量刑问题。目前的量刑辅助,主要用两种方式,一种是类案识别,通过若干类案来识别出量刑的建议值,建议值的计算有平均值、方差、正态分布等不同的方式;用于计算的类案的数量也从几十个到上百个不等;另一种是量刑指导意见,即通过最高院以及各地高院制定的量刑指导意见中对个罪规定的详细的增减幅度,通过内置为计算规则,让承办人省却了自行计算、同加逆减的工作,从实现方式上也有两种,一种是自动识别本案的量刑要素,另一种是提供各种量刑情节,由承办人自行勾选。

3.证据审查

证据审查也是法律大数据可以大显身手的领域,比如上海的206工程,就是把特定犯罪类型中的证据标准进行了大数据学习和人工搭建,对后续案件起到指引作用。实践中机器辅助证据审查也有两种方式,一种是形式审查,包括证据本身形式完整性审查,比如是否有印章、指纹等,还有就是对证据必要内容的形式完整性审查,包括是否有必要的到案经过、鉴定意见等;另一种是效力审查,包括瑕疵和非法证据审查,主要是根据证据制作过程的完整性、合法性来判断是否合法,如是否存在同时讯问、一人讯问、刑讯逼供的情况。对于证据证明力的审查,目前未见有实现的情况。

4.裁判偏离度审查

裁判文书大数据运用的另一个场景就是通过对类似案件判决分布情况,来对比本案的裁判结果偏离度。比如江苏高院、四川达州中院的偏离度审查系统。在刑事领域,以及裁判结果有高度类型化判决标准的领域,采用偏离度审查比较妥当,但也存在用一个算法来监督、判断人的个性化判断是否合理的情况。

5.办案绩效评估

员额制改革之后,如何评估每名司法人员的办案质效,传统的评价方式中以办案数量、结案周期作为评价标准,似乎已经不太科学,绩效评估中如何把每个案件的难度系数识别出来、将每个案件的办理效果识别出来,需要根据既往数据并结合司法人员经验进行综合判断。


大数据对网信执法的智能化辅助

由于在网信执法过程中存在监督范围广、违法线索多、执法依据繁杂、执法标准不统一等问题,有必要借鉴检法行业对大数据的应用实现网信执法的智能化辅助。

首先是要明确网信执法的目标。

实现执法公平还是形成威慑效应即可?


从目前的情况来看,网信执法的威慑意义更大,一方面体现在最终被处罚者甚微,以及约谈等柔性执法手段被广泛运用,另一方面也体现在各个互联网平台的代理执法。长期来看,行政执法无论是过程还是结果都应该有相对公平,但也要注意,执法常态化不意味着处罚严苛化,用技术手段来保证线索获取的公平性、处理流程的透明性,处理结果可以根据国家政策、法律规范的指引,重重轻轻。

靠经验主义还靠规范主义?


在规则已经出台的情况下,具体执法是根据条条框框的规定,还是结合生活经验、工作经验,甚至是历史案件的处理经验?

放管服还是强化处罚?


网信执法也是行政执法的一种方式,行政行为面临深化“放管服”改革,进一步优化政府和市场、政府和社会的关系,提升政府效能。针对网络空间的治理,是否遵循与现实世界同样的治理方式?如何应对虚拟时代各种社会关系线上化所引起的变革?密织法网、行刑无缝衔接,是良方还是苦药?

白茫茫一片真干净还是万物生长?

这也涉及到网络内容监管的终极目标,是要达到一干二净、清清楚楚的白茫茫一片,还是允许万物生长、百花争鸣?

对这些问题的选择,也就是网信执法智能化的方向和要求。

阶段性目标

第一阶段  充分汇集数据、简单重复性工作减负

一方面,提升法律知识的供给,提供精准、高效的执法依据,提升线索处理的效率、保障执法质量、降低执法成本。

对此,可以通过知识图谱、自然语义理解等方式,建立网信执法专门法律知识库,提供一站式检索、语义检索和智能问答,解决法律适用标准统一问题。

另一方面,加强类案研判,建立历史执法数据库,通过规则化——要素化——数据化——信息化的方式,更好的利用历史经验、办案人员的隐性知识,保证执法标准统一、保障执法质量。

比如,芜湖中院二审的“天一案”中“淫秽物品”的认定,是否可以结合外部数据进行时代标准的认定,看社会公众对“淫秽”程度的认定是否随着时代变化而有所改变?


第二阶段  人工与技术、数据的最大化结合

比如进一步开放、整合关联数据。政府各部门、各级政府之间数据打通,政府数据与商业数据之间的打通,用开放数据来发现问题、分析问题、解决问题,充分利用大数据的预测、预警作用,做到对网络内容生产的正向引导和不良监测、预警。

在进行数据关联、挖掘时,要注重个人隐私的保护,不同场景、不同权限人员享有不同的数据使用权限,政府作为数据使用的最高权利人,更应对使用行为做好安全保障。

比如进一步加强行业指导、规范内容生产。发挥各大互联网平台的代为监管作用,利用技术手段、加之以人工辅助,确保优秀内容生产、不良信息屏蔽,但也要防止管得太死、束缚创新精神,做好两方面的平衡。

这是一个AI的史前时代,我们每个人作为历史的见证者,留下的声音、文字、图像,都会成为未来训练AI的语料,如果希望未来的世界色彩斑斓,就要给那个世界留下浓墨重彩。

相关阅读

智慧法院的建设现状丨智慧法院建设路径思考(上)

智慧法院建设中的问题丨智慧法院建设路径思考(中)

智慧法院建设的阶段性任务丨智慧法院建设路径思考(下)

面对法律AI,我们的冷思考(上)

面对法律AI,我们的冷思考(下)

从信息公开到数据开放,司法大数据如何实现跨越式发展?

一个连看电影都不忘思考法律问题的公众号

相关内容
分享 2019-08-12 08:00:01

0个评论

文明上网理性发言,请遵守新闻评论服务协议