去年9月,国务院发布了《促进大数据发展行动纲要》,将大数据应用上升到了国家战略的层面。在法律领域,大数据也有很多可挖掘、可利用、可产生价值的地方。
首先,法律大数据可以为司改决策提供数据支持。
举个简单的例子,四中全会提出要设跨行政区划的法院,希望破除地方保护问题。问题在于,跨行政区划的案件,就一定会受到地方干预吗?有过数据支持吗?
我们律所对目前已经公开的1800多万篇裁判文书,进行了大数据分析。在提取出跨区域案件数量、跨行政区划打官司的一方是否败诉、败诉率是否高于同一区域同类型案件等数据之后,我们就可以建立模型,分析跨行政区划的案件是否有地方保护的情况存在。
未来,只要把每年千万级的案件数据放入数据模型中进行计算,就可以实时监控跨行政区划案件是否有地方保护的情况存在。
其次,法律大数据可以帮助解决司改进程中遇到的一些问题。
比如说老生常谈的“案多人少”问题。不依靠技术手段,这个问题根本无法解决。
“无讼”团队的程序员们正在研发相关产品,通过对裁判文书中的“大数据”进行提炼、分析,可以智能、精准地为法官推送与在办案件密切相关的法律法规、相似案件的裁判文书等信息,在线自动生成文书模板,最大限度减少法官的工作量。
再次,法律大数据可以帮助民众更好地理解司法改革。
一个个数据本身艰深、枯燥,但是利用数据可视化技术,普通民众也能轻松读懂。
设想一下,如果通过数据可视化技术,勾画出中国法治地图,那么,整个中国的法治现状,就可以一目了然地展现给社会公众。在这样的思路下,我们已经尝试做了中国裁判文书公开的地图,实时展现全国各地的裁判文书公开情况。
但是,我们也看到,要形成这样的法律大数据,还面临着一些困难。
为了促进法律大数据的形成,推动司法改革进程,我提出以下三个建议:
第一,充分利用信息化手段采集数据。
法律大数据产生于法律人的日常工作中,法官、检察官每触动一下鼠标、敲击一次键盘,都是在生产司法数据。这样的数据,完全可以通过信息化的手段进行采集。
国家有关部门应加大律师行业信息化的投入,更好地提供采集数据的基础。
我们现有的技术水平,可以将一篇裁判文书拆解为若干数据段,从中提取有价值的数据。这种技术也可以挖掘律师代理词、辩护词等文书中蕴含的大量数据。未来随着智能语言分析技术的发展,甚至随着人工智能技术在法律领域的广泛应用,数据采集、挖掘的能力,还会得到进一步增强。
第二,实现司法数据的全面开放。
司法机关也应当按照国家的战略部署,把整个司法过程中形成的各种文书全部公开。司法系统内部各部门、各条线间的数据,也应该全部贯通,形成完整的法律大数据资源。
第三,鼓励、引导社会充分利用法律大数据。
法律大数据是全社会的共同财富,民间的创新力量也可以在它的利用上,发挥重要作用。最近中国裁判文书网的改版,受到了法律界的交口称赞,这实际上是在民间先行探索的基础上,采各家之长的成果。
再比如,由司法行政机关主导的“律师分级制度”争议极大,但其实,只要司法行政机关开放所有的律师行业信息,这件事情完全可以依靠民间力量和市场调节机制,更好地完成。
我们的“无讼”团队已经尝试用大数据的方法,为律师提供在互联网上的虚拟身份,生成“律师名片”,为更客观的律师评价提供基础。如果未来的法律大数据更加全面完整,不仅“律师名片”可以更详实、客观,“法官名片”“检察官名片”也可以应运而生。
期待未来法律大数据的采集、挖掘、分析等相关技术,运用到司法实践中来,更好地帮助发现司法工作中的关键问题,找出有效对策,从而更有效地提升司法公信力,构建一个法官、检察官与律师之间相互支持、彼此信任的法律生态圈。