2024年11月15日,最高人民法院召开新闻发布会,发布“法信法律基座大模型”研发成果。由人民法院出版社研发建设的“法信法律基座大模型”,定位于法律行业基座模型,既是一个为法治领域提供生成式人工智能底层能力的基座模型;也是一套为保障法律人工智能安全发展,配套安全治理机制,提供数据资源、算力资源、评测资源的服务体系。

人民法院出版社总编辑余茂玉在介绍研发建设总体情况时表示,“法信法律基座大模型”已完成在网信部门的生成式人工智能服务备案,这是国家级法律人工智能基础设施,也是法律行业的基座大模型。

最高法.png

               “法信法律基座大模型”的研发背景

当前,科技创新、技术迭代正加速推进,大语言模型已成为推动人工智能技术进步的关键动力之一,并广泛影响到社会各个方面,包括法律行业。未来法治建设将更加紧密地与人工智能等先进技术结合,行业也将迎来智能化变革。同时,也带来了一定的安全和风险挑战。  

人民法院出版社按照最高人民法院部署,通过研发建设自主可控的法律基座大模型,一方面推动现代科技与司法审判工作深度融合,积极探索人工智能技术赋能法律行业的路径,推进科技赋能公正司法,提升应用实效;另一方面促进规范人工智能技术应用,保障技术和数据内容安全可控,守住安全底线。

大模型是利用深度学习技术和大规模参数进行训练的生成式人工智能模型。余茂玉说,研发建设“法信法律基座大模型”是在数字时代提高司法效能,充分挖掘、发挥司法大数据资源价值,助力审判工作现代化,更好满足社会各界和人民群众多元司法需求的重要举措。”

“法信法律基座大模型”的重要意义

第一,研发建设“法信法律基座大模型”是落实总体国家安全观的具体措施。人民法院出版社在研发建设法律基座大模型过程中,一方面始终界定好大模型辅助性、工具性的基本定位;另一方面始终坚持在法律数据安全合规的基础上进行创新应用,在守住安全底线的前提下促进技术应用和效能提升,努力以“法信法律基座大模型”的安全规范促进法律行业大模型广泛应用的整体安全。

第二,研发建设“法信法律基座大模型”是推动法律行业新质生产力发展的创新引擎。研发建设“法信法律基座大模型”,一方面,在做好内容安全管控和数据合规利用的基础上,可以积极发挥法律大数据要素投入行业产生的乘数效应,为法治建设工作广泛应用新质生产力提供支持。另一方面,大模型技术提供嵌入业务场景的人工智能解决方案,能够有效赋予法律业务的“新能力”和“智体验”,进而促进产业聚合和技术创新,将会成为法律行业新质生产力的创新引擎。

第三,研发建设“法信法律基座大模型”是助推审判工作现代化的有效路径。基于海量、权威和高质量法律大数据预训练后形成的“法信法律基座大模型”,具备法律语义理解、逻辑推理、融合搜索、内容生成等基础能力,同司法审判工作深度融合,有利于提升法律文书处理质效,保障法律正确统一实施,助力优化提高裁决公正性和准确性,助力加强监督制约和防范执法司法风险,更好地服务人民群众、服务法治建设、服务高质量发展,能够为审判工作现代化提供有力的科技基础支撑。

“法信法律基座大模型”的研发进展

自2023年起,人民法院出版社开始广泛调研,走访19家科研企业和单位,组织多轮专家论证和研讨。在清华大学科研成果转化的千亿参数通用大模型基座上,投入最高人民法院“法信”等多个法律大数据平台经过高质量专业标注的3.2亿篇共计3.67万亿字的法律文献、裁判、案例、观点等数据语料,融入人民法院电子音像出版社历时十余年搭建的包含18万法律知识体系编码的“法信大纲”,在各级法院、科研机构和科技企业的共同努力下,经过为期数月的预训练、优化训练、监督微调和多轮测评,最终形成研发成果——“法信法律基座大模型”。

谈及应用成果,余茂玉表示,一是以“法信法律基座大模型”作为底层支撑的深圳法院人工智能辅助审判系统1.0版上线全面运行后,有力提升了审判工作质效。二是对最高人民法院“法答网”“人民法院案例库”数据预训练研发的“库网融合”智能检索系统将于近期试点应用,以数字化、智能化手段促进法律适用的统一。

据悉,经过对“法信法律基座大模型”底层能力进行更有针对性、场景性的开发应用后,下一步,一批数字化、智能化的“办案助理”“普法助手”“领域找法查案专家”“个人法律知识管家”等将上线应用,成为法律从业者的AI智能助手。

(本文编辑:李兆)