目前在中国最高法院的网站上,已可以查阅最新的各类裁判文书资料,数量达到了数千万件,每天的更新量达到约十万件。这些裁判文书资料的公开,极大地满足了各类法律工作人员人员、企事业工作人员的需要。 中国裁判文书网 目前公开的裁判文书资料都是以长篇文本的形式出现的,大部分内容篇幅较长、表述复杂,不利于快速浏览和阅读,也不便于查阅人员迅速掌握文书中的重点信息。有鉴于此,神州泰岳语义工厂提供了针对裁判文书的数据解析服务。 全面的文书解析功能 泰岳语义工厂使用自主的智慧语义认知技术开发的针对裁判文书的信息提取和分析服务,可以有效地从裁判文书中提取各类重点信息,如:案号、当事人、案由、审理过程、裁判结果、判决事项等,同时还可以针对判决结果和判决事项给出各种具体的标签,如:有期徒刑、缓刑、被告赔付、被告返回财物、诉讼费分担等,这些标签或特征信息可以方便查询人员迅速了解裁判结果的要点信息,便于解读。 (1)裁判文书分段解析,自动形成文书目录 服务内置了各种裁判文书的文档模型,能自动识别裁判文书的类别(民事、刑事等)、审讯阶段(一审、二审、终审等),针对不同类型的文书,自动调用文档模型,对文书进行分段解析。 展开全文
(2)裁判文书结构化提取 服务能从裁判文书中自动提取司法相关信息,并形成结构化字段输出。服务支持提取的字段数可达到41项。服务输出字段分两类: (3)分案由要素提取 针对不同案由的裁判文书,如离婚案件、房产纠纷、盗抢案件等,提供针对性的信息提取和分析服务,以获取各类不同案由类型的独有信息点。如:针对离婚案由,支持提取的要素包括:争议焦点、子女抚养、抚养费、有无婚外情、是否多次起诉、是否家庭琐事、是否性格不合、是否分居、有无家庭暴力、子女性别、子女姓名等。 解析性能指标高 泰岳语义工厂裁判文书解析服务的准确率达到了较高的水平。不同案由或不同文书类型,准确率均可达到96%,召回率均可达到99%。 技术优势 泰岳语义工厂裁判文书解析服务具有以下方面的技术优势: ★采用深度学习算法(CNN+LSTM等),对3千万篇裁判文书进行训练,形成了多种类别文书的文档模型,实现基于业务知识树的文本切块技术,自动形成目录结构; ★采用独创的DINFO-OEC语义建模技术,构建了上万条语义规则,针对每个结构化信息的抽取点,精准刻画其上下文语义信息,实现高精准度的信息抽取; ★采用智慧语义认知技术,结合千万级概念知识库,对文书中的同一含义的句子多样性歧义表达自动识别,对文书中的一词多义、同义词等词汇歧义进行概念归一化,实现准确的要素提取; 服务特色 以SAAS服务调用的方式提供,只需输入法律文书,即可获得输出的结构化信息。服务输出结果,不受调用环境、编程语言等限制,可直接展示,或者集成到自有业务系统中去。 本服务具有如下特点: ★裁判文书信息抽取准确率高 ★集成了先进的大数据分析技术框架 ★可以快速、高效实现裁判文书的分析和提取 ★使用方便,学习成本低 ★提供针对各类具体案由的定制服务 成功案例 服务已有多家用户在实际使用,并且取得了很好的效果。 例如:某大型国有银行的企业风控系统、某法律科技公司的裁判文书服务系统等。 服务适用于各种业务场景下,法律文书的解析需求。 不需要拥有专业的NLP技术,让您轻松拥有法律文书变成结构化信息的能力。 来源:泰岳语义工厂 版权声明:除非特别注明,本站所载内容来源于互联网、微信公众号等公开渠道,不代表本站观点,仅供参考、交流之目的。转载的稿件版权归原作者或机构所有,如有侵权,请联系删除。返回搜狐,查看更多 (责任编辑:) |