新闻> 社会新闻> 正文

推进警用标签体系应用 提升警务精准防控效能

山东法制报 2018-10-30 17:14 大字

近年来,大数据已成为公安信息化建设不可或缺的技术支持。大数据与公安工作深度融合,显著提升了警务效能,在维护稳定、打击犯罪、治安防控、服务群众等方面发挥了重要作用。随着互联网大数据的发展,数据标签已经成为一种广泛的网络信息分类方式,数据标签使得用户能够给信息定义具有关键字特性的标签,并通过标签来进行信息导航和检索。由于标签在信息资源与用户基于关键字搜索上建立了便捷的桥梁,因此研究如何为信息资源定义标签成为必要,进而研究标签推荐,充分发挥大数据价值,成为一个热门话题。

警用标签广泛应用在多个场景

标签在警务实战主要应用在人员画像、智能检索、 业务分析、 群体归集(人群透视、人群扩大)、智能推荐等场景。

人员画像。标签化是人员画像的核心,标签化的人员画像既方便人们理解,又方便计算机分析和程序化处理。基于“以人为中心”的设计理念,人员画像按人、案件、物品等公安业务要素以及关联关系,从多个维度分层构建“一人一档”数据模型。

智能检索。用户检索行为、习惯、检索内容进行分析后,将已有数据进行标签化处理,从而使检索更加人性化、更加智能、更加灵活。

业务分析。围绕分析目标,对要分析的数据资源进行标签化处理,辅助分析人员对分析结果的研判。例如:在案例分析中,对案发时间段、案发地区特征、作案手法、侵害对象等内容进行范围、特征、种类标签化标记,从而使结论更加具有针对性。

群体归集。将已知部分人员群体信息作特征汇总提取显著特征,扩大到特征相似的更广人员群体,实现在海量数据中寻找同类型人群的功能。通过刻画一群人抽象出来他们的特质,并以此为规则找到更大类似群体,并逐渐形成更完备的人员群体档案体系。

智能推荐。基于机器学习、 NLP 通过案件快速提取案件信息中的嫌疑人标签、受害人标签、案件信息标签等,通过后台事先定义的分析模型与标签知识库中已有的人员标签进行快速比对、分析,推荐出与案件疑似有关的嫌疑人信息。通过推荐技术、标签体系辅助民警快速锁定嫌疑人范围,起到辅助案件侦破的作用率。

警用标签的分类

警用标签分类,以“五要素”信息模型体系理论为基础,结合警务工作的重点,通过数据梳理和数据建模两种方式,分析挖掘出各维度标签信息。

首先是依据业务目标进行初级分类,分为要素画像、智能检索、碰撞比对、业务分析、群体归集、智能推荐等。

然后基于初级分类继续标签进标签维度分类,一个业务目标可以对应多个标签维度,一个标签维度可以对应多个业务目标。

深入标签挖掘,最终形成多维度的标签体系,为标签应用提供强有力的支持。

标签建模主要分为四层事实类标签,譬如性别、民族;模型类标签,以事实标签为基础,通过构建事实标签与业务规则之间的模型,进行模型分析得到的标签;机器学习模型的预测标签,在模型的基础上进行分析预测;业务类的标签,譬如高危人群、盗窃惯犯等等。

警用标签的生成

标签是通过对数据信息分析而来的高度精炼的特征标识,依托大数据技术,通过数据资源进行整合、清洗,按照一定的语意及结构进行组织,通过计算、分析、机器学习实现数据的标签自动化生产,并提供标签的快速检索、分析、统计、挖掘功能,为用户构建全纬度标签和知识库,进行深入的分析研判提供支撑,能够有助于我们精准的数据挖掘,构建智能推荐系统。

首先对数据进行收集,收集的数据不会百分百准确的,根据不同数据源的可信度,在建模过程中再进行判断。

其次是建模分析,就是对收集的数据进行处理。通过聚类法、分解法、加入法、动态聚类法、 k-均值、 k-中心点、决策树算法、推荐系统、异常检测等算法得出大概率事件并尽可能排除一些偶然情况。

再次,依据算法设计出来的标签进行验证,验证一般就是准确率验证和完整性验证。一旦出现较大偏差则重回标签规划,进行新一轮的调整,这是一个循环、持续完善、丰富的过程。标签既要依据不断变化的基础数据进行修正,也要依据已知数据抽象出来的新标签使标签体系更加立体化。

警用标签应用平台

从构建单一标签到形成一套标签体系,再到标签价值的挖掘,需要标签应用平台来支撑。警用标签应用平台主要实现标签的生命周期管理、标签的集成加工、标签价值分析三大目标。

标签的生命周期管理对标签进行创建、上线、修改、停用、下线等生命周期状态管理。

标签的集成加工是通过集成加工引擎实现的。标签的集成加工引擎对标签规则进行解析验证,根据规则生成的可执行任务并调度对应的执行平台进行标签的加工生产。标签引擎分为“实时计算引擎”、“离线计算引擎”、“交互式计算引擎”,每种模型对应不同的处理方式。

标签价值分析主要是开展人员画像分析、标签指数分析、主题标签分析、人群放大分析等,进一步挖掘标签价值。

警务标签认识的误区

随着大数据应用逐步深化,以及各类供应商过度的宣传,使得部分人对于数据标签产生了不少的误区,主要体现在两个方面:

一是,可以通过几期工程的建设就建立完整的客户标签。

有不少人认为,可以通过整合内部数据,增加数据采集点,引入外部数据就可以建立完善的标签体系,可以支撑当下及未来的业务发展。但实际情况是,标签的建设是一个永无止境的过程。很多标签不是采集和加工出来的,而是在应用过程中根据需要不断增加和完善进来的。如果采用自下而上驱动的方法,很容易造成采集和加工了大量的标签但没有发挥其作用的情况。事实上,在搭建好一个技术的框架和基本的标签体系后,就应该迅速寻找业务切入点,从业务切入点来反向提出缺失的标签,重新寻找更多的数据来源和加工方法。

二是,重系统建设,轻运营应用。

标签体系的建设和应用不仅仅是建设一个系统,随着业务应用场景的不断增加,需要不断投入资源来进行数据源的不断丰富,对于效果不好的标签和数据来源,也应该逐步减少,形成有增有减、持续完善的循环,不断释放业务价值。因此其应用的过程实际上是改变人的思维习惯的过程,不是系统建设完就能产生价值的。

推进警用标签体系应用,将进一步加快信息资源整合共享,让海量的信息数据真正成为实现预防预警、精准防控的源头活水,提升对各类风险的预测预警预防能力。

周建平

新闻推荐

精神文明建设大家谈 “精准营销”也要诚信守法 胡蔚

当手机莫名其妙遇到广告弹窗,或者连接到了一个毫无用处的“WiFi”时,你可能走进了“WiFi探针”设备的覆盖范围里。“前些日...

 
相关新闻