简介:[目的]针对环境依赖型犯罪时空预测中模型泛化能力弱、依赖大量城市标注数据的问题,本文提出了一种基于生成式预训练与提示学习的基础模型ST-Crime,旨在提升环境依赖型犯罪时空预测的准确性以及对新环境的泛化性能.[方法]该方法首先将犯罪数据统一表示为张量形式,以Transformer为主干网络捕获全局时空依赖,并设计了犯罪时空记忆检索增强模块,通过时空记忆、犯罪类型交互与自适应图学习机制,从多城市数据中提取共性时空模式并生成提示信息以增强模型表达能力.[结果]实验使用2019年全年纽约、洛杉矶、旧金山、芝加哥4个城市总计超过30万条的犯罪数据,涵盖入室盗窃、抢劫、重罪袭击与重大盗窃4类典型环境依赖型犯罪.在充分训练场景(即使用纽约、洛杉矶、旧金山3个城市全年数据进行模型训练)下,ST-Crime在3个城市上的Macro-F1分别达到0.739 7、0.643 3、0.665 2,Micro-F1达到0.687 1、0.601 8、0.537 5,相较于各城市次优模型,Macro-F1分别提升了1.57%、4.30%和6.45%,Micro-F1分别提升了1.15%、6.06%和9.63%,提升效果显著.在少样本与零样本推理场景(使用芝加哥数据,前者仅用20%数据微调,后者直接推理)下,其Macro-F1也分别达到0.658 6与0.603 1,Micro-F1达到0.596 9与0.565 3,相较于次优模型,Macro-F1分别提升了7.02%和7.73%,Micro-F1分别提升了3.41%和9.51%,展现出优秀的跨城市泛化能力.[结论]ST-Crime能够有效捕捉犯罪时空分布特性,并在充分训练、少样本与零样本等不同数据条件下均表现出色,为环境依赖型犯罪时空预测任务提供了统一的解决方案.展开