“经常出没于伦敦的大雾中,头脑冷静,观察力极强,能从蛛丝马迹中推断出事情的来龙去脉,抓住幕后真正的凶手。”柯南-道尔笔下的福尔摩斯不仅家喻户晓,更是不少人崇拜的对象。但如果让这位神探一下子来到今天,面对错综复杂的高科技网络犯罪案件, 即便是深谙痕迹学、医学和推理,福尔摩斯先生估计也只能摊开双手、耸耸肩,表示自己无能为力。
那么,信息化时代的福尔摩斯又是何方神圣呢?
日前,以色列的几位科学家开发出了另一种基于动态数据的搜索算法。借助该算法,侦查人员能够对与案件相关的信息进行高效的搜集和分析,实现对犯罪分子实时追踪。通过对相关信息的分析,该算法甚至还能预测出犯罪分子可能出现的地点和场所。有了这套系统,侦查人员无疑是如虎添翼。
“网络指纹”无处不在
如同福尔摩斯要经常阅读各种流行的报纸,和社会不同阶层的各色人等保持接触一样,侦查案件也需要随时了解各种相关信息和新动向。而这种搜索算法的数据来源便是人们在日常生活中留下的各种“数字痕迹”。
与留下指纹的过程类似,我们平日在使用互联网、手机、自动取款机等与网络相关的电子设备时都会留下一定的“数字痕迹”,无论是发出一封电子邮件,还是在自动取款机上的一次简单操作。这些信息看似杂乱无用,但却能够为案件的侦查和取证提供极大的便利。
由以色列特拉维夫大学的埃塔·本加尔教授、尤金·卡根博士和博士研究生艾维·格鲁伯所开发的这套系统,正是通过对这些信息的搜集和分析,才得以挖掘出对侦破案件有价值的信息。研究人员称,该系统不但能够用于一般刑事案件的侦破,还能够为国土**和打击恐怖分子提供帮助。
该研究成果日前在以色列举行的电气和电子工程师协会(IEEE)年会上进行了公布,相关论文将于近日发表在《质量技术与定量管理》杂志上。
新型算法“数字追凶”
本加尔说,与普通的数字文件不同,人总是处于不断的移动当中。要预测出其下一步的行动,就必须对现有的各种信息和猜想进行整合和分析,建立一定的数据模型。这种新型算法能够通过对常见的数字痕迹的搜集和分析,确定恐怖分子或犯罪分子的活动模式。
简单来说,其工作就如同一个数字化的侦探,它会首先对包括电话,电子邮件或信用卡在内的数字信息进行搜集和整理,通过对这些信息分析建立一定的数据模型。新的信息片段会自动插入现有数据库当中,而算法则会根据更新后的数据对目标重新进行分析定位。
本 加尔教授解释说,所有这些信息实质上都可以被看作是等待被解码的一个长信息的片段。就拿一通电话来说,其中有很多变量都应该考虑在内:这是打给谁的,通话 时长是多少,来电者的位置在哪里……等等。一旦其中的绝大多数成为已知,该算法就能发挥出威力。它不但能预测到整个犯罪活动的走向,同时还能以图像化的方 式显示出该集团或个人可能出现或感兴趣的地点。
在呈现时,该算法能以类似地形图的方 式,按照不同的主题(刑事案件、恐怖活动、毒品交易)和对象显示出概率图。图中的每一个区域都会按照统计学的方法以不同的可能程度进行标记。虽然该算法首 次处理原始数据时会耗费数小时的时间,但一旦这一过程完成后,新加入的信息片段在几毫秒内就可处理完毕,并能立即在新的分析中得以应用。
本 加尔说:“我们的算法能够帮助侦查人员更有效地利用现有信息。如果要立即抓住一名嫌犯,将概率图上可能性较高的区域作为重点,一般都不会让他们失望;可能 性低的事发地点则可以被排除在外,这样侦查人员就能将注意力集中到更有价值的线索上。而随着空闲时间的增多,该系统还能进一步对搜索做出改进,甚至会关注 一些概率较低的区域,而从中往往也能发现一些宝贵信息。”
商业应用同样给力
由 于在应对刑事案件和国土**事件时,新算法必须要在很短的时间对大量的数据进行搜集和分析。目前,人们面对的各种数据日渐增加,电子商务、云存储方兴未 艾,这种强大运算和处理能力,也能使其在商业应用上大展拳脚。除了追踪嫌犯外,该技术还能提供从市场营销到文件共享的多种解决方案。
本 加尔说,如亚马逊、IBM和苹果这样的公司,其实早已采用了类似的算法。在亚马逊网站上,我们平时所看到的关于图书、音乐或其他商品的购买建议都是由类似 的程序生成的。而苹果公司即将在今年秋天正式推出的iCloud云存储服务,也需要用到类似的算法来确定何时以及向哪些移动设备推送文件。
此外,该研究同样还可以用于基于位置的营销,这种销售模式可根据消费者所处的地理位置,推断他们可能需要购买的商品,并通过移动设备进行提醒和完成交易。