[Meiya技术共享]第7期:大数据时代的电子取证技术发展前景
时间:2021-01-02

[Meiya技术共享]第7期:大数据时代的电子取证技术发展前景

一、背景

近年来,全球数据量激增,数据已成为当今社会增长最快的资源之一。根据国际数据公司IDC的监测统计,即使在2009年遭遇金融危机时,全球信息量也比2008年增长了62%,达到80万PB。到2011年,全球数据总量已达到1.8ZB,并且随着每两年翻一番快速增长,到2020年,全球数据总量有望达到40ZB,而到2021年将增长20倍以上10年。到2020年,地球上的人均数据预计将达到5247GB。可以说广州私家侦探事务所,大数据是继云计算和物联网之后的另一项颠覆性的技术革命。这将对国家治理模式,公司决策,组织和业务流程以及个人生活方式产生巨大影响。它的作用堪称另一场工业革命。

在中国,我国于2012年7月9日发布的“十二五”国家战略性新兴产业发展计划明确了下一代信息网络产业,电子核心基础产业以及高端软件和新兴信息产业。服务业是“十二五”期间战略性新兴产业的重点发展内容,应该说大数据产业也包括在内。

电子取证技术的工作是从浩瀚的“数据”中提取相关证据以进行展示。这些“大数据”具有巨大的数据量(量),种类繁多的(变量)和快速的流量(速度),并且具有低值密度(值)的“ 4V”功能,这使其取证分析更加复杂,并对取证技术进行了大数据测试。

二、大数据挑战电子取证技术

1、数据规模严重影响取证的效率。调查媒体的当前容量已从GB增加到TB,甚至ZB。依靠单独的服务器或工作站来实施证据已经变得极其缓慢调查,并且大部分时间都花在了分析媒体上。长时间等待媒体克隆,媒体装入和数据查询严重影响了取证的效率。

2、取证对象复杂度。对于大数据存储设备,目前,许多传统的硬件设备制造商在提供服务器和存储设备的同时,还专门针对大数据处理和存储推出集成解决方案,例如各种大数据合二为一。在国际制造商甲骨文,IBM,EMC,微软等公司发布了大数据全集之后,华为,浪潮和Sugon等国内公司紧随其后。但是,如何在这些大数据多合一机器上执行有效的调查分析也给电子证据调查人员带来了严峻的挑战。

3、多种数据存储方法。在传统时代,数据存储的形式相对单一,通常存在于计算机,移动电话,U盘和各种存储卡中。电子数据取证的目标相对明确;在大数据时代,“云存储”的普遍应用使数据无处不在。在调查 取证的过程中,狡猾的犯罪嫌疑人可能会将重要文件存储在“云”中。如何获取这些远程存储的数据并使其成为法庭证据,这也是调查人员面临的重要问题;

4、在大数据时代,传统的取证体系结构越来越难以适应取证的需求。当前的主流工具基于单机系统架构。介质安装,分析和证据生成无法执行并发任务,并且它们无法基于“云”模型实现存储,检索和证据的并发执行。这从根本上无法适应增长趋势。 取证大型大数据介质的效率要求。

三、大数据取证与分析相关的技术前景

1.大数据平台调查技术

在常见的大数据平台中,Hadoop是一种分布式大数据平台,由于其高可靠性,高可扩展性,高效率和低成本,用户可以轻松构建和使用。当前,Internet领域的许多任务,例如Web搜索,广告系统,数据分析和机器学习,已经在Hadoop集群上,例如Google,Yahoo,JP Morgan Chase等外国公司。国内的腾讯,百度,淘宝,阿里巴巴等互联网企业已经成功应用了Hadoop系统。

但是,由于Hadoop是一个免费的开源环境,因此Hadoop在其设计之初并未考虑平台的安全性,也未在先前版本中添加安全性机制。默认情况下,集群中的所有节点都是可靠且可信赖的。环境安全,没有恶意攻击者,因此Hadoop存在一些安全风险,例如缺少用户和服务器安全认证机制。缺乏安全授权机制,缺乏传输和存储加密。此外,其数据服务器对内存和存储中的数据没有存储保护,并且在恶意入侵,媒体丢失和维护的情况下,数据很容易泄漏。