基于全生命周期视角的交通大数据隐私保护

昨天文章我们介绍了交通大数据的内容及从法律和技术方面保护数据隐私的重要性,相信大家对交通大数据的隐私保护都有了全新的理解。今天,我们将从交通大数据的全生命周期视角出发,为大家介绍一种更加全面具体的大数据隐私保护体系。


01什么是交通大数据的全生命周期

交通大数据并不是一个单一的结构,它是一个横跨数据收集、预处理、使用和解释的过程。


基于全生命周期视角的交通大数据隐私保护

交通大数据的数据总量巨大,来源众多,包括数据库、文本、图片、视频、网页等各类结构化、非结构化及半结构化数据。数据收集阶段主要包括公开数据和私有数据的收集,是大数据应用的第一步;在数据使用之前,需要对数据进行清洗转换和存储,这一阶段被称为数据预处理,其主要进行原始数据的匿名加密处理并解决数据间冗余、不一致、相互拷贝等问题;数据使用阶段是大数据应用的核心阶段,其目的是对预处理后的数据进行分析建模,通过多源数据集成融合从数字化数据与模拟化数据中挖掘其潜在价值;数据解释旨在更好地支持用户对大数据分析结果的使用,是大数据分析结果的展示,其通过数据可视化等手段对挖掘出的数据潜在价值进行解释,是数据真正价值的体现。

通过大数据全生命周期框架,大数据由庞大抽象的数量级转化为直观的价值体现,从而应用于金融、交通、医疗等多个行业,促进行业发展社会进步。


02基于全生命周期的交通大数据隐私保护要点分析

大数据的发展给社会带来了新的安全问题,但是其本身也是解决问题的重要手段。为合理的保护数据隐私安全,从数据全生命周期发展的角度,对各阶段的隐私保护要点进行讨论,给出如下建议:

1)数据收集阶段

数据收集是大数据分析的第一步,其对数据隐私的保护主要包括两方面。一是数据收集者的行业自律。要求数据收集者在开始数据收集行为之前,告知用户相关信息,待用户充分理解做出选择后,尊重其选择,不能为利益故意歪曲数据主体授予数据的最初目的。另一个是用户自身对知情同意权的理解与重视。用户是数据的主人,其拥有数据的最终决定权,而知情同意则意味着用户给数据收集者的授权。要求用户在充分了解数据的使用条件、目的、范围与产生价值后,理性决定是否同意授予数据。

2)数据预处理阶段

数据预处理主要包括数据清洗和数据存储,其常用的手段是对数据进行匿名加密。在复杂的大数据环境中,如何对这些方法技术进行改进和发展,避免匿名数据重新识别及加密数据被破解,是数据预处理阶段主要的数据隐私保护途径。

3)数据使用阶段

数据使用阶段是大数据应用的核心阶段,主要包括数据的集成融合及建模分析,通过对数据的处理,挖掘其潜在价值。故针对数据使用阶段的隐私保护技术,就是在尽可能提高大数据可用性的前提下,研究更加合适的数据隐藏技术,以防利用数据挖掘方法造成的隐私泄露。


基于全生命周期视角的交通大数据隐私保护

同时,由于数据的研究范围、使用目的和潜在价值在数据收集阶段都不够明确,此时,用户授予的知情同意权可被认为是不够充分的,故在保持传统框架对知情同意权重视的同时,应将注意力放在数据使用上,即数据使用者应当为他们怎么样管理和使用数据而不仅仅是他们是否得到用户同意而负责,他们应自重自律,遵循行业准则,合理依法调用数据,建立一个有公信度的大数据分析使用良性循环。这就要求建立有力的数据使用监管机制及执法补偿机制。

4)数据解释阶段

数据解释阶段是大数据应用的最后一个阶段,是大数据价值的具体体现。在大数据的环境下,如何确保合适的数据及属性能够在合适的时间和地点,给合适的用户访问和利用,是数据解释阶段面临的主要风险。为了解决大数据访问和使用时的隐私泄露问题,现在的技术主要包括:时空融合的角色访问控制、基于密文策略属性集的加密等技术。在现有技术的基础上,对其进行发展和改进,是数据解释阶段的主要隐私保护方法。


基于全生命周期视角的交通大数据隐私保护

在数据隐私保护的过程中,应认清现有数据隐私保护存在的局限性,对数据主体、数据收集者和数据使用者的相互作用关系重新定义,积极发展数据匿名、数据加密、访问控制等新型数据保护方法(如:区块链技术),建立有力的数据使用监管及执法补偿机制,严格限制以营利为目的的个人隐私信息商业化利用,在数据隐私保护需求和与社会发展创新精神之间找到平衡点,共同发展共同进步。


分享到:


相關文章: