本文是一篇工程论文,结论是对工程论文主要研究结果、论点的提炼与概括,应准确、简明,完整,有条理,使人看后就能全面了解论文的意义、目的和工作内容。主要阐述自己的创造性工作及所取得的研究成果在本学术领域中的地位、作用和意义。同时,要严格区分自己取得的成果与导师及他人的科研工作成果。(以上内容来自百度百科)今天为大家推荐一篇工程论文,供大家参考。
第 1 章 绪 论
随着社交网络的蓬勃发展,大众普遍使用社交应用记录和分享自己的喜怒哀乐,同时社交应用也提供着各种功能强大的社交服务。签到服务就是社交应用的主流服务之一。在签到服务中,用户使用带有定位功能的移动设备向服务器发送自己所在的地理位置进行签到。社交应用提供商也可以通过这些签到信息为用户提供更加优质的服务。为此,目前对于签到服务的相关研究备受关注。
1.1 课题介绍
本课题研究在国家自然科学基金“面向时空特性的社交网络推演攻击与隐私保护关键技术研究”(No.61502316)下展开,该基金课题研究面向时空特性的社交网络推演攻击与隐私保护关键技术,主要研究内容涉及社交网络隐私保护、位置隐私保护、位置预测、连接预测等方面。
.........
1.2 研究背景及意义
随着社交网络的蓬勃发展,大众普遍使用社交应用记录和分享自己的喜怒哀乐,同时社交应用也提供着各种功能强大的社交服务。签到服务就是社交应用的主流服务之一。在签到服务中,用户使用带有定位功能的移动设备向服务器发送自己所在的地理位置进行签到。目前,Foursquare 的签到数据已达 5 亿多条。国内的切客、街旁等签到服务也有近亿条的签到数据。签到服务的流行主要有以下原因:(1)签到服务的社交特性是吸引用户的重要因素,用户可以将自己的签到位置分享给好友或分享到其它社交软件中,以便了解朋友动态,增进彼此的互动;(2)服务提供商与商家设计了丰富的激励措施以提高用户参与的积极性。例如,当用户在某个位置的签到次数达到某个标准时,可以获得等级、荣誉称号等奖励。除此之外,激励措施还为用户提供了各种实际优惠。例如,在餐厅签到并分享状态可以获得折扣或者赠品。总而言之,签到服务具有以下特征:(1)现实意义性。虽然用户的签到记录表示为现实空间中的经纬度,但是这些经纬度往往存在着现实意义。例如,用户的每一次签到都有可能对应着超市、医院等具有现实意义的位置;(2)连续性。随着时间的推移,这些签到记录最终会形成一条签到序列。由于签到记录的数量巨大并带有以上两种特性,攻击者就可以从签到记录中推演高度敏感的个人属性。如,某著名移动设备厂商在未获得用户允许的情况下大量收集用户的位置数据[5,6],攻击者可以通过这些位置数据推测用户的身体状况等个人敏感信息[7 9]。位置推演是一项传统的移动计算任务,通过分析用户移动模式提高服务质量,有利于促进移动营销、旅行规划、灾难救援等实际应用。随着用户对于自身隐私的不断重视,在使用社交软件的某些特定功能时,用户不会留下位置信息,这就会使推演用户位置变的愈发困难。传统的推演方法往往无法推演这些不存在于用户数据集中的位置。
.........
第 2 章 相关技术研究与分析
首先对社会网络现状进行介绍;然后对位置隐私的现状及特点进行了介绍;最后对位置隐私预测技术的现有研究进行分析,针对当前社会网络位置隐私预测技术的发展趋势分析它们的优劣势。
2.1 社会网络的发展及现状
社会网络(Social Network)是指社会个体成员之间通过社会关系结成的网络体系。近年来,随着信息技术的发展,在线社交和微博等新兴社会网络应用获得了快速发展,为人类交互、知识共享、信息传播提供了完善的通信平台,也对人们的日常生活和行为方式产生了显著的影响,因此,在当今这个在线社交的时代,对社会网络研究更具有重要的理论价值和实际价值。目前基于社会网络的研究包括社会网络中组织关系的研究,个人在社会网络组织中的定位。社交网络与社会网络的区别如下:(1)社交网络里的基本单位是个体,注重研究个体与个体的关系。(2)社会网络里的基本单位可以是个体,也可以是团体或某种组织。研究的是个体与个体的关系,也可以是组织与组织的关系。
.........
2.2 位置隐私应用
基于 LBS(LocationBaseService)的服务常常伴随着泄露隐私的风险。在 LBS 服务中可能在三个方面泄露用户隐私。第一,在终端方面。若用户使用 LBS 服务的终端被攻击者劫持或种下木马,可能会造成用户所有请求服务内容泄漏,威胁用户安全。第二,在网络传输过程中,攻击者可以通过监听手段得到用户于 LBS 服务器的传输内容,再通过解码同样可以获得用户的 LBS 请求服务内容。第三,在 LBS 服务提供商的服务器上。LBS 服务器若被攻击者攻破,用户同样面临着巨大的隐私泄露风险。本文主要讨论在LBS 服务器被攻破的基础上,即攻击者可以获取用户的所有历史数据的情况下,攻击者如何攻击用户隐私。例如,某手机厂商在私自手机用户定位数据[2]。通过某女明星的微博即可以顺利地推测出她的家庭住址[3]。又由于 LBS 为社交软件提供数据,这就造成了高度敏感的个人属性可能会被推测的风险。文献[4]通过对 Facebook 用户 Like 的使用记录,可以推测出使用者的性取向、种族、宗教和政治观点、性格特征、年龄和性别。随着隐私保护意识的不断增强,当用户访问对不愿为人所知的地点时,多会选择不使用 LBS,但通过一定的算法依然可以推测出用户访问其隐私位置的概率。虽然位置隐私面对泄露的威胁,但也不能因噎废食。位置隐私在日常生活中存在广泛应用。如位置推荐,群组划分等。签到服务的社交特性是吸引用户的重要因素,用户可以将自己的签到位置分享给好友或分享到其它社交软件中,以便了解朋友动态,增进彼此的互动;服务提供商与商家设计了丰富的激励措施以提高用户参与的积极性。例如,当用户在某个位置的签到次数达到某个标准时,可以获得等级、荣誉称号等奖励。除此之外,激励措施还为用户提供了各种实际优惠。例如,在餐厅签到并分享状态可以获得折扣或者赠品。总而言之,签到服务具有以下特征:(1)现实意义性。虽然用户的签到记录表示为现实空间中的经纬度,但是这些经纬度往往存在着现实意义。例如,用户的每一次签到都有可能对应着超市、医院等具有现实意义的位置;(2)连续性。随着时间的推移,这些签到记录最终会形成一条签到序列。同时,通过签到记录可以挖掘出用户的行为模式,进而可以扩展更多的应用场景。例如,广告推荐等应用。
.........
第 3 章 预备知识及问题定义......12
3.1 预备知识 ......12
3.2 预处理阶段采用的算法 ............14
3.2.1 连续子序列生成算法 .....15
3.2.2 位置去重算法 .......16
3.3 问题定义 ......17
3.4 本章小结 ......18
第 4 章 基于用户签到模式的位置预测算法 ...........19
4.1 整体处理框架 ........19
4.2 签到模式序列概率计算 ............21
4.3 签到序列扩展算法 ..........23
4.4 基于用户签到模式的隐式位置推演算法 ....25
4.5 本章小结 ......26
第 5 章 实验与分析............27
5.1 实验环境与配置 ....27
5.2 正确率 ..........28
5.3 错误率 ..........28
5.4 预测率 ..........29
5.5 时间效率 ......31
5.6 实验小结 ......31
第 5 章 实验与分析
本章主要完成论文实验验证工作,对第 3、4 章提出的连续子序列生成、位置去重算法、签到模式概率计算算法、签到序列扩展算法和基于用户签到模式的隐式位置推演算法进行实验。通过实验证明算法的合理性和高效性。
5.1 实验环境与配置
Brightkite 和 Gowalla 是基于位置的社交网络服务提供商,其中用户可以通过签到服务来分享他们的位置。本文对 Brightkite 和 Gowalla 数据集进行预处理,筛选出美国加州地区的签到数据,预处理后 Brightkite 数据集包含 9192 名用户,签到时间从 2008 年4 月到 2010 年 10 月,签到记录为 52 万条;在 Gowalla 数据集中共有 14852 名用户,时间从 2009 年 2 月至 2010 年 10 月,签到记录为 65 万条。对用户签到序列以天为单位分割为若干子签到序列;提取出两个数据集中签到地点,并对其进行编号,通过开源 API获得签到地点的地点名称和地点类别;表 5.1 显示实验数据集的统计信息。正确率结果如图 5.1 所示,在两个数据集上,PBHLI 算法的正确率都要高于 BI 算法。由于 Gowalla 数据集密集度高于 Brightkite 数据集,所以 PBHLI 算法在 Gowalla 数据集上正确率达到 81.75%高于在 Brightkite 数据集的 61.5%。去掉的地点皆为用户曾经访问过的地点,虽然去掉了地点,模拟形成了隐式位置,但仍有可能从其余的历史记录中推测出对应的签到模式。所以 PBHLI 算法在正确率上要高于 BI 算法。#p#分页标题#e#
.........
结 论
随着社交网络的蓬勃发展,大众普遍使用社交应用记录和分享自己的喜怒哀乐,同时社交应用也提供着各种功能强大的社交服务。签到服务就是社交应用的主流服务之一。在签到服务中,用户使用带有定位功能的移动设备向服务器发送自己所在的地理位置进行签到。而这些签到数据反映了用户的行为习惯以及通过这些签到数据可以挖掘出用户的行为模式。而基于这些签到数据的位置预测研究就自然成为了一个研究方向。然而在分析了目前现有的位置推演方法后,发现目前的一些方法无法预测用户隐式地点;而一些方法可以预测用户的隐式地点,但存在着需要额外的预备知识或者计算开销过大等问题。而在分析了现有的挖掘用户行为模式的方法后,发现目前类 Apriori 方法的挖掘结果失去了签到点间的时空关联特性;而时间序列频繁模式挖掘的时间开销又无法接受。因此,针对基于用户签到行为模式的位置推演过程中存在的无法推演隐式地点的问题,本文提出一种基于签到序列模式的隐式位置推演技术。该技术首先将用户的签到数据以天为时间单位生成签到序列;其次,建立用户签到序列对应的模式序列模型;然后,根据用户的模式序列扩展了用户的签到序列,增加了候选集数量,降低了数据稀疏性;最后,设计了一种采用贝叶斯方法的位置推演算法,算法基于前文扩展的数据集,保证了对隐式位置的有效性以及可用性。
..........
参考文献(略)