论文部分内容阅读
随着计算能力日渐强大的移动智能设备的广泛普及,一种基于众包思想而衍生出的移动计算范式——移动群智感知,可以协调网络中的移动用户群体通过携带的智能设备进行大规模的数据收集和复杂的任务计算。另一方面,数据交易可以打破数据孤岛,提高数据的流通性和复用性,但它同时也面临数据来源匮乏和多样性欠缺的问题。因此本文利用移动群智感知在数据收集方面的智能性、普适性、低成本等优势构建一种新型的移动群智感知数据交易系统。这种数据交易系统既可以按需收集和分析数据也可以实现数据的高效共享利用,对促进数据货币化和商业化具有重大意义。在开放系统环境下,移动群智感知数据交易系统的设计存在许多挑战。首先,每个移动用户可以自由进出系统,系统很难获悉用户的个人信息和能力,因此用户招募是一个信息未知的在线决策过程。其次,系统中通常存在多方参与者之间的博弈,需要平衡多方参与者的收益以激励他们的参与积极性。最后,多方参与者之间涉及到大量隐私信息和数据的交互,任何参与者的不可信行为(如窃听他人的隐私信息、违反预先设计的机制、虚构信息等)都会影响交易的公平性,从而导致参与意愿的降低。针对以上问题,本文从以下三个方面进行了深入的研究,主要贡献如下:(1)基于组合多臂赌博机的未知用户在线招募机制。针对开放系统环境下用户质量信息未知的问题,本文提出了基于组合多臂赌博机的未知用户在线招募机制。该机制将移动用户的未知质量信息的学习过程形式化为组合多臂赌博机的摇臂拉动过程,并为质量学习过程设计了扩展的上置信界(Upper Confidence Bound,UCB)索引,以平衡质量估计误差带来的不确定性。与已有工作相比,本文还考虑了数据请求者的预算有限、数据收集任务异构、移动用户的任务偏好和成本虚报问题。为此,该机制在多臂赌博机模型下通过综合考虑预算、UCB索引、成本和任务偏好建立了用户招募的指标模型,并在此基础上提出了用户招募的贪心策略,同时利用反向拍卖和临界值理论为移动用户计算报偿,以防止具有社会化行为的移动用户通过虚报成本以牟取额外收益进而影响其他移动用户的利益。本文通过严格的理论证明和真实世界的车辆轨迹数据集上的大量实验模拟验证了所提出机制可以在有限预算下实现近似诚实性、个体理性、计算效率并获得较好的质量学习效果和用户招募效果。(2)基于Stackelberg博弈的异构数据交易激励机制。针对开放系统环境下存在多方参与者博弈的问题,本文提出了基于三阶段层次Stackelberg博弈的数据交易激励机制。与大多数现有三方参与的数据交易侧重单边或双边的两方博弈不同,本文提出的激励机制考虑更加复杂的三方同时博弈过程并考虑了质量未知的情况。通过综合考虑数据请求者(称为数据消费者)的估值信息、平台的数据服务成本信息、移动用户(称为数据卖家)的数据收集成本信息和利用组合多臂赌博机模型学习的质量信息,本文为每个参与者设计相应的利润函数,并基于倒推法推导出数据价格同质和异构的两种交易场景下的最优激励策略。最优激励策略满足特殊的Stackelberg均衡,并保证任何参与者都无法通过偏离最优激励策略来提高自身利润。因此,该激励机制可以同时最大化三方参与者的利润(即均衡性)并实现交易的公平性,从而鼓励参与意愿低的各方积极参与移动群智感知数据交易并驻留系统。通过严格的理论分析,本文证明了两种数据交易场景下的最优激励策略构成的Stackelberg均衡存在且唯一。大量的实验模拟也验证了该激励机制的优越性能。(3)基于区块链的安全可信数据交易系统。针对开放系统环境下任何具有社会化行为的参与者都可能违反交易规则,包括随时退出系统,提交不真实的成本、数据、评估信息,窃听他人成本和数据隐私等问题,以及大多数现有工作使用中心化的第三方系统平台作为数据交易代理商的流程不透明带来的信任隐患和参与意愿降低的问题,本文设计了一个基于区块链的群智感知数据交易系统,并在运行于区块链上的智能合约中嵌入了以下两种机制来解决以上安全性挑战。1)基于区块链的反向拍卖机制使用区块链作为拍卖执行者并采用两阶段竞价策略来选择数据卖家和确定报偿,可以确保所有数据卖家遵循拍卖流程并如实报告其成本,并且保证没有任何参与者可以通过在交易过程中窃听他人的成本信息来操纵反向拍卖并从中牟利。2)安全的真值发现和可靠性评级机制是基于同态加密和数据隐藏技术实现的,可以激励数据卖家提交真实的感知数据,敦促数据消费者如实评估数据,并保护数据隐私在此期间不被泄露。通过为智能合约附加一些区块链特有的设计技巧并结合以上两种机制,本文可以保证该系统满足系统层面的安全性,即交易流程的可信性、诚实性(包括成本、数据、评估的真实性)和隐私保护(包括数据和成本信息)。本文通过大量真实区块链环境中的实验模拟验证了所提出的系统的实用性和可行性。总体而言,本文提出的三个研究方案可以解决移动群智感知数据交易在开放系统环境下的不同需求和不同场景下数据收集、数据交易、数据评估等阶段面临的不同问题,并且也可以被融合以解决同时涉及多阶段的复杂数据交易场景,具有较高的实用性和可扩展性。