计算机论文哪里有?本文研究了基于 WiFi 的跨场景行为感知技术。这一技术将基于 WiFi 实现行为感知,将具有被动感知、部署成本低、识别精度高、可跨场景使用等优点。
第一章 绪论
1.2国内外研究现状
由于其高传输速率,适中的信号覆盖范围和低能耗,WiFi 已在我们的日常生活中广泛应用。WiFi 是一种利用电磁波信号通信的方式,由于电磁波信号的传播中存在多径效应,人类行为和室内环境变化等因素都可以影响 WiFi 接收器最终接收到的信号。因此,类似 RFID,除了用于网络通信外,WiFi 也具有被视为传感器的潜力。基于以上背景,研究人员发明了许多基于 WiFi 的无线传感应用程序,它们可以分为两类:位置跟踪和人类行为识别。
位置跟踪:文献[1]提出了一种基于 Sigma-Point 卡尔曼平滑器(SPKS)的定位和跟踪算法,并将收集到的 WiFi RSSI 用于室内跟踪和定位。文献[2]设计了 Pilot 系统,该系统可以使用收集到的 CSI 来实现被动室内定位。文献[3]提出了一种新颖的基于深度学习的室内指纹识别系统,该系统使用信道状态信息(CSI),称为 DeepFi。文献[4]使用 WiFi 来设计分米级跟踪系统 Widar,Widar 2.0[5]进一步改进实现了单链路的跟踪方法。文献[6]使用 CSI 和接收信号强度信息(RSSI)共同融合实现精确的室内定位。
人类行为识别:WiS ee[7]使用通用软件无线电外围设备(USRP)处理 WiFi 信号,从而实现高精度的人类手势识别。但是,USRP 是专用设备,价格昂贵,特别是对于大规模部署而言。
在使用商用 WiFi 的系统中,WiFall[8]和 RT-Fall [9]通过获取 WiFi 信号的 CSI,以实现检测老年人或患者的跌倒检测。WiHear [10]使用特殊的定向天线来获取 CSI 数据,并分析人嘴唇变化引起的 CSI 变化来进一步识别人的言语。WiWho[11]基于 CSI 提取频谱图,识别每个人的步态信息,最后实现人物分辨。文献[12]甚至使用多个访问点(Access Point, AP)来识别人的行为以提高准确度。文献[13]利用时频注意力机制提出了一种人类行为识别系统。SlideAugment [14]是一种称为窗口切片的数据增强方法,这种方法可以提高行为识别的准确度,并且具有良好的解释性。DeepSeg[15]是一个基于深度学习的活动细分框架,可用于使用 WiFi信号进行活动识别。
第三章 基于 BiLSTM 的跨场景迁移识别系统
3.1 系统设计
3.1.1 挑战
使用商用 WiFi 来实现跨场景行为识别系统面临许多挑战。首先,使用 WiFi 信号采集到的 CSI 数据量巨大,且有效信号被湮没在巨大的环境噪声中。如何有效的从数据中排除各种噪声和环境因素干扰,成功识别行为是一个挑战。其次,WiFi 信号位于丰富多路径场景中,接收到的信号是多个反射路径的组合。其次,WiFi 信号位于多径场景中,不同的环境,甚至人类身高和体重差异都会影响接收信号的特征。这就造成了不同场景下的同一个行为,所采集到的信号也可能有很大差异,不同环境下训练的模型无法通用。我们将在接下来的部分中应对这些挑战。
3.1.2 设计思路
由于 WiFi 信号存在多径效应,而人类行为可以改变 WiFi 信道的多径特性,使得信号具有不同的幅度和相位变化。因此,我们可以通过采集分析 WiFi 信道状态信息(CSI)来识别人类行为。CSI 数据包含幅度和相位信息,但是在使用相位信息时,需要解决诸如相位包裹之类的干扰问题。因此,本章提出的系统将仅使用 CSI 幅度信息进行行为识别。
由人类行为产生的 CSI 幅值数据是一个典型的时间序列,因此,我们可以把基于 CSI 的行为识别问题概括成一个时间序列分类问题。根据[26],隐马尔可夫模型(HMM)可以解决处理这类序列分类问题。但是使用 HMM 会造成模型无法进行跨场景迁移的问题。因此,我们把视线聚焦于人工神经网络模型。由于 LSTM 在处理时间序列的问题有着卓越的效果,所以当遇到时间序列的分类问题时,我们很自然的想到使用 LSTM 来解决。更进一步的考虑,我们使用 CSI 数据是一组类似自然语言的前后关联数据,使用 BiLSTM 可以更好的捕捉双向的语义依赖,因此我们可以将 BiLSTM 应用在本系统中。
第五章 基于 DBA 的最佳源模型挑选
5.1 背景及核心方法
在前两章中,我们使用微调方法进行跨场景下的模型适配。在使用这一方法之前存在着一个主要挑战,它就是:在有多个源模型可选的情况下,如何选择训练效果最佳的源模型M𝑆。
在文献[47]中,作者证明了如果训练数据集之间的边际分布差距较大,则使用微调方法将不会产生最佳性能。直观上的感受来说就是,在使用微调方法进行迁移学习时会出现准确率下降、训练时间较长、无法收敛等情况。在上一章的实验中,我们使用到了 5 个数据集进行评估,如果两两数据集之间都进行微调训练,则需要训练 5×4=20 个模型,这大大增加了迁移学习需要的计算资源。因此,为了更好的选择源模型M𝑆,我们将探索一种预先选择预训练模型的方法。
我们知道,两条时间序列之间的相似度可以使用动态时间扭曲(Dynamic Time Warping, DTW)方法来评估,而文献[47]还证实了这一方法对整个数据集也是有效的。因此,在本章中,我们会将 DTW 方法扩展到计算 CSI 数据集之间的相似性上,并会将以此为依据对最佳源模型M𝑆的挑选给出指导意见。
5.2相关方法简介
5.2.1 DTW 简介
DTW 即动态时间规整(Dynamic Time Warping)[48],这是一种基于动态规划方法来计算两个时间序列间最小距离的算法,也是一个典型的优化问题。在一些典型的时间序列比较问题中,例如两条语音的相似性计算问题中,DTW 方法能够发挥重要作用。
假设我们有两条时间序列数据 X = (𝑥1,𝑥2,…,𝑥m)和 Y = (𝑦1,𝑦2,…,𝑦n),它们的长度可能并不相同,分别是 m 和 n。由于不同时间序列长度可能不同,因此在进行最终比较前,我们需要先将两个序列进行对齐操作。对齐的方法有很多,最简单的即线性缩放。但是,线性缩放并没有考虑其中内容持续时间的长短变化,例如语音序列中发音可能拖长也可能缩短。因此,线性缩放之后进行对比效果并不好,此类问题更多的是需要采用动态规划方法。
DTW 在进行对齐前将会建立一个m × n的矩阵,矩阵中的元素(i, j)表示𝑥i 和𝑦j 两个点的距离,即序列 X 第 i 个点到序列 Y 第 j 个点之间的距离,距离值越小则说明越相似,该值一般采用欧式距离。DTW 中采用 DP 算法以便寻找一条通过矩阵网格若干个点的路径,这条路径可以让经过的点累积距离最小,这条路径经过的点便是两个序列对齐的点。因此,DTW 算法在序列已扭曲或变形的情况下,仍然能最小化地计算出两个时间序列之间的距离。
第六章 总结与展望
目前,行为感知技术已大规模应用于生产生活各个领域。为了使计算机感知人的行为,实现人机交互,异常行为报警等,对人类行为感知的研究具有重要意义。传统的人类行为感知技术都具有某些弱点。例如,基于计算机视觉的行为识别需要足够的光线,并且目标也需要暴露于相机下;基于可穿戴设备的感知需要使用者每时每刻都佩戴设备。因此,改进以上弊端,研究一种新型的行为感知技术是势在必行的。由于 WiFi 设备具有分布广泛,被动识别,容易部署等特点,因此,使用 WiFi 信号进行行为感知有着广泛的应用前景,可以给日常生活带来巨大便利。目前,研究人员已开始使用 WiFi 进行行为识别,他们发明了许多基于 WiFi的无线传感应用程序,例如:跌倒检测、睡眠监测、行为识别、轨迹跟踪等。
虽然众多工作已经证明 WiFi 作为感知技术拥有巨大潜力,但目前存在一个明显的缺点,即 WiFi 行为识别系统在跨场景识别中表现并不佳。为了使 WiFi 感知模型可以进行跨场景使用,增强系统的鲁棒性,对跨场景识别技术的研究十分必要。
基于此,本文研究了基于 WiFi 的跨场景行为感知技术。这一技术将基于 WiFi 实现行为感知,将具有被动感知、部署成本低、识别精度高、可跨场景使用等优点。主要的工作如下所示:
1. 本文对行为感知的研究现状进行了归纳总结,详细介绍了行为感知,与行为感知相关的时间序列分类,以及与跨场景相关的迁移学习等技术背景。
2. 本文设计了一系列预处理步骤来处理原始 CSI 数据流,从而提高了系统的鲁棒性和可靠性,并加快了后续的模型训练过程。
3. 本文基于 BiLSTM 和 Conv1D 网络分别构建了基于 WiFi 的人类行为识别模型,且都可以实现高准确率的识别。
4. 本文设计了一个基于微调的行为识别模型场景适配方法,避免从零开始训练模型。仅需很少的训练时间,模型就可以达到与从零开始训练模型相似的准确度,从而大大降低了适应新场景成本。
5. 本文设计了一个基于 DBA 的最佳源模型的挑选方法,此方法使用 DBA 算法来将数据集的进行合并,使用 DTW 算法来计算数据集之间的相似度,并以此为依据对微调前的源模型选择给出指导意见,可以进一步提升微调效率。
参考文献(略)