电力论文哪里有?本文以海量 95598 工单数据为基础,开展工单分类、人员工作效率评判,构建有效的分析模型,实现对工单分类精简、客服人员工单处理效率评估功能的研究,改进当前对客户服务数据分析的局限性,提升客户服务分析管理水平。
第一章 绪论
1.2 国内外对工单分类模型的研究
在大数据背景下,对成千上万条文本信息进行数据挖掘愈发流行,其中文本分类技术的研究也在不断深入,利用语义分析、聚类等大数据相关技术进行文本挖掘研究已经成为一项重要研究课题。
文献[7-12]基于 TF-IDF 值计算词相似度进行文本分类研究,文献[13]基于 LDA 主题模型对情感分析进行研究,文献[14]基于贝叶斯层次聚类实现对文本的数据挖掘工作,文献[15]基于深度主题特征提取模型,将有监督学习与无监督学习相结合,提高多文本分类的性能,文献[16]基于生成式对抗网络与异质集成学习进行文本分类研究,文献[17]基于 CHI(Chi-square Statistics)和 PCA(Principal Component Analysis)的混合特征降维方法(CHI-PCA)进行多模型融合的新闻文本分类研究,文献[18]基于词典与改进信息增益对微博情感进行分析研究,文献[19-23]基于深度学习进行文本分类研究,文献[24]基于旋转森林和 AdaBoost 分类器对多标签文本进行分类研究,文献[25]基于 AdaBoost 集成与朴素贝叶斯对农业短文本信息分类进行研究。
关于电力工单文本分析也已经进行了较多的研究工作,文献[26]基于单一深度学习模型和融合的方法判断工单标签类别。而且电力企业也运用文本挖掘、语义分析、聚类等大数据相关技术对文本数据进行深入挖掘;文献[27]研讨的是 95598 工单分类问题,采用主成分分析方法将工单按月份排列,找出多种类型的工单数量与时间的关联性,建议合并部分月末高发的工单类型;文献[28]是研究 95598 工单文本分类和用户情感识别分析问题,建立客服词典库,完成用户情感识别,获取工单处理最优顺序,提高客服工作人员服务效率。
由此可见,在电力改革快速发展的背景下,原始的基于经验学概括归纳得到的工单分类需要进行优化改进,所以本文采用多技术融合的方法对工单文本内容的潜在价值信息进行更深入的数据挖掘,不断开展更多标签的分类研究,进行高效的、有针对性的工单分类精简从而提高客服坐席人员的工作效率,提高用户的满意度。
第三章 基于聚类的工单分类精简实例研究
3.1 文本聚类算法
文本聚类原理就是按照文本相似程度来对文本进行分类,当文本向量之间的相似度很高时,它们将被分组到同一个类簇中,如果文本之间不相似,那么它们会被分到不同的类簇中,在文本挖掘领域进行文本相似度分析中,聚类算法的选择对获得精确的聚类效果非常重要。
(1) K-means 聚类
K-means[58][59]聚类算法的思想比较简单,聚类花费时间短,很适合应用于大规模数据的处理。
其算法步骤如图 3-1 所示。
(2) Hierarchical clustering 聚类
层次聚类(Hierarchical clustering)主要分为凝聚(agglomerative)型层次聚类和分裂(divisive)型层次聚类,凝聚型层次聚类是将每个样本单独看作一类,找到最相似的样本然后将它们合并重新去计算他们的相似度,一直迭代该过程直到满足条件不再细分而终止,分裂型层次聚类则相反,它是将所有数据集整体看作一个类,然后把最不相似的样本划分为子类,重新计算相似度,一直迭代过程直到满足算法的结束条件[60]。
第五章 绩效考核模型效率评估结果对比
5.1 坐席人员效率考核现状数据分析
本章将坐席人员处理呼入工单的数据进行分析,针对目前客服坐席 KPI 考核模型存在的问题,基于上一章提出的基于经验层次贝叶斯的改进人员效率评估模型,对 95598客服坐席人员考核评估的结果与原 KPI 模型的考核评估结果进行分析对比,验证经验层次贝叶斯模型的优势。
客服坐席效率评估模型路线如下图 5-1。
范文
本文应用原 KPI 计算模型和 EHB 模型来对比分析 N 市 95598 客户服务中心提供的真实数据。95598 客户服务中心于 2020 年 1 月生成了 167,944 个呼叫记录,并非所有电话都必须接受 EHB 模型评估。根据客户服务中心提供的“工单统计规则”、“95598 工单处理实现规则”对每条工单记录做标注,过滤掉不相关的记录后,获得了 39,710 条记录。本文使用原 KPI 绩效考核方法对 2020 年 1 月的数据进行了计算。
5.2 绩效考核模型实验仿真
本研究在 R 软件中进行实例仿真,使用的工具包为 stringr,openxlsx,dplyr,lme4,ggplot。
多层回归模型中的固定效应是业务类别,随机效应是班组和首次服务坐席:班组。这里的“业务类别”即对应回归方程中的“工单类型”,即变量 Z ;“(1|班组/首次服务坐席)”代表回归公式中的“个人效率”,即参数 。本研究中,N 市客户服务中心有 206位客服坐席人员,分为不同班组以关注不同类型的问题,班组共有 24 个。
1) “业务类别”因子:订阅信息;故障报修;建议;举报;其它;投诉;意见;用电业务;咨询查询。
2) “班组”因子:回访 1 组;回访 2 组;回访 3 组;回访 4 组;N 市 1 班;N 市2 班;N 市 3 班;N 市 4 班;投诉 1 组;投诉 2 组;投诉 3 组;投诉 4 组;综合 1 班 1 组;综合 1 班 2 组;综合 1 班 3 组;综合 1 班 4 组;综合 2 班 1 组;综合 2 班 2 组;综合 2 班 3 组;综合 2 班 4 组;综合 3 班 1 组;综合 3 班 2组;综合 3 班 3 组;综合 3 班 4 组。
3) “首次服务坐席”因子:首次工作的客服人员。 程序运行结果如下表 5-5,5-6,5-7 所示,系数表显示 系数估计值及其显著性水平:
Estimate:截距(0b ,以上显示为-2.5654),即与每个预测变量相关的 系数估计(如业务类别订阅信息的系数为-2.0504);
Std.Error:系数估计值的标准误差。这代表了系数的准确性,标准误差越大,估计值的准确性越低;
Z value: z 统计量,即系数估计值(表 5-5 中第 2 列 Estimate)除以估算值的标准误差(表 5-5 中第 3 列 Std.Error);
Pr(>|z|):对应于 z 统计量的 p 值。 p 值越小,估计值对结果变量来说就越重要。
第六章 总结与展望
6.2 工作展望
本文研究的是基于大数据的电力 95598 服务质量提升研究,还存在以下问题需要更进一步探讨:
(1) 在工单分类精简研究中,会发现在进行特征词选择时,应该剔除掉与电力关系不大的词汇,比如“客户”、“工作”和“人员”等,几乎大部分工单来电内容都含有这些词语,此类词汇都不可作为特征词,这些词汇作为特征词来表示此类工单的主题意义不大,剔除掉它们后,会降低后续文本聚类的算法复杂度。
(2) 在基于经验分层贝叶斯的效率模型评估中,本文假设工单完成效果有两个主要因素决定,即客服坐席个人效率和工单难度,在实例研究中,只针对一月份数据进行研究,实际会发现工单难度会随着温度、时间和季节的变化而变化,比如夏日空调用电就比春秋用电量大,月底抄表催费也会导致派单数增加,针对上述问题还需要对不同月份进行实例研究,判断经验层次贝叶斯模型的稳健性。
(3) 想要提高电力 95598 服务质量,不仅仅可以从工单分类精简和科学评判人员工作效率两个方面进行研究。要保障电力 95598 服务质量提升的顺利进行并切实提高坐席人员工作效率,企业还要着重关注制度、文化和技术方面的保障。
参考文献(略)