上海论文网提供毕业论文和发表论文,专业服务20年。

机器学习构建理念之机构财务预警体系概述

  • 论文价格:免费
  • 用途: ---
  • 作者:上海论文网
  • 点击次数:165
  • 论文字数:0
  • 论文编号:el201408261701206024
  • 日期:2014-08-26
  • 来源:上海论文网
TAGS:

第一章绪论


1.1本文研究背景和研究意义
随着金融市场的快速发展,企业高层通常会选择IPO或者再发行公司证券来募集资金。企业的财务状况直接关系到企业所有者、债权人和投资者的利益,更关系到企业生存发展⑴。但市场是讲究规律的。企业在融资、投资、项目营运等资金活动中,任何一个决策不当都可能使企业陷入财务危机中。因此现代公司必须实时对企业的财务风险进行客观评估,及时掌控自身的财务状况,管理控制好自身的财务风险[2]。当一个公司刚成立时,它的财务状况无疑是正常的,所以财务危机的发生是逐步量变的过程,因此企业的财务危机是可预测的。通过构建一个准确可信的公司财务危机预警系统来评估企业的财务风险,对企业的利益相关者,对企业财务部门的风险管理,对证券监管委员会的监管工作,都具有十分重要的现实意义。退市制度是证券市场一项基本制度,是指证券交易所制定的关于上市公司暂停、终止上市等相关机制的规定章程。据统计,已经有七十多家上市公司被股市清退,退市数为总公司数的1.8%。而NASDAQ股市每年公司退市比例更是达到8%0沪深两市现规定连续三年净资产为负,或者连续三年营业收入低于1000万元,或多次收盘价低于股票面值的公司将被终止上市[3]?公司出现财务危机是它们退市的主要原因。通过构建有效的财务预警机制,企业管理层就能及时发现其存在的财务问题,从而追本溯源,发现引发财务问题后面的经营决策问题,进而对症下药从根本上来预防财务危机。所以上市公司财务风险预警系统的研究意义重大。
………….


1.2国内外研究现状
国外于上世纪30年代就开始研究公司的风险预警,经过多年实证研究,已经形成了较为成熟的理论成果,并建立了多个有效的预警模型,并应用真实的公司财务数据作了大量的实验分析。1932年Fitz Patrick提出了单变量判定模型,运用单个财务比率判别破产组与非破产组的特征差异。研究发现了二个重要预警特征(净资产收益率和股东权益负债率)[6]。1968年Altaian提出了著名的多元线性判别Z评分模型。他以营运资本/总资产,留存盈佘/总资产,息税前利润/总资产,股权市值/债务账面价值,销售/总资产这五个特征作为输入,根据判别式求出模型的Z值。依据Z值的大小来判断企业是否处于财务危机中[8]。1980年,Ohlson提出了多元逻辑斯谙预警模型。他以两千多家破产和非破产公司为研究样本,建立了破产概率分布,比较两个条件概率值得大小来分类预警,他发现公司资产额、资本负债率、盈利能力和当前的融资能力这四个特征的风险预警能力最为良好[9]。1985年,Bartczak将现金流量指标加入到多元逻辑斯谛预警模型中。研究表明:资本支出现金流量和股利发放特征具有很强的预警能力[19]。1999年,Tirapat运用Logistic回归模型进行预警研究,以1997年泰国经济危机中破产的企业为研究样本,证实宏观经济因素对企业财务风险有一定影响。如果一家企业对通货膨胀率越敏感,其财务风险就越大。
………….


第二章财务危机预警基本理论及机器学习技术


2.1财务危机理论
财务危机,又称“财务困境”,关于什么是财务危机学者们并没有达成一个共识。因为财务危机存在多种表现形态一利润为负,无法偿付负债,违约等,而且财务危机有轻重之分,轻者仅仅是临时性短暂性的现金流出现问题,经过外界有效的帮助如银行贷款,付款日期延后,新一轮融资等有效措施之后,企业有可能度过难关,恢复企业的正常经营,而重者则是积重难返,无有效措施可行,只能申请破产。1972年,Deakin把“仅包括已经经历破产、无力偿债或为债权人利益而已进行清算的公司”定义为财务危机。1980年,Foster将财务危机定义为除非对企业的经营或结构进行大规模重组,否则就无法解决的严重的变现问题[25]。2000年,Ross从四个方面概括了企业财务危机,①技术失败,即企业无法按期履行债务合约来付息还本,②会计失败,即企业的账面净资产出现负数,资不抵债,③企业失败,即企业清算后无力支付到期债务,④法定破产,即企业或者债权人由于债务人无法到期履行债务合约[261。我国学者一般以公司财务出现两年连续亏损,或最近一年的每股净资产低于每股面值,或同时出现上述情况作为发生财务危机的标志。
………….


2.2系统模型理论基础
本文认同”对公司的历史财务数据进行数据模式的挖掘,我们可以达到企业财务危机预警的目的”这一观点.因此本文的财务危机预警系统本质上是对公司财务数据进行正常与非正常分类的二分类系统,机器学习中的监督学习系统。本文使用的模型应用到了机器学习理论中的svni-knn、adaboost、不平衡分类问题等理论,以下章节是对这些理论的介绍。支持向量机(support vector machines,SVM)是Vapnik教授于1995年提出的一种机器学习方法,它以结构风险最小化作为优化目标,其泛化能力要明显优于一些以经验风险最小化为优化目标的学习方法[3G]。在大部分数据线性可分时,SVM学习算法会加入惩罚因子C,通过优化引入C的误差函数来得到经验误差最小的决策面。非线性SVM问题的基本思路是:通过一种非线性映射,将样本空间的线性不可分问题转换为特征空间的近似线性可分问题,然后在特征空间中求解最大化间隔分类面。KNN_SVM模型是SVM与KNN相结合的一种模型,由史忠植教授提出。数值实验证明了使用支持向量机结合最近邻分类的分类器分类比单独使用支持向量机分类具有更高的分类准确率[35]。SVM-KNN的结合:根据SVM理论,在使用SVM分类时,分类超平面附近的样本基本上都是支持向量,错分的样本基本都出现在超平面附近,这也就提示了如果想提高分类性能,就要尽量充分地利用分界面附近的样本所提供的信息。而kNN算法就是利用样本附近的K个样本信息进行分类,因此我们可以将SVM与k-NN进行结合。
……………


第三章财务危机预警系统的构建........   24
3.1本项目主要技术路线 ........25
3.2根据财务预爱理论降维........ 27
3.3特征选择方法........ 29
3.4難降维之主成分分析........ 35
3.5基于生成样本的财务预瞀KNN-SVM模型 ........37
3.5.1基于半监督学习的稀有类样本釆样........ 37
3.6基于非平衡数据分类的KNN-SVM集成学习模型........ 3
3.6.1基于非平衡数据分类的财务预警集成学习模型........ 41
3.7引入模糊集对样本分类结果给出置信度 ........43
第四章实验及其结果分析........ 47
4.1 SVM及其分类特征有效性验证实验........   47
4.2基于KNN-SVM模型的财务预瞀实验........ 48
4.3基于生成样本的财务预瞀KNN-SVM模型实验........ 51
4.4基于非平衡数据分类的KNN-SVM集成........52
4.5样本分类结果置信度计算实验........ 55
4.6实验总结........ 56
第五章总结与展望........ 59
5.1总结 ........59
5.2展望........ 60


第四章实验及其结果分析


4.1 SVM及其分类特征有效性验证实验
根据分析,财务危机预警问题是一个非线性高维小数据量的监督学习问题。而根据经验,支持向量机在解决这类问题有很好的效果,为了验证上章选择的特征及SVM在处理财务报表数据上的分类有效性,本文建立了两个对比实验,基于原始特征的BP神经网络与SVM的模型对比实验,基于SVM的原始特征与pea得到的最终的特征的对比实验。BP神经网络与SVM的模型采用默认参数。首先确定训练集和测试集;其次对总体样本数据集进行信息增益法显著性检验相关性检验等特征选择,样本特征集由35个特征简化为30个;再然后标准化样本数据,利用PAC方法对样本数据进行主成分提取,本文选取了 11个主成分;然后用PAC特征数据训练SVM-KNN分类器。最后将测试集输入到构建完的分类器中,得到最终的分类结果。

………….


结论


本文根据机器学习理论构建了上市公司财务预警系统,从模型比较结果可知,当面对不平衡数据集分类时,传统的SVM-KNN模型对少数类的分类效果较差,加入了代价敏感学习的改进SVM-KNN模型对少数类的分类效果有很好的提高(在多数类分类效果微下降情况下),而基于半监督学习的人工合成SVM-KNN模型由于使训练的实际超平面与最优超平面偏移程度减弱,模型的正负类分类准确率及Gmeans值都有一定的提高。而集成模型由于adaboost算法的迭代训练更大关注前一轮被分错误的样本的学习而将分类错误率进一步降低。在特征提取方面,将数据降维技术特征选择技术统计学检验技术等技术进行交叉融合利用,我们一般可以得到我们满意的特征。针对正负类不平衡的二分类问题,引进类似SMOTE的人工生成样本数据方法和半监督学习机制,得到人工合成的带类标签的稀有类样本,可以增加稀有类的模式知识,可以避免“分类器对多数类过学习对稀有类欠学习“问题。在参数优化方面,运用包含群体进化和概率统计的分布估计算法得到的参数一般比简单的网格搜索法得到的参数更优。#p#分页标题#e#
…………
参考文献(略)

1,点击按钮复制下方QQ号!!
2,打开QQ >> 添加好友/群
3,粘贴QQ,完成添加!!