优胜从选择开始,我们是您省心的选择!—— 无忧期刊网
帮助中心
期刊发表
您的位置: 主页 > 论文范文 > 经济论文 > 正文

大数据挖掘风险评估研究

作者:admin 来源:未知 日期:2020-11-27 08:29人气:
  摘要:随着网络数据体量的增加,AI图景中隐含的风险因素增多,加重了AI图景的使用风险,威胁各个行业与工作领域。而传统方法由于获取风险因素的静态关联规则,当数据体量不断上涨时,其风险等级评估结果严重脱离实际,因此研究AI图景下,基于大数据挖掘的风险评估方法。此次评估基于大数据挖掘,获取风险因素动态关联规则;利用云模型,粒化AI图景;根据评估矩阵,评估AI图景的使用风险。实验证实数据体量不断增长条件下,此次研究方法的风险评估结果,与给定结果一致。可见此次研究的风险评估方法,可用来测量AI图景的使用风险。
  
  关键词:AI图景;大数据挖掘;风险评估;动态关联规则
  
  现阶段我国提出“新一代人工智能发展规划”,并在第十三届全国人大一次会议政府工作报告中指出,“做大做强新兴产业集群,实施大数据发展行动,加强新一代人工智能研发应用”。可见在网络科技创新发展背景下,人工智能技术的发展越来越受到国家的关注。人工智能技术全称为ArtificialIntelligence,是根据人脑思维模式创建的一项机器智能技术,但随着人工智能技术的不断优化升级,AI图景下,各行各业都将该技术应用到企业发展中,通过提升高工作效率、降低决策成本等,进一步调整企业生产与项目管理。但AI图景发挥强大功能的同时,也带来了巨大的风险,例如人工智能技术构建AI图景时,需要智能采集基本数据,侵害了企业的数据产权;黑盒疏漏打破了大数据平衡等等[1]。因此针对现阶段的问题,传统方法根据文献[2]中的部分内容,将风险程度分为无风险、一般风险、中度风险以及重度风险,结合贝叶斯网络,建立了基于多状态贝叶斯决策树的风险评估模型,用来评估AI图景下的风险因素[2]。但随着网络信息体量的不断增加,该评估方法出现了不适用的问题,因此在AI图景下,研究基于大数据挖掘的风险评估方法。大数据挖掘就是从大规模异构或多源数据中,找出其中隐藏的风险因素,或识别风险因素之间的关联特征,再通过计算评估风险程度,为目前海量的网络数据,提供更加可靠的评价结果。
  
  1AI图景下基于大数据挖掘的风险评估方法
  
  1.1基于大数据挖掘获取风险因素动态关联规则
  
  一般意义上来说,风险因素关联规则是静态的和永恒有效的,但是当前社会的大环境在变化,人们的需求也在不断改变,风险因素的静态关联规则,已经是过去的风险评估基本条件,此次研究根据目前的变化特征,引入支持度向量和置信度向量,通过大数据挖掘结果,描述规则在时间变化下的动态特性。大数据挖掘算法,将动态关联规则进行定义:现阶段的风险因素动态关联规则,是描述AI图景数据自身特性随时间变化而改变特性的关联规则。因此假设在t时间段内,AI图景下基于大数据挖掘的风险评估研究王伟(河南工业贸易职业学院信息工程系,河南郑州,451191)摘要:随着网络数据体量的增加,AI图景中隐含的风险因素增多,加重了AI图景的使用风险,威胁各个行业与工作领域。而传统方法由于获取风险因素的静态关联规则,当数据体量不断上涨时,其风险等级评估结果严重脱离实际,因此研究AI图景下,基于大数据挖掘的风险评估方法。此次评估基于大数据挖掘,获取风险因素动态关联规则;利用云模型,粒化AI图景;根据评估矩阵,评估AI图景的使用风险。实验证实数据体量不断增长条件下,此次研究方法的风险评估结果,与给定结果一致。可见此次研究的风险评估方法,可用来测量AI图景的使用风险。关键词:AI图景;大数据挖掘;风险评估;动态关联规则获得事务数据集A,然后根据需要,将时间段t分割为n个不相交的时间序列,即{}12,,,nt=ttt,用{}12,,,mI=iii,表示项的集合。再将数据集A划分为n个不相交的数据子集,即{}12,,,nA=AAA,此时可以说数据子集(1,2,,)iAi∈n的数据,是在(1,2,,)iti∈n时间段内收集到的。假设X、Y表示非空项集,且X、Y均属于集合项的集合I,则关联规则可用X⇒Y表示。该规则同时具有支持度和置信度[3]。令支持度()Ac=PX∪Y,表示两个项集在A中同时出现的概率;令置信度(|)As=PYX,表示项集X在A中某一事务集出现的情况下,该事务集同时也出现项集Y的概率。根据上述参数,确定风险因素动态关联规则的表达式为X⇒Y(C,S,c,s),其中C表示支持度向量;S表示置信度向量。则该规则的频数向量计算表达式,如下所示:在数据子集(1,2,,)iAi∈n中出现的频数。因此大数据挖掘算法,按照下列步骤挖掘整个动态关联规则:找出频繁项集F,并计算其相应的频数向量H;根据频繁项集F,再次扫描AI图景生成数据库,产生动态规则,且根据H产生向量C和向量S。由于大数据的特征之一就是价值密度低,因此大数据挖掘算法通过两阶段挖掘的形式,计算节点间的动态负载均衡,以此实现对风险因素动态关联规则的挖掘。
  
  1.2粒化AI图景
  
  云模型是大数据挖掘中一个计算型模型,可以揭示风险因素的模糊性与随机性之间的关联,因此通过云模型粒化AI图景。假设定量论域用D表示,G是定量论域的定性概念,若定量值α∈D,且α是定性概念的一次随机实现,那么α对G的确定度为λ(α)∈0,1,表示有稳定倾向的随机数,即λ:D→0,1,∀α∈D,α→λ(α),此时在论域D上的分布,就是云模型,每一个α为一个云滴。利用期望Eα、熵En以及超熵Ge的特征,反映定性概念G整体上的定量特征。使用云模型粒化AI图景,就是使用逆向云发生器,从数据集中得到反映定性概念的数字特征集,该集合可表示为{(Eα,En,Ge)},利用该集合将图景划分为n个粒。利用云模型分割具有不同风险AI图景,得到每个图景对应的一个粒,根据该粒以推广的方式,评估风险指数。1.3风险评估根据粒化后的AI图景,建立判断矩阵,进行AI图景使用稳定性风险评估。该判断矩阵的部分参数,K表示图景使用稳定性风险;U1、U2、U3、U4分别表示机制风险、社会用户风险、图景生成风险、环境影响风险;uij表示指标Ui比指标Uj重要的程度量化值。该判断矩阵中,uii=1;uji=1/uij,且uij>0。根据上表1中的数据,制定所有影响AI图景的风险因素的判断矩阵,并计算所有判断矩阵的最大特征值和对应的特征向量,通过归一化得到判断矩阵的权重向量,该权重用ijω表示。假设最大特征值为maxϕ,则一致性指标的计算结果为:由于风险因素具有多样性、复杂性等特征,因此只依靠上述指标,判断图景使用稳定性风险K时,还具有一定的片面性,因此利用平均随机一致性指标RI,来弥补一致性指标的不足。用一致性指标CI比上平均随机一致性指标RI,得到的一致性比率用CR表示。当CR<0.1时,则判断矩阵通过一致性检验;当CR≥0.1时,说明判断矩阵未通过一致性检验,需要重新调整判断矩阵。根据确定的评估矩阵,执行评估工作。至此在AI图景下,实现基于大数据挖掘的风险评估。
  
  2对比实验
  
  设置此次研究的风险评估方法,为实验组;传统方法为对照组。搭建仿真实验平台,利用仿真测试软件,模拟海量信息生成的AI图景存在的风险程度。分别利用上述两个测试组,测试数据体量动态变化下,AI图景中隐含的风险指数,结果如图1所示。根据图中的风险评估结果可知,当数据体量在100GB时,两种方法的风险评估结果极为相近。当数据体量分别为5000GB、10000GB以及100000GB时,实验组的风险评估结果,与表3中给定的数据近似;而对照组对含有3组海量信息的图景,其风险评估结果均在0.3~0.4之间,当数据体量增加到10000GB、100000GB时,风险评估结果的变化非常微弱。表1为两个测试组的风险等级评估结果。根据表中的数据可知,虽然实验组的风险指数评估结果,没能与给定结果完全一致,但高度近似的评估结果,可以认为实验组方法评估可靠,其得到的风险等级,也与给定数据一致。而对照组的风险指数评估结果,只有前两组与给定结果近似,后两组评估结果完全失真,因此最终得到的风险等级,也完全错误。可见实验组评估结果更加贴合实际。
  
  3结束语
  
  此次研究的风险评估方法,经过实验论证后,得到了较高的评价,但受个人能力以及研究经验限制,还存在一些不足之处,今后的风险研究工作中,可以对大数据挖掘算法进行改进,进一步优化关联规则获取方式,使得到的评估数据,更能体现AI图景基本现状,为国家AI技术的发展与应用,提供性能更好的评估方法。
  
  参考文献
  
  [1]蒋洁.AI图景下大数据挖掘的风险评估与应对策略[J].现代情报,2018,38(05):147-151.
  
  [2]杨建华,周震宇,奚洪磊,等.基于数据挖掘的继电保护系统风险评估模型[J].信息技术,2018,42(07):60-64.
  
  [3]李珏,李世杰.基于文本挖掘的高处坠落事故致因及关联规则分析[J].长沙理工大学学报(自然科学版),2020,17(02):61-67+74.
  
  作者:王伟 单位:河南工业贸易职业学院信息工程

在线客服:

无忧期刊网 版权所有   

【免责声明】:所提供的信息资源如有侵权、违规,请及时告知。

专业发表机构