您好,欢迎进入半岛体育官方网站!

全国咨询热线

020-03846697

2022年数学建模国赛C题“古代玻璃制品的成分分析与鉴别半岛体育官方网站”思路解析

发布时间:2024-08-13 08:57浏览次数:

  对表单一中的数据进行处理:补全缺失值并对数据进行简化和量化;剔除表单2中的无效数据,将表单1的纹饰、类型、颜色和表面风化与表单2文物采样点的数据对应起来。

  要研究表面分化和纹饰,颜色,类型相关关系,先进行卡方检验比较P值是否呈现显著性,确定分量间是否有相关性,之后才能采用SPSS建立对应分析模型,并利用散点图判断之间的关系。

  结合玻璃类型分析文物样品表面有无风化化学成分含量的统计规律时,对处理的表单2的化学成分含量据计算均值和方差并进行正态性检验,得到统计性描述数据来分析化学成分含量规律。

  建立移位平均模型来预测分化前的化学成分含量,分别计算高钾和铅钡玻璃化学成分风化和无分化风化的平均值,接着分别求高钾和铅钡玻璃风化和无风化的平均值的差,把各类型的差值与各个玻璃风化的化学成分数值相加,得到的数值为风化前的化学成分含量。

  表单1的数据量较小,并且有部分数据缺失,如果直接删除缺失项,则可能会影响对数据的分析,因此把缺失的数据项补全,应当是定性数据且对个体精度要求不大,采取相同条件下出现次数最多的值也就是众数来补缺失值。

  数据量化是将一些不具体,模糊的因素用具体的数据来表示,以一定范围内线性变换的数据反映自然界或社会的状态,从而达到分析比较的目的。

  玻璃文物的化学文物成分比例介于85%~105%之间的数据为有效数据,用EXCEL对成分比例求和,按顺序排列后,剔除不符合的行。将表单1中的类型和表面风化与表单2整合在一张表中,并进行量化 。

  对表面风化和纹饰,颜色,类型的相关关系的分析,采用对应分析的方法。做对应分析之前,需要对交叉表进行卡方检验,只有卡方检验结果显示两个分类变量之间具有相关性,才作对应分析,如果没有,分析出的结果没有普遍性。

  卡方检验(Pearson)是比较定类变量与定类变量之间的差异性分析。通过统计样本的实际观测值与理论推断值之间的偏离程度,实际观测值与理论推断值之间的偏离程度就决定卡方值的大小,如果卡方值越大,二者偏差程度越大;反之,二者偏差越小;若两个值完全相等时,卡方值就为0,表明理论值完全符合。

  其中:A是实际值,T为理论值,χ2就是衡量理论与实际的差异程度,χ2越大,说明定类变量之间有关系的可能性大。具体操作使用SPSSAU为分析工具。

  对玻璃文物的表面风化与其玻璃类型、纹饰和颜色的关系进行对应分析之前,需要先对其进行卡方检验,检验数据之间是否独立。

  对应分析R型因子分析和Q型因子分析都是反应一个整体的不同侧面,因而存在一是R-Q型因子分析,通过分析由定性变量构成的交互汇总表来揭示变量间的联系。由于定联系。对应分析就是通过对应变换后的标准化矩阵Z将两者有机地集合起来。

  得出结论:铅钡玻璃容易风化,高钾玻璃不易风化;纹饰B容易风化,AC不易风化。

  颜色的卡方检验P值过大,不易进行对应分析。根据表单1中的数据,大致得出:深蓝色和绿色不易被风化,其他颜色与表面风化得不出什么密切联系。

  对数据计算均值和方差并进行正态性检验,得到统计性描述数据来分析化学成分含量规律。

  根据附件来分析高钾玻璃、铅钡玻璃的分类规律,先将表单1纹饰、类型、颜色和表面风化和表单2的数据整合在一张表中,补全颜色缺失的部分。使用CRT生长法来进行决策树分类,得出高钾、铅钡玻璃的分类规律。

  对两类玻璃根据化学成分进行亚类划分,先对每个化学成分进行显著性分析并判断是否存在显著性差异,提取出具有显著性差异的化学成分,对高钾和铅钡玻璃有显著性差异的化学成分建立系统聚类模型,得出划分结果。最后使用近似值矩阵来判断分类结果的的合理性,若近似值越大,合理性越强,其敏感性通过增加或减少化学成分的含量,重新进行系统聚类,比较新,旧两种聚类结果,分析敏感性。

  分析高钾玻璃、铅钡玻璃的分类规律,在已知玻璃的化学成分比例下,选择建立决策树模型来找出划分两类玻璃的划分标准,具体操作:

  决策树分类依据梳理出的数据中的属性,比较按照某种特定属性划分后的数据的信息熵增益,选择信息熵增益最大的那个属性作为第一划分依据,然后继续选择第二属性,以此类推。其中信息熵越大,样本的纯度越低,信息增益=信息熵-条件熵。

  决策树采用的是自顶向下的递归方法,以信息熵为度量构造一颗熵值下降最快的树,到叶子节点的熵值为0。

  对高钾玻璃和铅钡玻璃进行亚类划分时,选用化学成分有显著性的建立系统聚类模型,得出划分结果。

  显著性的含义是指两个群体的态度之间的任何差异是由于系统因素而不是偶然因素的影响。

  这里求解分组变量的显著型差异采用事后多重比较的方法,得出方差分析结果显示哪些化学成分水平上存在显著性,将具有显著性的成分作为系统聚类分析的变量,求出亚类划分的结果。

  系统聚类分析(Hierarchical Cluster Analysis)的基本思想是,按照距离远近,将距离相近的变量先聚成类,距离较远的变量后聚成类,依次进行,直到每个变量都归入合适的类中。

  组间平均距离连接法:合并两类的结果使所有的两两项对之间的平均距离最小,使用平方欧氏距离,将距离相近的变量聚成一类。

  根据近似值矩阵,越接近0近似值越小,近似性数值越大,说明越相似,以矩阵的方式呈现分类结果的合理性。

  预测未知玻璃文物的类型,对已知的表单2的化学成分和类型之间的规律分析,进行显著性,正态性检验,得出数据具有线性关系,可以建立类型和化学成分之间的多元线性回归方程,基于最小二乘法,利用SPSSPRO得出回归系数,进而在给定的化学成分下,预测玻璃文物的类型。

  最后对回归模型进行敏感性研究,可以通过改变回归模型中一个自变量来观察因变量的变化,预测结果变化的大小,得出敏感度系数,通过系数即可判断出敏感性程度,对分类结果的敏感性进行总结。

  建立多元线性回归方程求回归因子(自变量为化学成分,因变量为玻璃类型),在给定的化学成分下,,基于最小二乘法,使用SPSSPRO建立线性回归模型,求解模型的标准化系数B,t值,VIF值,R2,调整R2等,用于模型的检验,并分析模型的公式。

  根据上图得出拟合效果优秀,预测值和真实值的偏差并不大,使用多元线性回归预测出的结果准确率高,可以去预测未知类型的文物。

  令化学成分在可能的取值范围内变动,研究和预测化学成分的变动对模型输出值的影响程度。将影响程度的大小称为该属性的敏感性系数。敏感系数越大,说明化学成分对模型输出的影响越大。其中敏感系数数值的大小不是计算该项的目的,重要的是各不确定因素敏感系数的相对值,借此了解各不确定因素的相对影响程度,以选出敏感度较大的不确定因素,来分析结果的敏感性。

  要得出每个类别的化学成分之间的关联关系,分别对两类玻璃的化学成分进行相关分析,得出相关系数结果表和相关系数热力图,针对相关系数做出成分之间的相关强度的统计图,根据以上图表总结关联关系和比较两类玻璃化学成分的差异性。

  由问题四分析,分别对两类玻璃文物样品的化学成分之间的关联性进行分析,可以看作是根据一个变量与另一各变量是否大于临界值,判断两个因素是否相关,根据相关系数大小判断两个因素关系的密切程度,相关系数越大,说明两者关系约密切,因此建立相关性分析模型即可得出化学成分之间的关联性。

  数维杯大学生数学建模挑战赛近年来连续多次被各大高校纳入学科竞赛加分名单,并列为国家级C类竞赛,彰显了数维杯广泛的认可度和影响力。同时,竞赛还得到了国内latex平台技术支持、全国百余所高校协办、科研单位以及国内资深数学建模专家、人民教育在线等国内主流媒体的大力支持。

  本次竞赛国内外队伍的踊跃参与,离不开全国百余所高校的鼎力支持和积极宣传,在此特对相关工作人员表示感谢,在竞赛倒计时12天之际,也迎来了同学们的报名高峰期。

  特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

  王家伟火了!1996 年出生的他,28 岁成为副处级干部,涉事单位回应

  EPSN评欧足坛50大教头:瓜帅第1,穆帅仅排17,前10有2人无工作!

  千万财力打底, 「海淀式鸡娃」十八年一场空:得到如此之少, 失去如此之多

  与中坚力量共成长,2024建信信托艺术大奖评委会特别奖获奖艺术家凌海鹏

020-03846697