<tbody id="5lyhc"></tbody>
<dd id="5lyhc"><track id="5lyhc"></track></dd>

  • <button id="5lyhc"><acronym id="5lyhc"></acronym></button>

    <rp id="5lyhc"></rp>
    收藏本站
    《江苏大学》 2019年
    收藏 | 手机打开
    二维码
    手机客户端打开本文

    基于随机森林和支持向量机的糖尿病风险预测方法研究

    缪琦  
    【摘要】:糖尿病治疗时间长,没有立竿见影的治疗方法,并且随着病情的加重,有着严重的并发症,如视网膜功能障碍、脑梗死机率增大和冠状动脉病变等。糖尿病前期的及时发现对于控制糖尿病的发展有极其重要的意义,但是糖尿病前期的病症表现并不明显,单靠某项检测指标很难判断,若在普通体检中增加多个指标,会大大增加时间和费用上的消耗,因此可以建立一个有效的数学模型协助医生对糖尿病前期进行有效的判断,从而提高糖尿病前期的诊断率。当前很多研究表明支持向量机可以对非线性糖尿病数据进行有效的分类,使用随机森林算法可以帮助支持向量机模型从具有小边际效应和复杂相互作用的特征集合中识别出主相关特征。本文使用支持向量机对糖尿病数据进行训练得到分类模型,结合随机森林给出的特征重要度对其加以改进,得到适应性更好的预测模型。本文的主要工作如下:(1)糖尿病数据中包含多个因素,这些因素与目标函数的相关性往往是不同的。针对无关特征对预测模型产生不良影响的问题,提出一种改进的随机森林特征选择方法,该方法采用随机森林算法计算出特征的平均置换重要性并经决策树权重加权后对数据特征排序,采用包裹式评价方式和后向序列法筛选出最优特征子集。实验结果表明该方法可以有效地识别并消除糖尿病数据中冗余的特征。(2)针对单核在数据分析上存在自身局限性的问题,提出了一种多核支持向量机,该方法采用兼容单核函数优点的多核核函数建立预测模型,基于糖尿病数据的分析选择合适的核函数组合,并且采用粒子群优化算法寻求模型中参数的最优值。同时考虑到样本数据不平衡的问题,建模前先对数据集进行采样。实验结果表明该方法可以得到性能更优良的预测模型。(3)针对特征重要程度明显不同会造成模型可靠性不高的问题,提出了一种基于随机森林和多核支持向量机的糖尿病预测模型,该方法先采用随机森林算法和多核支持向量机分类结果筛选出合适的特征数据集,再使用多核支持向量机模型对其进行训练以及预测,并且利用特征加权增强与糖尿病分类更相关的特征对结果的作用。实验结果表明该方法提高了模型整体的分类精度以及可靠性。
    【学位授予单位】:江苏大学
    【学位级别】:硕士
    【学位授予年份】:2019
    【分类号】:TP181;R587.1

    【参考文献】
    中国期刊全文数据库 前10条
    1 张红艳;石文惠;张明;尹磊;庞超;冯天平;张璐;任永成;王炳源;杨香玉;周俊梅;韩成义;赵阳;赵景志;胡东生;;基于中国农村人群的非侵袭性2型糖尿病风险预测模型的建立[J];中华预防医学杂志;2016年05期
    2 陈海红;;多核SVM文本分类研究[J];软件;2015年05期
    3 胡湘萍;李彦勤;;特征加权的核学习方法[J];计算机工程与应用;2015年14期
    4 李飞;王贻坤;朱灵;张元志;计敏;张龙;刘勇;王安;;基于神经网络模式识别的糖尿病无创风险评估方法研究[J];光谱学与光谱分析;2014年05期
    5 陈松景;罗森林;潘丽敏;张铁梅;韩龙飞;赵海秀;;2型糖尿病患病因素对血糖影响的定量分析[J];北京理工大学学报;2014年02期
    6 杨杰明;刘元宁;曲朝阳;刘志颖;;文本分类中基于综合度量的特征选择方法[J];吉林大学学报(理学版);2013年05期
    7 孙凤;陶庆梅;陶秋山;杨兴华;曹纯铿;詹思延;;中国台湾地区35~74岁健检人群2型糖尿病患病率以及5年发病风险预测模型[J];中华疾病控制杂志;2013年05期
    8 刘畅;;糖尿病前期防治的研究进展(综述)[J];中国城乡企业卫生;2012年03期
    9 李娟;吴疆;卢莉;刘东磊;庞星火;胡永华;;基于支持向量机建立环境和遗传因素对2型糖尿病的预测模型[J];中华疾病控制杂志;2012年02期
    10 汪廷华;田盛丰;黄厚宽;;特征加权支持向量机[J];电子与信息学报;2009年03期
    【共引文献】
    中国期刊全文数据库 前10条
    1 张红艳;张明;石文惠;胡东生;;2型糖尿病风险评估模型的研究进展[J];中华预防医学杂志;2016年09期
    2 张国刚;徐向辉;;基于加权纹理特征的SAR图像目标识别算法[J];国外电子测量技术;2015年09期
    3 杜雅芹;成旭东;;DPP-4抑制剂(西格列汀)对糖尿病前期人群的治疗效果与安全性分析[J];现代仪器与医疗;2015年05期
    4 魏亚利;刘丽;项雪琰;齐绪停;;基于随机特征子空间及加权核函数的SVM算法[J];山东师范大学学报(自然科学版);2015年03期
    5 胡菊香;吕学强;刘克会;;利用类别引导词的投诉文本分类[J];现代图书情报技术;2015年Z1期
    6 陈晓军;;糖尿病从肝胆论治初探[J];糖尿病新世界;2015年14期
    7 黄昊红;;2型糖尿病的中西医综合治疗[J];吉林中医药;2015年07期
    8 何凤英;钟尚平;肖玉麟;;基于改进支持向量机的高维隐写盲检测方法[J];计算机工程;2015年06期
    9 杨志伟;努尔布力;贾雪;胡亮;;基于ReliefF的入侵特征选择方法[J];吉林大学学报(理学版);2015年03期
    10 武小年;彭小金;杨宇洋;方堃;;入侵检测中基于SVM的两级特征选择方法[J];通信学报;2015年04期
    【二级参考文献】
    中国期刊全文数据库 前10条
    1 陈冯梅;郭志荣;武鸣;周正元;骆文书;;腰围和BMI动态变化对2型糖尿病发病的影响[J];中华预防医学杂志;2015年12期
    2 文江平;田亚平;;2型糖尿病高危人群筛查研究进展[J];国际检验医学杂志;2015年18期
    3 贾伟平;;糖尿病慢性并发症的适宜筛查技术[J];中华内科杂志;2014年08期
    4 唐思源;柳原;崔媛;;利用支持向量机对癌细胞的识别[J];软件;2014年03期
    5 高明;李俊娟;吴云涛;王希柱;赵剑秋;侯金泓;李雯;陈朔华;李慧英;张东红;吴寿岭;;睡眠时间与2型糖尿病发病风险的相关性研究[J];中华内分泌代谢杂志;2014年05期
    6 袁爱领;齐伟;钱旭;;基于流形正则化的支持向量机文本分类[J];软件;2013年02期
    7 李眩;;基于免疫支持向量机的预测研究[J];软件;2012年01期
    8 张龙;张元志;王贻坤;朱灵;余锋;张弓;刘勇;王安;;基于支持向量机的皮肤自体荧光光谱分类方法在糖尿病筛查中的应用[J];激光生物学报;2012年01期
    9 张雷;张盼;娄培安;余加席;陈培培;张宁;陈娜;姜姗;;睡眠质量及时间与2型糖尿病的关系研究[J];中华疾病控制杂志;2012年02期
    10 李娟;吴疆;卢莉;刘东磊;庞星火;胡永华;;基于支持向量机建立环境和遗传因素对2型糖尿病的预测模型[J];中华疾病控制杂志;2012年02期
    【相似文献】
    中国期刊全文数据库 前10条
    1 沈智勇;苏翀;周扬;沈智威;;一种面向非均衡分类的随机森林算法[J];计算机与现代化;2018年12期
    2 于大海;李金;罗艳虹;刘近春;张岩波;;随机森林模型和决策树模型在肝硬化上消化道出血预后中的应用[J];中国卫生统计;2019年02期
    3 胡蝶;;基于随机森林的债券违约分析[J];当代经济;2018年03期
    4 赵艺淞;杨昆;王保云;黎晓路;;随机森林在城市不透水面提取中的应用研究[J];云南师范大学学报(自然科学版);2017年03期
    5 吴辰文;梁靖涵;王伟;李长生;;一种顺序响应的随机森林:变量预测和选择[J];小型微型计算机系统;2017年08期
    6 顾娟;林敏;鞠桂玲;;基于随机森林回归的军械器材需求预测[J];自动化应用;2017年09期
    7 刘迎春;陈梅玲;;流式大数据下随机森林方法及应用[J];西北工业大学学报;2015年06期
    8 罗超;;面向高维数据的随机森林算法优化探讨[J];商;2016年04期
    9 杨晓峰;严建峰;刘晓升;杨璐;;深度随机森林在离网预测中的应用[J];计算机科学;2016年06期
    10 张强;;随机森林在居民购房意愿研究中的应用[J];现代经济信息;2016年13期
    中国重要会议论文全文数据库 前10条
    1 尤东方;赵杨;;存在混杂时高维数据的随机森林分析[A];2017年中国卫生统计学学术年会论文集[C];2017年
    2 张涛;李贞子;武晓岩;李康;;随机森林回归分析方法及在代谢组学中的应用[A];2011年中国卫生统计学年会会议论文集[C];2011年
    3 吕洁;;基于随机森林算法对内蒙古地区地面逐日平均温度的估算[A];第34届中国气象学会年会 S20 气象数据:深度应用和标准化论文集[C];2017年
    4 张炜;;天津市人才吸引力影响要素评价——基于随机森林法的检验分析[A];发挥社会科学作用 促进天津改革发展——天津市社会科学界第十二届学术年会优秀论文集(中)[C];2017年
    5 谢忠局;王琳璘;王琦;陈永权;;基于随机森林的电力企业现金流预测模型研究[A];第二届智能电网会议论文集[C];2018年
    6 高洪利;;基于随机森林算法的卷烟销量预测及分析[A];中国烟草学会学术年会优秀论文集[C];2017年
    7 武晓岩;方庆伟;;基因表达数据分析的随机森林方法及算法改进[A];黑龙江省第十次统计科学讨论会论文集[C];2008年
    8 杨学良;陶晓峰;黄福兴;熊霞;;基于随机森林及时间序列模型的电能量异常数据检测及修复方法[A];第三届智能电网会议论文集[C];2018年
    9 柯智元;刘怡飞;樊冀闽;张华平;苏焕章;胡安可;曾奕明;陈晓阳;;基于随机森林算法的阻塞型睡眠呼吸暂停低通气综合征的睡眠呼吸暂停低通气指数预报[A];中国睡眠研究会第十届全国学术年会汇编[C];2018年
    10 高磊;秦慧杰;许康;;基于随机森林的资源三号影像地表覆盖信息提取[A];地理信息与人工智能论坛暨江苏省测绘地理信息学会2017年学术年会论文集[C];2017年
    中国重要报纸全文数据库 前2条
    1 本报记者 田新元;人工智能助力保险业智慧化转型[N];中国改革报;2017年
    2 张阳;5G时代,AI能走多远?[N];人民邮电;2019年
    中国博士学位论文全文数据库 前10条
    1 王晓军;基于大数据的风洞马赫数集成建模方法的研究[D];东北大学;2016年
    2 王鑫;基于随机森林的认知网络频谱感知算法研究[D];东北大学;2016年
    3 姚登举;面向医学数据的随机森林特征选择及分类方法研究[D];哈尔滨工程大学;2016年
    4 黄玥;VANET信息安全问题及异常检测技术研究[D];吉林大学;2017年
    5 倪强;基于随机前沿和随机森林法的沿海开发区发展效率研究[D];天津大学;2011年
    6 季斌;内蒙古浩布高地区多金属矿综合信息找矿预测研究[D];合肥工业大学;2017年
    7 雷震;随机森林及其在遥感影像处理中应用研究[D];上海交通大学;2012年
    8 金超;基于随机森林的医学影像分割算法研究及应用[D];苏州大学;2017年
    9 李宝富;巨厚砾岩层下回采巷道底板冲击地压诱发机理研究[D];河南理工大学;2014年
    10 赵东;基于群智能优化的机器学习方法研究及应用[D];吉林大学;2017年
    中国硕士学位论文全文数据库 前10条
    1 彭宜;基于残差网络和随机森林的音频识别方法研究[D];武汉科技大学;2019年
    2 任雨林;基于改进的随机森林模型的云平台资源使用状态预测研究[D];武汉科技大学;2019年
    3 崔洁;基于随机森林的激光超声金属表面缺陷识别方法研究[D];中北大学;2019年
    4 张倩;基于随机森林回归模型的住房租金预测模型的研究[D];东北师范大学;2019年
    5 刘天宇;基于集成支持向量机与随机森林的蛋白交互预测研究[D];东北师范大学;2019年
    6 连婷;基于随机森林和夜间灯光数据的建筑物尺度人口估算[D];华东师范大学;2019年
    7 胡天宇;基于Spark的随机森林算法优化与并行化研究[D];齐鲁工业大学;2019年
    8 于大海;基于BP神经网络和随机森林算法的冠状动脉狭窄风险识别模型研究[D];山西医科大学;2019年
    9 尤毅;基于随机森林模型的某商业银行企业信用风险评估实证研究[D];上海交通大学;2017年
    10 朱亦农;基于KMV-随机森林模型信用债券违约风险度量[D];山东大学;2019年
    中国知网广告投放
     快捷付款方式  订购知网充值卡  订购热线  帮助中心
    • 400-819-9993
    • 010-62791813
    • 010-62985026


    福利黄片