当前位置:论文写作 > 毕业论文范文 > 文章内容

基于决策树的全日制本科生英语四级考试通过

主题:数据 下载地址:论文doc下载 原创作者:原创作者未知 评分:9.0分 更新时间: 2024-02-02

简介:大学硕士与本科成绩数据毕业论文开题报告范文和相关优秀学术职称论文参考文献资料下载,关于免费教你怎么写成绩数据方面论文范文。

成绩数据论文范文

数据论文

目录

  1. 2.桂林电子科技大学高教研究中心,广西壮族自治区 桂林 54004)
  2. 1. 引言(Introduction)
  3. 2. 数据准备(Experimental data)
  4. 3. 数据分析(Data analysis)
  5. 5.0次实验中得到测试准确率最高的决策树如图1—图8所示.
  6. 4. 结论(Conclusion)
  7. 数据:WPS Office表格 成绩统计教程一:数据检查

易新河1,文益民2,陈雄伟2

(1.桂林电子科技大学计算机科学与工程学院,广西壮族自治区 桂林 54004;

2.桂林电子科技大学高教研究中心,广西壮族自治区 桂林 54004)

摘 要:我国大学生为通过大学英语四级考试需要付出很大的时间代价,分析影响大学英语四级考试通过的原因,对于采取针对性措施通过英语四级考试意义重大.以某特色地方工科高校教学管理系统为研究对象,从中提取了四个学院的学生成绩数据,采用决策树方法进行了分析.数据分析结果表明:大学英语课程成绩对大学英语四级考试通过影响最大,毕业设计成绩、高等数学课成绩、专业基础必修课成绩也会影响大学英语四级考试的通过,基础必修课成绩对大学英语四级考试通过的影响不大.

关键词:教育数据挖掘;大学英语四级考试;决策树

中图分类号:TP391 文献标识码:A

1. 引言(Introduction)

《国家中长期教育改革与发展规划纲要》中对新时期人才培养提出了新的要求,即培养“适应国家经济、社会对外开放的要求,培养大批具有国际视野,通晓国际规则,能够参与国际事务与国际竞争的国际化人才”.随着经济全球化的加剧,高校英语教育的重要性日益提高.大学英语四级,即CET-4(College English Test Band 4).它是由国家教育部高等教育司主持的针对大学生或研究生开展的全国性英语水平考试.1987年正式实施.目的是推动大学英语教学大纲的贯彻执行,对大学生的英语能力进行客观、准确的测量.不容置疑,大学英语四级考试极大地推动了我国大学生英语水平的提高,为我国国际化人才的培养做出了巨大贡献.然而,大学英语四级考试也使得我国大学生付出了巨大的时间代价.分析影响大学英语四级考试通过的因素,对于采取针对性措施通过英语四级考试意义重大.

文秋芳等使用调查法和统计分析法对影响大学英语四级考试通过的因素进行了分析,发现“高考英语成绩”“性别”“母亲受教育程度”“母语策略”“形式操练策略”“深层动机”和“努力程度”,对大学英语四级考试成绩具有明显的预测能力[1];胡啸等使用调查法和统计分析法证明了英语学习策略与大学英语四级考试成绩相关[2];叶瑞娟等使用调查法和统计分析法证明了学生英语平时成绩、学习时间、性别、高考英语成绩、教师授课态度等均是大学英语四级考试通过的影响因素[3].

教育数据挖掘[4]是数据挖掘在教育领域的应用.近年来,教育领域积累的数据迅速增长,国内外(尤其是国外)学者对教育数据(尤其是远程教育的数据)挖掘展开了广泛的研究[5].然而,这些研究主要针对远程教育开展.如何利用每个学校积累的全日制本科数据进行数据挖掘?如何使用数据挖掘方法对影响大学英语四级考试通过的因素进行分析?王娜等使用广义线性回归法对同年级不同专业的39名在校大学生的年龄、高考分数、籍贯、性别、民族、是否为独生子女、中教英语类课程成绩、外教英文类课程成绩、数学类课程成绩、政治理论课程成绩、计算机类课程成绩、专业课课程成绩、体育课程成绩、实践类课程成绩等14项数据指标与是否首次通过大学英语四级考试之间的关系进行了研究[6];郑培钿等使用调查法和决策树方法分析了大学生的英语基础、努力程度、学习方法、学习兴趣、社会压力和英语氛围与大学英语四级考试通过之间的关系[7].曹丹阳等使用决策树方法分析了专业、学生性质(定向、非定向)、性别、科类、民族、地区、学生班主任、学生英语教师、大学英语一、大学英语二、大学英语三、大学英语四与大学英语四级考试通过的关系[8].以上研究的不足在于:第一,样本量太小,数据挖掘得到的结果不一定可靠;第二,模型的泛化能力不好.

本文尝试使用决策树方法对某特色地方工科高校教学管理系统中2007级和2008级学生的成绩数据进行深入分析,利用决策树容易解释的优点分析影响大学英语四级考试通过的因素.

2. 数据准备(Experimental data)

本文中使用了某特色地方工科高校教学管理系统中机械工程学院、信息与通信工程学院、计算机科学与工程学院及电气与自动化学院2007级和2008级学生的成绩数据.其中数据基本情况见表1.根据数据挖掘的需要,提取了学号、大学英语课程平均成绩、高等数学课平均成绩、基础必修课平均成绩(不包括高等数学)、专业基础必修课平均成绩、毕业设计课程成绩、大学英语四级考试成绩.

3. 数据分析(Data analysis)

数据分析采取了两种方案.第一种方案是区分学院,也就是分别对机械工程学院、信息与通信工程学院、计算机科学与工程学院及电气与自动化学院这四个学院的学生数据进行分析;第二种方案不区分学院,也就是将四个学院的学生成绩数据合并在一起进行数据分析.如表1和表2中的“总计”.以上两种方案又分别先使用2007级学生数据作为训练集,2008级学生数据作为测试数据,然后再交换.使用从训练集学习到的决策树对测试集进行分类,统计准确率.实验结果如表2所示.

决策树的训练算法采用论文范文.5算法,论文范文.5算法选择具有最大信息增益率的属性作为分裂属性.剪枝采用了降低错误率的“后剪枝”方法.剪枝时使用随机抽取训练集中1/10的样本进行剪枝,使用训练集中其他样本进行训练.实验重复50次.对测试集的准确率的均值和方差如表2所示.

表2中以2007级为测试集的准确率都比表1中对应的2007级大学英语四级考试通过率都要高.表2中除掉带下划线的结果外,以各学院2008级为测试集的准确率要比2008级的大学英语四级考试通过率要高.一般情况下,2007级的学生成绩数据分布不见得与2008级学生成绩数据分布相同.因此,采取上述的交叉测试的策略仍然能得到上述结果,这说明得到的决策树具有较大合理性.

5.0次实验中得到测试准确率最高的决策树如图1—图8所示.

通过分析50次随机实验得到的这50颗决策树可以知道:英语平均成绩出现在决策树第一层和第二层的次数占绝对多数;出现在决策树的第二层和第三层次数最多的属性是毕业设计成绩、其次是专业基础必修课平均成绩、再次是高等数学课平均成绩;基础必修课几乎在决策树的前三层不出现.这说明了:工科大学生的大学英语成绩的好坏对大学英语四级考试通过的影响最大,其次是毕业设计、专业基础必修课和高等数学课.大学英语四级考试通过与基础必修课成绩的好坏关系不大.

显然,大学英语成绩的好坏会直接影响到大学英语四级考试的通过.但是,决策树分析表明:大学英语成绩较好时才能确保大学英语四级考试通过.这可能是因为大学英语四级考试的难度比平常的大学英语课程考试的难度要大.毕业设计成绩也与大学英语四级考试的通过相关,可能是因为毕业设计成绩和大学英语四级考试成绩都会影响到学生的就业质量.专业基础必修课和高等数学课会影响到大学英语四级考试的通过可能是因为这两门课的成绩的好坏体现着学生的学习态度和学习习惯,因此会影响到大学英语四级考试的通过.基础必修课成绩由于与就业、考研直接关系不是很强,因此对大学英语四级考试的通过的影响最小,以上分析有待通过调查证实.

数据:WPS Office表格 成绩统计教程一:数据检查

4. 结论(Conclusion)

本文以一所特色地方工科高校的教学管理系统中的数据为研究对象,使用决策树方法分析影响英语四级考试通过的因素.发现工科学生的大学英语课程成绩对其大学英语四级通过影响最大,毕业设计成绩、高等数学课成绩、专业基础必修课成绩也会影响大学英语四级考试的通过,基础必修课成绩对大学英语四级考试通过的影响不大.根据此特点,可以根据学生大学英语课成绩、高等数学课成绩、专业基础必修课成绩采取有效措施促进学生通过大学英语四级考试.

未来的工作包括:通过大规模学生调查验证数据挖掘的结果;使用更多的学生信息来分析影响大学英语四级考试通过的因素;建立利用大学生第一、二学年的数据来进行大学英语四级考试通过的预测,以尽早采取措施帮助学生更高效率地通过大学英语四级考试.

参考文献(References)

[1] 文秋芳,王海啸.学习者因素与大学英语四级考试成绩的关系[J].外语教学与研究,1996,(4):33-39.

[2] 胡啸,唐霞.大学生英语学习策略与英语四级考试成绩相关性研究[J].硅谷,1999,(22):165.

[3] 叶瑞娟,梁波,周舒冬.大学英语四级考试成绩影响因素的分析及思考[J].广东药学院学报,2008,24(4):429-431.

[4] 葛道凯,张少刚,魏顺平.教育数据挖掘[M].北京:教育科学出版社,2012.

[5] Romero C,Ventura S.Educational data mining:a review of the state of the art[J].IEEE Transactions on Systems,Man,and Cybernetics-Part C:Applications and Reviews,2010,40(6):601-617.

[6] 王娜,李关民.广义线性模型在大学英语四级考试通过率研究中的应用[J].沈阳工程学院学报(自然科学版),2010,6(3):281-284.

[7] 郑培钿,等.基于ID3算法的英语四级考试条件结论信息数据挖掘[J].信息与通信,2012,(2):121-122.

[8] 曹丹阳,等.基于决策树的英语四级成绩分析[J].北方工业大学学报,2007,19(1):38-41.

作者简介:

易新河(1969-),女,学士,助理研究员.研究领域:合作教育,教育数据挖掘.

文益民(1969-),男,博士,教授.研究领域:高教管理,教育数据挖掘.

陈雄伟(1975-),男,硕士,讲师.研究领域:高教管理,教育数据挖掘.

总结:该文是关于成绩数据论文范文,为你的论文写作提供相关论文资料参考。

数据引用文献:

[1] 大数据营销学论文选题 大数据营销专业论文题目怎么拟
[2] 数据挖掘博士论文题目范文 数据挖掘博士论文题目如何定
[3] 数据结构方向论文选题 数据结构论文题目怎么取
《基于决策树的全日制本科生英语四级考试通过》word下载【免费】
数据相关论文范文资料