硕士
论文
政研论文下载论文大学下载论文大学下载关于长拳的论文浙大论文封面下载
质量评价问题
蔡新星,古振炎,黄祥振
摘要
本文讨论的是对硕士论文质量评价的问题,通过2006,2007,2008年硕士生论文的评
阅分数和各项指标分数,我们采用概率函数分布法、回归分析法来确定论文质量,总体水平,各方面特征以及硕士生的各个方面的能力。
对于问题一,我们将其分为两步进行解决: 一是对硕士生论文选题进行各专业的评价和各年的总体评价,二是对硕士生论文开题进行各专业的评价和各年的总体评价。我们首先求出各年各专业的XT和KT的平均值,按照分数对其进行排列,制表;然后求出各年的XT和KT的平均值并制表。通过对图表的对比分析,对硕士生论文选题与开题进行总体评价。得出2007年的XT平均值最接近3,有理论意义和实用价值的论文所占当年论文总数的比例最大;三年中学生所写的专业论文以既有理论意义又有实用价值的为主;2007年比较好的论文占该年论文总数的比例最大,写的开题最好。
对于问题二,我们通过两位专家评审的结果求出每篇论文的平均值,得出各年硕士论文评分的总体评价结果。然后通过计算各专业论文评分的平均值及
标准
excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载
差,列表比较,并制作成折线图,分析其高低及波动性,对各专业论文进行总体评价。得出各年论文的分数在不断的提高,论文的优秀率也在不断的提高,整体质量越来越好,总体上来说08年的论文最好,07年的其次;各专业的论文评分基本都在85左右,未出现很高或很低的分数,论文的质量比较的接近。
对于问题三利用回归分析的
方法
快递客服问题件处理详细方法山木方法pdf计算方法pdf华与华方法下载八字理论方法下载
,用matlab拟合出论文得分与选题开题期望的线性关系。首先我们通过MATLAB软件画出2006、2007和2008各年选题开题与总分之间的散点图以及其回归模型。再通过对stat的值的分析讨论出各年选题开题与总分之间的线性关系是否显著。对于各专业选题开题与总得分之间的相关关系,我们选取数量最多而且有代表性的专业13分析选题开题与总得分之间的相关性。类似的我们用MATLAB软件画出专业13的选题开题与总分之间的散点图以及其回归模型,再类似的分析其选题开题与总分之间的线性关系是否显著。
对于问题四,我们通过计算各年各专业硕士论文复审评分的平均值和标准差,对论文复审(毕业后的重新评阅)进行总体评价。得出2007年的论文质量最好,但三年论文复审的成绩均低于首次的评分;各学科论文的复审成绩均低于首次评价的成绩,且学科16、24初审成绩较好但复审出现了较大下滑,这又说明硕士论文的评审出现了缺陷。
为了解决问题五,在问题二与问题四的基础上,我们通过计算各年初审复审评分的平均值及标准差,得到初审复审评分平均值的差值,及各自波动情况。用EXCEL汇总各年各专业论文初审复审的平均值,制成折线图进行比较分析。通过折线图的比较发现,审分数得到的学科排名与初审得到的完全不同,说明当前论文评价体制的严重缺陷,既不能通过一次评审的分数而贸然得出学科排名;应建立更加完善、详细的评分细则,进一步减少主观判分造成的偶然性因素,以便使评审更加客观。
关键词:概率函数分布法、回归分析法、EXCEL、平均值、标准差、MATLAB软件
一、 问题重述
本题要求建立合理的硕士生论文质量评价体系,对硕士生的招生质量、论文质量等进行综合评价。同时,通过一系列的量化手段,分析研究生招生环节存在的问题,为后面的政策制定提供参考。
以下是题目所给出的信息: 2006-2008 年硕士生论文抽查表;2006-2008 年硕士论文复审抽查表。 根据题目提供的数据,我们需要解决以下问题:
问题一:对2006-2008 硕士论文的选题与开题进行总体评价,包括各专业的评价和各年的总体评价;
问题二:对2006-2008 硕士论文评分进行评价,同样需要包括各专业和各年的总评;
问题三:对各专业、各年硕士论文选题开题与论文得分之间的相关性进行分析, 并从中总结出一定的规律;
问题四:对2006-2008 论文复审(毕业后的重新评阅)的评价,包括各专业和各年的总体评价;
问题五:对硕士毕业前后论文的评分结果进行分析,从中得出一些结论,并在此结论的基础上提出自己的建议。
二、 模型假设
1、 假设初审论文与复审论文都是在某学校的硕士论文中随机收集的,排列顺序也是随机分布的。
2、 假设初审论文、复审论文的评阅信息之间是相互独立的,并且是有效的。
3、 假设06-08年硕士论文选题的评分标准,硕士论文
开题报告
课题研究开题报告ppt课题开题报告格式污水处理厂开题报告研究生开题报告酒店vi设计开题报告
指标、硕士论文评分不变。
4、 假设论文评阅不收受专业、年份等影响。
5、 假设专家和评阅教室对论文的评阅采取双盲评审制度(隐去硕士生姓名、知道老师姓名及其指导老师的参考文献等),客观公正,排除了评审中非学术因素的干扰。
6、 假设论文质量由论文最终得分唯一确定。
7、 假设开题的标准和选题指标对论文质量有决定性作业。
8、假设论文初审和复审得分共同决定论文质量。
三、符号说明
XT
选题
KT
开题
KT1
论文难度
KT2
论文工作量
KT3
研究
方案
气瓶 现场处置方案 .pdf气瓶 现场处置方案 .doc见习基地管理方案.doc关于群访事件的化解方案建筑工地扬尘治理专项方案下载
可行性
KT4
硕士生对文献资料和课题的了解程度
KT5
硕士生在论文选题报告中反映出的综合表达能力
KT6
对论文选题报告的总体评价
A1
论文选题
A2
文献综述
A3
论文难度和工作量
A4
发表学术论文及获奖
A5
论文体现的理论基础和专门知识
A6
论文体现作者的科研能力
A7
学风写作能力
四、问题分析
问题一分析:
为了解决问题一,我们将其分为两步: 一是对硕士生论文选题进行各专业的评价和各年的总体评价,二是对硕士生论文开题进行各专业的评价和各年的总体评价。我们首先求出各年各专业的XT和KT的平均值,按照分数对其进行排列,制表;然后求出各年的XT和KT的平均值,制表。通过对图表的对比分析,对论文选题与开题进行总体评价。
问题二分析:
为了解决问题二,我们通过两位专家评审的结果求出每篇论文的平均值,得出各年硕士论文评分的总体评价结果。然后通过计算各专业论文评分的平均值及标准差,列表比较,并制作成折现图,分析其高低及波动性,对各专业论文进行总体评价。
问题三分析:
对于问题三利用回归分析的方法,用matlab拟合出论文得分与选题开题期望的线性关系。首先我们通过MATLAB软件画出2006、2007和2008各年选题开题与总分之间的散点图以及其回归模型。再通过对stat的值的分析讨论出各年选题开题与总分之间的线性关系是否显著。对于各专业选题开题与总得分之间的相关关系,我们选取数量最多而且有代表性的专业13分析选题开题与总得分之间的相关性。类似的我们用MATLAB软件画出专业13的选题开题与总分之间的散点图以及其回归模型,再类似的分析其选题开题与总分之间的线性关系是否显著。
问题四分析:
对于问题四,我们通过计算各年各专业硕士论文复审评分的平均值和标准差,对论文复审(毕业后的重新评阅)进行总体评价。
问题五分析:
为了解决问题五,在问题二与问题四的基础上,我们通过计算各年初审复审评分的平均值及标准差,得到初审复审评分平均值的差值,及各自波动情况。用EXCEL汇总各年各专业论文初审复审的平均值,制成折线图进行比较分析得出结论。
五、模型的建立与求解
㈠问题一
⑴对硕士生论文选题进行各专业的评价和各年的总体评价
我们对各专业的XT进行量化分析,XT有理论意义的为1分,有实际意义的为2分,既有理论又有实际意义的为3分,意义不大的为4分。我们通过对各专业的XT进行求均值运算,并对其进行排名,可以得到各专业的排名表:
表1 各专业的XT平均值排名表
2006年
2007年
2008年
排名
学科序号
选题平均分
学科序号
选题平均分
学科序号
选题平均分
1
4
3
1
3
2
3
2
27
2.83333333
7
3
4
3
3
9
2.8
10
3
6
3
4
26
2.8
17
3
23
3
5
29
2.75
25
3
24
3
6
31
2.75
15
2.9
25
3
7
32
2.75
30
2.9
26
2.88888889
8
14
2.7
12
2.8965517
5
2.8
9
15
2.7
6
2.8888889
12
2.8
10
1
2.66666667
21
2.8214286
15
2.77777778
11
7
2.66666667
20
2.8148148
34
2.75
12
20
2.66666667
24
2.8
22
2.72222222
13
22
2.64705882
27
2.8
1
2.7
14
18
2.61111111
28
2.775
27
2.7
15
28
2.6
13
2.7714286
33
2.7
16
30
2.6
19
2.7307692
28
2.67647059
17
12
2.55555556
14
2.7142857
17
2.66666667
18
33
2.5
32
2.7
18
2.64
19
13
2.48275862
16
2.625
20
2.62068966
20
6
2.44444444
9
2.6
9
2.6
21
24
2.44444444
26
2.6
30
2.6
22
25
2.44444444
22
2.5757576
13
2.59375
23
16
2.4375
29
2.5454545
31
2.55555556
24
10
2.42857143
18
2.5416667
19
2.53571429
25
8
2.42105263
31
2.4
29
2.46153846
26
2
2.375
33
2.4
32
2.44444444
27
17
2.375
2
2.3333333
14
2.42857143
28
21
2.37037037
4
2.2631579
21
2.40740741
29
19
2.3125
11
1.9090909
16
2.38709677
30
11
2.25
8
1.4
8
2.35
31
3
3
10
2.2
32
5
5
11
2.2
33
23
23
3
2
34
34
34
7
1.75
通过表中的数据可以知道:
2006年各专业XT量化分数排名:4,27,9,26,29,31,32,14,15,1,7,20 ,22,18,28,30,12,33,13,6,24,25,16,10,8,2,17,21,19,11,3,5,23,34。相比较来说4,27,9,26专业的XT值比较接近3,既有理论意义又有实用价值;而17,21,19,11专业的XT值比较接近2,有实用价值但理论意义不强。
2007年各专业XT量化分数排名:1,7,10,17,25,15,30,12,6,21,20,24,27,28,13,19,14,32,16,9,26,22,29,18,31,33,2,4,11,8,3,5,23,34。
相比较来说1,7,10,17,25专业的XT值为3,既有理论意义又有实用价值;而2,4,11,8专业的XT值比较接近2,有实用价值但理论意义不强。
2008年各专业XT量化分数排名:2,4,6,23,24,25,26,5,12,15,34,22,1,27,33,28,17,18,20,9,30,13,31,19,29,32,14,21,16,8,10,11,3,7。相比较来说2,4,6,23,24,25专业的XT值为3,既有理论意义又有实用价值;而10,11,3,7专业的XT值比较接近2,有实用价值但理论意义不强。
通过题目所给的数据,我们还可以得到各年TX的平均值和标准差及各年中TX值为3的论文所占各年论文的比例。
表2 各年XT的平均值
年份
平均值
标准差
2006
2.557029
0.712771
2007
2.672065
0.625481
2008
2.60262
0.654352
表3 各年XT值为3的论文所占论文总数的比例
XT值为3的论文数
论文总数
XT值为3的论文所占论文总数的比例
2006年
259
377
0.687
2007年
374
494
0.757
2008年
319
458
0.697
图1 各年XT值为3的论文所占论文总数的比例
从表2、表3中的数据我们可以知道各年的TX平均值:2007 > 2008 > 2006 。2007年的XT平均值最接近3,有理论意义和实用价值的论文所占当年论文总数的比例最大,三年中学生所写的专业论文以既有理论意义又有实用价值的为主。
⑵对硕士生论文开题进行各专业的评价和各年的总体评价
我们将学生KT1~KT6各项开题报告的总得分作为学生开题报告得分。然后
对各专业的KT运算求出均值,并排名,得分越低,论文的开题报告越好。
表4 各专业的KT平均值排名
2006年
2007年
2008年
排名
学科序号
开题平均分
学科序号
开题平均分
学科序号
开题平均分
1
33
8.28571429
10
7.6
7
7.625
2
25
8.625
15
8.3
15
8
3
32
8.71428571
32
8.6
6
8.3333333
4
12
9.17647059
17
8.8
9
8.5
5
19
9.26666667
2
8.8888889
30
8.8
6
17
9.28571429
18
8.9583333
16
8.8064516
7
10
9.33333333
16
8.975
25
8.875
8
11
9.33333333
7
9
12
8.9
9
21
9.53846154
8
9
2
9
10
1
9.55555556
9
9.1
17
9
11
20
9.64285714
29
9.3636364
31
9.1111111
12
8
9.66666667
25
9.4444444
18
9.2
13
6
9.70588235
20
9.5185185
27
9.3
14
31
9.71428571
1
9.6
26
9.3333333
15
22
9.75
24
9.6
20
9.3793103
16
24
9.75
19
9.6153846
10
9.4
17
13
9.82142857
21
9.6785714
8
9.45
18
4
9.85714286
14
9.7142857
28
9.4705882
19
18
9.94117647
28
9.725
13
9.625
20
9
10
11
9.7272727
4
9.7
21
16
10.0666667
4
9.7368421
24
9.9
22
28
10.1052632
13
9.7714286
5
10
23
2
10.1428571
12
9.7931034
29
10
24
30
10.2142857
26
10.4
22
10.361111
25
27
10.4
27
10.4
11
10.4
26
14
10.4444444
30
10.5
23
10.5
27
15
10.5555556
22
10.969697
19
10.571429
28
7
10.75
31
11.1
1
10.7
29
29
10.8571429
33
11.6
21
10.777778
30
26
11.1111111
6
11.666667
33
10.9
31
3
3
14
11
32
5
5
32
11.333333
33
23
23
34
12
34
34
34
3
13.5
通过表中的数据可以知道:
2006年各专业KT排名:33,25,32,12,19,17,10,11,21,1,20,8,6,31,22,24,13,4,18,9,16,28,2,30,27,14,15,7,29,26,3,5,23,34。就普遍来讲专业33,25,32的开题比较优秀,而7,29,26的开题比较的一般。
2007年各专业KT排名:10,15,32,17,2,18,16,7,8,9,29,25,20,1,24,19,21,14,28,11,4,13,12,26,27,30,22,31,33,6,3,5,23,34。
就普遍来讲专业10,15,32,17的开题比较优秀,而31,33,6的开题比较的一般。
2008年各专业KT排名:7,15,6,9,30,16,25,12,2,17,31,18,27,26,20,10,8,28,13,4,24,5,29,22,11,23,19,1,21,33,14,32,34,3。就普遍来讲专业7,15,6,9的开题比较优秀,而32,34,3的开题比较的一般。
通过题目所给的数据我们还可以得到各年开题的平均得分。我们定义选题值为3,开题值小于9的论文为比较好的论文,可以得到比较好的论文占论文总数的比例。
表5 各年开题的平均得分
年份
平均分
标准差
2006
9.721485
0.101687
2007
9.6714
0.08491
2008
9.676856
0.09212
表6 比较好(XT=3,KT<9)的论文占论文总数的比例
比较好的论文
论文总数
比较好的论文占论文总数的比例
2006年
93
377
0.2467
2007年
139
494
0.2814
2008年
115
458
0.2511
图2 比较好(XT=3,KT<9)的论文占论文总数的比例
通过表中的数据我们可以知道:2007年比较好的论文占该年论文总数的比例最大,写的开题最好,2008年次之,2006年比较好的论文占该年论文总数的比例最小。
㈡问题二
⑴根据题目所给的数据,我们通过两位专家评审的结果求出每篇论文的平均值,可得出各年硕士论文评分的总体评价结果。
表7 各年硕士论文评分的总体评价
2006年
2007年
2008年
特优(95分以上)
5
5
6
优秀(85分-94分)
235
337
314
良好(75分-84分)
131
148
137
一般(65分-74分)
6
4
1
较差(65分以下)
0
0
0
平均值
85.51127
86.04251
86.14738
论文总数
377
494
458
优秀以上论文的比例
0.6366
0.6923
0.6987
由上表可看出各年硕士生论文的分数在不断的提高,论文的优秀率也在不断的提高。整体质量越来越好。总体上来说08年的论文最好,07年的其次。
⑵我们通过计算各专业论文评分的平均值及标准差,列表比较,并制作成折现图,分析其高低及波动性,对各专业论文进行总体评价。
表8 各年各专业论文平均值及标准差
2006年
2007年
2008年
排名
学科号
平均值
标准差
学科号
平均值
标准差
学科号
平均值
标准差
1
1
85.778
6.027
1
83.9
2.737
1
83.8
3.853
2
2
83.438
8.239
2
86.889
2.329
2
88.5
3.488
3
3
3
3
77.25
8.132
4
4
86.906
4.412
4
85
4.01
4
84.45
3.891
5
5
5
5
83.8
1.718
6
6
86.472
5.118
6
82.222
3.261
6
79
3.279
7
7
86.333
6.108
7
86.25
3.726
7
84.063
3.57
8
8
84.697
4.575
8
86.85
2.954
8
85.925
3.369
9
9
84.65
4.995
9
88.65
5.682
9
89.6
2.654
10
10
86.643
5.146
10
90.8
1.255
10
87.1
2.51
11
11
87.25
4.406
11
87.591
4.582
11
86.4
2.104
12
12
85.472
4.77
12
87.103
5.292
12
88.975
2.803
13
13
86.259
4.735
13
86.471
3.378
13
85.891
3.442
14
14
82.75
5.614
14
87.643
5.313
14
85.571
3.034
15
15
83.65
4.184
15
83.9
4.754
15
85.028
2.231
16
16
87
2.739
16
87.775
3.451
16
89.363
2.728
17
17
87.188
3.76
17
86.4
5.384
17
87.833
2.669
18
18
86.694
5.233
18
85
3.498
18
86.04
3.485
19
19
85.078
4.909
19
83.654
4.917
19
84.393
3.755
20
20
84.65
4.14
20
86.167
3.187
20
86.414
3.691
21
21
85.398
4.403
21
86.571
3.335
21
85.87
3.399
22
22
84.853
5.086
22
82.652
3.292
22
83.25
3.023
23
23
23
23
86.5
3.536
24
24
87.111
3.219
24
90.3
2.163
24
89.3
4.29
25
25
85.222
4.258
25
89.111
3.798
25
87.656
2.9
26
26
86.9
6.022
26
83.35
3.757
26
86.611
2.595
27
27
84.583
4.364
27
84.1
2.923
27
84.325
4.292
28
28
84.125
6.041
28
87.363
3.238
28
86.647
3.878
29
29
85.5
1.512
29
86.455
3.305
29
86.077
3.439
30
30
85.633
4.498
30
88.45
3.862
30
89.3
3.402
31
31
85.313
4.325
31
85.6
3.502
31
87.111
2.522
32
32
86.375
4.215
32
86.3
2.406
32
87.111
4.106
33
33
84.125
3.271
33
82
3.48
33
86.25
3.729
34
34
34
34
83.375
3.25
图3 各年各专业论文平均值
图4 标准差
由上述图表可知,各专业的论文评分基本都在85左右,未出现很高或很低的分数,论文的质量比较的接近。学科3的平均值为77.25,标准差为8.132,学科3的论文总体质量最差,相比较而言专业10,16,24的论文质量比较好。
㈢问题三
我们对问题三建立多元线性回归模型:当多个自变量与因变量之间是线性关系时,所进行的回归分析就是多元线性回归。
此问题中自变量有两个,分别为选题
,开题
,因变量为论文得分
。所以选用二维线性回归模型:
,其中
为常数项,
为回归系数,
为
固定时,
每增加一个单位对
的效应,即
对
的偏回归系数;同理
为
固定时,
每增加一个单位对
的效应,即,
对
的偏回归系数。
首先我们通过MATLAB软件画出2006、2007和2008各年选题开题与总分的散点图以及回归模型。
2006年散点图
2006年相关性分析数据
系数b值
bint 置信区间
stat的值
90.6361
83.2003 98.0719
-0.723
-3.3074 1.8614
R的平方
F检验数
P值
-0.3331
-1.0571 0.3909
0.0693
1.0057
0.3791
我们通过上表的数据可以知道检验数P=0.3791>0.05,且F=1.0057< .,可以知道回归方程不具有显著性。也就是说由系数得到的回归方程:
Y2006=90.6361-0.723x1-0.3331x2
没有实际的价值意义。
同样用MATLAB软件画出2007年开题与选题之间的散点图及回归模型。
2007年散点图
2007年相关系数分析数据
系数b值
bint 置信区间
stat的值
98.8189
88.8069 108.8309
0.1543
-1.9694 2.2781
R的平方
F检验数
P值
-1.3569
-2.1656 -0.5483
0.3084
6.02
0.0069
我们通过上表的数据可以知道检验数P=0.0069<0.05,且F=6.02> .,可以知道回归方程具有显著性。也就是说由系数得到的回归方程:
Y2007=98.8189+0.1543x1-1.3569x2
具有实际的价值意义。
再一次用MATLAB软件画出2008年开题与选题之间的散点图及回归模型。
2008年散点图
2008年相关系数分析数据
系数b值
bint 置信区间
stat的值
92.4282
80.7430 104.1134
0.9896
-2.0222 4.0015
R的平方
F检验数
P值
-0.9399
-1.6920 -0.1878
0.2002
3.8805
0.0313
我们通过上表的数据可以知道检验数P=0.0313>0.05,且F=3.8805> .,可以知道回归方程具有显著性。也就是说由系数得到的回归方程:
Y2008=92.42820.9896x1-0.9399x2
具有实际的价值意义。
对于各专业选题开题与总得分之间的相关关系,我们选取数量最多而且有代表性的专业13分析选题开题与总得分之间的相关性。类似的我们用MATLAB软件画出专业13的选题开题与总得分之间的关系。
专业13相关性分析数据
系数b值
bint 置信区间
stat的值
90.0992
85.7801 94.4184
0.6694
-0.4607 1.7994
R的平方
F检验数
P值
-0.5874
-0.9877 -0.1870
0.0854
4.3434
0.0157
上表的数据可以知道检验数P=0.0157>0.05,且F=4.3434> .,可以知道回归方程具有显著性。也就是说由系数得到的回归方程:
Y13=90.0992+0.6694x1--0.5874x2
具有实际意义,同样的我们认为其他专业和13专业一样,他们的选题开题与总得分之间存在显著性。
㈣问题四