如何填报高考志愿(A题)
蒋绪升,陈少杰,韩亚萍
(信息
工程
路基工程安全技术交底工程项目施工成本控制工程量增项单年度零星工程技术标正投影法基本原理
学院 2005计算机科学与技术专业)
摘要:本文利用概率统计的回归
分析
定性数据统计分析pdf销售业绩分析模板建筑结构震害分析销售进度分析表京东商城竞争战略分析
法,依据每年高考人数和各高校录取情况的不同,而导致每年的录取分数线的不同,做出了相关系数的回归模型,预测2007年的本科专科分数线和各高校的录取分数线!
关键词:回归分析,相关系数,分数线
一:问题的重述:
大学是广大中学生心目中神圣的知识殿堂,对于每个拥有“大学梦”的高中毕业生来说,填报高考志愿是他们通往高等学府的关键一步,但由于我省采用的是“估分报”的形式,并且各高校所录取的分数线时不径相同的,这样一来,估分和估计分数线又成了一个很重要的问题,如何估好自己的分数和填报志愿才不会落榜是考生、家长以及老师共同关注的问题。再加上“高分撞车”现象的时有发生,让一些学生被迫选择了自己不太理想的或是自己不喜欢的学校,这样一来,在经济型的社会中,花掉了钱,毁掉了前途,还有可能给社会带来负面影响,为了解决好“如何填报高考志愿”才能实现自己的愿望,达到自己的理想,我们作如下模型以供参考。
二:模型假设及符号说明:
(1) 假设每年的考试题的难度按人数比例是均等的;
(2) 考生的其他加分项目不影响分数线;
(3) 考生报考志愿时不受其他因素的影响;
(4) 为了便于计算,人数精确到千位;
(5) 由于在一定程度上各高校的录取具有一定的相同性,所以本模型只考虑甘肃省具有代表性的6所高校(兰州大学,西北师大,兰州理工,兰州交大,兰州商学院,西北民大)
符 号
说 明
符 号
说 明
x
高考参加人数
分数线
随机变量
真实值Y的拟合值
参加高考人数的平均
每年分数线的平均值
回归参数—相关系数1
回归参数--相关系数2
SST
离差平方和
SSR
回归平方和
SSE
残差平方和
E(.)
数学期望
F(.)
F分布
D(.)
方差
(.)
差方分布
样本相关系数
f(.)
回归直线函数
c
上侧分位数
三:模型建立:
甘肃省历年高考录取分数线表
高考人数(万)
第一批
第二批
第三批
年份/科类
文科
理科
文科
理科
文科
理科
2006年
24.8
542
566
483
512
420
435
2005年
20.7
535
558
476
498
450
430
2004年
16.26
578
568
528
508
435
400
2003年
13.61
504
458
456
402
396
350
2002年
11.51
492
508
466
457
416
406
2001年
10.4
490
512
465
467
432
426
平均数
16.2133
523.5
528.33
479
474
424.833
407.833
甘肃省各高校录取情况表
2006年
2005年
2004年
2003年
2002年
2001年
平均数
高考人数(万)
24.8
20.7
16.26
13.61
11.51
10.4
16.2133
学校/科类
(文)(理)
(文)(理)
(文)(理)
(文)(理)
(文)(理)
(文)(理)
(文)(理)
兰州大学
550,566
540,560
572,564
513,478,
504,508
490,510
528.167,531
西北师大
535,546
518,542
563,548
488,499
490,488
478,496
512,519.833
兰州理工
502,526
488,510
534,512
458,408
466,457
465,467
485.5,480
兰州交大
498,524
483,522
534,520
460,410
466,460
465,467
484.33,483.833
兰州商院
483,512
476,498
528,508
456,402
466,457
465,467
479,474
西北民大
473,502
466,488
518,498
446,392
446,447
455,457
467.33,465.6667
从以上表中我们可以看出,x与y之间不可能存在一种明确的函数关系式,但也不能就此认为两者之间没有任何关系,为了看清楚其中的规律,采用散点图的方式将参加高考的人数和分数线成对数据(
)(i=1,2,3,4,5,6)(以2001-2006,以往6年的有关数据作模型建立的参考数据)在平面坐标系中表示出来(散列图),
为了分析问题的方便我们用x表示学生人数,用Y表示分数。
统计学上将类似于上述问题之间这种不具有确定关系的两个变量之间的统计关系称谓相关关系。人们往往通过对(X,Y)的一个观察样本(
)(i=1,2,3,4,5,6)来对X与Y的相关系数作出估计,即所谓的相关系数
,可以证明,r是相关系数
的渐近无偏估计。
通过对前面几张表的观察和分析,可高考录取的分数线问题看成是两部分叠加而成,一部分由考生人数的线性函数引起,记作
,另一部分由随机因素引起的(包括:当地政府的若干政策以及考生周围的生活环境等等的因素)记作
即y=
+
相应的变量Y与X的关系可表示为
(式一)
对于线性、函数中的
的系数
和
,一旦通过估计和检验得到一个合适的线性函数
,便可利用(式一)对Y进行预测和实施控制。所以我们要寻求一个随机变量Y对另一个或一组随机或是非随机变量
……
的相关的统计方法,而采用回归分析的函数模型。其形式如下:Y=f(
……
)+
其中f(
……
)是
……
的一个确定的函数,称谓回归函数,
是数学期望为0的随机变量。
我们为了简单为体分析,只考虑分数线与考生人数两个变量之间的线性回归模型,而将当地政府的政策和其他一些因素归结到随机变量
中,这一模型中回归函数是耽搁解释变量的,系数未知的线性函数,即f(x)=
其中
,
为待定参数,此时回归方程表示一条直线,此外,为了处理问题的方便,通常我们只考虑x为可控制变量,即不是一个随机变量。
在今后,我们用x代替x以示它为一确定的量,n 组样本以(
)(i=1,2,3,4,5,6)来表示。
并且给作了如下的基本假设:
(1):回归函数是自变量x的一次线性函数;
(2):自变量x别看作是确定的变量;
(3):n个样本
,
……
是独立的;
(4):式中
满足同方差条件,即D(
)=
(i=1,2,……n)从而
,
……
的方差也是相等的即D(
)=
。
四:模型求解:
对于
,
的估计实际上是在平面直角坐标系中估计一条直线
,使得它尽可能地接近回归直线,
利用最小二乘法得:
,
其中,
,
, 称
,
为
,
的最小二乘估计,可得估计回归方程为
.这是通过(
),(0,
)的直线.
为了书写简洁,我们引入如下记号:
=
=
.
=
则
可以表示为:
=
,对于每个
(i=1,2,3……,n)有
称
为真实值
的拟和值. (具体数据见下表)
07年甘肃省主要6所高校分数线预测及我省各批次录取分数线
2007年分数(27.2万人)
理工类(Y)
兰州大学
531
448.0998
5.1131
448.0998+5.1131x
587.1987
西北师大
519.83
450.6463
4.2673
450.6463+4.2673x
567.5703
兰州理工
480
386.5533
5.7636
386.5533+5.7636x
533.3759
兰州交大
483.83
388.5457
5.877
388.5754+5.877x
547.9755
兰州商院
474
397.0144
4.7483
397.0144+4.7483x
525.7178
西北民大
465 .667
394.6671
4.3791
394.6671+4.3791x
513.8544
2007年分数(27.2万人)
文史类(Y)
兰州大学
528.167
464.1788
3.9466
464.1788+3.9466x
571.6156
西北师大
512
456.5275
3.4534
456.5275+3.4534x
550.4507
兰州理工
485.5
440.1606
2.7964
440.1606+2.7964x
516.242
兰州交大
484.33
445.3847
2.4021
445.3847+2.4021x
510.7222
兰州商院
479
455.6296
1.4414
455.6296+1.4414x
494.844
西北民大
467.33
439.0556
1.7439
439.0556+1.7439x
486.4885
理科
2007年分数(27.2万人)
理工类(Y)
第一批
528.33
442.1181
5.3174
442.1181+5.3174x
586.7514
第二批
474
396.9797
4.7504
396.9797+4.7504x
526.1906
第三批
407.833
367.8550
2.4685
367.8550+2.4685x
434.9982
文科
2007年分数(27.2万人)
文史类(Y)
第一批
523.5
460.6654
3.8755
460.6654+3.8755x
566.079
第二批
479
455.6296
1.4414
455.6296+1.4414x
494.8357
第三批
424.833
409.6152
0.9386
409.6152+0.9386x
435.1451
2007年高分撞车人数预测表(理科)
2007年分数(27.2万人)
理工类(Y)
2007年的高分人数
2696.833
2065.3
38.9512
2065.3+38.9512x
3128
注:依据参加高考的人数(X)与历年来的高分人数(Y),得到的2007年高分人数
撞车人数(2007 )
151.6667
255.8419
0.1511
255.8419+0.1511x
498
注:依据每年的高分人数(x)以及高分撞车人数(Y),得到的2007年高峰撞车人数
五:模型检验:
在一元线性回归模型中,回归函数
是x的线性函数,如果x的变量与Y无关,即有
=0,反之,若
=0,则回归函数是一个常数,从而x变化对Y不产生影响,因此我们作出如下假设:
:
=0 能否被拒绝.
我们容易得到总的离差平方 SST=
可分解为:
SST=
+
SSE+SSR,
SSE=
=
称为残差平方和,
SSR=
=
=
称为回归平方和.
从而利用以下命题:
(1) E(SSR)=
+
;
(2) E(SSE)=(n-2)
可知道E(
)=
,从而
是
的无偏估计.
故有E(SSR)=(1+
)E(
)
E(
).
当
=0时E(SSR)= E(
).可见当
足够大时可以拒绝
条件成立,即有
( c为分布的上侧分位数)
故有在
条件成立时
和
=
的差方分布.并且在
条件成立时,SSR和SSE是独立的,因此有
,于是在给定的显著性水平
=0.1查表可以得到c=F
(1,n-2)的上侧分位数,
的拒绝可取为
C={(
;
; ………;
):F>F
(1,n-2)}
这样就得到
的一个显著性水平为
的检验.
由上表《07年甘肃省主要6所高校分数线预测及我省各批次录取分数线》及表《2007年高分撞车人数预测表(理科)》可知,
及
是可拒绝
的,所以,模型是成立的。
六:结论与建议
掌握全部信息和资料 ——
避免高考志愿扎堆撞车
高考是考生成年后经受的第一次重大考验,而填报志愿则是他们面临的第一次重大人生选择。有人这样比喻:高考成功与否,60%靠实力,40%靠志愿。确实,每年高考总有不少考生因志愿填报把握欠妥而“上线落榜”或者“高分低就”,加之今年我省实行考生自己先估分后填报志愿的方式。那么,考生的志愿如何填报?
掌握全部信息和资料然后再填报志愿是一个充分利用有关信息综合决策的过程,一般来说,考生至少要掌握以下几方面的信息和资料。
1.准确预估自己的高考成绩;
2.招生
计划
项目进度计划表范例计划下载计划下载计划下载课程教学计划下载
。全国高校今年在我省计划招收的人数,直接与我省今年的录取比例有关,考生在填报志愿时,根据今年各高校的招生计划;
3.录取分数线。考生应尽量了解我省近年的各批次院校最低控制分数线和各院校及其专业在我省的录取分数线。考生可对这些数据进行分析,作为自己填报志愿时的参考;
4.自身素质及本人在全省考生中的相对位置。自身素质包括兴趣、特长、气质、性格、职业价值观、环境适应能力及身体条件等,所谓身体条件就是根据体检结果,看自己有无限报专业。
但是考生仅仅预测自己的高考总分是不够的,重要的是对在自己相应分数段内的考生及自身所处位置做出较准确估计,并将上一年相当位置考生的录取结果作为自己填报志愿的参照点,这样就能使自己的志愿填报得较为合理。
5.还应注意,“分数汇编”中所提供的各院校历年在甘肃省招生的最高最低分数表现的是录取的专业分,所以考生最好以该校录取分数的平均成绩作为填报志愿的参考,否则容易出现成绩即便上了该校提档分数,但达不到所报专业分数,最终被退档的情况。
6,第一志愿至关重要:填报志愿时,第一志愿至关重要。首先,从历年甘肃省的几所高校招生录取的实际情况看。我省考生按第一志愿录取的占全部录取人数的80%左右。由于高校在录取工作中实行“学校负责,招办监督”的录取体制,学校在录取过程中的自主权扩大了,提取上线考生档案的数量由学校决定,录取与否由学校决定。只有在第一志愿考生档案材料不足或多数第一志愿考生分数较低的情况下,高校才考虑提取第二、第三志愿考生的档案材料。换句话说,如果考生的第一志愿是一所热门学校,而分数虽然上线但不是很出众,那就可能进不了这所学校;或者考生的分数虽然对这所学校来说很优秀,但没有将这所学校列为第一志愿而是第二、三志愿,那进这所学校的机会同样很小。