报告范文

教育测量与评价

教育测量与评价 | 楼主 | 2017-07-16 05:22:24 共有3个回复 报告范文
  1. 1教育测量与评价
  2. 2教育测量与评价
  3. 3教育测量与评价

教育测量与评价期末复习重点,分数能够说明心理学理论的某种结构或特质的程度,项目的区分度是测验是否有效的指示器,常见题目编排方式有并列直进式混合螺旋式,年龄当量年级当量具有顺序性不具有等距性。

教育测量与评价2017-07-16 05:20:42 | #1楼回目录

《教育测量与评价》期末复习重点

一、名词解释

1.教育测量:指针对学校教育影响下学生各方面的发展,侧重从量的规定性上予以确定和描述的过程。

2.教育评价:教育评价是指按照一定的价值标准和教育目标,利用测量和非测量的种种方法系统地收集资料信息,对学生的发展变化及其影响学生发展变化的各种要素进行价值分析和价值判断,并为教育决策提供依据的过程。

3.常模参照:常模参照测量与评价是将被试水平与测验常模相比较,以评价被试在团体中的相对地位的一种测量与评价类型。

4.标准参照(标准参照测验):在一定的行为领域上按照具体的行为标准水平对被试的测验结果作出直接解释的测验。标准参照测量与评价是将被试的表现与既定的教育目标或行为标准相比较,以评价被试在多在大程度上达到该标准。

5.典型行为:典型行为测量与评价要求被试按通常的习惯方式做出反应(即典型行为),其目的不在于测量与评价被试能力的高低,而是测量与评价是否具备某种典型行为。

6.最佳行为:最佳行为测量与评价是以测量被试的最佳行为表现为目的。如以成就或能力的高低作为评价基矗

7.重测信度:指用同一个量表对同一组被试施测两次所得结果的一致性程度。

8.复本信度:指两个平行测验测量同一批被试所得结果的一致性程度。

9.同质性信度:指测验内部所有题目间的一致性程度。

10.内容效度:指一个测验实际测到的内容与所要测量的内容之间的吻合程度。包括欲测的知识范围,以及该范围内各知识点所要求掌握的程度两个方面。

11.结构效度:指一个测验实际测到所要测量的理论结构和特质的程度,或者说它是指测验

分数能够说明心理学理论的某种结构或特质的程度。

12.实证(效标关联)效度:指一个测验对处于特定情境中的个体的行为进行估计的有效性。

13.区分度:指测验项目对被试心理品质水平差异的区分能力或鉴别能力。项目的区分度是测验是否有效的“指示器”。常记为D。

14.评价指标:指根据评价的目标,由评价指标的设计者分解出来的,能够反映评价对象某方面本质特征的具体化、行为化的主要因素,它是对评价对象进行价值判断的依据。

15.指标权重:就是表示每项评价指标在指标体系中所占的重要性程度,并赋予相应的值,这个数值就叫做对应指标的权数(权重)。

16.评价标准:是针对每个评价指标的分类作出具体规定,提出具体要求和说明。

17.常模:指一个有代表性的样组在某种测验上的表现情况,或者说是一个与被试同类的团体在相同测验上得分的分布状况与结构模式。

18.常模团体:是由具体某种共同特征的人所组成的一个群体或是该群体的一个样本。

19.百分等级:指在一个群体的测验分数中,得分低于这个分数的人数的百分比。

20.百分等级常模:就是基于某个常模团体,为某种测验的原始分数与百分等级之间建立起对应关系的组内常模类型。

21.智力:

⑴智力是抽象思维能力:智力是正确进行理解、判断和推理的能力。(Binet&Simon,1905)⑵智力是适应的能力或智力是学习的能力:智力是总括性的术语,指用来适应物理和社会环境的认知结构的组织和平衡的高级形式。(Piaget,1972)

⑶智力是多种能力的综合,是一种全面能力:智力是个体有目的地行动,理性地思考以及有效地应付环境的总体能力。(Wechsler,1939)

⑷总结:智力是各种认识能力的综合,它包括观察力、注意力、记忆力、想象力、思维能力

等,其中以抽象思维能力为核心。

22.晶体智力:是获得的知识与技能的有效结合之能力。适用于完成某种固定的任务。

23.流体智力:是洞察复杂关系的能力,是在不同环境和条件下都要显示出来的一般的普遍的能力。适用于适应新环境的情形下。

二、填空题

1.测量的基本要素是参照点和单位。

2.结构效度的验证方法:测验内部寻找证据法(内容效度、作答过程分析、测验的同质性、因素分析法)。P61-62

3.效标关联效度可分为同时效度和预测效度。

4.效标关联效度的估计方法:相关法(二列相关、积矩相关)、区分法、命中率。P63-64

5.客观性试题包括选择题、匹配题、是非题、填空题、简答题等。

⑴优点:答案客观,作答简便,在限定的时间内,测验可以包含足够数量的试才所测知识内容的覆盖面。客观题一般适用于测量知识、理解等几个层次的教学目标,在教育测验中用得较多。

⑵缺点:不能测量与评价高层次的教学目标,并且编制也较为复杂。

6.主观性试题包括论述题、作文题、操作题等。

⑴优点:适合于测量较高层次的教学目标,特别是测量综合、评价等目标层次。主观性试题鼓励被试积极地组织资料,表达点,有利于培养被试解决实际问题的能力。

⑵缺点:作答耗费的时间过长,在规定的时间内,试题数量不能太多,因而知识的覆盖面较校由试题没有非常统一明确的标准答案,所以评分易受主观因素的误差较大。

7.常见题目编排方式有并列直进式、混合螺旋式。

8.测验的常模可分为两类:发展常模(年龄常模、年级常模)、组内常模。发展常模仅适用

于高中以前。年龄当量、年级当量具有顺序性,不具有等距性。

9.课业考评存在的主要问题:课业考评思想与学校教育理念、目标不相适应;课业考评方法单一;课业考评抽象化和表征化。

10.课业考评改革的主要目标:要实现考试向发展性评价观转变;要努力实现从重视“掌握性结果”的评价转变到既重视“掌握性结果”又重视“发展性结果”的评价;内容从认知领域转变到憨盖学习结果的更广泛的教育目标领域上来;要努力实现从表征性分数机制到实质性内容机制的转变。

11.学生课业发展的主要内容:学生的个体一般性发展、学科理论知识和学科能力或技能的发展、思维技能与品质的发展、研究与学习技能的发展、创新精神与实践能力的发展、态度、观念及兴趣的发展、欣赏与审美的发展、适应与习惯的发展、学生体育技能与素质的发展、个体独特性的发展。

12.评价学生课业发展进步的个人发展参照法有:个人发展横向参照法、个人发展纵向参照法及个人发展潜力参照法。P182

13.评价学生课业发展进步的主要方法:客观题评价法与主观题评价法、表现性测验评价法(口头测验:口试、课堂提问、论辩或辩论;论文题测验:短文题考试、写作测验、实验技能教学考试评价)。

14.斯皮尔曼G因素说:G因素(一般因素)是智力的核心,而S因素(特殊因素)只有在某些情况下才会表现出来。

15.桑代克的特殊因素说、塞斯顿群因素说、弗农智力层次结构模型、吉尔福特的智力三维结构模型、卡特尔的流体智力和晶体智力理论、加德纳的智力结构理论、斯腾伯格的成功智力理论。P221-226

16.自陈量表包括艾森克人格问卷(EPQ)、WAIS、爱德华个人兴趣量表。

17.投射测验包括罗夏克墨迹测验、默瑞的主题统觉测验(TAT)、罗桑兹威格的逆境对话测验。

18.卡特尔16种人格因素量表(16PF)是唯一一个没有说谎量表的。

附:

1.要衡量教育测量的质量,可以采用四个指标:信度、效度、难度和区分度。

2.测验的难度适中,能使测验的信度达到最大,也能使测验的区分度达到最大。

3.教育科学研究中绝大部分数据都属于等级变量,这些数据的单位不等值、没有绝对零点,可以比较大小,不能加减更不能乘除。

4.最常用的双向细目表是反映测验内容与测验目标关系的双向细目表。

5.教育评价表在结构上是由评价指标、指标权重及评价标准三部分组成的。

6.广义的教育评价是按照一定的价值标准和_______,利用测量和非测量的种种方法系统地收集资料信息,对学生的发展变化及其影响学生发展变化的各种要素进行价值分析和价值判断,并为教育决策提供依据的过程。

7.教育测量与评价按测量对象可分为__________和_____________;按测量材料可分为文字测验和非文字测验。

8.信度的估计方法有重测信度,____________和__________。

9.内容效度就是测验题目样本对于_______与______的代表性程度。15、区分度的值域范围为______________。

10.年级常模通常用_____位数表示,其中,第一位是年。

11.教育测量的特点中,测量对象具有__________,误差是_________避免的。

12.标准分数Z本身是关于原始分数X的一种_____________,要合理使用标准分数。__________是基于百分等级形成的另一较常见的评分量表。

13.测验题目的恰当难度,应该使P值尽量接近_________。

14.表述得当的教育目标应该___________;表述明确、具体;反应学习结果的层次性;表达教育工作者的意图。

三、计算题

1.重测信度、复本信度(积差相关公式):p47

2.同质性信度:

⑴分半信度(斯皮尔曼-布朗校正公式):p50

⑵克龙巴赫系数:p52

3.评分者信度(相同等级无需掌握):p55

4.⑴二分法计分:p65-66

①难度值(通过率)的计算公式:P=R/N

(P:难度值;N:被试人数;R:答对该题目的人数)

②极端分组法(27%):P=(PH+PL)/2;校正公式:CP=(KP-1)/(K-1)⑵非二分法计分:P=X/Xmax

(P:题目难度;X:所有被试在某题目上的平均得分;Xmax:该题目的满分)附:

P值介于0与1之间,P和难度成反比;

难度为0.50时区分度最高,各个项目的难度在0.50±0.20之间变化。

5.计算测验原分数X所对应的百分等级PR:p135

6.标准分数的计算:p136

四、简答题

1.教育测量的特点:(简述)

⑴间接性和推断性;

⑵测量对象模糊性和误差的不可避免性;

⑶量表具有的多样性,结果具有相对抽象性。

2.教育测量与教育评价的关系:p7

⑴教育测量与教育评价既有联系又有区别。

⑵区别(定义):

①从句法意义上讲,测量是按照一定的法则和程序,对事物或现象在量上的规定性加以确定和描述的过程。教育测量则是对教育效果或者学生各方面的发展予以测量和描述的过程,旨在获得有一定说服力的数量事实,是一种以量化为主要特征的事实判断。

②教育评价是根据一定的标准,对教育事物或现象的价值进行系统的调查,在获取足够多的资料事实(定性资料与定量资料)基础上,作出价值分析和价值判断。

⑶联系:

①教育测量可以为教育评价提供价值判断的基本数量事实,教育测量是教育评价的基矗②教育评价往往是教育测量过程的延续,是对测量结果的解释与应用,并朝着价值判断与释放教育功能的方向拓展。

3.教育测量与评价的主要功能:

⑴实现教育判断的功能:测量评定、事实判断、价值判断、问题诊断、区分选拔;

⑵改进教师教学的功能:了解学生的起点行为、作为改进教学的参考、作为补救教与学的依据、确保教学目标的达到;

⑶促进学生学习的功能:激励学生的学习动机、帮助学生的记忆和促进迁移、促进学生的自我评价。

⑷行使教育管理的功能:对教师的管理、对学生的管理、对教学目标和质量的管理、对教育

过程的管理、对学校的管理。

4.信度与效度的关系:

⑴信度高是效度高的必要而非充分的条件。

⑵测验的效度受它的信度制约。

⑶补充:效度是信度的一部分,效度来得比信度更重要。

5.设计测验的基本考虑:p103

⑴确定测验目的和属性;

⑵明确测验的性质和用途:

①测验的编制者首先要明确的就是自己所编制的测验是用来测量哪种心理结构或者说心理物质。

②明确了测验用途,才能有的放矢地去寻找测验的理论根据。

③明确测验测验用途的同时还要明确抽编制的测验是属于常模参照测验还是标准参照测验。⑶明确测验的对象:在编制测验时应考虑到被试的年龄特征、教育水平、文化社会背景等因素。

⑷分析测验的目标:

①确定能表示所欲测量的心理结构的行为。所选择的行为要有代表性,这组有代表性的行为我们称为行为样组。

②确定每一类行为的项目比例。项目比例确定的问题其实就是确定每一类行为在心理结构中的比重问题。

△6.设计测验蓝图的步骤:p105-106

⑴确定测验内容要目;⑵确定科目要考查的目标层次;⑶确定测验内容要目下的权重;⑷形成命题双向细目表。

7.测验的编制与组织:p106-110

⑴选定测验的材料:

☆注意点:①测验材料要适合测验目的;②测验材料要能够代表该科教材的全部内容;③测验材料要有普遍性,要以统一的课程标准或教学大纲和统编教材为选材依据,应该是大多数至全部被试都已学过的内容,从而对全体被试具有公平性。

⑵编写测验试题

⑶试测(预测)与题目分析:

☆注意点:

①预测时所用的被试应该是从测验对象这个全域中抽取的,即取样时应注意样本代表性。②关于预测的人数问题。

③预测应力求按正规的要求进行,使其与将来正式测验的情况相近似。

④预测的实施,应使被试有足够的完成作业的时间,以便搜索充分的反应资料使统计分析结果可靠。

⑤在预测过程中,应就被试的反应情况随时加以记录。

⑷合成测验(组卷)⑸编制复本⑹编写测验手册

8.制订教育评价表的基本原则:p114-115

⑴科学性与导向性原则;⑵完备性与独立性原则;⑶发展性与整体性原则;⑷操作性与可测性原则;⑸可行性与可比性原则;⑹超前性与持续性原则⑺同时,除必须遵肚些基本原则之外,还必须采用一定的科学程序与技术进行操作。

9.制订教育评价表的方法:p118-122

⑴确定教育评价的对象和目标

⑵初拟评价指标:①头脑风暴法;②因素分解法;③理论推演法;④典型研究法。

⑶筛选评价指标:①经验法;②调查统计法;③模糊聚类法。

⑷确定评价指标权重:①关键特征调查法;②两两比较法;③专家评判平均法;④倍数比较法;⑤Q分类法。

⑸设计教育评价标准。

⑹整合、修改与完善教育评价表。

10.确定常模团体的注意事项:p125

⑴群体构成的界限必须明确;

⑵常模团体必须是所测群体的一个代表性样本;

⑶取样的过程必须明确且有详尽的描述;

⑷样本大小在适当;

⑸常模团体必须是近时;

⑹注意一般常模与特殊常模的结合。

11.标准Z分数的性质和特点:p138-139

⑴任何一批原始分数转化成Z分数后,Z分数的平均值为0,标准差为1。Z>0,测验成绩高于平均数;Z<0,测验成绩地域平均数;Z=0,测验成绩等于平均数。

⑵标准分数Z量表的单位是相等的,其零点是相对的。因此,不同科目的Z分数具有较好的可比性和可加性。

⑶Z分数本身是关于原始分数X的一种线性变换,因此Z分数不改变原始分数的分布形态。⑷在一般情况下,标准分数Z的取值范围是(-3,+3)。Z分数的意义可以用正态分布曲线下的面积比例(本质上是概率值)做出最好的解释。

附:标准分数变式的评价

优点:

(1)具有等单位特点,便于工作进一步的统计分析。

(2)正态分布下,可以利用正态分布表将各种导出分数与百分等级分数作换算。

(3)正态分布下,运用某种变式分数可以将几个测验上的分数作直接的比较。缺点:

(1)分数过于抽象,不易理解。

(2)在非正态分布下,分布形态不同的变式分数,仍然不可作相互比较,也不能相加求和。

12.课业考评的主要作用:p168-169

⑴合理的课业考评制度为学生发展提供较明确的目标和努力的方向。

⑵合理的课业考评制度将有助于评价学生的发展、进步,从而对教与学双方活动起着重要的控制、调节和促进等作用。

⑶课业考评为学生心理发展和学习进步创造必要的背景和空间,诱发学生的学习动机和自主发展的动力。

⑷课业考评在中小学生个体社会化进程中起着控制、调节、促进和加速作用。

13.韦氏智力量表的特点:

⑴测验具有完整的结构,能较好地反映智力的整体和各个侧面。不但有总智商,还有分量表评价。同时韦氏智力量表具有很高的信度,一般都在0.9以上。

⑵采用离差智商代替比率智商,既克服了计算成人智商的困难,又解决了在智商变异性上长期困扰人心的问题。

⑶各年龄组都接受相同的分测验,如WAIS-R,WISC-R,WPPSI-R有相同的8个核心分测验,可对各种能力加以比较,同时可节省指导测验的时间。

⑷韦氏智力量表有:韦氏成人智力量表、韦氏儿童智力量表和韦氏幼儿智力量表,三套智力量表相互衔接,适用的年龄范围可从幼儿到老年,便于开展智力发展的个案研究与跟踪研究。

⑸采用了因素分析法研究结构效度,更具有理论意义。

14.瑞文推理测验的特点:

⑴适用的年龄范围宽,测验对象不受文化、种族与语言的限制,并且可用于一些生理缺陷者。⑵测验可个别进行,也可团体实施,使用方便,省时省力,结果解释直观简单,测验具有较高的信度与效度。

⑶瑞文推理测验有系列量表,如适用于更小年龄儿童和智力落后者的彩色推理测验以及适用于高智力水平者的高级推理测验。

15.自陈量表的特点:

⑴优点:①测量工具一般为调查表;②测量题目数量较大;③在同一测验中往往包含几个分量表,测多个特质;④通常采用纸笔测验,因而可团体实测;⑤计分规则简单而客观。⑵缺点:①社会称许性;②自我防御:掩饰、默认、折中。

16.投射测验的特点:

⑴测验材料没有明确的结构和确切的意义;

⑵受测者对测验材料的反应不受限制;

⑶测验的目的具有明显的隐蔽性;

⑷对测验结果有解释重在对受测者的人格特征获得整体性的了解;

⑸投射测验的内容多为无明确意义的图片,在测验时不受语言文字的限制;

⑹相对于自陈量表,投射测验的最大局限是计分上的困难。

教育测量与评价2017-07-16 05:20:24 | #2楼回目录

教育测量与评价论文

摘要:随着改革开放以及各项措施的不断开展实施,中国经济得到了长足发展,在经济发展、人民生活水平得到改善提高的情况下,国家逐渐加强了对教育的投入力度,改革开放以来,教育事业进入快速发展时期,义务、高等、职业等教育方式都得到迅速发展。但是在教育事业取得巨大成功的同时,我们更应该看到教育事业发展过程中暴露出来的种种问题,各种教育问题已成为阻碍中国教育事业进一步发展的绊脚石,要如何正确的面对并处理好这些问题还值得我们深思。

关键字:中国教育教育现状教育的出路

前言:

近段时间,诸如太原一幼儿园老师“狂扇女童70余下耳光”、浙江温岭幼儿园老师“揪孩子耳朵悬空”等虐童事件频频发生。虐童行为为何屡禁不止?消除教育暴力我们该做什么?由此进一步引发了人们对于中国教育事业的深入思考:中国应该实行什么样的教育?通过这些教育政策达到一个培养什么样人才的目的?中国教育现状是怎么样的?存在什么样的问题?中国教育的未来是什么?中国思想文化的方向在哪里?在具体的实施过程中从上到下应该怎样去贯彻执行,达到上行下效的目的?以下就从对于中国教育现状的分析、中国教育的出路两个方面来具体的分析:

一、中国教育现状

1、教育理念的偏差

中国文化几千年的绵延发展可以说是世界史上的一朵奇葩,而在灿烂辉煌的文化体系中,尤为重要的是中国沿承发展数千年的教育事业。燧人之世,天下多水,故教民以渔;宓羲氏之世,天下多兽,故教民以猎。这些都是最原始的教育活动,但却反映了中国教育发展之早。此后,无论是夏商西周的官学体制,还是春秋时期的百家争鸣,亦或者是汉朝开始的独尊儒术的推行,还有隋唐的开始的科举制以及明清时期的程朱理学,凡此种种,无论出于何种目的、造成何种结果,其目的归根到底都是为了维护封建统治的需要,所以在教育上就一味的偏向于迎合统治阶级的教育需求,及至几天的应试教育的越演越烈,大抵根源皆在于此。深入民众几千年的思想确实很难一时扭转。也正是由于应试教育的深入人

心,我们不禁要问:素质教育在哪里?

2、教育体制、教育实施的尴尬

新中国建立尤其是改革开放以后,中国的教育事业已经发生了翻天覆地的变化,教育部门也在教育事业上投入了很大的力度,采取了很多行之有效的措施来促进中国教育事业的发展。但是在取得成绩的同时,我们更应该看到如此多的教育措施到底有多少真正得到了贯彻落实。诚然,特殊情况下要采取特殊的措施来保证一个地区教育事业的稳定正常发展无可厚非,可是将这种“特权”诠释成为所欲为,结果只能导致教育的偏失。虽然我们都在倡导教育的公平,可是这种公平往往都是对于“特劝阶层”而言,教育在实施过程中不公平现象如今还在挑战者人们敏感的神经。

3、公平问题

教育在实施过程中的不公平只是整个教育大厦中的一角,而用公平的眼光去审视整个教育体制,会发现这种不公平还有很多。公民有平等受教育的权利。我们不禁要问:教育的公平何在?是偏远山区连基本教育设施都难以保障和城市温室里的花朵身在福中不知福之间的公平,还是苦学十余载难以企及的学府的学生和那些凭借“特殊政策”就可以轻轻松松就读的学生之间的公平?

4、教什么和怎么教的问题

教育体制的不断完善只能是中国教育事业真正走向成熟的体制保障,而要真正的将这么多的举措实施好,还是要看教育的终端:具体怎样教学这个问题上来。如今面临的尴尬境地是中西方文化之间的相互冲击、是中国的传统文化和不断革新的文化之间的矛盾。一方面我们要和世界接轨,学习西方先进的文书知识,另一方面又要尽最大可能沿承中国的传统文化。但是一味的的应试教育已经让中国的教育在这一方面偏移了太多,教育已经陷入一个无法调和的畸形发展的怪圈,而传统上的应试教育一般只能去迎合这种趋势。那当务之急就是如何调出这个怪圈,寻找真正的出路。

5、其他的诸多问题

当然,除了上述的四个教育问题以外,中国的教育业还有许许多多的问题,比如因教育偏差而导致中国的人才体系难以形成一个有效地成长系统,比如既然教育问题如此之多,那要改变这种状况的话,坚强的推力以及实施相关政

策措施的决心在哪里等等问题。

二、中国教育的出路

1、教育体制的不断完善

中国的教育事业要发展,最主要的还是要在根本上将教育体制建设好,这样,中国的教育事业才能有一个大的方向性、一个指导思想。而中国教育所表现出来的正是教育体制上的缺失以及不合理性,虽然制定了许多的教育策略,并且经过几十年的不断发展,中国的教育体制也在不断地完善,但是从目前所反映出来的诸多问题上看,中国的教育事业还有很长的路要走。一方面是在制定大政方针的时候有所偏差,因为一些原因可能在最初制定教育政策时就与预期有了一定的偏离,再加上地方在具体实施时的不同情况影响,可能会导致最终的结果南辕北辙。还有一个原因,虽然方针政策制定出来了,在用到实处时却举步维艰。中国的官僚体制导致有时候有些政策根本到不到贯彻实施。

2、监督机制的辅助性

任何体制一旦独断就难免向着他的黑暗面逐渐倾斜,所以对于一国的教育发展,一定的监督制度必不可少,这样才能达到制衡作用。另外,群众的监督也是必要的。当然,光监督也许很难达到预期目的,因为只有监督,但是监督的结果却不合法,或者说群众的言论应经被堵死,最终的监督也只会变成官官相护的产物。

3、开民智、启民心

在探讨中国教育问题的时候已经提出,中国上千年的文化积淀导致中国民众思想的功利性演变,反映在教育上就变成了一味的应试教育。这种思想不仅上层,即便是每个个体皆有之。所以解决中国教育问题的重中之重是转变民众的思想,使人们认识到学习的目的不仅仅是为了“博取功名”,而依中国目前的情况来看,这一过程、这一任务也是任重而道远的。对于解决这一问题,我以为应该从源头抓起,即注重对于初级教育的倾斜。

4、差异性发展、首重公平

中国乃至世界的教育都存在着诸多的不公平性,这也导致教育事业发展的不合理性,教育改革的难以进行性。所以教育要发展、要完善,还得公平来保驾护航。中国由于地域性的差异明显,地域的复杂性,导致公平性问题更加

突出,东西部的差异、城乡之间的差异、教育资源分配的不合理性都之间或者间接地影响了中国教育事业的健康发展。要解决这一问题,首先要做到体制上的公平,不能为了某一目的而导致大量的教育资源偏向严重。其次是教育资源要达到共享,因为地区之间的发展或多或少的存在着偏见,导致教育成功很难进行深入的交流、探讨,闭门造车的发展方法要不得。

5、立法保障

立法自古以来对于国家的发展、各项措施的实施都有着很高的保障性。中国在教育立法上也投入很大的力度,例如《中华人民共和国教育法》、《中华人民共和国高等教育法》等等,虽然教育上的立法在不断地完善、不断地进步,但是力度仍然不够,并且在教育的许多方面还存在着法律的空白区或者法律的缺失,这也对我国教育事业的立法工作提出了更高的要求。

当然中国教育事业的问题症结以及面对中国教育反映出来的种种问题我们要如何却解决,要怎样找到更加合理有效的解决途径,还需要我们在实践中进一步的实践探讨。

地理科学二班

白雷超

2016、11、1

教育测量与评价2017-07-16 05:20:26 | #3楼回目录

《教育测量与评价》习题

(一)填空题

1._桑代克_的论著《精神与社会测量导论》一书标志着教育测量理论的诞生,泰勒领导了著名的八年研究并提出“行为目标评价模式”,最早提出了教育评价的概念,被称为“当代教育评价之父”。

2.按照测量的精确程度,教育测量量表从低级到高级分为称名量表、顺序量表、区间量表/等距量表和比率量表。

3.某道论述题满分12分,所有考生在这道题上的平均得分为3.6分,则此题的难度为0.3。

4.教育基本理论研究、教育测量与评价科学研究以及教育发展理论研究已成为现代教育科学研究的三大领域。

5.教学工作评价的内容包括对教师的备课、上课、批改作业、课外辅导、命题考试等教学工作基本环节的评价。

(二)判断题

(√)1.测验的信度受许多因素的影响。一般来讲,增加测验的长度,可以提高试题取样的代表性,因而有助于提高测验的信度。

(√)2.标准分数本身是关于原始分数的一种线性变换,因此,标准分数不改变原始分数的分布形态。

(×)3.假如某学生在期中语文统考中卷面分数为85分,又知该学生所在年级中有60%的学生成绩低于85分,则该学生的百分等级为51。

(×)4.等距变量具有等级变量的特征,要求连续数量之间的差距相等,亦即具有相等的单位。因此,等距变量可以作加减乘除运算。

(×)5.教育评价的主要功能就是甄别和选拔,通过各个层次的教育评价可以监督教师的教学工作和学生的学习活动,确保学校教育教学工作的正常进行。

(√)6.测验试题的难度影响着测验分数的分布。

(×)7.现代测量理论是在经典测量理论的基础上发展起来的,修正了经典测量理论的不足,所以现代测量理论可以完全代替经典测量理论。

(√)8.发展性教学评价认为面面俱到的课不是好课,只是“教教材”,没有“用教材教”的课也不是好课。

(三)简答题

1.常见的指标权重分配方法有哪几种?

【答题要点】:常见的指标权重分配方法包括:(1)关键特征调查法;(2)两两比较法;(3)专家评判平均法;(4)倍数比较法;(5)Q分类法。答题时一是要阐述清楚这五种方法各自的内涵是什么,二是简单说明这五种方法的操作步骤。

相关内容可参考第七章“制定教育评价表的一般方法和步骤”中第二节“教育评价表的构成及编制”。

2.衡量测验质量的四个指标分别是什么?

【答题要点】:(1)衡量测量质量的四个指标分别是信度、效度、难度和区分度。(2)在答案中需阐述清楚这四个指标分别的定义是什么。(3)一个良好的测验应该具备恰当的难度和区分度,具备较高的信度和效度。(4)指出这四个指标对于测量质量的意义,即前两个指标主要是对整个测验而言,后来两个指标主要是对测量的项目而言。

相关内容可参考第三章“教育测量与评价的质量特性”。

3.在现代社会中,具有健康人格的学生具有哪些特征?

【答题要点】:在现代社会中,青少年学生所具有的健康人格应是:能客观地认识自我和外部世界;开放的;对所承担的学习和其他活动有胜任感;充分发挥自己潜能;对父母、朋友有显示爱的能力;有安全感;喜欢创造;有能力管理自己的生活;有责任感等。

相关内容可参考第八章“学生评价”中第五节“学生人格心理发展的测评”。

4.制定教育评价表需要遵循哪些原则?

【答题要点】:教育评价表是根据教育教学的特性编制而成的,它由评价指标、评价项目(条目)、评价标准、评定等级、指标权重等构成。它是进行教育测量与评价的工具,为了使评价的结果更为可靠,需要对教育评价表进行更深入的研究,制定教育评价表应遵循以下的原则:

(1)科学性与导向性原则

(2)完备性与独立性原则

(3)发展性与整体性原则

(4)操作性与可测性原则

(5)可行性与可比性原则

作答时需对以上五个原则分别展开阐述,说明其各自内涵。

相关内容可参考第七章“制定教育评价表的一般方法和步骤”中第一节“制定教育评价表的意义与原则”。

(四)论述题

1.现代学生评价具有那些特点?如果您是一名评价者,您将从哪些方面评价学生?【答题要点】:

(1)在回答现代学生评价的特点是,注意结合以下几点进行阐述,注意把握它们的内涵并结合实践进行说明。强调了评价功能的形成性。

重视评价内容的全面性。

重视评价类型的多样性。

(2)现代学生评价的这些特点也反映在现代学生评价的原则与操作方法上。现代学生评价的基本原则包括:发展性原则、全面性原则、明确性原则和过程性原则。

(3)可从综合的角度出发,提出学生课业发展的内容框架。这个内容框架,除了学生的健康与体能发展目标外,还可包括如下九个方面:

学生个体一般性发展

学科理论知识和学科能力或技能的发展

思维技能与品质的发展

研究与学习技能

创新精神与实践能力的发展

态度、观念与兴趣的发展

欣赏与审美的发展

适应与习惯的发展

个体独特性的发展

阐述上面九个方面时,同样需要把握实践对它们的内涵进行阐述。

2.简述教师评价的方法,并重点论述如何处理不同评价方法之间的关系。【答题要点】:

教师评价方法包括:

(1)教师自评

(2)学生评教

(3)同行评议

(4)观察与会谈

(需阐明每种评价方法的具体含义、优势等以及如何处理不同评价方法之间的关系)

1.信度的定义

信度,简单地说就是测量结果的可信程度,指的是测量结果的稳定性或一致性程度。

2.信度的估算方法

(一)重测信度

重测信度也叫稳定性系数,指的是用同一个量表,对同一组被试施测两次所得结果的一致性程度,其大小等于同一组被试在两次测验上所得分数的相关系数。

(二)复本信度

复本信度指的是两个平行测验测量同一批被试所得结果的一致性程度,其大小等于同一批被试在两个复本测验上所得分数的相关系数。

(三)同质性信度

同质性信度也叫内部一致性信度指测验内部所有题目间的一致性程度。

题目间的一致性有两层意思:其一是指所有题目测的是同一种心理特质;其二是指所有题目得分之间都具有较高的正相关。

(1)分半测验

指的是将一个测验分成对等的两半后,所有被试在这两半上所得分数的一致性程度。

反映了测验内两半题目间的一致性。用斯皮尔曼—布朗公式加以校正。

(2)库德—理查逊信度

适合于测验题目全部为二分计分题。两种公式。

(3)克龙巴赫系数

当测验题型较多,并且都是二分计分题时,估计测验信度可采用克龙巴赫系数。

(4)荷伊特信度

1941年提出用方差分量比来估计测验内部一致性的方法。

(四)评分者的信度

定义:指的是多个评分者给同一批被试的答卷进行评分的一致性程度

3.提高测验信度的方法

(1)适当增加测验题目的数量

(2)测验的难度要适中

(3)测验的内容应尽量同质

(4)测验的程序应统一

(5)测验的时间要充分

(6)评分要尽量做到客观化、减少评分误差

(7)应试者参加测验的动机水平、积极性、疲劳程度也会影响测验分数,从而影响信度。引起应试者参加测验的强烈动机,提高其积极性,使其保持旺盛的精力,都对提高测验信度有一定作用。

4.效度的定义

效度(validity)指的是一个测验或量表实际能测出其所要测量的特性的程度,记为rxy。顾名思义,效度就是一次测量的有效程度。效度分为:内容效度、效标关联效度和结构效度。

5.内容效度、效标关联效度和结构效度

(1)内容效度

内容效度是指测验目的代表所欲测量的内容和引起预期反应所达到的程度。也就是测量内容的代表性程度。在编制测验时,内容效度是一个相当复杂和不易解决的问题。以成绩测验来说,固然要求测验题目能代表所学习过的全部内容,但仅仅在形式上做到这一点还不能保证足够的内容效度,因为学习成绩的高低要从学习内容的巩固程度、理解程度和应用能力几种行为反应去考察,如果测验题目大多是只需牢记教材就可以回答的问题,那么,对全面测验学生的成绩这一目的来说,内容效度仍然不够高,也就是说,还没有完全测验到所想测量的特性和功能。

(2)效标关联效度

效标关联效度又可称为经验效度或统计效度,是以测验分数和效标之间的相关系数来表示测验的效度的高低的。效标就是足以显示测验所欲测量的特性的变量或足以显示测验所欲预测的特性的变量,作为检定效度的参照尺度。效标关联效度又可分为同时效度和预测效度。同时效度是指测验与当前效标之间的关联程度;预测效度是指测验与将来的效标之间的关联程度。例如,用全国高考的成绩作为效标来检验高中毕业会考的成绩,计算两者之间的相关系数就是会考的同时效度;而用大学一年级的成绩作为效标来检验高考的成绩,计算两者之间的相关系数就是高考的预测效度。

(3)结构效度

所谓结构效度,是指一个测量能实际测量出理论上的构念或心理特性的程度。它的目的在于用心理学的概念来说明分析测验分数的意义,也就是说从心理学的理论观点就测验的结果加以解释和探讨。这里的结构的含义是心理学理论所涉及的抽象而属假设性的概念、特性或变量,如智力、焦虑、机械能力倾向、成就、动机等。

6.提高效度的方法

(1)控制系统误差

(2)精心编制量表

(3)规范测验程式

(4)扩充样本的容量和代表性

(5)合理处理效度和信度的关系

(6)适当增加测验的长度

7.信度与效度的关系

信度高是效度高的必要但非充分条件。

测验的效度受制于它的信度,即效度系数不会大于信度系数的平方根。

8.难度

难度指被试完成测验或量表时所遇到题目的难易程度记为P。难度的计算

(1)难度对测验的影响

影响测验分数的分布状态。

影响测验的鉴别能力。

(2)影响题目难度的因素

考查知识点的多少

考查能力的复杂程度或层次的高低

考生对题目的熟悉程度

命题的技巧

利用经验判断或者通过预测调整难度

9.区分度

区分度指测验或量表题目区别被试水平能力的量度,记为D。区分度的高低直接影响到测验的信度和效度。具体关系如下:(1)提高区分度可以达到理想的测验信度;(2)难度适中,可使区分度达到最大值。

区分度的计算

(1)相关法。区分度的实质是题分与总分的相关。计算方法:

点双列相关系数(适应用于0\1计分的题目或二分变量,总分是连续变量)

二列相关系数(适用于两个变量都是正态连续变量,但其中一个变量被人为分为两类)

积差相关系数(适应于非二分变量项目)

(2)高低分组法。

1.确定评价指标的方法

提出初拟评价指标的方法主要有以下几种:

(1)头脑风暴法:利用头脑积极思维,进行智力碰撞,激发智慧灵感,从而提出评价指标。根据人数的多少,可分为个人头脑风暴法和多人头脑风暴法。还可以分为直接头脑风暴法和质疑头脑风暴法。直接头脑风暴法是指按照统一要求从正面论述自己的观点;质疑头脑风暴法是连续召开两个会议,第一个会议按直接头脑风暴法要求进行讨论,而第二个会议则对第一个会议提出的指标进行质疑。

(2)因素分解法:将评价指标按照评价对象本身的逻辑结构逐级进行分解,把分解出来的主要因素作为评价指标。分解出来的因素,从高到低逐层次缩小内涵,越往下层次的指标越明确、越具体、范围越孝越可以观测。

(3)理论推演法:根据有关学科的理论推演出评价指标。根据心理学关于智力、能力的理论,可以推演出评价中小学生智力、能力的指标,同时还可借鉴这些理论对评价指标的内涵作出明确界定,使其更加严密。

(4)典型研究法:通过对少数典型事例进行研究而设计评价指标。可分为正向研究、负向研究和正负向结合研究三种类型。正向研究是通过对成功的典型事例研究,提出评价指标;负向研究是通过研究失败的典型,提出评价指标;正负向结合研究是通过成功的典型事例与失败的事例进行比较,提出评价指标。

必须对初拟指标进行归类合并和筛选,目前大多采用以下方法:

(1)经验法:凭设计者的学识修养和工作经验进行筛眩掌握以下要点:理由是否充分或必要、取主舍次、从各指标之间的关系上进行比较、去难存易,删繁就简。

(2)调查统计法:把初拟指标制成问卷,发给有关专家和有经验的教育工作者,请其对初拟指标作出判断。一般分为很重要、重要、一般、可要可不要、不要五档。答卷者在每项指标后记上自己判断的重要程度。收回问卷统计“很重要”、“重要”两档的人数比例,按评为人数比例和的高低,由高到低排序。把低于某数值的指标删除(一般以低于2/3或3/4处作为划界),就得到经过筛选的指标。

(3)模糊聚类法——简化指标。

2.确定评价指标权重的方法

(1)关键特征调查法:先请被调查者从所提供的备择指标中找出最关键、最有特征的指标,再对指标进行筛选并求出其权重。

(2)两两比较法:为了确定各指标的权重,可对指标进行逐对比较,并加以评分,重要者记为1分,次重要者记为0分;然后分别计算各指标得分之和,再除以所有指标得分之总和。

(3)专家评判平均法:对于已经确定的指标,分别请专家评判其权重,然后以专家评判结果的平均数作为各指标权重。

(4)倍数比较法:对已确定的指标,以每一级指标中重要性程度最小的指标为基础,记为1,然后将其他指标与它相比,作出重要性程度是它多少倍的判断,再经归一化处理,即获得该级各指标权重。

(5)Q分类法:将写有指标名称的一套卡片交给被调查者,请他们按指标重要性程度分组。具体步骤为:①将卡片分成高重要度组和低重要度组,两堆卡片数不必相等。②选出中等重要度的卡片,形成第三堆。③从高重要

度组中选出一堆更高重要度的卡片,从低重要度组中选出一堆更低重要度的卡片。④检查分类结果,并进行调整。⑤根据分类结果,给出各类指标的权重。

3.设计评价标准的方法

(1)分解教育评价表中指标所包含的主要内容。

(2)确定标度:标度是达到标准的程度,它说明什么样的程度属于什么等级。表示标度的方式有二,一是用描述性语言表示,二是用量化形式表示,经常用分数阈来划分程度。

(3)确定等级数量:评价标准设多少等级为好没有统一的规定,可根据需要而定。等级数量越多,分等精确度就越高。一般以3-5个等级为宜。

主观题部分:

一、简答题(每题2.5分,共2题)

1、教育测量的含义与特点是什么?

答案要点:

含义:针对学校教育影响下学生各方面的发展,侧重从量的规定性上予以确定和描述的过程。教育测量学是一门发展较早、应用较多、内容较丰富的教育科学分支。

特点:

(1)间接性和推断性

(2)测量对象的模糊性和测量误差的不可避免性

(3)量表具有多样性,结果具有相对抽象性

2、教育测量与评价在教育系统中有哪些作用?

答案要点:

(1)教育测量与评价在教育系统中的作用:教育本身是一个系统。在教育系统中,学生、教师、学生、教育方案、课程、教材、教学训练、考试等都是这个系统的组成部分。当根据教育目标和计划、把教育方案、课程、教学等因素作用于学生身上后,需参照教育目标和计划,对教育效果及其输入条件的妥当性予以测量评估、价值分析和判断。然后,把这一测量与评价过程所获得的信息反馈给教育者、学习者以及有关教育决策者,以便改进教育的策略与方案,更有效地答道教育目的。

在教育系统运转过程中,除了对教育效果要进行测量与评价外,还要针对影响教育效果的诸因素进行客观的分析和评价。教育测量与评价在教育系统中对实现教育目标起着重要的作用。

(2)教育改革常常以教育测量与评价的改革作为突破口。

二、论述题(每题5分,共2题)

1、制定教育评价表的意义与原则是什么?

答案要点:

意义:(1)有利于提高评价的客观性;

(2)有利于提高评价的全面性;

(3)有利于提高评价的科学性。

原则:(1)科学性与导向性原则;

(2)完备性与独立性原则;

(3)发展性与整体性原则;

(4)操作性与可测性原则;

(5)可行性与可比性原则;

(6)超前性与持续性原则。

2、现代教育测量与评价的发展趋势是什么?

答案要点:

(1)教育测量与评价的政治性得到加强;

(2)教育测量与评价的教育功能得到强化;

(3)教育测量与评价理论研究得到突破性进展;

(4)计算机技术的发展提高了测验的效率。

相关文章:

下期小学班主任工作总结09-24

六年级数学下期末复习计划08-10

2017数学下期中学业水平测试08-16

最新小学数学教学工作总结10-11

下期语文教学工作总结(精选5篇)08-11

六年级下期英语教学工作计划12-13

小学数学教育教学随笔01-20

小学数学教学改进措施05-04

小学数学教学教案模板11-30

小学数学教学工作总结 15篇01-14