AI智能总结
Conclusions 这项研究调查了对 ACT 的社会经济 , 种族 / 族裔和性别偏见的指控®性能并评估了ACT为应对这些偏差而实施的战略的有效性。本研究揭示,在考虑学术准备情况后,不同学生子群体之间的ACT分数差异显著缩小。本文还评估了ACT为促进公平所做的努力,例如在测试开发中纳入多样化的视角、进行公平审查以及提供诸如费用减免和免费备考资源等措施。通过分析由学术背景与社会经济状况及人口统计特征解释的ACT分数差异,本研究为标准化考试公平性的持续讨论做出了贡献,并强调了对学生能力进行全面评估的重要性。 那又怎样 ? 通过强调学生高中成绩和课程作业在决定ACT分数中的重要作用,该研究强调了为所有学生提供公平教育机会的必要性。研究结果挑战了对ACT固有偏见的看法,表明观察到的子群体差异可以很大程度上由学术因素解释,从而鼓励采用更为细致的方法来解读标准化测试分数及其公正性。 现在呢? 这项研究建议,减少标准化考试成绩差异的努力应集中于解决学术准备和高级课程访问不平等的问题,而不是修改考试本身。这强调了确保所有学生,无论其社会经济状况或背景,都能获得高质量教育的教育改革。 关于作者 Acknowledgements 埃德加 · 桑切斯 作者感谢Jeff Conway、Joyce Schnieders和Dana Murano对之前报告草案提出的建议。 埃德加·I·桑切斯博士是ACT公司的首席研究科学家,他的研究领域包括高等教育入学、国家级考试项目、考试准备效果以及干预措施的有效性。在他的职业生涯中,桑切斯博士的研究重点在于高中与大学之间的过渡阶段,以及支持高校管理人员、学生及其家庭的决策能力。他的研究成果广泛被学术文献和媒体引用,包括《华尔街日报》、《华盛顿邮报》、《今日美国》以及教育行业媒体。 Introduction ACT®测试,如同美国教育系统中广泛使用的许多标准化评估一样,面临着其构建过程中可能存在偏见的指控,这可能对参加评估的部分学生群体产生负面影响。三种常见的偏见包括经济背景偏见、种族/ Ethnic 背景和文化偏见以及性别偏见。 当讨论社会经济偏见时,常常有人认为来自较高社会经济背景的学生在ACT考试中受到青睐,并因此获得较高的分数。人们认为这些学生拥有更多的资源,例如优质的学校、私人辅导和昂贵的备考课程。有人argument认为这些资源导致了更好的测试表现,进而形成了一种优势,从而在不同背景的学生之间造成了差距。例如,Kohn(2000)认为社会经济地位是标准化测试成绩差异的主要来源之一,并指出学生的社会经济背景显著影响标准化测试(如ACT)的成绩。而Milner(2013)则反驳这一观点,认为标准化测试成绩的差异部分取决于教学和学习机会,以及与教育无关的因素,如贫困、就业情况和住房位置等。 关于种族和文化偏见的主张主要涉及对某些种族/族裔群体的固有偏见。这可能是由于文化参考、语言细微差别或问题的表述方式更符合某些群体而对其他群体不熟悉。这种观点认为,这种类型的偏见可能对来自代表性不足的种族和族裔背景的学生的表现产生负面影响。例如,一项针对ACT的具体论点(FairTest,2007b)指出,ACT在预测白人学生的结果方面表现得更好,但在预测黑人学生的结果方面表现较差。 最终常被提及的偏见是性别偏见。在这一论点中,有人认为ACT的部分部分可能对不同性别有所偏向,特别是在数学和科学领域,历史上这些领域的性别组别之间确实存在差异。这些差异被认为代表了性别偏见。FairTest(2007a)曾提出过关于ACT中性别偏见的一个论点。在该文章中,作者声称由于女性学生的ACT成绩通常低于男性学生,因此该测试必然对女性学生存在偏见,并且会低估她们的能力。 在ACT中,已采用了多种方法以防止或减少《ACT测试》中可能存在的偏差。例如,在项目开发过程中涉及多样化的群体,这有助于确保项目不包含文化、种族和性别偏见。来自不同背景和专业领域的专家团队帮助识别并解决潜在的问题中的偏见,这些问题在被用于ACT之前已经得到了处理。 此外,在预测试之前,ACT 对所有项目进行外部公平性审查,然后在形式投入使用前再次进行审查。在外部内容审查期间,刺激物和项目会被评估其内容准确性以及语言和情境的适宜性。ACT 邀请在相关领域具有知识和经验的外部审阅者参与,包括高中教师等。为了确保多样性,评审人员在性别、种族、文化背景和地理方面都有不同的背景。 这个发展过程中,ACT还包括对测试项目进行全面的统计审查和验证过程。这些审查包括统计分析以识别在不同人口统计群体中表现出差异性项目功能(DIF)的任何项目。DIF 用于识别在不同学生子群体中表现不同的项目,如果发现项目存在 DIF,则对其进行修订或删除。 此外,为了应对社会经济方面的考虑,ACT提供了费用减免、免费考试准备服务以及广泛的考试中心网络,以帮助减少考试访问和准备中的社会经济差异。例如,费用减免计划使符合条件的学生可以免费参加ACT考试。这些学生还可以获得免费的考试准备服务,以帮助他们做好充分准备,发挥最佳水平。考试中心也被战略性地选址,以确保来自较低社会经济背景的学生能够公平地获得考试中心的访问权。 此外,ACT还开展了研究以探索ACT分数的主要变异源。例如,McNeish等人(2015)利用带稳健标准误的块回归模型分析了认知和非认知特质与ACT分数之间的关系。高中平均成绩点数(HSGPA)是主要解释变量,能够解释ACT分数变异的20%到31%。高中课程内容额外贡献了阅读部分8%的变异度以及数学部分17%的变异度,而其他高中特征(如学校中有资格享受免费或减价午餐的学生比例)能够额外解释ACT分数变异的7%到9%。社会经济和人口统计因素的影响相对较小,在调整了其他学生和学校特征后,仅能解释ACT分数变异的4%或更少。重要的是,在调整了HSGPA和高中课程内容后,不同种族/ Ethnic 组别、家庭收入水平和父母教育程度之间的平均分差异显著缩小。McNeish等人(2015)的研究展示了学术准备对ACT表现以及后续学业成果的重要性。然而,该研究的重点在于ACT综合得分的子群体差异。 当前文献缺乏对如何通过记录高中成绩来缓解不同人口群体(例如种族/ Ethnicity、性别、家庭收入)在ACT科学、技术、工程和数学(STEM)以及ACT英语语言艺术(ELA)分数上观察到的差异的理解。自2015年秋季起,ACT开始报告一个STEM分数,该分数是将数学和科学部分的1-36分比例分数取平均值并四舍五入到最接近的整数(0.5及以上的分数向上取整)。仅参加数学和科学测试的学生可以获得ACT STEM分数。自2015年秋季起,ACT也开始报告一个综合的ELA分数。ACT ELA分数是... 英语分数、阅读分数和1-36写作领域得分的加权平均值。只有参加所有三项测试的学生才能获得ELA(English Language Arts)分数。对于ELA分数的计算,写作领域的得分总和被转换为1-36的尺度。然而,这个1-36的写作领域得分不会单独报告。 本研究使用参加ACT考试的2022届高中毕业生的数据,探讨高中课程、家庭经济状况和社会人口特征与ACT STEM和ELA分数之间的关系强度。本研究旨在证明,在考虑学生的高中学术成就后,家庭经济状况和社会人口特征对解释学生子群体之间观察到的差异几乎没有增加的解释力。通过这样做,本研究扩展了当前的研究,关注特定科目的结果。本研究探索了以下三个研究问题: 1. ACT STEM 分数中观察到的方差的主要来源是什么 ? 2. ACT ELA 分数中观察到的方差的主要来源是什么 ? 3. 在考虑成就和学术准备因素后,ACT STEM和ELA分数的子群体差异是否得到减少? 方法 分析样品 本研究使用了2022年参加ACT考试的高中毕业生数据(样本量N=1,349,644)。由于学生必须获得有效的数学和科学测试分数才能获得ACT STEM分数,以及获得有效的英语、阅读和写作分数才能获得ACT ELA分数,因此本研究采用了2022年两份独立样本进行分析。在2022届高中毕业生中,有877,917名学生获得了ACT STEM分数,符合本研究的纳入标准。由于计算限制(即整个数据集太大,无法使用现有计算机资源处理),本研究中使用了随机样本。ACT STEM样本包括333,000名学生(占38%),其社会经济状况和人口统计特征与总体样本的比例相似(详见附录中的群体和样本统计数据)。ACT ELA样本包括217,371名学生,他们拥有有效的ACT ELA分数。在分析ELA样本时没有遇到计算问题,因此不需要像STEM样本那样随机抽取子样本。在两个样本中,大约50%的学生自认为是女性,约50%的学生自认为是白人,约45%到46%的学生未报告家庭收入,且两个样本在英语、数学、社会研究和科学的平均成绩上具有相似性(GPA)。表1). 措施 ACT STEM 和 ACT ELA 得分。官方ACT STEM和ACT ELA分数是从2022届毕业班记录中获得的。这些ACT分数可能是在校内测试或国家测试管理期间获得的。对于多次参加ACT考试的学生,研究中使用了他们在高中毕业前的最高分数。 高中学科 GPA 。自我报告的各门课程成绩平均值用于计算每位学生的科目GPA。英语GPA的计算包括9年级、10年级和11年级的英语成绩。数学GPA的计算包括代数1、代数2、几何、高于代数2的其他数学课程以及计算机数学。科学GPA的计算包括物理科学、地球科学、综合科学、生物学、化学和物理学。社会研究GPA的计算包括美国历史、美国历史、世界历史、世界文明、政府、公民学、公民资格、心理学以及其他历史课程的成绩。 桑切斯和布丁(2015)研究表明,学生自我报告的科目GPA与学生正式的成绩单上的科目GPA高度相关。根据他们的发现,学生的课程特定成绩与成绩单上的成绩相似——中位数的精确一致率(即,自我报告的成绩与正式记录的成绩一致的百分比)。 报告中提到,有68%的学生在成绩单上报告的成绩等级与他们在成绩单上的成绩等级相同,而在相差一个等级以内的范围内报告的成绩等级范围从91%到100%。他们还指出,在英语、数学、科学和社会研究科目中,学生倾向于低估自己的成绩而不是高估。其他研究表明,自我报告的GPA数据也可用于研究目的(Camara等,2003;Kuncel等,2005;Shaw & Mattern,2009)。 采取的课程。高中英语、数学、自然科学和社会研究课程的学习模式被考虑纳入本研究。在英语课程方面,绝大多数学生在参加考试注册时已经修完了英语9、10和11,这使得它成为一个不可用的指标。在数学方面,大多数学生至少修了代数1、代数2和几何,但也存在其他高级数学组合。然而,三角学、初等微积分和其他高级数学的组合导致N值很低。在生物学仅、生物学与化学以及生物学、化学与物理之间存在一定的有意义差异。对于社会研究而言,并不存在自然的学习顺序。基于这些原因,课程学习模式未被纳入学术准备情况的指标中。 参加了高级课程。自报拥有完成英语、数学、自然科学和社会研究高级课程的指标被采用。该指标包括每门科目都修读了AP、加速或荣誉课程。 学生人口统计。自我报告的学生人口统计数据包括家庭收入、性别和种族/族裔。这些数据是在参加ACT注册时收集的。学生从九个选项中选择了他们估计的父母总收入:少于24,000美元、24,000美元至36,000美元、36,000美元至50,000美元、50,000美元至60,000美元、60,000美元至80,000美元、80,000美元至100,000美元、100,000美元至120,000美元、120,000美元至150,000美元以及超过150,000美元。这些类别被合并为四个类别:少于36,000美元、36,000美元至60,000美元、60,000美元至100,000美元以及超过100,000美元。学生从四个选项中选择了他们的自我