郑勤华:双向驱动的学生综合评价新范式(“聚焦国家教育数字化战略行动”理论篇④)

新时代中外合作办学网 时间:11/10/2022 10:18:55 PM 来源:中国教育报 0 次浏览

双向驱动的学生综合评价新范式

郑勤华

2022年07月13日 星期三 中国教育报


    ■“聚焦国家教育数字化战略行动”理论篇④


    教育评价改革的需求与智能技术的发展,从理论、技术上均有突破现有困境的可能。在理论与技术的双向驱动过程中,通过评价模型构建、数据采集、数据智能分析、评价应用等环节的迭代优化,形成稳定且成熟的学生综合素养评价体系,发挥评价结果的导向、诊断、调控和改进作用,实现“以评促育”。


    教育评价事关教育发展方向,有什么样的评价指挥棒,就有什么样的办学导向。2020年中共中央、国务院印发的《深化新时代教育评价改革总体方案》,明确提出要“健全综合评价”。在教育数字化转型的背景下,特别是教育信息化取得长足进步的今天,学生的综合评价需要构建以核心素养为底座的学生全面发展理论模型与指标体系,依托常态化教与学信息化应用所采集的学生客观行为、身心发展和结果数据,并积极探索形成各指标与多模态数据的关联映射关系,从而建立起理论指导技术应用、技术应用优化理论模型的双向驱动评价新范式。


    双向优化的新范式


    如何全面理解理论与技术双向驱动下的学生评价新范式?首先,新范式的重中之重是,理论站得住,技术可操作,两者相互促进,在迭代中形成不断优化的评价解决方案。新范式不仅在于理论层面的拓展与深化,而且涵盖方法层面的创新。


    一是理论上的完备性和综合性。理论层面的完备性重在指导评价内容的全面性,即对学生面向新时代跨越学科特性的必备能力、关键品格和价值观的全面覆盖。综合评价不是对已有德智体美劳各要素的分立性判断,而是对学生能力发展的基础性和必要性成分的综合判定。学生问题解决能力、批判性思维、心理健康、亲子关系、家国情怀等,都是综合评价涉及内容。


    二是技术上的可行性和先进性。新技术的使用,使采集和汇聚学生不同场景的客观数据已成为可能,突破了以往综合评价依赖主观经验的局限。同时,利用多模态数据的智能处理与分析技术可以对不同来源、不同结构的海量数据进行处理和分析,构建特征数据与各指标的映射关系,从而深度挖掘学生综合素养发展过程与特点,并为学生个体提供综合性评价结果和未来发展建议。


    三是理论与技术不断迭代的发展性。新范式下,基于智能技术的持续动态采集能力,学生综合评价可以对特定时间范围内的学生能力变化进行持续刻画,精准洞察学生个体在一定时间范围内的发展变化,从而支持对学生的增值评价;并且,通过对相关评价信息进行关联挖掘、分析,能够实现针对学生发展规律的理解。更重要的是,大数据支持下的强化学习和主动学习,又帮助我们进一步挖掘出能够表征理论指标的更多数据特征,从而支持理论模型的不断迭代优化。


    新范式的构建


    新范式坚持理论科学性与技术可行性的有机统一,总体来说,新范式的核心理念可以概括为“四个环节”“双向驱动”与“循环迭代”。


    四个环节主要包括模型构建、数据采集、数据智能分析以及评价应用。


    第一,学生综合评价模型构建。学生综合评价模型的构建不再完全依靠教育学领域专家,而要联结多领域专家共同构建一套以“中国学生发展核心素养”的文化基础、自主发展、社会参与三个方面为基础,适应时代发展、共识性与可解释性较强、灵活性较高的学生综合素质评价模型。


    第二,多场域多模态的数据采集。新范式下,数据采集方式、数据来源、数据模态等方面有了根本性的改变。数据采集方式方面,突破传统调查、填报为主的采集方式,转向基于教育信息化基础数据汇聚,走向伴随式数据采集为主的趋势。数据来源方面,不再局限于学校场景,而是延伸至对学生发展至关重要的家庭、社区、科技馆等多种典型场域。数据模态方面,除了文本数据以外,还能够采集包括音频、视频、图像、生理信号等多模态数据。


    第三,多模态数据智能分析。通过分析旨在将多模态数据指标与学生发展特征建立关联映射关系。面对复杂的、非结构化的多模态数据,首先要做的就是对其进行包括缺失值处理、无效数据剔除等工作;然后依据评价理论模型,通过特征变量提取等方法提取特征,构建综合评价的各指标与不同模态学生表现性数据特征的映射关系。


    第四,学生综合评价应用。基于上述三步,将构建起学生综合评价的数据表征能力。在此基础上,我们就可以搭建起学生综合评价的应用体系,通过常态化的应用,去验证理论模型,优化技术服务,从而实现综合评价应用的常态化和科学化。


    从以上四个环节来看,通过融合“理论”与“技术”优势,形成了从理论到技术的“自上而下”(理论指导技术应用)和从技术到理论的“自下而上”(技术应用优化理论)的双向驱动机制。就理论到技术的“自上而下”而言,实质是从权威的角度出发构建学生综合评价理论模型,为多模态数据采集、多模态数据智能分析以及学生综合评价应用提供基本理论指导与模型服务支持。就技术到理论的“自下而上”而言,实质是从数据出发构建基于数据的学生综合评价模型,为学生综合评价指标找到可测量、可计算的数据指标,提炼出相应的数学结构,计算出学生综合评价结果,为结果应用提供参考,进而优化、完善理论。


    通过“模型构建—数据采集—数据智能分析—评价应用—模型构建”的闭环反馈、多轮迭代流程,新范式下的评价模型持续优化,数据来源持续丰富,数据处理持续精准,最终使学生综合评价能够适应不同场景需要。但是,针对不同的情形,循环迭代过程中所要迭代的侧重点也不一样,大致可以分为三种情形:一是教育学、心理学等领域已有成熟理论模型和方法的评价内容,迭代优化数据采集点;二是教育学、心理学等领域尚无成熟理论模型和方法的评价内容,迭代优化评价指标以及指标权重;三是教育学、心理学等领域已有理论模型,但尚无测量方法的评价内容,迭代优化评价模型与数据采集点。


    新范式的实施路径


    理论与技术双向驱动的学生综合评价新范式从理论走向实践,解决教育评价实践中存在的问题,必然会遇到挑战。在实践中有效解决以下四个关键问题,将利于持续推进新范式的落地应用。


    一是破解数据汇聚难题。我国教育信息化发展历经40多年,已经建立起了完备的应用系统或平台体系。然而,如何汇聚海量多源异构数据?首先,建立健全数据标准规范体系是从源头上保障数据格式的规范与统一。其次,建立高一级别的数据采集与汇聚平台,通过统一的数据接口对接各应用系统或平台,实现各取所需。


    二是保障数据安全和隐私。针对不同应用系统或平台的海量数据能够汇聚融合的情况下,组合数据加密、签名、隐私处理等方法确保数据在传输、存储以及应用过程中的安全性。针对不同应用系统或平台的海量数据无法汇聚融合的情况下,采用联邦学习技术保证学生个人的隐私不外泄,同时还能保证数据拥有方的利益。


    三是加快建立综合评价常模。从长远来看,学生综合评价的结果要服务于我国人才培养与教育评价改革。常模建立能为评价结果应用提供参考的基准线。一方面,对于可以确定因变量的指标或维度,引入数据科学方法进行分析;另一方面,对于数据科学方法无法进行合理权重分配的情况,以教育科学方法为主,结合数据科学方法确定权重,这均为常模构建提供了支持。


    四是遵循定性与量化评价相结合。新范式下,学生发展的一切指标均可以通过智能技术采集客观数据进行量化评价。然而,从评价的科学性与当前技术的可行性来看,这是一种理想状态。因此,在实践中考虑这一问题时,我们主张不走极端的数据决定论支持的绝对量化评价这一道路,纯粹的量化评价对学生综合评价并不完全适合,而是需要将定性评价与定量评价结合起来,共同针对学生某一发展指标进行科学、客观、全面评价。


    (作者系北京师范大学远程教育研究中心主任、教授)


lll