전통문화대전망 - 전통 미덕 - 시험 품질 분석 방법
시험 품질 분석 방법
1. 연구 주제 제안
(1) 전통적인 시험 통계 이론의 단점
개인차가 편재하기 때문에 "학생을 다음과 같이 가르칩니다." 적성'을 교육의 이상으로 삼는 교육원칙. 현실에서는 "...자신의 생각을 불분명하게 표현하는 천재와 자신의 생각을 명확하게 표현하는 바보를 구별하기는 쉽지만 전자는 계산과 결론을 통해 과학에 대한 깊은 이해를 보여 주지만 '라고 말할 수는 없습니다. '그것이 어떤 것인지 알아내는 것'; 후자는 적절한 단어로 가득 차 있는 것처럼 보이지만 이러한 단어가 나타내는 개념을 사용하는 해당 능력이 없습니다. 그러나 오늘날의 학업수행능력검사와 지능측정은 주로 학생들의 외현기억 지식과 인식이나 재생을 통해 의식적으로 인출할 수 있는 지식을 측정하기 때문에 정식 시험의 도움으로 원하는 효과를 얻는 것이 어려운 경우가 많습니다. 이런 종류의 지식 적용 능력은 암묵적 학습, 암묵적 기억과 같은 학생의 무의식적 처리 능력에 대해서는 측정하기 어렵습니다. 이러한 처리 능력은 학생들의 종합적인 이해와 개별화된 교육에 기여할 것입니다. 왜냐하면 평가의 목적은 학생들을 좋고 나쁨으로 분류하는 것이 아니라 아이들을 적절한 교육 환경에 배치하고 학생들이 자신의 장점을 개발하고 피하도록 돕는 것이기 때문입니다.
시험 전반에 걸쳐 고전적인 시험 이론을 사용하여 동일한 수준의 시험 결과를 분석합니다. 개인차와 문항 응답 패턴의 차이로 인해 동일한 시험 점수에 포함된 성격의 차이를 혼동하게 됩니다. 일부 연구에서는 동일한 정답률이 응답 패턴의 차이에서 비롯될 가능성이 높다는 사실을 보여주었습니다. 잠재 특성 이론과 현대 측정 이론의 발전, 즉 항목 반응 이론은 이러한 단점을 극복하고 결과와 해당 심리적 특성 사이의 관계를 어느 정도 결정하려고 노력합니다. 직접적으로 관찰하고 측정할 수 없는
(2) 전문적인 통계분석 도구의 부족
수험통계는 교육의 집합체이기 때문에 수학적 통계를 융합한 종합적인 학제간 교과목이다. 그러나 현재 시중에 나와 있는 통계분석 소프트웨어는 각계각층을 대상으로 하고 있어 교육통계에만 활용하면 낭비적이고 부족한 기능이 많으며, 분석결과가 너무 추상적이어서 한 마디로 설명할 수 없다. 따라서 사용자에게 설명하기 위해서는 전문적인 테스트 통계 분석 도구를 설계하는 것이 테스트 품질을 향상시키는 데 최우선 과제가 되었습니다.
(3) 문항 응답 이론의 등장은 데이터 분석을 위한 새로운 도구를 제공합니다. >
p>
1970년대와 1980년대 측정이론의 가장 중요한 진전은 문항반응이론의 적용으로, 이는 고전적 측정이론 이후 중요한 측정이론이 되었다. 고전적 측정이론은 '시험점수=능력'이라는 후자 분석자료의 한계를 극복하고 능력을 잠재적 변수로 간주하며, 프로젝트의 난이도, 차별성 등 중요한 매개변수를 프로젝트의 고유한 특성으로 간주하기 때문이다. 현재 이 이론은 객관식 시험, 시험 문제 은행의 구축, 다양한 시험에서 다양한 피험자 그룹의 능력 응답의 동등성, 문화 간 비교 등 다양한 측정 분야에서 주로 사용되고 있습니다. 선진국의 인재평가 데이터 분석에 있어서 문항반응이론은 전통적인 분석도구로 자리잡았다.
2. 연구 목적 및 의의
첫째, 전통적인 교육 통계 방법을 활용하여 거시적 수준에서 시험지를 분석하고 시험 품질에 대한 피드백 정보를 제공합니다. 논문과 학생의 전반적인 수준을 관리자에게 교육하여 교육 및 의사 결정을 향상시킵니다. 둘째, 전통적인 교육통계방법의 단점을 고려하여 시험지를 미시적인 수준에서 분석한다. 문항 반응 이론을 사용하고, 학생들의 암묵적 학습과 암묵적 기억에 주목하고, 문항 반응 모델의 차이를 통해 "시험 = 능력"의 한계를 극복하고, 학생들의 진정한 심리적 특성이나 특정 심리적 세트를 반영하고 시험지를 작성합니다. 분석 결과 성적 평가. 형성 평가(총괄 평가와 비교하여, 형성 평가는 일상적인 교수 상황에 대한 더 많은 정보를 제공할 수 있음)의 목적은 학생들의 학습 상태를 진단하고 평가할 뿐만 아니라 교수 내용과 교수 방법을 검토하고 평가하는 것입니다.
시험지의 거시적 분석
1. 시험지의 거시적 분석이 필요하다
시험은 짧은 시간 내에 교육에 관한 많은 양의 정보를 얻을 수 있다. 이는 교육 관리자가 교육 업무를 개선하기 위한 결정을 내리고, 시험지 분석을 통해 피드백 정보를 얻고, 교사와 학생 간의 교육에 존재하는 문제를 이해하는 데 도움이 됩니다. 시험을 통한 교수방안에 대한 계획적인 점검과 연구는 관리자가 교수관리를 개선하는 중요한 기초이며, 관리자가 교사의 교수상황을 이해하고 구체적인 도움과 지도, 통제를 제공하는 중요한 기초 중 하나이다.
시험지의 거시적 분석을 통해 교육 관리자와 교과 교사는 학생들의 집단 지식 수준, 집단 방향 등 중요한 정보를 파악하고 적시에 수업 전략과 방법을 조정할 수 있습니다.
2. 시험지 거시분석 사례
이 수준의 통계분석의 주요 내용은 시험지 점수의 전체적인 분포형태, 평균값, 전체적인 난이도, 차이 등이다. 표준편차와 그 빈도 및 빈도분포, 시험지 난이도 및 변별력 분포, 시험지 전체 구성의 차이, 시험지 신뢰성, 시험지 구조적 타당성, 내용 타당성 등
이 사례는 SPSS(Statistics Package for Social Science)를 이용하여 복단중 1(2)급 2학기 최종점수에 대한 전체 범위, 표준편차, 중앙값, 빈도분포, 시험지를 분석한 사례이다. 상하이 학교의 난이도, 시험지 신뢰도 및 시험지 차별성을 분석합니다. 분석 결과는 다음과 같습니다.
(1) 전체 범위
전체 범위는 데이터 그룹의 최대값과 최소값의 차이를 의미하며 두 극단값 사이의 전체 간격을 나타냅니다. , 일반적으로 기호 R로 표시됩니다.
(2.1)
전체 범위는 전체 범위 R이 상대적인 경우 데이터의 불연속성 또는 차이 정도를 표현하는 데 사용할 수 있습니다. 크다는 것은 응시자의 시험점수 차이가 크다는 것을 의미하며, R이 상대적으로 작다면 응시자의 시험점수가 상대적으로 집중되어 있다는 것을 의미한다. 시험 문제를 통해 우리는 모든 응시자의 해당 지식 포인트 숙달 수준을 쉽게 이해할 수 있습니다.
표의 데이터를 보면 수학 시험지의 전체 범위는 77점입니다. 이 과목에서 학생들의 시험 점수에 큰 격차가 있는 것을 알 수 있으며, 평균 점수는 수학은 70.2708로 전반적인 수준은 좋지만 가난한 학생들은 너무 가난하다는 것을 의미하므로 주의해야 합니다. 중국어, 역사, 정치에서는 전체 거리가 더 좁고 평균 점수가 높아 전체 수준이 더 좋고 학생 간 차이가 크지 않은 것으로 나타났습니다. 이는 또한 과학과 인문학의 차이를 반영합니다.
(2) 표준편차
변수 값이 평균값에서 분산되는 정도를 나타내는 것으로 사물의 평균적인 발전과 변화를 반영하는 수치적 지표입니다. 이는 시험 중 학생 성취도의 차이 정도를 측정하는 데 사용할 수 있으며[3], 이 시험의 구별 정도에 대한 일반적인 이해를 갖기 위해 계산 공식은 다음과 같습니다.
(2.2. )
수식에서 S는 각 관측값이고, N은 관측치 수입니다. 일반적인 상황에서는 각 테스트의 표준 편차를 9~15포인트 사이로 제어하는 것이 더 적절합니다. 표준편차가 8점 미만이면 점수 분포가 상대적으로 집중되어 있고, 시험 문제가 너무 차별화되어 있으며, 중간 난이도의 문제가 너무 많다는 것을 의미합니다. 점수가 너무 분산되어 있다는 것.
수학과 외국어 시험의 점수 분포가 정상이 되도록 시험의 표준편차를 9점에서 15점 사이로 조절하는 것이 더 적절하다. 정치, 중국어, 물리학, 화학, 역사 분야의 점수가 너무 집중되어 있어 시험문제 간 구분이 부족하다는 것을 알 수 있습니다.
(3) 중앙값
중학교의 점수는 일반적으로 백분율 방식을 사용하므로 시험 점수의 분포가 뚜렷한 중심 경향을 가지지 않으므로 일반적으로 모드를 사용하지 않습니다. 통계로 사용하고 중앙값을 사용합니다. 공식은 다음과 같습니다.
중간 위치 = (2.3)
수학 시험지를 예로 들면 최빈값은 60이고 중앙값은 71입니다. 가장 많이 나오는 점수가 60점이고, 중간에 있는 점수가 71점임을 알 수 있습니다. 이는 시험지의 난이도가 보통이고 약간 낮은 편임을 나타냅니다. 외국어 시험지의 중앙값은 56.5점으로 시험지가 어렵고 전반적으로 학생들의 점수가 낮은 것으로 나타났다. 역사 시험의 평균 점수는 90점으로 상대적으로 단순하며, 학생들이 대체적으로 높은 점수를 받습니다.
(4) 빈도 분포
일반적인 상황에서 시험 점수는 정규 분포에 가깝지만, 실제 시험에서 시험 점수는 다음과 같은 4가지 분포 형태를 가집니다. 수치) . 시험문제의 다양한 품질정보를 반영
그림 2.1 빈도분포도
그 중 그림 A는 시험문제의 난이도 정규분포를 반영한 것이며, 그림 B는 정규분포이다. 분포는 점수가 낮은 사람이 많을수록 평균 점수가 낮아진다는 것을 의미하며, 음의 왜곡 분포는 점수가 높은 사람이 더 많다는 것을 의미합니다. 그림 C에서는 평균 점수가 더 높고 덜 어려운 질문이 더 많은 점수를 차지합니다. 피크 모양 빈도 분포는 학생들의 점수가 평균 점수를 중심으로 집중되어 있으며 중간 및 어려운 시험 문제가 점의 비율이 높을수록 학생들의 점수가 크게 달라지며, 쉬운 유형, 중간 유형, 어려운 유형의 시험 문제가 높은 비율과 낮은 비율을 나타냅니다. 해당 항목의 점수가 집중되어 있고, 시험 문제의 난이도 구배가 크며, 보통 수준의 어려운 시험 문제는 더 작은 비율을 차지합니다.
수학 시험지를 예로 들면, 해당 반 학생 48명의 점수의 도수분포도는 다음과 같습니다.
그림에서 알 수 있듯이 수학 논문에서 응시자의 점수의 빈도 분포는 음의 편향 분포입니다. 점수가 높은 사람이 많을수록 평균 점수도 더 높으며, 난이도가 낮은 질문이 점수에서 차지하는 비중이 더 크다는 것을 알 수 있습니다. 대부분의 지원자의 점수는 10점에서 20점 사이입니다. 40~50점, 즉 지원자의 점수가 범위에 포함되지 않습니다. 20~40점은 가난한 학생이 너무 가난하므로 특별한 주의를 기울여야 함을 나타냅니다.