विभेदक योग्यता परीक्षण नमूना कार्य। विशेष क्षमता परीक्षण बैटरियाँ। स्वाध्याय के लिए विषय

आइटम कठिनाई को एक सूचकांक द्वारा दर्शाया जाता है जो आइटम को सही ढंग से हल करने वाले व्यक्तियों के अनुपात से मेल खाता है (बोर्त्ज़ और डोरिंग, 2005)। पहले, इस सूचक को लोकप्रियता सूचकांक कहा जाता था। कठिनाई सूचकांक का उद्देश्य अत्यधिक कठिन कार्यों को आसान कार्यों से अलग करना है। वे कार्य जिनके लिए सभी विषय सही उत्तर देते हैं, या जिन कार्यों के लिए किसी को भी उत्तर नहीं मिला है उन्हें अनुपयुक्त माना जाता है। कठिनाई सूचकांक आवश्यक रूप से इन चरम मामलों के बीच आना चाहिए। परीक्षणों में, कठिनाई के स्तर को परीक्षण द्वारा मापी गई विशेषता की संपूर्ण संभावित सीमा को कवर करना चाहिए।

दो-चरणीय उत्तर (उदाहरण के लिए, सही/गलत) के साथ परीक्षण आइटम की कठिनाई की गणना निम्नानुसार की जाती है:

एनआर = सही उत्तर देने वाले विषयों की संख्या, एन = विषयों की संख्या, पी = आइटम की कठिनाई (केवल दो-चरणीय उत्तर वाले आइटम के लिए!) यह सबसे सरल मामले के लिए एक समाधान प्रदान करता है। यदि विषयों ने कार्य को हल नहीं किया या संदेह है कि कुछ कार्य "यादृच्छिक रूप से" पूरे किए गए थे, तो किसी को अन्य वैकल्पिक समाधानों पर निर्भर रहना होगा। (वीजीएल. फिसेनी, 1997, 41-42)।

मल्टी-स्टेज (वैकल्पिक) उत्तरों के साथ कार्यों की कठिनाई की गणना: मामला जब पी परिभाषित नहीं है। इस समस्या के संभावित समाधान: निर्धारित मानों का द्विभाजन करें (उदाहरण के लिए, 0 और 1), जिस स्थिति में दो-चरणीय उत्तर वाले कार्य की कठिनाई की गणना की जाती है। माध्य और विचरण की गणना (माध्य p के बराबर है, हालाँकि, विचरण को भी ध्यान में रखा जाना चाहिए)।

बहु-स्तरीय उत्तर वाले कार्यों के लिए सूचकांक:

सरलीकृत सूत्र:

अधिक सटीक गणना के लिए, अलग-अलग लेखक अलग-अलग तरीके पेश करते हैं (वीजीएल. फिसेनी, 2004, 43-45)। दो कार्यों के बीच कठिनाई के अंतर को बहुविषयक तालिका का उपयोग करके जांचा जा सकता है। इन सूत्रों का उपयोग केवल परीक्षण स्तर पर किया जा सकता है, अर्थात, जब किसी परीक्षण की आवश्यकता नहीं होती है और/या जब विषय सभी कार्यों का सामना करने में सक्षम होते हैं।

कार्य की विभेदक क्षमता.

कार्यों की विभेदक क्षमता के संकेतक

भेदभाव गुणांक,

बिंदु-द्विक्रमिक गुणांक

सहसंबंध,

द्विक्रमिक सहसंबंध गुणांक,

फाई सहसंबंध गुणांक.

किसी परीक्षण कार्य की गुणवत्ता का एक महत्वपूर्ण संकेतक विभेद करने की क्षमता है, जो यह निर्धारित करती है कि कोई दिया गया कार्य "सर्वश्रेष्ठ" और "कमजोर" विषयों के बीच कितनी अच्छी तरह अंतर करता है।

विवेकशील क्षमता की अवधारणा मौलिक धारणा पर आधारित है कि जो परीक्षार्थी किसी दिए गए विषय में उच्च स्तर की दक्षता प्रदर्शित करते हैं, उनसे उस विषय के बारे में किसी भी प्रश्न का सही उत्तर देने की संभावना उन लोगों की तुलना में अधिक होती है जिनके पास निम्न स्तर की दक्षता है।

इसके विपरीत, जिन कार्यों में या तो सभी परीक्षार्थियों ने सही उत्तर दिया या सभी ने गलत उत्तर दिया, उनमें अंतर करने की क्षमता नहीं होती, यानी। मजबूत और कमजोर विषयों के बीच अंतर न करें।

जिन वस्तुओं में भेदभावपूर्ण शक्ति का अभाव है, वे व्यक्तियों के बीच मतभेदों के बारे में कोई जानकारी प्रदान नहीं करते हैं। किसी कार्य की भेदभावपूर्णता को मापने के लिए कई सांख्यिकीय प्रक्रियाएं मौजूद हैं। ये संकेतक असाइनमेंट की गुणवत्ता का विश्लेषण करने में बेहद उपयोगी हैं क्योंकि वे लेखकों को उन विशिष्ट असाइनमेंट की ओर इशारा करते हैं जिनमें सुधार की आवश्यकता है।

भेदभाव गुणांक

शास्त्रीय परीक्षण सिद्धांत में, भेदभाव गुणांक - डीजे - का व्यापक रूप से परीक्षण वस्तुओं की गुणवत्ता का आकलन करने के लिए उपयोग किया जाता है। इस गुणांक की गणना विषयों के दो "विपरीत" समूहों की पहचान करके परीक्षण परिणामों के आधार पर की जाती है। ज्यादातर मामलों में, ये पूरे नमूने में से 27% "कमजोर" और 27% "सर्वश्रेष्ठ" छात्र हैं।

गुणांक सूत्र Dj = Рu - Рl द्वारा पाया जाता है, जहां Рu और Рl सबसे अच्छे और सबसे कमजोर समूहों में छात्रों के हिस्से हैं जिन्होंने दिए गए (जे-वें) कार्य का सही उत्तर दिया है।

गुणांक Dj का मान -1 से +1 तक भिन्न हो सकता है।

यदि डीजे का मान -+1 के करीब है, तो इस कार्य में उच्च भेदभाव क्षमता है, अर्थात, नमूने में से छात्रों का "सर्वश्रेष्ठ" समूह "कमजोर" समूह की तुलना में अधिक बार इसका उत्तर देता है।

शास्त्रीय परीक्षण सिद्धांत के अनुसार विभेदक शक्ति गुणांक डीजे की व्याख्या तालिका में प्रस्तुत की गई है

बिंदु द्विक्रमिक सहसंबंध गुणांक.

बिंदु-द्विक्रमिक सहसंबंध गुणांक एक सांख्यिकीय संकेतक है जिसका उपयोग कार्यों की विभेदक क्षमता का विश्लेषण करने के लिए किया जा सकता है।

यह संकेतक दो चर के बीच सांख्यिकीय संबंध की डिग्री का आकलन करता है: एक विशिष्ट कार्य के लिए प्रतिक्रिया प्रोफ़ाइल और परिणामी परीक्षण स्कोर।



जे-वें कार्य के लिए, बिंदु-द्विक्रमिक सहसंबंध गुणांक की गणना सूत्र का उपयोग करके की जाती है:

यहां x 1, Y पर "एक" के मान के साथ X वस्तुओं का औसत मान है;

x 0 - Y पर "शून्य" मान के साथ X ऑब्जेक्ट पर औसत मान;

एसएक्स - एक्स के साथ सभी मूल्यों का मानक विचलन;

n 1 - Y में वस्तुओं की संख्या "एक", n 0 - Y में वस्तुओं की संख्या "शून्य";

एन = एन 1 + एन 0 - नमूना आकार।

परीक्षण सिद्धांत के अनुसार, बिंदु-द्विक्रमिक सहसंबंध गुणांक आरपीबीआई का मान 0.3 के बराबर या उससे अधिक इसकी गुणवत्ता का एक स्वीकार्य संकेतक है।

इस सांख्यिकीय संकेतक का उपयोग करके, कार्य लेखक अपनी विभेदक क्षमता का मूल्यांकन कर सकता है। सामान्यतया, इस सूचक के उच्च मूल्य वाले कार्य प्रशिक्षित और अप्रस्तुत विषयों के बीच बेहतर अंतर करते हैं। व्यवहार में, नकारात्मक बिंदु-द्विक्रमिक सहसंबंध गुणांक वाले कार्यों को या तो कार्य बैंक से हटा दिया जाता है या पूरी तरह से संशोधित किया जाता है।

कार्य की कठिनाई का माप अध्ययन की जा रही संपत्ति के पैरामीटर की भागीदारी की डिग्री के बारे में जानकारी प्रदान करता है जिसे मापने का इरादा है। कभी-कभी यह कहा जाता है कि कठिनाई का माप यह निर्धारित करता है कि कोई वस्तु परीक्षण के लक्ष्य समूह के लिए उपयुक्त है या नहीं। सामान्य तौर पर, हम कह सकते हैं कि यह मानदंड हमें इसका न्याय करने की अनुमति देता है।

कोई कार्य कठिन है या आसान, इसका निर्धारण उनमें से प्रत्येक के गलत उत्तरों के अनुपात की गणना करके किया जाता है। हालाँकि, आज किसी कार्य की कठिनाई को निर्धारित करने की पूरी तरह से शास्त्रीय पद्धति का उपयोग नहीं किया जाता है - अनुमान के आधार पर, उन तत्वों की अनुमानित संख्या और प्रकृति के आधार पर जो कार्य को पूरा करने में शामिल हैं (और मापी जा रही संपत्ति के पैरामीटर में शामिल हैं) . मान लीजिए कि स्मृति क्षमता के परीक्षण में स्वैच्छिक याद रखने से संबंधित एक कार्य है, जिसमें भाषण (संख्याओं की एक सूची को ज़ोर से या "स्वयं से बोलना"), सोचना (साहचर्य संबंध बनाना) आदि शामिल हो सकते हैं। इस मामले में, विषय का ध्यान भटकाए हुए किसी संख्या श्रृंखला को याद करने का कार्य पूरा करने में कठिनाई बढ़ सकती है।

विभेद करने की क्षमता.

किसी कार्य की विभेदक क्षमता यह है कि वह मापी जा रही संपत्ति के संदर्भ में एक मजबूत विषय को एक कमजोर विषय से कितना अलग कर सकती है। यदि सभी विषयों में किसी एक कार्य के लिए समान मूल्य है, तो इस कार्य को परीक्षण में शामिल करना अनुचित है। किसी कार्य की विभेदक क्षमता को उसकी कठिनाई/सहजता समझने की गलती न करना बहुत कठिन है। तथ्य यह है कि उन परीक्षणों में जो प्रदर्शन की गई गतिविधियों, ज्ञान आदि की गुणवत्ता को मापते हैं, उपलब्धि परीक्षण, किसी कार्य के लिए कई समान उत्तरों का अर्थ दो विकल्प होंगे: सही / गलत। तदनुसार, इस श्रृंखला से कोई भी कार्य की कठिनाई (सभी गलत उत्तरों के मामले में) या आसानी (सभी सही उत्तरों के मामले में) के बारे में गलत निष्कर्ष निकाल सकता है।

यह ध्यान दिया जाना चाहिए कि आधुनिक परीक्षणों के संकलनकर्ताओं द्वारा इस मानदंड की अक्सर उपेक्षा की जाती है। इससे विषयों, जिन्हें अनावश्यक प्रश्नों का उत्तर देना पड़ता है, और मनोवैज्ञानिकों, जिन्हें अनावश्यक जानकारी संसाधित करने के लिए मजबूर होना पड़ता है, दोनों के लिए बहुत असुविधा होती है।

विशेष योग्यताओं के व्यक्तिगत परीक्षणों के अलावा, पश्चिम में इनका व्यापक रूप से उपयोग किया जाता है बैटरी का परीक्षण करें, वे। परीक्षणों के समूह जो व्यक्तियों की अपेक्षाकृत स्वतंत्र विशेषताओं को मापते हैं, जो मिलकर किसी विशेष गतिविधि के सफल कार्यान्वयन में योगदान करते हैं। बैटरियों का उपयोग करके, कारक विश्लेषणात्मक अध्ययनों के माध्यम से पहचाने गए अपेक्षाकृत स्वतंत्र महत्वपूर्ण विशेषताओं के लिए परीक्षण संकेतकों की प्रोफाइल प्राप्त करना संभव है।

ऐसी व्यापक क्षमता वाली बैटरियां बनाने का पहला प्रयास बुनियादी मानसिक क्षमताओं का शिकागो परीक्षण था। (प्राथमिक मानसिक योग्यता परीक्षण - पीएमए)। वे एल. थर्स्टन की 12 स्वतंत्र प्राथमिक मानसिक क्षमताओं के अस्तित्व की अवधारणा पर आधारित थे जो शैक्षिक गतिविधियों की सफलता का आधार हैं। पहली बार 1941 में प्रकाशित, वे हाई स्कूल और कॉलेज के छात्रों के लिए थे। बाद में इस बैटरी में सुधार किया गया (1962) ताकि कम उम्र के परीक्षणों को शामिल किया जा सके। हालाँकि, कई महत्वपूर्ण कमियों (कम विश्वसनीयता और वैधता, मानदंडों की अपर्याप्तता, कई संकेतकों की अनुचितता, गति पर परिणामों की अत्यधिक निर्भरता) की उपस्थिति के कारण, अब इसे उसी प्रकार के अधिक आधुनिक तरीकों से बदल दिया गया है। .

उनमें से एक विभिन्न क्षमताओं के परीक्षणों की एक व्यापक बैटरी है (डिफरेंशियल एप्टीट्यूड टेस्ट - डीएटी)। 1947 में प्रकाशित इस बैटरी को तब कई बार संशोधित किया गया था; इसका उद्देश्य कक्षा 8-12 के छात्रों को उनकी शिक्षा और करियर मार्गदर्शन की प्रक्रिया में परामर्श देना है। इसे दो समकक्ष रूपों, एस और टी में प्रशासित किया जाता है, जिनमें से प्रत्येक में आठ उप-परीक्षण शामिल हैं।

कार्यों के उदाहरण

1. मौखिक सोच.

वाक्य में रिक्त स्थानों को भरने के लिए वांछित शब्द युग्म का चयन करें। युग्म का पहला शब्द वाक्य के आरंभ में रिक्त स्थान को भरता है, दूसरा अंत में:

शाम को और नाश्ता...

ए. रात्रिभोज - कोने.

बी नम्र - सुबह.

सी. दरवाजा - कोना.

डी. प्रवाह आनंद है.

ई. रात का खाना - सुबह. सही उत्तर ई है।

2. संख्यात्मक क्षमताएँ.

प्रत्येक समस्या के लिए, सही उत्तर खोजें: 13 और 12 जोड़ें

ई. कोई भी संख्या नहीं दी गई है। सही जवाब बी है।

3. सामान्य सोच।

प्रत्येक कार्य में आंकड़ों की एक श्रृंखला होती है जो एक निश्चित नियम के अनुसार बदलती रहती है। प्रत्येक कार्य में अंक बदलने के नियम को समझने के बाद, आपको प्रस्तावित पांच विकल्पों में से एक उत्तर चुनकर आंकड़ों की श्रृंखला की निरंतरता का पता लगाना चाहिए।

4. धारणा की गति और सटीकता।

प्रत्येक परीक्षण कार्य में, पाँच प्रस्तावित प्रतीक संयोजनों में से एक को रेखांकित किया गया है। विषय को उत्तर प्रपत्र पर ठीक उसी संयोजन को अंकित करना था।

5. तकनीकी सोच.

प्रत्येक कार्य में एक तकनीकी स्थिति दर्शाई गई है और एक छोटा प्रश्न है जिसका उत्तर देने के लिए तकनीकी समझ की आवश्यकता है।

6. स्थानिक संबंधों।

एक ज्यामितीय आकृति के चित्रित विकास के कार्यों में, आपको इसे चार उत्तर विकल्पों में से ढूंढना होगा।

7. साक्षरता।

बताएं कि कौन सा शब्द सही लिखा गया है और कौन सा गलत लिखा गया है।

  • (सही उत्तर x चिह्नों से चिह्नित हैं)।
  • 8. भाषा का प्रयोग।

इंगित करें कि वाक्य के किस अक्षरांकित भाग में त्रुटि है और उस भाग को अपनी उत्तर पुस्तिका पर x से चिह्नित करें। यदि वाक्य में कोई त्रुटि न हो तो H का चिन्ह लगायें।

उ. क्या हम अगले सप्ताह/काम पर/जाते हैं?

डीएटी बैटरी को ग्रेड 8-12 में अमेरिकी छात्रों की आबादी के एक नमूना प्रतिनिधि पर वैधता और विश्वसनीयता के लिए मानकीकृत और परीक्षण किया गया है। नमूने में 33 राज्यों और कोलंबिया जिले के 76 स्कूलों के 64,000 से अधिक छात्र शामिल थे। डीएटी की वैधता पर डेटा कई हजार गुणांकों तक पहुंचता है, जिनमें से अधिकांश स्कूल में उपलब्धियों की पूर्वानुमानित वैधता और बाद के अध्ययनों (विश्वविद्यालयों, विशेष पाठ्यक्रमों और स्कूलों आदि में) की सफलता से संबंधित हैं। यह माना जाता है कि यह बैटरी सामान्य शैक्षिक गतिविधियों में व्यक्तियों की क्षमताओं का आकलन करने का अच्छा काम करती है। हालाँकि, शैक्षिक मानदंड हमेशा किसी को पेशेवर उपलब्धियों की भविष्यवाणी करने की अनुमति नहीं देते हैं, और पेशेवर मानदंडों पर अपर्याप्त डेटा है।

इसलिए, पेशेवर परामर्श के उद्देश्य से अन्य तकनीकों का उपयोग किया जाता है। सबसे अधिक मान्यता प्राप्त में से एक है जनरल एबिलिटी टेस्ट बैटरी। (जनरल एप्टीट्यूड टेस्ट बैटरी - जीएटीबी)। इसे अमेरिकी रोजगार सेवा द्वारा विशेष रूप से सरकारी एजेंसियों में सलाहकारों की गतिविधियों में उपयोग के लिए विकसित किया गया था। यह बैटरी नौ कारकों को मापती है और इसमें 12 परीक्षण शामिल हैं। GATB निम्नलिखित कारक प्रस्तुत करता है:

  • 1) सामान्य सीखने की क्षमता (तीन परीक्षणों के कुल स्कोर द्वारा मूल्यांकन - शब्दावली, गणितीय सोच और त्रि-आयामी अंतरिक्ष की धारणा);
  • 2) मौखिक क्षमताएँ (एक शब्दावली परीक्षण द्वारा मापा जाता है जिसमें परीक्षार्थी को यह बताना होगा कि प्रत्येक सेट में दो शब्दों में से किसका अर्थ समान या विपरीत है);
  • 3) संख्यात्मक क्षमताएँ (गणना और गणितीय तर्क के परीक्षण द्वारा मूल्यांकन);
  • 4) स्थानिक क्षमताएँ (त्रि-आयामी अंतरिक्ष की धारणा के परीक्षण द्वारा मापा गया, जिसमें द्वि-आयामी अंतरिक्ष में त्रि-आयामी वस्तुओं के प्रतिबिंब को समझने के कार्य और तीन आयामों में गति के परिणाम की कल्पना करने की क्षमता शामिल है);
  • 5) आकार धारणा (दो परीक्षणों द्वारा मापा जाता है जिसमें विषय भागों और ज्यामितीय आकृतियों के चित्रों की तुलना करता है);
  • 6) मानसिक धारणा (परीक्षण आकृति धारणा का आकलन करने के लिए उपयोग किए जाने वाले परीक्षणों के समान हैं, लेकिन नामों की तुलना की जाती है, चित्रों और आकृतियों की नहीं);
  • 7) मोटर समन्वयन (एक साधारण परीक्षण द्वारा मापा जाता है जिसमें विषय वर्गों की एक श्रृंखला में एक पेंसिल के साथ कुछ निशान बनाता है);
  • 8) उंगली मोटर कौशल (दो परीक्षणों द्वारा मापा जाता है जिसमें विषय क्रमशः रिवेट्स और वॉशर को जोड़ता और डिस्कनेक्ट करता है);
  • 9) मैनुअल मोटर कौशल (दो परीक्षणों का उपयोग करके मूल्यांकन किया गया जिसमें विषय चलता है और बोर्ड पर टुकड़ों को पलटता है)।

पूरी बैटरी लगभग 2.5 घंटे तक चलती है।

जनरल एबिलिटी टेस्ट बैटरी को 4,000 लोगों के नमूने पर मानकीकृत किया गया था, जो अमेरिकी ब्लू-कॉलर श्रमिकों की आबादी का प्रतिनिधि था। संकेतकों की प्रणालियाँ पाई गईं जिनमें प्रत्येक पेशे के लिए उसकी महारत में योगदान देने वाली विशेषताएं और उनके न्यूनतम स्वीकार्य स्तर स्थापित किए गए। उदाहरण के लिए, एक एकाउंटेंट के लिए, सामान्य सीखने की क्षमता कारक पर कम से कम 105 और संख्यात्मक क्षमता कारक पर कम से कम 115 अंक प्राप्त करना आवश्यक है। एक मैकेनिक के लिए, सामान्य सीखने की क्षमता के लिए न्यूनतम स्कोर 85 है, स्थानिक और मैनुअल मोटर कौशल के लिए 85 है, और मानसिक धारणा के लिए 75 है।

परामर्श करते समय, किसी व्यक्ति के संकेतकों की प्रोफ़ाइल की तुलना व्यवसायों के मानक संकेतकों से की जाती है, और जिन व्यवसायों के मानक संकेतक विषय द्वारा प्राप्त या उससे अधिक हो जाते हैं, उन्हें परामर्श के दौरान अनुशंसित किया जा सकता है।

विभिन्न प्रकार की विश्वसनीयता के संकेतक 0.80 से 0.90 तक होते हैं। वैधता गुणांक संतोषजनक हैं. CATV के नुकसानों में गति प्रदर्शन की ओर परीक्षणों का उन्मुखीकरण, साथ ही कई क्षमताओं के प्रतिनिधित्व की कमी शामिल है। उदाहरण के लिए, यह बैटरी तकनीकी क्षमता, संसाधनशीलता या कुछ अन्य लक्षणों को नहीं मापती है। इसलिए, यह उन व्यवसायों को कवर नहीं करता है जहां इन विशेषताओं की आवश्यकता होती है।

इसके अलावा, यह पाया गया कि एक ही पेशे के अत्यधिक सफल सदस्यों की परीक्षण प्रोफ़ाइल भिन्न हो सकती है। नतीजतन, जब कुछ व्यवसायों के लिए मानक प्रोफाइल के साथ व्यक्तिगत प्रोफाइल की तुलना की जाती है, तो किसी व्यक्ति की पेशेवर उपयुक्तता की उपस्थिति का पता लगाना हमेशा संभव नहीं होता है। यह इस तथ्य के कारण है कि किसी गतिविधि के सफल प्रदर्शन के लिए गायब कुछ विशेषताओं की दूसरों की कीमत पर व्यापक रूप से भरपाई करना संभव है। जैसा कि ऊपर उल्लेख किया गया है, उपलब्धि का एक ही स्तर विभिन्न तरीकों से प्राप्त किया जा सकता है। मानव व्यक्तित्व की विशेषता उच्च प्लास्टिसिटी, परिवर्तनशीलता, विकास और सुधार करने की क्षमता है। परिवर्तनशीलता कई व्यवसायों की दुनिया और श्रमिकों पर उनके द्वारा की जाने वाली मांगों की प्रकृति पर लागू होती है। आइए हम एक बार फिर किसी व्यक्ति की प्रेरणा, रुचियों और झुकावों की निर्णायक भूमिका को याद करें।

उपरोक्त सभी बताते हैं कि क्यों व्यक्तिगत व्यवसायों के लिए सीखने की क्षमता के मानदंडों के विरुद्ध सत्यापन, व्यावसायिक सफलता के मानदंडों के विरुद्ध सत्यापन की तुलना में वैधता गुणांक काफी अधिक देता है। निदानकर्ता मानते हैं कि GATB स्कोर व्यावसायिक प्रशिक्षण की सफलता और प्रारंभिक नौकरी प्रदर्शन (दो साल के अनुभव तक) का एक अच्छा भविष्यवक्ता हो सकता है।

परामर्श के लिए इस बैटरी के संकेतकों के उपयोग को सुविधाजनक बनाने के लिए, जिन व्यवसायों को 70 के दशक में समान सुविधाओं की आवश्यकता होती है। XX सदी अपेक्षाकृत छोटे प्रकारों में संयोजित किया गया। 60 से अधिक ऐसे प्रकारों की पहचान नहीं की गई। प्रत्येक प्रकार के लिए, तीन सबसे महत्वपूर्ण विशेषताओं के अनुसार मानक संकेतक स्थापित किए गए थे। अंतिम स्कोरकार्ड कहा गया व्यावसायिक योग्यता पैटर्न - OAR), हजारों विशिष्ट व्यवसायों और विशिष्टताओं को कवर करता है।

अमेरिकी सशस्त्र बल एप्टीट्यूड बैटरी का उपयोग हाई स्कूल के छात्रों के साथ-साथ सैन्य व्यवसायों में रुचि व्यक्त करने वाले किसी भी व्यक्ति के साथ काम करने के लिए किया जाता है। सशस्त्र सेवा व्यावसायिक योग्यता बैटरी - एएसवीएबी), जिसमें सामान्य प्राकृतिक विज्ञान ज्ञान, निर्देशों के पैराग्राफ की समझ, गणित का ज्ञान, तकनीकी समझ, इलेक्ट्रॉनिक्स और ऑटोमोटिव उपकरण के बारे में जागरूकता आदि जैसे मापदंडों का निदान करने वाले 10 परीक्षण शामिल हैं।

सशस्त्र बल योग्यता परीक्षण का उपयोग अमेरिकी सेना में रंगरूटों का चयन करने और उन्हें नियुक्त करने के लिए किया जाता है। (सशस्त्र बल योग्यता परीक्षण - एएफक्यूटी)। इसके अलावा, सेना की प्रत्येक सेवा (वायु सेना, जमीनी सेना, आदि), योग्यता परीक्षण के उप-परीक्षणों का उपयोग करते हुए, अपने मानदंडों के अनुसार कर्मियों के चयन और वितरण के लिए अपने स्वयं के तरीके और संयुक्त संकेतक विकसित करती है।

अशिक्षित और सांस्कृतिक रूप से अविकसित लोगों के परीक्षण और रोजगार की सुविधा के लिए, अमेरिकी रोजगार सेवा विशेष बैटरी विकसित कर रही है जो परीक्षण को नेविगेट करने और इसके कार्यों और प्रकृति को सही ढंग से समझने में मदद करने के लिए विशेष प्रक्रियाओं का उपयोग करती है। इन बैटरियों में चिंता दूर करने के लिए सामग्री और बातचीत की योजनाएँ शामिल हैं। परीक्षार्थियों की इन श्रेणियों के लिए, विशेष ब्रोशर प्रकाशित किए जाते हैं जो बताते हैं कि परीक्षा में अच्छा प्रदर्शन करने का क्या मतलब है, जिसमें जीएटीबी में उपयोग किए गए प्रकार के उदाहरण आइटम और उत्तर पुस्तिकाएं शामिल हैं। विशेष आबादी के लिए डिज़ाइन की गई ऐसी बैटरियों में बुनियादी व्यावसायिक साक्षरता के परीक्षण शामिल हैं। (बुनियादी व्यावसायिक साक्षरता परीक्षण - बोल्ट), जिसमें शब्दावली, पढ़ने की समझ, अंकगणितीय गणना और गणितीय तर्क के परीक्षण शामिल हैं। इस बैटरी के प्रदर्शन का मूल्यांकन स्कूली शिक्षा के बजाय विभिन्न व्यावसायिक समूहों की आवश्यकताओं के अनुसार किया जाता है।

पश्चिम (मुख्य रूप से संयुक्त राज्य अमेरिका में) में विकसित विशेष क्षमताओं के परीक्षणों और बैटरियों की चर्चा को समाप्त करते हुए, हम ध्यान दें कि निदान का यह क्षेत्र सबसे विकसित में से एक है। शैक्षिक प्रणाली और व्यावसायिक उद्देश्यों दोनों के लिए बड़ी संख्या में विशेष योग्यताओं के परीक्षण और बैटरियां बनाई और उपयोग की गई हैं। इन परीक्षणों और बैटरियों की क्षमताओं के आम तौर पर सकारात्मक मूल्यांकन के बावजूद, मनोचिकित्सक उनकी विश्वसनीयता और वैधता के बारे में जानकारी एकत्र करना जारी रखते हैं, नमूनों के मापदंडों को स्पष्ट करते हैं जिसके लिए वे प्रतिनिधि हैं, उनके प्रदर्शन को प्रभावित करने वाले विभिन्न कारकों के प्रभाव को स्पष्ट करते हैं, परीक्षण प्रक्रियाओं में सुधार करते हैं। और उनके संकेतक, और इन संकेतकों का उपयोग करने के लिए विशेष तकनीक विकसित करना।

इसी समय, मनोचिकित्सक तेजी से इस निष्कर्ष पर पहुंच रहे हैं कि शैक्षिक और व्यावसायिक सफलता के बारे में पूर्वानुमान केवल व्यक्ति के बारे में समग्र जानकारी के आधार पर संभव है, जब क्षमता परीक्षणों के परिणामों को अलग से नहीं, बल्कि केवल एक पहलू के रूप में माना जाता है। व्यक्तिगत तकनीकों, उपलब्धि परीक्षणों, जीवनी संबंधी प्रश्नावली आदि के संकेतकों के साथ मूल्यांकन का। इस प्रकार, ई. घिसेली ने पाया कि टैक्सी ड्राइवरों की जांच करते समय, उनकी कार्य कुशलता और विशेष क्षमताओं के परीक्षणों के संकेतकों के बीच संबंध केवल 0.22 था। लेकिन यदि आप रुचियों और पेशेवर प्रेरणा को ध्यान में रखते हैं, तो इस गुणांक को काफी बढ़ाया जा सकता है - उच्च स्तर की प्रेरणा वाले ड्राइवरों के लिए 0.664 तक। आर. ग्रूम्स और एन. एंडलर के एक अन्य अध्ययन में पाया गया कि उच्च चिंता वाले छात्रों का प्रदर्शन योग्यता परीक्षणों में प्रदर्शन के साथ अधिक सहसंबद्ध था। (जी = 0.63) शांत छात्रों की तुलना में (आर = 0.19)।

यह बताना भी महत्वपूर्ण है कि वर्तमान में पश्चिमी निदान विशेषज्ञ व्यक्तियों के प्रशिक्षण, उनके द्वारा अर्जित कौशल और ज्ञान पर क्षमता परीक्षणों की निर्भरता को पहचानते हैं। इस प्रकार, शोधकर्ताओं ने निष्कर्ष निकाला कि मेयर आर्ट जजमेंट टेस्ट के परिणाम पेशेवर प्रशिक्षण (कला शिक्षा के स्तर और मेयर टेस्ट स्कोर के बीच 0.4 से 0.69 तक सहसंबंध) के महत्वपूर्ण प्रभाव के अधीन हैं। सीशोर म्यूज़िकल टैलेंट मेज़र टेस्ट के नतीजे अभ्यास और प्रशिक्षण के प्रभाव के प्रति संवेदनशील पाए गए। इसलिए, तेजी से, मनोचिकित्सक परीक्षणों के इस समूह के नाम में "क्षमता" शब्द का उपयोग नहीं करते हैं, इसे "दक्षता", "सफलता" आदि की अवधारणाओं से प्रतिस्थापित करते हैं। ऐसा माना जाता है कि इस अवधारणा को त्यागना बेहतर है परीक्षणों के संबंध में "क्षमता" के बारे में और ज्ञान और कौशल में अंतर के बारे में बात करते हैं जो कुछ शर्तों के तहत, कुछ उपलब्धियों को प्राप्त करने की अनुमति देते हैं।

  • अनास्तासी ए.मनोवैज्ञानिक परीक्षण: 2 खंडों में। एम.. 1982. 2 वही।
  • अनास्तासी ए.
  • अनास्तासी ए.मनोवैज्ञानिक परीक्षण: 2 खंडों में। एम., 1982।
  • अर्न्त्ज़ेन एफ.बेगाबंग्ससाइकोलॉजी में एक इनफुहरंग। गोटिंगेन. 1976.

शैक्षणिक विज्ञान यूडीसी 37.011, 519.23

प्रशिक्षण की गुणवत्ता का आकलन करने के लिए परीक्षण सामग्री की विभेदीकरण क्षमता ऐलेना व्लादिमीरोव्ना अल्पत्सकाया, शैक्षणिक विज्ञान के उम्मीदवार, एसोसिएट प्रोफेसर, निकोले विक्टरोविच बुबनोव, वरिष्ठ व्याख्याता, अलेक्जेंडर वासिलीविच मिनचेनकोव, आवेदक, स्मोलेंस्क स्टेट एकेडमी ऑफ फिजिकल कल्चर, स्पोर्ट्स एंड टूरिज्म

(एसजीएएफकेएसटी) सार लेख प्रशिक्षण की गुणवत्ता का आकलन करने के लिए परीक्षण सामग्री तैयार करने की समस्या के लिए समर्पित है। किसी भी नियंत्रण सामग्री में कई गुण (सूचना सामग्री, विश्वसनीयता, विभेदीकरण क्षमता) होने चाहिए। इस प्रयोजन के लिए, शिक्षक को गणितीय सांख्यिकी के तरीकों का उपयोग करते हुए, वैज्ञानिक दृष्टिकोण से अपनी परीक्षण सामग्री तैयार करनी चाहिए। इस कार्य में, लेखक, विशिष्ट उदाहरणों का उपयोग करते हुए, विभिन्न प्रकार के प्रश्नों पर ध्यान केंद्रित करते हुए, एक परीक्षण की विभेदक क्षमता निर्धारित करने के तरीकों की जांच करते हैं। प्रस्तुत सामग्री का उद्देश्य शिक्षकों को पढ़ाए गए विषयों में छात्रों की सीखने की गुणवत्ता का आकलन करने में मदद करना है।

मुख्य शब्द: शिक्षण की गुणवत्ता, परीक्षण, विभेद करने की क्षमता।

डीओआई: 10.5930/issn.1994−4683.2015.11.129.p9−14

का आकलन करने के लिए परीक्षण सामग्रियों की विभेदीकरण क्षमता

शिक्षा गुणवत्ता

ऐलेना व्लादिमिरोव्ना अल्पत्सकाया, शैक्षणिक विज्ञान की उम्मीदवार, वरिष्ठ व्याख्याता, निकोले विक्टरोविच बुब्नोव, वरिष्ठ शिक्षक, अलेक्जेंडर वासिलीविच मिनचेनकोव, प्रतियोगी, स्मोलेंस्क स्टेट एकेडमी ऑफ फिजिकल एजुकेशन, स्पोर्ट्स एंड टूरिज्म

छात्रों का मूल्यांकन करने के लिए तैयारी करने वाले परीक्षणों की समस्या" - लेख में ज्ञान पर विचार किया गया है। परीक्षण सामग्री जानकारीपूर्ण, विश्वसनीय होनी चाहिए, जो विभेदक क्षमता को दर्शाती हो। परीक्षणों की विभेदक क्षमता एक मजबूत परीक्षण को एक कमजोर से अलग करना संभव बनाती है। एक। लेखक इस अध्ययन में विभिन्न प्रकार के प्रश्नों पर ध्यान केंद्रित करते हुए परीक्षण की विभेदक क्षमता निर्धारित करने के तरीकों के उदाहरणों पर विचार करते हैं। लेख को एक शिक्षक को छात्रों की गुणवत्ता का आकलन करने में मदद करनी चाहिए" - अध्ययन किए गए विषयों में शिक्षा।

कीवर्ड: शिक्षा की गुणवत्ता, परीक्षण, अंतर करने की क्षमता।

रूस में दूरस्थ शिक्षा के विकास में तेजी से वृद्धि हमें एक बार फिर छात्रों के ज्ञान के परीक्षण के मुद्दे पर विचार करने के लिए मजबूर करती है। लेकिन दूरस्थ शिक्षा करते समय, छात्र को न केवल ज्ञान, बल्कि कौशल और क्षमताएं भी हासिल करनी चाहिए, और शिक्षक, बदले में, उनकी महारत के स्तर का मूल्यांकन और निर्धारण करने के लिए बाध्य है। परीक्षण कार्यक्रमों का उपयोग करके परिचालन नियंत्रण हाल ही में तेजी से व्यापक हो गया है। शिक्षण परिवेश में नियंत्रण की इस पद्धति के प्रति एक अस्पष्ट रवैया है, लेकिन इसे एक वस्तुनिष्ठ वास्तविकता के रूप में स्वीकार करना होगा। हमारी व्यावसायिक गतिविधियों की प्रकृति के कारण, हमें "शारीरिक शिक्षा" की तैयारी की दिशा में व्यावसायिक चक्र सहित विभिन्न शैक्षणिक विषयों में छात्रों के परीक्षण में भाग लेना पड़ा। इसके आधार पर, यह निष्कर्ष निकाला गया कि ज्ञान का प्रोग्रामयोग्य नियंत्रण हमेशा शिक्षक को छात्रों की संज्ञानात्मक गतिविधि के प्रबंधन और उसे ठीक करने के लिए वस्तुनिष्ठ जानकारी प्रदान नहीं करता है। इसे नियंत्रण प्रक्रिया की गुणवत्ता को संकलित करने और जांचने के अकुशल दृष्टिकोण द्वारा समझाया जा सकता है।

व्याकरण योग्य सामग्री. शैक्षिक प्रक्रिया में परीक्षण कार्यक्रम शुरू करने से पहले, शिक्षकों को कठिनाई (विभेद करने की क्षमता), विश्वसनीयता और सूचना सामग्री की जांच करने की आवश्यकता होती है। और केवल परीक्षण और अनुभवजन्य सत्यापन के बाद ही परीक्षण कार्यक्रम प्रभावी ढंग से विभिन्न उपदेशात्मक कार्य कर सकते हैं: छात्रों की गतिविधियों को पढ़ाना, निगरानी करना, प्रबंधन करना, सक्रिय करना और तीव्र करना। साहित्यिक स्रोतों के विश्लेषण ने हमें यह निष्कर्ष निकालने की अनुमति दी कि गणितीय और सांख्यिकीय विश्लेषण के सही अनुप्रयोग के बिना, विकसित परीक्षण कार्यक्रमों का शैक्षिक प्रक्रिया के लिए व्यावहारिक मूल्य नहीं हो सकता है, खासकर दूरस्थ शिक्षा स्थितियों में। परीक्षण कार्यक्रमों की गुणवत्ता की जांच और मूल्यांकन करने के लिए इनमें से कुछ तरीके, प्राथमिक तरीकों में से एक प्रश्नों के नैदानिक ​​​​मूल्य (कठिनाई या आसानी) की पहचान करना है, नीचे प्रस्तुत किए जाएंगे।

नैदानिक ​​मूल्य संभावित उत्तरों की कुल संख्या के सही उत्तरों के प्रतिशत से निर्धारित होता है। कोई प्रश्न तब काफी कठिन माना जाता है जब 75% से अधिक छात्र उसका उत्तर नहीं देते। किसी प्रश्न की कठिनाई 100% या 0 के जितनी करीब होगी, उसकी सहायता से उतनी ही कम विभेदित जानकारी प्राप्त की जा सकती है। जैसा कि विभिन्न विषयों में शिक्षकों द्वारा अकादमी में उपयोग किए जाने वाले नियंत्रण परीक्षणों के विश्लेषण से पता चला है, परीक्षण कार्यक्रमों में ऐसे प्रश्न होते हैं जिनका उत्तर 80-85% से अधिक और 10-15% से कम छात्रों द्वारा नहीं दिया जाता है।

प्रश्नों की शुद्धता उनकी विभेदीकरण क्षमता से निर्धारित होती है, जिसे विभेदीकरण सूचकांक "I" द्वारा व्यक्त किया जाता है। यह आपको उनके आगे गुणात्मक सुधार के उद्देश्य से प्रश्न और प्रश्नों की प्रणाली के बारे में अधिकतम जानकारी प्राप्त करने की अनुमति देता है। अध्ययन समूह में छात्रों को दो उपसमूहों में विभाजित किया जाना चाहिए: मजबूत और कमजोर। विभेदन सूचकांक सूत्र द्वारा निर्धारित किया जाता है: I = (O1-O2)^, जहां O: मजबूत उपसमूह में सही उत्तरों की संख्या है; O2 कमजोर उपसमूह में उत्तरों की संख्या है; N परीक्षण किए गए छात्रों की संख्या है .

विभेदन सूचकांक -1 से +1 तक भिन्न हो सकता है। विकसित परीक्षण कार्यक्रम में, प्रत्येक प्रश्न के लिए स्वीकार्य मान L=+0.4 है। कम मान इंगित करता है कि इस प्रश्न की शब्दावली और गुणवत्ता छात्रों को उनकी सैद्धांतिक तैयारी के स्तर के अनुसार अंतर करने की अनुमति नहीं देती है। यदि विभेदीकरण सूचकांक नकारात्मक है, तो प्रश्न पर दोबारा काम किया जाना चाहिए या दूसरे के साथ प्रतिस्थापित किया जाना चाहिए। कठिनाई की दृष्टि से असंतोषजनक प्रश्नों का विश्लेषण करने और उन्हें समाप्त करने के बाद, आप लगभग समान रूप से कठिन प्रश्नों वाले परीक्षण कार्यक्रम प्राप्त कर सकते हैं।

अधिकतम विभेदन के लिए, प्रश्नों की कुल संख्या 0.50 के कठिनाई स्तर पर होनी चाहिए। प्रश्नों की विभेदक क्षमता दर्शाती है कि कोई विशेष कार्य किस हद तक परीक्षण की जा रही शैक्षिक सामग्री के संदर्भ में छात्रों की सकारात्मक उपलब्धियों को अलग करना संभव बनाता है।

प्रायोगिक परीक्षण के दौरान, प्रश्नों का विश्लेषण करने और विशेष तालिकाओं का उपयोग करके विभेदन सूचकांक की गणना करने की सिफारिश की जाती है। ऐसी आभासी तालिका तालिका 1 में दिखाई गई है।

तालिका नंबर एक

परीक्षण कार्यक्रम में शामिल प्रश्नों का विश्लेषण_

प्रश्नों की संख्या मजबूत समूह G1 कमजोर समूह G2 P1 Pg विभेदन सूचकांक I

सही उत्तरों की संख्या, पी1 सही उत्तरों की संख्या, पी2

तालिका दर्शाती है कि परीक्षण कार्यक्रम में कौन से प्रश्न छोड़े जाने चाहिए, और प्रतिस्थापित या पुनः कार्य भी किया जाना चाहिए। इसके अलावा परीक्षण कार्यक्रमों में व्यक्तिगत प्रश्नों में से चुनने के लिए दिए गए उत्तरों का विश्लेषण करना आवश्यक है। उनसे चर्चा कर रहे हैं

प्रश्नों की जांच करके, जिनके अधिकांश मामलों में स्पष्ट नहीं, लेकिन अलग-अलग उत्तर दिए गए थे, समूह उनके गलत होने का कारण पता लगा सकता है। यदि प्रश्न और उत्तर खराब तरीके से तैयार किए गए हैं, तो उन्हें संशोधित किया जाना चाहिए या यहां तक ​​कि परीक्षण कार्यक्रम से बाहर कर दिया जाना चाहिए।

जैसा कि ऊपर उल्लेख किया गया है, परीक्षण कार्यक्रमों पर किए गए एक सर्वेक्षण के परिणामों के अनुसार, छात्रों को दो समूहों में विभाजित किया गया है: मजबूत (जी! - सही उत्तरों की अधिक संख्या के साथ) और कमजोर (जी2 - कम संख्या में उत्तरों के साथ)। खराब ढंग से बनाए गए प्रश्नों का पता लगाने के लिए, आप एक विशेष तालिका (तालिका 2) का उपयोग करके उत्तरों का विश्लेषण कर सकते हैं। यह विकल्प उदाहरण के तौर पर दिया गया है.

तालिका 2

_परीक्षण कार्यक्रम_ के व्यक्तिगत प्रश्नों के लिए चुनने के लिए प्रस्तावित उत्तरों का विश्लेषण

क्रमांक समूह प्रश्न 1 2 3 4 5 के चयनित उत्तर

एन जी1 0 0 15 0 0

नोट: सही उत्तरों पर डेटा बोल्ड में हाइलाइट किया गया है, एन प्रश्नों की संख्या है।

पहले प्रश्न के उत्तर विकल्पों से पता चलता है कि चौथे उत्तर का चुनाव इस तथ्य से जुड़ा है कि इसमें ऐसी जानकारी है जिसके कारण मजबूत समूह के छह छात्र सही उत्तर के बजाय इसे पसंद करते हैं। इसका कारण साक्षात्कार के दौरान शिक्षक द्वारा उनसे उनकी पसंद के उत्तर को उचित ठहराने के लिए पूछकर निर्धारित किया जा सकता है।

दूसरे प्रश्न में, उत्तर चार गलत विकल्पों में समान रूप से वितरित हैं। यह परिणाम या तो प्रश्न के असफल सूत्रीकरण या सही उत्तर का सुझाव देता है।

तीसरा प्रश्न विषयों के लिए बहुत कठिन है: मजबूत समूह के 11 छात्रों और कमजोर समूह के सभी 15 छात्रों ने गलत उत्तर दिया। अन्य विकल्पों के संबंध में चौथे उत्तर का थोड़ा बड़ा विकल्प इसकी संभाव्यता को इंगित करता है, खासकर कमजोर समूह के छात्रों के लिए। कमजोर समूह में सही उत्तरों का पूर्ण अभाव यह दर्शाता है कि यह उत्तर (संख्या 2) उस छात्र को गलत लगता है जो अध्ययन किए जा रहे पाठ्यक्रम को अच्छी तरह से नहीं जानता है। ये गुण प्रश्न के उच्च उपदेशात्मक मूल्य और चयनात्मक उत्तर विकल्पों की विशेषता बताते हैं। एक परीक्षण समूह में एक साक्षात्कार यह दिखा सकता है कि यह प्रश्न वास्तव में कठिन नहीं है, यह सिर्फ विषय के एक भाग से संबंधित है जिसमें छात्रों को खराब महारत हासिल है।

कमजोर समूह के छह छात्रों ने प्रश्न एम का गलत उत्तर दिया। इस मामले में, चयनित गलत उत्तरों की संख्या प्रश्न की शुद्धता के बारे में बहुत कम बताती है। इसलिए, शिक्षक को छात्रों के साथ इस मुद्दे पर चर्चा करने की आवश्यकता है, जो शिक्षक को निम्नलिखित की पहचान करने में सक्षम बनाएगा: क्या प्रश्न वास्तव में बहुत आसान है और उपदेशात्मक मूल्य का प्रतिनिधित्व नहीं करता है, या शब्दांकन ही छात्रों को सही उत्तर की ओर निर्देशित करता है, या क्या यह प्रश्न आवश्यक है, लेकिन विषयों द्वारा अच्छी तरह से अध्ययन किए गए विषय से संबंधित है? सामग्री। पहले मामले में, प्रश्न को परीक्षण कार्यक्रम से बाहर रखा जाना चाहिए, दूसरे में - फिर से काम किया जाना चाहिए, और तीसरे में - अपरिवर्तित छोड़ दिया जाना चाहिए।

प्रत्येक विकसित परीक्षण कार्यक्रम के लिए प्रश्नों और उत्तरों का समान विश्लेषण किया जाना चाहिए। इससे शैक्षिक प्रक्रिया में सीधे शामिल होने से पहले प्रोग्राम की गई सामग्री में समय पर समायोजन किया जा सकेगा।

प्रश्नों का नैदानिक ​​मूल्य अन्य तरीकों से निर्धारित किया जा सकता है। आइए उनमें से कुछ को सूचीबद्ध करें।

परीक्षण कार्यक्रम के प्रायोगिक परीक्षण के परिणामों के आधार पर, छात्रों के गलत उत्तरों को विशेष तालिकाओं (तालिका 3) में दर्ज किया जाता है।

टेबल तीन

प्रश्न "कमजोर" समूह में गलत उत्तर, यूके "मजबूत" समूह में गलत उत्तर, "मजबूत" और "कमजोर" समूहों में गलत उत्तरों का अंतर (यूके-यूटी) "मजबूत" और में गलत उत्तरों का योग "कमज़ोर" समूह (यूके +यूटी)

परीक्षण कार्यक्रम में प्रत्येक प्रश्न का नैदानिक ​​मान (V) निर्धारित किया जाता है

सूत्र द्वारा निर्धारित किया जाता है: बु =

के एक्स (उम+उत)

जहां K प्रश्नों की कुल संख्या है (निम्नलिखित)।

क्रमशः, और संभावित उत्तर) - एन - विषयों की संख्या ("मजबूत" ("कमजोर") एन एक्स 27 एजी _

समूह)। n =- जहां N प्रश्नों का उत्तर देने वाले छात्रों की कुल संख्या है

स्टियरिंग प्रोग्राम. उम- "कमजोर" समूह में गलत उत्तर, उम- "मजबूत" समूह में गलत उत्तर।

एक उदाहरण के रूप में, हम एक परीक्षण कार्यक्रम के नैदानिक ​​​​मूल्य का आकलन कर रहे हैं जिसमें 60 छात्रों ने भाग लिया (एसएच, और गलत उत्तर वितरित किए गए जैसा कि तालिका 4 में दिखाया गया है। "कमजोर" और "मजबूत" छात्रों की संख्या

समूह का निर्धारण सूत्र द्वारा किया जाएगा: n =

100 100 चोरी कार्यक्रम एन (https://site, 15)।

पहले प्रश्न का नैदानिक ​​मूल्य:

बी = के एक्स (उम + उम) = 10 (3 +1)

16. पाठ में प्रश्नों की संख्या

2p (K -1) 2×16 (10 -1)

इसी प्रकार, दूसरे प्रश्न BU2 = 31%, तीसरे प्रश्न BU3 = 48%, और दसवें प्रश्न BU10 = 59% का नैदानिक ​​मूल्य।

यदि बीयू मान 16% से 84% की सीमा में हैं, तो परीक्षण कार्यक्रम में प्रश्न संतोषजनक मूल्य के हैं। यदि यह 16% से कम है, तो प्रश्न परीक्षार्थियों के लिए बहुत आसान हैं, और यदि यह 84% से अधिक है, तो वे बहुत कठिन हैं।

नियंत्रण कार्यक्रम प्रश्नों का नैदानिक ​​​​मूल्य तालिका 4 के चौथे और पांचवें कॉलम में प्रस्तुत डिजिटल डेटा द्वारा निर्धारित किया जा सकता है। तालिका के चौथे कॉलम में दी गई संख्या (यूयू-यूटी) जितनी बड़ी होगी, नैदानिक ​​​​मूल्य उतना ही अधिक होगा, पांचवें कॉलम में दी गई संख्या (Uy+Ut) जितनी अधिक होगी, प्रश्न उतने ही कठिन होंगे।

कभी-कभी चौथे कॉलम की संख्याओं का मान ऋणात्मक हो सकता है। इसका मतलब यह है कि "मजबूत" छात्र ऐसे प्रश्नों का गलत उत्तर देते हैं, जबकि "कमजोर" छात्र इनका सही उत्तर देते हैं। इससे पता चलता है कि ऐसे प्रश्न स्पष्ट और स्पष्ट रूप से तैयार नहीं किए जाते हैं और इनमें महत्वपूर्ण संशोधन या प्रतिस्थापन की आवश्यकता होती है।

कुछ परीक्षण कार्यक्रमों में, कार्य (प्रश्न) अलग-अलग होते हैं (पूर्ण और पूर्ण नहीं), अर्थात, उनमें से प्रत्येक में केवल दो अवस्थाएँ हो सकती हैं (1 या 0, हाँ या नहीं, "+" या "-")।

इसलिए, उनके रिश्ते का अध्ययन करने के लिए, आप टेट्राकोरिक संयुग्मता (सहसंबंध) गुणांक का उपयोग कर सकते हैं: t _ (A x D ~B x C)~ 0.5 x n

4 yj (ए + बी) एक्स (सी + डी) एक्स (ए + सी) एक्स (बी + डी) "-

जहां T4 टेट्राकोरिक सहसंबंध गुणांक है। ए, बी, सी और डी - समूह आकार, या भिन्न आवृत्तियाँ, संबंधित चार-क्षेत्र सहसंबंध तालिका की कोशिकाओं में वितरित, एन - नमूना आकार।

आरबीएस _ —एस- यू—(—1), जहां एम1 और एम2 वैकल्पिक समूहों के अंकगणितीय साधन हैं,

nj और n2 इन समूहों के आयतन हैं, N=n1+n2 अवलोकनों की कुल संख्या या नमूना आकार हैं, एसएम पूरे नमूने के लिए मानक विचलन है।

आरबीएस की गणना करने के लिए, दो स्थिर श्रृंखलाओं की तुलना की जाती है: एक मात्रात्मक है, जो प्रस्तावित परीक्षण कार्यक्रम की प्रतिक्रिया की समग्र सफलता को व्यक्त करती है, अक्सर इसका मतलब छात्रों द्वारा सही ढंग से पूरा किए गए कार्यों की संख्या है, दूसरी श्रृंखला गुणात्मक है। इसके दो वैकल्पिक समूह हैं (1 या 0, "+" या "-")। पहले का मतलब है कि कार्य पूरा हो गया है, और दूसरे का मतलब है कि कार्य पूरा नहीं हुआ है। द्विक्रमिक आकस्मिकता गुणांक -1 से +1 तक भिन्न होता है। जब m1=m2, Rbs=0. छात्र के टी परीक्षण का उपयोग करके आरबीएस के महत्व का आकलन किया जाता है।

निष्कर्ष में, यह ध्यान दिया जाना चाहिए कि परीक्षण कार्यक्रमों का प्रायोगिक परीक्षण पर्याप्त छात्र आबादी पर किए जाने की सिफारिश की जाती है। यदि, उदाहरण के लिए, परीक्षण कार्यक्रम प्रथम वर्ष के छात्रों के लिए हैं, तो उनका मानकीकरण एक प्रयोग के डेटा के आधार पर किया जाता है जिसमें केवल प्रथम वर्ष के छात्रों ने भाग लिया था। परीक्षण और माप सामग्री बनाते समय, शिक्षक को यह याद रखना चाहिए कि विकसित परीक्षणों को पूर्ण नहीं माना जा सकता है यदि उन्हें विश्वसनीयता और सूचना सामग्री के लिए संतोषजनक रेटिंग प्राप्त नहीं होती है। लेख का सीमित स्थान हमें इन दो मुद्दों पर विचार करने की अनुमति नहीं देता है।

1. अवनेसोव, वी.एस. ज्ञान के परीक्षण नियंत्रण की वैज्ञानिक समस्याएं / वी.एस. अवनेसोव। - एम.: पब्लिशिंग हाउस "टेस्टिंग सेंटर", 1994. - 240 पी।

2. अल्पात्सकाया, ई. वी. गणितीय सांख्यिकी विधियों का उपयोग करके परीक्षण कार्यक्रमों की गुणवत्ता का आकलन: पद्धति संबंधी सिफारिशें / ई. वी. अल्पात्सकाया, एन. वी. बुब्नोव। - स्मोलेंस्क: [बी. i.], 2012. -21 पी।

3. एंड्रीवा, ए.वी. शिक्षा की गुणवत्ता का आकलन और प्रबंधन करने के लिए स्वचालित सूचना प्रणाली का उपयोग [इलेक्ट्रॉनिक संसाधन] / ए.वी. एंड्रीवा // विज्ञान और शिक्षा की आधुनिक समस्याएं। - 2013. - नंबर 1. - यूआरएल: http://es.rae.ru/science/195−881 (पहुंच तिथि 02/27/2015)।

4. मेयोरोव, ए.एन. शिक्षा प्रणाली के लिए परीक्षण बनाने का सिद्धांत और अभ्यास / ए.एन. मेयोरोव। - एम.: इंटेलेक्ट सेंटर, 2002. - 296 पी।

1. अवनेसोव, वी.एस. (1994), परीक्षण ज्ञान नियंत्रण की वैज्ञानिक समस्याएं, प्रकाशन गृह परीक्षण केंद्र, मॉस्को।

2. अल्पत्सकाया, ई.वी. और बुब्नोव एन.वी. (2012), गणितीय सांख्यिकी के गुणवत्ता मूल्यांकन परीक्षण कार्यक्रम के तरीके, एसजीएएफकेएसटी, स्मोलेंस्क।

3. एंड्रीवा, ए.वी. (2013), "शिक्षा की गुणवत्ता का आकलन और प्रबंधन करने के लिए स्वचालित सूचना प्रणाली", विज्ञान और शिक्षा की आधुनिक समस्याओं का जर्नल, संख्या। 1, यहां उपलब्ध है: es.rae.ru/science/195−881, मॉस्को।

4. मेजरोव, ए.एन. (2002), द थ्योरी एंड प्रैक्टिस क्रिएटिंग टेस्ट ऑफ एजुकेशन, इंटेलेक्ट-सेंटर, मॉस्को।

संपर्क जानकारी: [ईमेल सुरक्षित]

यह लेख संपादक को 30 अक्टूबर 2015 को प्राप्त हुआ था

फ़ुटबॉल खिलाड़ियों के तकनीकी प्रशिक्षण में फ़ुटड्राइंग विधि अल रुबाई नुहाद हब्बास, स्नातक छात्र, मिखाइल अलेक्जेंड्रोविच प्रवाडोव, शैक्षणिक विज्ञान के डॉक्टर, प्रोफेसर, इवानोवो स्टेट यूनिवर्सिटी की शुया शाखा, शुया सार लेख फ़ुटड्राइंग के कार्यान्वयन पर एक अध्ययन के परिणाम प्रस्तुत करता है फुटबॉल खिलाड़ियों के तकनीकी प्रशिक्षण की प्रक्रिया में तकनीक। यह स्थापित किया गया है कि पैरों से ड्राइंग से जुड़ी विशेष मोटर क्रियाओं का उपयोग फुटबॉल खिलाड़ियों में समन्वय क्षमताओं के विकास में योगदान देता है। गेंद के साथ पैर की गति के प्रक्षेप पथ को चित्रित करने, मॉडलिंग करने के लिए मुख्य प्रकार की रेखाएँ निर्धारित की गई हैं। गेंद के साथ क्रियाओं का अनुकरण करते समय पैरों के विभिन्न हिस्सों को चित्रित करने के लिए उपकरण प्रस्तुत किया गया है।

कीवर्ड: एक पैर से चित्र बनाना, एक फुटबॉल खिलाड़ी के पैर के प्रक्षेप पथ, प्रशिक्षण उपकरण, समन्वय क्षमताएं।

डीओआई: 10.5930/issn.1994−4683.2015.11.129.p14−18

की तकनीकी तैयारी में फुटड्राइंग की विधि

फुटबॉल खिलाड़ी

अल रुबाय नुहद ख अब्बास, स्नातकोत्तर छात्र,

मिखाइल अलेक्जेंड्रोविच प्रवाडोव, शैक्षणिक विज्ञान के डॉक्टर, प्रोफेसर, इवानोवो स्टेट यूनिवर्सिटी, (शुया में शाखा), शुया

लेख खिलाड़ियों के तकनीकी प्रशिक्षण के दौरान "फुटड्राइंग" पद्धति के कार्यान्वयन पर अध्ययन के परिणाम प्रस्तुत करता है। यह पाया गया है कि फ़ुटड्राइंग से संबंधित विशिष्ट मोटर क्रियाओं का उपयोग खिलाड़ियों की "समन्वय क्षमताओं" के विकास में योगदान देता है। ड्राइंग के लिए मुख्य प्रकार की लाइनें, गेंद के साथ पैर की गति के प्रक्षेपवक्र का अनुकरण करती हैं। गेंद के साथ क्रियाओं का अनुकरण करते हुए पैरों के विभिन्न हिस्सों से चित्र बनाने के उपकरण प्रस्तुत किए गए हैं।

कीवर्ड: फ़ुटड्राइंग, फ़ुटबॉल खिलाड़ी के पैरों का प्रक्षेपवक्र, प्रशिक्षण उपकरण, समन्वय क्षमताएँ।

परिचय फुटबॉल में खिलाड़ियों के कौशल की डिग्री की सबसे महत्वपूर्ण विशेषता तकनीकी तत्परता का स्तर है। वर्तमान में, फुटबॉल खिलाड़ियों के तकनीकी प्रशिक्षण की समस्याओं को हल करने के लिए समर्पित अनुसंधान की सांस्कृतिक परत को कई वैज्ञानिक और पद्धतिगत विकासों द्वारा दर्शाया गया है। साथ ही, तकनीकी प्रशिक्षण के नए दृष्टिकोण, रूपों, साधनों और तरीकों की खोज अभी भी वैज्ञानिकों और चिकित्सकों के लिए सबसे गंभीर समस्या बनी हुई है। तकनीकी प्रशिक्षण के घटकों में सुधार के क्षेत्रों में, खिलाड़ियों में उच्च-क्रम मोटर कौशल के गठन से जुड़ी समस्याओं पर विशेष ध्यान आकर्षित किया जाता है - गेंद के साथ क्रियाओं का एक सेट जो सटीकता, निष्पादन की गति के मापदंडों को पूरा करता है। प्राप्त करना, ड्रिब्लिंग करना, पास करना, फेंटना और प्रहार करना। वैज्ञानिक अनुसंधान का विश्लेषण हमें यह निष्कर्ष निकालने की अनुमति देता है कि गतिशीलता में एक गेंद के साथ मोटर क्रियाएं करते समय पैर के अलग-अलग हिस्सों के आंदोलनों की गतिकी के अध्ययन के लिए समर्पित कार्य

अपनी वर्तमान नौकरी के साथ फॉर्म भरें
अन्य नौकरियाँ

आधुनिक शैक्षिक प्रतिमानों में शिक्षा के मूल्य अभिविन्यास को प्रतिबिंबित करने वाले सांस्कृतिक दृष्टिकोण का स्थान माना जाता है। एक सामाजिक और शैक्षिक वातावरण के रूप में एक साहित्य पाठ के शैक्षिक स्थान की विशेषता है, इसके निर्माण के तंत्र दिए गए हैं, और सांस्कृतिक दृष्टिकोण को लागू करने के लिए संसाधन क्षमता की पुष्टि की गई है। निम्नलिखित संकेतकों पर विचार किया गया...

हाई स्कूल में आधुनिक क्वांटम सापेक्षतावादी भौतिकी और ब्रह्मांड विज्ञान की नींव के गहन अध्ययन के लिए एक अभिनव शैक्षिक परियोजना में पद्धति संबंधी अवधारणा और इसके कार्यान्वयन को प्रस्तुत किया गया है। शोध का उद्देश्य आधुनिक शैक्षिक प्रतिमान के संदर्भ में भौतिकी शिक्षा का विकास करना है।

लेख शैक्षिक संगठनों की गतिविधियों की प्रासंगिकता, सामाजिक-आर्थिक स्थितियों के लिए शैक्षिक कार्यक्रमों की सीमा और गुणवत्ता, श्रम बाजार की आवश्यकताओं और प्रत्यक्ष की अपेक्षाओं की समस्या को हल करने में सभी इच्छुक पार्टियों की बातचीत के तंत्र की जांच करता है। शैक्षिक सेवाओं के उपभोक्ता. रिश्तों की व्यवस्था में एक प्रमुख व्यक्ति के रूप में...

आधुनिक शिक्षा ने हमें किंडरगार्टन में शैक्षिक कार्य की प्रक्रिया पर नए सिरे से विचार करने के लिए मजबूर किया है। आधुनिक सूचना एवं संचार प्रौद्योगिकियों का उपयोग इसमें महत्वपूर्ण भूमिका निभा सकता है। टच स्क्रीन, या टैबलेट का उपयोग करने सहित आधुनिक कंप्यूटर की क्षमताओं के लिए धन्यवाद, एक बच्चे को अभिनय करने का अवसर मिलता है...

आधुनिक शिक्षण मॉडल के निर्माण के लिए एक नया दृष्टिकोण प्रस्तावित है। विश्वविद्यालय सूचना प्रणाली की संरचना पर विचार किया जाता है। शैक्षिक सामग्रियों के एकीकृत डेटाबेस के निर्माण के लिए एक बुद्धिमान प्रणाली की तकनीक पर चर्चा की गई है।

उर्फ- के पर्याप्त आधार के बिना दक्षताओं का विकास नहीं किया जा सकता। इस तरह का ज्ञान होने पर, बताएं कि ग्रिबॉयडोव की कॉमेडी के पात्र इतनी बार वोल्टेयर को क्यों याद करते हैं, क्यों तात्याना लारिना की मां "खुद रिचर्डसन की दीवानी थी" और उनकी बेटी को "रिचर्डसन और रूसो दोनों के धोखे से प्यार हो गया"? आधुनिक साहित्य की अंतर्पाठीयता, प्राचीनता की प्रचुरता के साथ उसकी समझ के बारे में कहने को कुछ नहीं है...

विभेदीकरण क्षमता (डीएस) - कमजोर से मजबूत (सक्षम) को अलग करने (अलग करने) की परीक्षण कार्य की क्षमता। आइए विभेदीकरण क्षमता की गणना के लिए कई तरीकों पर विचार करें।

विधि 1 - भेदभाव गुणांक की गणना।

ए. इस विधि में, भेदभाव गुणांक की गणना सूत्र का उपयोग करके की जाती है:

कहाँ एक्स- सभी व्यक्तिगत परीक्षण अंकों का अंकगणितीय माध्य, - उन विषयों के लिए परीक्षण अंकों का अंकगणितीय माध्य जिन्होंने समस्या को सही ढंग से हल किया, - नमूने के लिए व्यक्तिगत परीक्षण अंकों का मानक विचलन, एन- उन विषयों की संख्या जिन्होंने समस्या को सही ढंग से हल किया, - विषयों की कुल संख्या।

B. किसी कार्य का भेदभाव गुणांक -1 से +1 तक मान ले सकता है। एक उच्च और महत्वपूर्ण सकारात्मक गुणांक इंगित करता है कि कार्य उच्च और निम्न परीक्षण स्कोर वाले विषयों को अलग करने में अच्छा है। एक उच्च, महत्वपूर्ण नकारात्मक गुणांक परीक्षण के लिए कार्य की अनुपयुक्तता को इंगित करता है। यदि गुणांक मान 0 के करीब है, तो कार्यों को गलत तरीके से तैयार किया गया माना जाना चाहिए।

दूसरी विधि - चरम समूहों की विधि का उपयोग करके भेदभाव की गणना करना।

A. यह विधि चरम समूहों की विधि का उपयोग करके विभेदक क्षमता (भेदभाव) की गणना करती है, अर्थात, पूरी परीक्षा में सबसे अधिक और सबसे कम सफलतापूर्वक प्रदर्शन करने वाले छात्रों के परिणामों को गणना में ध्यान में रखा जाता है। एक नियम के रूप में, वे पूरे परीक्षण के सर्वोत्तम और सबसे खराब परिणामों में से 10 से 30% तक लेते हैं। कार्य भेदभाव सूचकांक की गणना उच्च-उत्पादकता और निम्न-उत्पादकता समूहों के विषयों के अनुपात में अंतर के रूप में की जाती है जिन्होंने इसे सही ढंग से हल किया।

सर्वश्रेष्ठ समूह में इस कार्य को सही ढंग से पूरा करने वाले छात्रों की संख्या कहां है, सबसे खराब समूह में इस कार्य को सही ढंग से पूरा करने वाले छात्रों की संख्या क्या है, सर्वोत्तम समूह में परीक्षार्थियों की कुल संख्या है, परीक्षार्थियों की कुल संख्या है सबसे ख़राब समूह में.

बी. इस विधि में, साथ ही पिछले एक में, भेदभाव सूचकांक +1 से भिन्न हो सकता है (जब सर्वश्रेष्ठ समूह में सभी छात्र और सबसे खराब समूह में एक भी छात्र ने कार्य पूरा नहीं किया) से -1 (जब) विपरीत स्थिति होती है - सबसे अच्छे समूह में किसी ने भी मुकाबला नहीं किया, लेकिन सबसे खराब स्थिति में, सभी ने मुकाबला किया)। भेदभाव सूचकांक के नकारात्मक मूल्य या शून्य के करीब मूल्य वाले कार्यों को संतोषजनक नहीं माना जा सकता है, और उनमें महत्वपूर्ण त्रुटियों की तलाश की जानी चाहिए। 0.3 से अधिक भेदभाव सूचकांक को संतोषजनक माना जाना चाहिए।

तीसरी विधि - उच्चतम और निम्नतम परिणाम दिखाने वाले विषयों की औसत उपलब्धियों की तुलना।

A. विभेदक क्षमता की गणना सूत्र द्वारा की जाती है:

क्रमशः उच्चतम और निम्नतम परिणामों वाले समूहों की औसत उपलब्धियाँ कहाँ और हैं (विषयों के समूह को दो समान भागों में विभाजित किया गया है)।

चौथी विधि - एक ही समूह में एक निश्चित समयावधि में दो बार परीक्षण करना.

A. इस विधि में, विभेदीकरण क्षमता की गणना सूत्र का उपयोग करके की जाती है:

पहले और दूसरे परीक्षण के दौरान दिए गए परीक्षण में क्रमशः सही उत्तरों की संख्या कहाँ और है, एन- विषयों की संख्या.

5वीं विधि - विभिन्न समूहों में एक ही परीक्षण के परिणामों की तुलना।

ए. और अंतिम विधि में, विभेदक क्षमता की गणना सूत्र द्वारा की जाती है:

जहां और पहले और दूसरे समूह में दिए गए परीक्षण के सही उत्तरों की संख्या है, और प्रत्येक समूह में विषयों की संख्या है।

बी. अंतिम तीन विधियों में परिणामों की व्याख्या इस प्रकार है: यदि संकेतक है तो परीक्षण की विभेदक क्षमता संतोषजनक मानी जाती है।

निष्कर्ष: आप देख सकते हैं कि दूसरी और तीसरी विधियों का उपयोग करके भेदभाव खोजने के सूत्र व्यावहारिक रूप से समान हैं। अंतर केवल इतना है कि पहले मामले में हम चरम समूहों की विधि का उपयोग करते हैं। चौथी और पांचवीं विधियों में, एक विशेष विशेषता परीक्षण स्थिति है (एक ही समूह में दो बार परीक्षण करना और विभिन्न समूहों में परिणामों की तुलना करना)।

लोड हो रहा है...लोड हो रहा है...