ﺳﻪشنبه، 17 شهریور 1394
خزانه سؤال و تعیین ویژگی‌های تست

خزانه سؤال و تعیین ویژگی‌های تست


 
خزانه سؤال و تعیین ویژگی‌های تست

همواره از خود می‌پرسیم که "خزانه سؤال" یا بانک سؤال" چیست و چگونه تهیه می‌شود. تصور عمومی برآن است که هر گاه ما سؤال‌های معلم ساخته و یا مجموعه سؤالات امتحانی را در جائی به صورت فیزیکی و یا مکانیزه جمع‌آوری کنیم،آنگاه به تأسیس بانک سؤال اقدام کرده‌ایم. در وهله‌ی نخست این تصور ممکن است هم منطقی و هم اجرایی به نظر برسد اما، اگر بخواهیم این بانک را مبتنی بر داده‌های علم سنجش و اندازه‌گیری پی‌ریزی نمائیم،لاجرم باید از اصول و منطق طراحی بانک سؤال پیروی کنیم. در غیر این صورت مواجه با انبوهی از سؤال‌ها در انباری از تست خواهیم بود که هیچ گونه ارزش آزمون‌گری ندارند. مطلب خلاصه زیر نحوه‌ی تدوین و آراستن بانک سؤال یا "گنجینه‌‌ی سؤال" را نشان می‌دهد.
اشخاصی که در ساخت تست‌های سنجش ایفای نقش می‌کنند معمولاً با سازمان‌های گسترده و متنوعی سرو کار دارند. معلمان مدارس به منظور سنجش پیشرفت تحصیلی دانش‌آموزان باید برای همه سطوح کلاسی، تست تهیه کنند. فرایند تهیه تست معمولاً مبتنی بر داشتن مجموعه‌ای سؤال است که از میان آن‌ها بتوان سؤال‌های مناسب را برای گنجاندن در یک تست خاص برگزید. به چنین مجموعه‌ای از سؤال‌ها "گنجینه‌یا خزانه سؤال" گفته می‌شود.انتخاب سؤال از چنین گنجینه‌ای بر پایه دو عامل محتوا و ویژگی‌های فنی،یعنی مقادیر پارامتر سؤال صورت می‌پذیرد. در" تئوری سؤال پاسخ"1 برای تهیه و نگهداری چنین گنجینه‌ای ، از مجموعه روش‌هایی که به خوبی تعریف شده باشد استفاده می‌شود. به این مجموعه از روش‌ها یک نام خاص زیر عنوان "بانک کردن" یا "ذخیره سازی" سؤال اطلاق می‌گردد و هدف اساسی آن داشتن گنجینه‌ای است که در آن مقادیر پارامترهای سؤال‌ها در یک مقیاس توانایی با نظام متریک مشخص بیان می‌شود. با داشتن چنین گنجینه‌ای ، امکان گزینش سؤال و تعیین ویژگی‌های عمده فنی تست،قبل از آنکه روی گروهی از آزمودنی‌ها اجرا شود،فراهم می‌آید. اگر ویژگی‌های تست نتواند مقاصد اصلی را بر آورده سازد، سؤال‌های انتخابی را می‌توان تا زمانی که ویژگیهای مطلوب به دست آید، با سؤال‌های دیگری که در بانک سؤال وجود دارد جای‌گزین کرد. از این طریق در زمان و هزینه‌ای که باید صرف مطالعات مقدماتی تست شود صرفه‌جویی به عمل می‌آید.

به منظور تهیه‌ی خزانه سؤال لازم است:

1-  صفت مکنونی2 که سؤال‌ها باید آن را اندازه بگیرد، به روشنی تعریف شود.
2- برای اندازه‌گیری این صفت سؤال‌های متعددی تهیه گردد.
3- با اجرای تست مقدماتی، سؤال‌های نامناسب کنار گذاشته شود.
بدین ترتیب ، پس از مدتی برای اندازه‌گیری صفت مکنون مورد نظر مجموعه‌ای سؤال در دست خواهد بود.
در مرحله بعدی، این مجموعه بزرگ سؤال باید در گروه بزرگی از آزمودنی‌ها اجرا شود، و داده‌های سؤال پاسخ آزمودنی‌‌ها با انتخاب یکی از مدل‌های روان‌سنجی تجزیه و تحلیل و در نهایت ، تست حاصل مدرج گردد. مقیاس توانایی حاصل از مدرج کردن این تست به عنوان نظام متریک خط پایه گنجینه سؤال در نظر گرفته می‌شود. از نظر ساخت تست، اکنون مجموعه سؤال‌هایی با پارامترهای معلوم در دست داریم( شامل قدرت تشخیص ، درجه دشواری ، سطح توانایی ...) که در اصطلاح فنی به آن " گنجینه سؤال از پیش مدرج شده" گفته می‌شود.
چون سؤال‌های موجود در گنجینه‌ای که از پیش مدرج شده است صفت مکنون معینی را اندازه‌ می‌گیرد، تست‌هایی که با استفاده از این گنجینه ساخته می‌شود نیز همان صفت را می‌سنجند. با آنکه ممکن است عجیب بنماید ، اما به دلایل متعدد برای اندازه‌گیری صفت مورد نظر، لازم است تست‌های دیگری نیز تهیه شود. برای مثال ، به منظور محافظت از تست باید فرم‌های همتای آن در دست باشد.علاوه بر این، برای اختصاص کمک "هزینه تحصیلی" نیز می‌توان نسخه‌های بخصوصی از تست تهیه شده را به کار برد. در این گونه موارد، به منظور تأمین هدف‌های خاص اندازه‌گیری ، سؤال‌ها باید بر پایه دو عامل محتوا و ویژگی‌های فنی آنها از "گنجینه سؤال" انتخاب و برداشت شود.
مزیت عمده "گنجینه سؤال‌های از پیش مدرج شده" آن است که با استفاده از مقادیر پارامتر سؤال‌هایی که تست را تشکیل می‌دهد می‌توان محاسبات مربوط به ویژگی‌های مهم تست را قبل از اجرای آن انجام داد. زیرا هیچ کدام از این ویژگی‌ها به توزیع نمره‌های آزمودنی در مقیاس توانایی بستگی ندارد.
 بنابراین ، وقتی مقادیر پارامترهای سؤال‌ها در دست باشد.، تست ساز پیش از آنکه تست را روی گروهی از آزمودنی‌ها اجرا کند، درباره‌ی چگونگی عملکرد آن،زمینه بسیار خوبی در دست خواهد داشت.علاوه بر آن وقتی تست اجرا و مدرج شده باشد، روش‌های هم تراز سازی را می‌توان برای بیان بر آوردهای توانایی آزمودنی‌های جدید در نظام متریک گنجینه سؤال به کار برد.

برخی از هدف‌های متدوال سنجش تستی:

الف-تست‌های ویژه سرند کردن:
تست‌هایی که با هدف سرند کردن به کار می‌رود ، دارای این قابلیت است که آزمودنی‌هایی را که درست در زیر سطح معینی توانایی قرار دارند از آنهایی که در همان سطح یا بالاتر هستند، کاملاً متمایز می‌سازد این گونه تست‌ها برای اختصاص "کمک هزینه‌های تحصیلی" (یا هر نوع پاداش دیگر) و نیز گماردن دانش‌آموزان به برنامه‌های خاص آموزشی مانند جای گزینی‌های ترمیمی یا پیشرفته به کار می‌رود.

ب- تست‌های با دامنه گسترده:

این تست‌ها برای اندازه‌گیری توانایی در کل دامنه یک" مقیاس توانایی" به کار می‌رود. هدف اساسی این گونه تست‌ها‌ آن است که بتوان درباره‌ی توانایی آزمودنی‌ها داوری و آنها را با یکدیگر مقایسه کرد.تست‌هایی که برای اندازه‌گیری خواندن یا ریاضیات به کار می‌رود نمونه هایی از تست‌های با دامنه گسترده است.

ج- تست‌های با دامنه محدود:

این گونه تست‌ها به گونه‌ای طراحی شده است که توانایی آزمودنی‌ها را در "ناحیه‌ای از مقیاس توانایی" که در آن بخش زیادی از آزمودنی‌ها قرار دارند به خوبی اندازه می‌گیرد، اما کاربرد آنها ذر خارج از این ناحیه مناسبت کمتری دارد. بنابراین زمانی تست‌های دامنه محدود را تهیه می‌کنیم که مایل باشیم تست مورد نظر ، توانایی آزمودنی‌ها را در دامنه‌ای وسیع‌تر از دامنه تست‌های ویژه سرند کردن ، اما نه به وسعت تست‌های با دامنه گسترده ، بخوبی اندازه ‌گیری کند.(مانند تست‌های تعیین سطح مهارت)
----------------------------------------------------------------------
1- تئوری" سؤال پاسخ" مبتنی بر این مفروضه ات که آزمودنی تا چه حد به پاسخ درست هر سؤال منفرد دست پیدا کرده است، در صورتی که در تئوری کلاسیک ، نمره خام امتحان شونده جمع نمره‌هایی است که در پاسخ به همه سؤال‌های تست به دست می‌آورد.
2- در علم روان‌سنجی به کلیه صفات مشاهده ناپذیر یعنی صفاتی که شنونده به صورت تصاویر ذهنی درک می‌کند ولی نقش آنها در فرایند سنجش تعیین کننده است " صفت مکنون " اطلاق می‌گردد.

محمد جواد روشنفکر- دکترای روانشناسی تربیتی
 

 

تلفن تماس با دپارتمان سنجش و ارزشیابی مبتکران:
021
61094126

department@mobtakeran.com

نظرات، انتقادها و پیشنهادهای خود را درباره بخش های زیر می توانید مطرح کنید.برای این کار از فرم انتهای صفحه استفاده کنید: