خزانه سؤال و تعیین ویژگیهای تست
همواره از خود میپرسیم که "خزانه سؤال" یا بانک سؤال" چیست و چگونه تهیه میشود. تصور عمومی برآن است که هر گاه ما سؤالهای معلم ساخته و یا مجموعه سؤالات امتحانی را در جائی به صورت فیزیکی و یا مکانیزه جمعآوری کنیم،آنگاه به تأسیس بانک سؤال اقدام کردهایم. در وهلهی نخست این تصور ممکن است هم منطقی و هم اجرایی به نظر برسد اما، اگر بخواهیم این بانک را مبتنی بر دادههای علم سنجش و اندازهگیری پیریزی نمائیم،لاجرم باید از اصول و منطق طراحی بانک سؤال پیروی کنیم. در غیر این صورت مواجه با انبوهی از سؤالها در انباری از تست خواهیم بود که هیچ گونه ارزش آزمونگری ندارند. مطلب خلاصه زیر نحوهی تدوین و آراستن بانک سؤال یا "گنجینهی سؤال" را نشان میدهد.
اشخاصی که در ساخت تستهای سنجش ایفای نقش میکنند معمولاً با سازمانهای گسترده و متنوعی سرو کار دارند. معلمان مدارس به منظور سنجش پیشرفت تحصیلی دانشآموزان باید برای همه سطوح کلاسی، تست تهیه کنند. فرایند تهیه تست معمولاً مبتنی بر داشتن مجموعهای سؤال است که از میان آنها بتوان سؤالهای مناسب را برای گنجاندن در یک تست خاص برگزید. به چنین مجموعهای از سؤالها "گنجینهیا خزانه سؤال" گفته میشود.انتخاب سؤال از چنین گنجینهای بر پایه دو عامل محتوا و ویژگیهای فنی،یعنی مقادیر پارامتر سؤال صورت میپذیرد. در" تئوری سؤال پاسخ"1 برای تهیه و نگهداری چنین گنجینهای ، از مجموعه روشهایی که به خوبی تعریف شده باشد استفاده میشود. به این مجموعه از روشها یک نام خاص زیر عنوان "بانک کردن" یا "ذخیره سازی" سؤال اطلاق میگردد و هدف اساسی آن داشتن گنجینهای است که در آن مقادیر پارامترهای سؤالها در یک مقیاس توانایی با نظام متریک مشخص بیان میشود. با داشتن چنین گنجینهای ، امکان گزینش سؤال و تعیین ویژگیهای عمده فنی تست،قبل از آنکه روی گروهی از آزمودنیها اجرا شود،فراهم میآید. اگر ویژگیهای تست نتواند مقاصد اصلی را بر آورده سازد، سؤالهای انتخابی را میتوان تا زمانی که ویژگیهای مطلوب به دست آید، با سؤالهای دیگری که در بانک سؤال وجود دارد جایگزین کرد. از این طریق در زمان و هزینهای که باید صرف مطالعات مقدماتی تست شود صرفهجویی به عمل میآید.
به منظور تهیهی خزانه سؤال لازم است:
1- صفت مکنونی2 که سؤالها باید آن را اندازه بگیرد، به روشنی تعریف شود.
2- برای اندازهگیری این صفت سؤالهای متعددی تهیه گردد.
3- با اجرای تست مقدماتی، سؤالهای نامناسب کنار گذاشته شود.
بدین ترتیب ، پس از مدتی برای اندازهگیری صفت مکنون مورد نظر مجموعهای سؤال در دست خواهد بود.
در مرحله بعدی، این مجموعه بزرگ سؤال باید در گروه بزرگی از آزمودنیها اجرا شود، و دادههای سؤال پاسخ آزمودنیها با انتخاب یکی از مدلهای روانسنجی تجزیه و تحلیل و در نهایت ، تست حاصل مدرج گردد. مقیاس توانایی حاصل از مدرج کردن این تست به عنوان نظام متریک خط پایه گنجینه سؤال در نظر گرفته میشود. از نظر ساخت تست، اکنون مجموعه سؤالهایی با پارامترهای معلوم در دست داریم( شامل قدرت تشخیص ، درجه دشواری ، سطح توانایی ...) که در اصطلاح فنی به آن " گنجینه سؤال از پیش مدرج شده" گفته میشود.
چون سؤالهای موجود در گنجینهای که از پیش مدرج شده است صفت مکنون معینی را اندازه میگیرد، تستهایی که با استفاده از این گنجینه ساخته میشود نیز همان صفت را میسنجند. با آنکه ممکن است عجیب بنماید ، اما به دلایل متعدد برای اندازهگیری صفت مورد نظر، لازم است تستهای دیگری نیز تهیه شود. برای مثال ، به منظور محافظت از تست باید فرمهای همتای آن در دست باشد.علاوه بر این، برای اختصاص کمک "هزینه تحصیلی" نیز میتوان نسخههای بخصوصی از تست تهیه شده را به کار برد. در این گونه موارد، به منظور تأمین هدفهای خاص اندازهگیری ، سؤالها باید بر پایه دو عامل محتوا و ویژگیهای فنی آنها از "گنجینه سؤال" انتخاب و برداشت شود.
مزیت عمده "گنجینه سؤالهای از پیش مدرج شده" آن است که با استفاده از مقادیر پارامتر سؤالهایی که تست را تشکیل میدهد میتوان محاسبات مربوط به ویژگیهای مهم تست را قبل از اجرای آن انجام داد. زیرا هیچ کدام از این ویژگیها به توزیع نمرههای آزمودنی در مقیاس توانایی بستگی ندارد.
بنابراین ، وقتی مقادیر پارامترهای سؤالها در دست باشد.، تست ساز پیش از آنکه تست را روی گروهی از آزمودنیها اجرا کند، دربارهی چگونگی عملکرد آن،زمینه بسیار خوبی در دست خواهد داشت.علاوه بر آن وقتی تست اجرا و مدرج شده باشد، روشهای هم تراز سازی را میتوان برای بیان بر آوردهای توانایی آزمودنیهای جدید در نظام متریک گنجینه سؤال به کار برد.
برخی از هدفهای متدوال سنجش تستی:
الف-تستهای ویژه سرند کردن:
تستهایی که با هدف سرند کردن به کار میرود ، دارای این قابلیت است که آزمودنیهایی را که درست در زیر سطح معینی توانایی قرار دارند از آنهایی که در همان سطح یا بالاتر هستند، کاملاً متمایز میسازد این گونه تستها برای اختصاص "کمک هزینههای تحصیلی" (یا هر نوع پاداش دیگر) و نیز گماردن دانشآموزان به برنامههای خاص آموزشی مانند جای گزینیهای ترمیمی یا پیشرفته به کار میرود.
ب- تستهای با دامنه گسترده:
این تستها برای اندازهگیری توانایی در کل دامنه یک" مقیاس توانایی" به کار میرود. هدف اساسی این گونه تستها آن است که بتوان دربارهی توانایی آزمودنیها داوری و آنها را با یکدیگر مقایسه کرد.تستهایی که برای اندازهگیری خواندن یا ریاضیات به کار میرود نمونه هایی از تستهای با دامنه گسترده است.
ج- تستهای با دامنه محدود:
این گونه تستها به گونهای طراحی شده است که توانایی آزمودنیها را در "ناحیهای از مقیاس توانایی" که در آن بخش زیادی از آزمودنیها قرار دارند به خوبی اندازه میگیرد، اما کاربرد آنها ذر خارج از این ناحیه مناسبت کمتری دارد. بنابراین زمانی تستهای دامنه محدود را تهیه میکنیم که مایل باشیم تست مورد نظر ، توانایی آزمودنیها را در دامنهای وسیعتر از دامنه تستهای ویژه سرند کردن ، اما نه به وسعت تستهای با دامنه گسترده ، بخوبی اندازه گیری کند.(مانند تستهای تعیین سطح مهارت)
----------------------------------------------------------------------
1- تئوری" سؤال پاسخ" مبتنی بر این مفروضه ات که آزمودنی تا چه حد به پاسخ درست هر سؤال منفرد دست پیدا کرده است، در صورتی که در تئوری کلاسیک ، نمره خام امتحان شونده جمع نمرههایی است که در پاسخ به همه سؤالهای تست به دست میآورد.
2- در علم روانسنجی به کلیه صفات مشاهده ناپذیر یعنی صفاتی که شنونده به صورت تصاویر ذهنی درک میکند ولی نقش آنها در فرایند سنجش تعیین کننده است " صفت مکنون " اطلاق میگردد.
محمد جواد روشنفکر- دکترای روانشناسی تربیتی