فتقصي الأداء الفارق للبند تبعاً للنوع في استبيان القدرة على التنظيم

نوع المستند : بحوث فی مجال علم النفس والصحة النفسیة


أستاذ مساعد علم النفس التربوي کلية التربية بقنا – جامعة جنوب الوادي


هدفت الدراسة الحالية تقصى الأداء الفارق للبند Differential Item Functioning (DIF) في المستوى المتضخم في استبيان القدرة على التنظيم (تعريب: الباحث) على أساس متغير النوع باستخدام ومقارنة الطريقة الحُکمية وطريقتين إحصائيتين هما: اختبار نسبة الأرجحية Item-Response Theory Likelihood-Ratio Test (IRT-LR) باستخدام قائمة الأوامر النصية DIFLRT واختبار مانتل-هانزل کوکران المعمم Generalized Cochran Mantel-Haenszel (GCMH) باستخدام برنامج GMHDIF، وبلغ حجم عينة الدراسة (1526) معلم ومعلمة (718 ذکور، 808 إناث) يعملون بالمرحلة الابتدائية بإدارتي قوص ونقادة التعليميتين بمحافظة قنا بمتوسط عمر قدره (36,37) سنة وانحراف معياري قدره (8,41).
وتوصلت نتائج الدراسة إلى:

وجود فروق دالة إحصائياً بين متوسطي درجات المعلمين والمعلمات في عوامل (تفضيل التنظيم، تفضيل الروتين، نهج التخطيط) والدرجة الکلية لصالح المعلمات.
يوجد اتساق في أداء اختباري مانتل هانزل ونسبة الأرجحية في تحديد البنود ذات الأداء الفارق.
أظهرت البنود (3، 7، 11، 17، 18، 23) وعددها ستة بنود من أصل ثمانية وعشرين بند أداء فارق متضخم في حالة استخدام درجة أي من العوامل الخمس أو الدرجة الکلية کمحک للتطابق بنسبة (21,43%).
لم تظهر البنود (2، 4، 8، 9، 10، 12، 13، 14، 15، 16، 19، 20، 21، 25، 27، 28) وعددها ستة عشر بند من أصل ثمانية وعشرين (28) بند أداء فارق متضخم في حالة استخدام درجة أي من العوامل الخمس أو الدرجة الکلية کمحک للتطابق بنسبة (57,14%).
أظهرت البنود الثلاث (1، 6، 24) أداء فارقاً متضخماً في حالة استخدام درجة عاملين أو الدرجة الکلية کمحک للتطابق بنسبة (10,71%).
أظهر البنود الثلاث (5، 22، 26) أداء فارقاً متضخماً في حالة استخدام درجة ثلاثة عوامل أو الدرجة الکلية کمحک للتطابق بنسبة (10,71%).
إن البندين الثالث والحادي عشر فقط قد أظهرا أداء فارقاً متضخماً منتظماً في حالة استخدام درجة أي عامل من العوامل الخمس أو الدرجة الکلية کمحک للتطابق بين مجموعتي الذکور والإناث.
بين التحليل الکي في لمحتوى البندين ذوى الأداء الفارق المنتظم أن سياق العمل، والطبيعة الذکورية يسببان تحيز البندين لصالح الذکور.  

This study aimed to reveal the gender related magnitude differential item functioning for the organizational ability questionnaire by using the judgmental method and two statistical methods (IRT-likelihood ratio test, Generalized Mantel Haenszel statistic). The sample of the study de-limited to 1526 teachers working on the primary stage (718 males, 808 females) choosed from Qus and Nagada Idarra (mean=36.37 years, SD=8.41).
 The study revealed the following results:
-          There was a statistical difference between means of females and males on three factors (preference for organization, planning approach, preference of delays) and the total score.
-          There was a consistency in the performance of IRT-likelihood ratio test and Mantel Haenszel statistic in determining items, which showed differential item functioning.
-          There was six items out of 28 function differentially magnitude between the two groups by using any of the factors scores or the total score as a matching criteria.
-          There was sixteen items out of 28 did not function differentially magnitude between the two groups by using any of the factors scores or the total score as a matching criteria.
-          There was three items out of 28 function differentially magnitude between the two groups by using two of the factors scores or the total score as a matching criteria.
-          There was three items out of 28 function differentially magnitude between the two groups by using three of the factors scores or the total score as a matching criteria.
-          Two items (3, 11) showed magnitude uniform DIF between the two groups by using any of the factors scores or the total score as a matching criteria.
 Finally, the qualitative study of the content of items showed uniform DIF indicated that work context factor and masculine nature might be responsiple for showing magnitude uniform DIF.

الكلمات الرئيسية

الموضوعات الرئيسية

ابتسام توفیق أبو خلیفة (2009). توظیف نموذج راش فی انتقاء فقرات مقیاس تقدیر لتقییم اتجاهات طلبة کلیة العلوم التربویة نحو تخصص معلم الصف. مجلة العلوم التربویة والنفسیة. کلیة التربیة. جامعة البحرین. 10(4)، 145 – 164.
إسماعیل سلامة البرصان (2013). الأداء التفاضلى لمتغیر الجنس لفقرات الاختبار الوطنی الأردنی لضبط نوعیة التعلیم لمادة الریاضیات للصف العاشر. دراسات نفسیة وتربویة. ع (79)، 229 – 270.
إقبال زین العابدین درندرى (2012). اختبارات القبول بالجامعات السعودیة فی ضوء التوجهات الحدیثة فی صدق الاختبار. المؤتمر الدولی الأول للقیاس والتقویم "معاییر القبول فی التعلیم العالی". المرکز الوطنی للقیاس والتقویم فی التعلیم العالی. المملکة العربیة السعودیة.
إیهاب محمد نجیب (2008). طرق الکشف عن تحیز مفردات الاختبار دراسة سیکومتریة مقارنة. رسالة ماجستیر غیر منشورة. کلیة التربیة. جامعة عین شمس.
حیدر إبراهیم أحمد (2006). فاعلیة طریقة الکشف عن التحیز فی الفقرة المبنیة على الإجراءات التحکیمیة مقارنة بالطرق التجریبیة المبنیة على إجراءات النظریة الکلاسیکیة فی القیاس ونظریة الاستجابة للفقرة. رسالة دکتوراه غیر منشورة. کلیة الدراسات العلیا. الجامعة الأردنیة.
خلود رحیم، سهام کاظم (2011). اختلاف دالة الفقرة فی مقیاس الصحة النفسیة. مجلة البحوث التربویة والنفسیة. کلیة التربیة. جامعة بغداد. ع (28)، 227 – 255.
راتب صایل الخضر (2013). أثر وجود أداء تفاضلی فی الفقرات المرساویة على دقة المعادلة العمودیة لاختبار أوتیس لینون للقدرة العقلیة. المجلة الدولیة التربویة المتخصصة، 2(8)، 754 – 771.
عادل أحمد الناجی (2011).  فاعلیة طریقة التحلیل العاملى المقید مقارنة بعدة طرق للکشف عن الأداء التفاضلی على الفقرة. رسالة دکتوراه غیر منشورة. کلیة التربیة. جامعة الیرموک.
عبد الرحمن عبد اللهالنفیعى (2008). مقارنةفاعلیةعددمنالطرقالإحصائیةللکشفعنالأداء التفاضلیلفقراتالاختباراتوأثرذلکعلىالخطأمن النوعالأولوقوةالاختبار. رسالة دکتوراه غیر منشورة. کلیة التربیة. جامعةأمالقرى.
عبد الله على القاطعى (1993). تحیز بنود اختبار وکسلر لذکاء الأطفال المعدل (الصورة السعودیة) حسب الجنس. مجلة جامعة الملک سعود (العلوم التربویة والدراسات الإسلامیة)، 5(2)، 373 – 390.
عبد الله على القاطعى (1998). دراسة مقارنة لبعض طرق تحیز بنود الاختبار. مجلة جامعة الملک سعود (العلوم التربویة والدراسات الإسلامیة). 10(2)، 259 – 296.
على صالح رجا (2013). أثر نسبة الفقرات ذات الأداء التفاضلى ومستواه فی تقدیر معالم فقرات الاختبار وقدرات الأفراد وفق نموذج الاستجابة للفقرة ثلاثی المعلمة. رسالة دکتوراه غیر منشورة. کلیة التربیة.          جامعة الیرموک.
کوثر رضوان صالح (2008). تقصى فاعلیة منحنى خصائص الفقرة فی الکشف عن الأداء التفاضلی لمتغیر الجنس فی عینة مختارة من اختبار فی الریاضیات. رسالة ماجستیر غیر منشورة. کلیة التربیة.          جامعة الیرموک.
مایسة فاضل أبو مسلم (2010). الکشف عن تحیز بنود الاختبار وفقاً لمدخل نظریة الاستجابة للمفردة (IRT) ومدخل مانتل هانزل (M-H) (دراسة مقارنة). مجلة کلیة التربیة. جامعة الإسکندریة. 20 (2)،         189 – 237.
محمد حبشی حسین (2006). تکافؤ القیاس بین النسختین العربیة والانجلیزیة لاستبیان مؤشر أسالیب التعلم فی ضوء نظریة الاستجابة للمفردة. دراسات نفسیة. 16(4)، 537-591.    
نجود على فریحات (2014). الأداء التفاضلی لفقرات الاختبار الوطنی لضبط نوعیة التعلیم فی العلوم والریاضیات للصف العاشر الأساسی تبعاً لطریقة تقدیم الاختبار. رسالة دکتوراه غیر منشورة. کلیة التربیة. جامعة الیرموک.
نزار راسم محمد (2008). مقارنة أربع طرائق للکشف عن دالة الفقرة التفاضلیة (دراسة محاکاة). رسالة دکتوراه غیر منشورة. کلیة التربیة. الجامعة الأردنیة.
هیئة اعتماد مؤسسات التعلیم العالی (2009). دلیل المصطلحات فی القیاس والتقویم التربوی. الأردن.
Abad, F. J., Colom, R., Rebollo, I., & Escorial, S. (2004). Sex differential item functioning in the Raven's Advanced Progressive Matrices: evidence for bias. Personality and Individual Differences. 36(7), 1459-1470.
Abedalaziz, N. (2010). A gender-related differential item functioning of mathematics test items. International Journal of Educational and Psychological Assessment. 5, 101–116.
Acar, T., & Kelecioglu, H. (2010). Comparison of differential item functioning determination techniques: HGLM, LR and IRT-LR. Educational Sciences: Theory & Practice. 10(2), 639-649.
Alquraan, M., Alshraideh, M., & Bsharah, M. (2010). Psychometric properties and differential item functioning (DIF) analysis of Jordanian version of self-assessed wisdom scale (SAWS-Jo). International Journal of Applied Educational Studies. 9(1), 52-66.
Alsmadi, A. A. (1998). Differential person functioning (Unpublished Doctoral Dissertation). Ohio University, USA.
Alsmadi, A. A., & Alnabhan, M. (2000). Detecting differential person functioning using Mantel-Haenszel and logistic regression techniques. Dirasat, Educational Sciences. 27(1), 208-217.
Alsmadi, Y. M., & Alsmadi, A. A. (2009). Detecting differential person functioning in emotional intelligence. Journal of Instructional Psychology. 36(4), 284-.
American Psychological Association (2010). Publication Manual of the American Psychological Association (6th ed.). Washington, DC: Author.
American Psychological Association, American Educational Research Association and National Council on Measurement in Education (1999). Standards for educational and psychological testing. Washington, DC: American Psychological Association.
Anastasi, A., & Urbina, S. (1997). Psychological Testing (7th ed.). Upper Saddle River, New Jersey: Prentice-Hall, Inc.
Baiqiang, T. (2007). Research into sexism in language testing & its implications to language testing in China. Paper presented at the 2007 international conference on language testing (China, Beijing, Nov. 3-4)
Basokcu, T. O., & Ogretmen, T. (2014). Comparison of parametric and nonparametric item response techniques in determining differential item functioning in polytomous scale. American Journal of Theoretical and Applied Statistics. 3(2), 31-38.
Brown, P. J. (1996). Using differential analysis to determine differential item functioning of survey questions (Unpublished Doctoral Dissertation), University of Illinois at Urbana-Champian.
Cardoza, S. L. (2006). Differential item functioning in Asian-Americans on the Stanford-Binet standardization fifth edition verbal subtests (Unpublished Doctoral Dissertation), George Fox University.
Childs, R. A. (1990). Gender bias and fairness. Practical Assessment, Research & Evaluation, 2(3). Retrieved November 26, 2014 from http://PAREonline.net/getvn.asp?v=2&n=3.
Chiesi, F., Ciancaleoni, M., Galli, S., Morsanyi, K., & Primi, C. (2011). Item response theory analysis and differential item functioning across age, gender and country of a short form of the advanced progressive matrices. Learning and Individual Differences. 22(3), 390-396.
Cole, S. R. (1999). Assessment of differential item functioning in the perceived stress scale-10. Journal of Epidemiol Community Health. 53, 319-320.
Conoley, C. A. (2003). Differential item functioning in the Peabody picture vocabulary test-third edition: Partial correlation versus expert Judgment (Unpublished Doctoral Dissertation). Texas A & M University.
Doudeen, H. M., & Annabi, H. A. (2008). Sex-related differential item functioning (DIF) analysis of TIMSS. Dirasat, Educational Sciences, 35, 697 – 705.
Ellis, B. (1989). Differential item functioning: Implications for test translators. Journal of Applied Psychology. 74, 912-921.
Facon, B., Magis, D., Nuchadee, M.-L., & De Boeck, P. (2011). Do Raven's Colored Progressive Matrices function in the same way in typical and clinical populations? Insights from the intellectual disability field. Intelligence. 39(5), 281-291.
Fang, T. (1994). The performance of Mantel-Haenszel and logistic regression DIF identification procedure with real data (Unpublished Master Thesis University of Ottawa, Canada.
Fidalgo, A´. M. (2011a). GMHDIF: A computer program for detecting DIF in dichotomous and polytomous items using generalized Mantel-Haenszel statistics. Applied Psychological Measurement. 35(3) 247–249.
Fidalgo, A´. M. (2011b). A new approach for differential item functioning detection using Mantel-Haenszel methods. The GMHDIF program. The Spanish Journal of Psychology. 14(2), 1018-1022.
French, B. F., & Finch, W. H. (2013). Extentions of Mantel-Haenszel for multilevel DIF detection. Educational and Psychological Measurement. 73(4), 648-671.
French, B. F., & Gotch, C. M. (2013). Sex differences in item functioning in the comprehensive inventory of basic skills-II vocabulary assessments. Journal of Psychoeducational Assessment. 31(4), 410-417.
Gierl, M. J., Bisanz, J., Bisanz, G., Boughton, K., & Khaliq, S. (2001). Illustrating the utility of differential bundle functioning analyses to identify and interpret group differences on achievement tests. Educational Measurement: Issues and Practice. 20, 26-36.
Gierl, M. J., & Bolt, D. M. (2001). Illustrating the use of nonparametric regression to assess differential item and bundle functioning among multiple groups. International Journal of Testing. 1(3&4), 249-270.
Gierl, M. J., Jodoin, M. G., & Ackerman, T. A. (2000). Performance of Mantel-Haenszel, simultaneous item bias test, and logistic regression when the proportion of DIF items is large. Paper Presented at the Annual Meeting of the American Educational Research Association (AERA) (New Orleans, Louisiana, USA April 24-27).
Gierl, M. J., Lai, H., & Li, J. (2013). Identifying differential item functioning in multi-stage computer adaptive testing. Educational Research and Evaluation. 19 (2-3),         188-203
Gokiert, R. J., & Ricker K. L. (2004). Gender differential item functioning on the WISC-II: Analysis of the Canadian standardization sample. Centre for research in applied measurement and evaluation. Edmonton, Canada: University of Alberta.
Gómez-Benito, J., Hidalgo, D., & Guilera, G. (2010). Bias in measurement instruments. Fair Tests. Papeles del Psicologo. 31(1), 75-84.
Gotzmann, A. J. (2002). The effect of large ability differences on type I error and power rates using SIBTEST and TESTGRAF DIF detection procedures. Paper Presented at the Annual Meeting of the American Educational Research Association (New Orleans, LA, April 1-5).
Greer, T. G. (2004). Detection of differential item functioning (DIF) on the SATV: A comparison of four methods: Mantel-Haenszel, logistic regression, simultaneous item bias and likelihood ratio test (Unpublished Doctoral Dissertation), University of Houston.
Guo, F., Rudner, L., & Miller, E. (2006): Differential impact as an item bias indicator in CAT and other IRT. Based test, GMAC Research Reports, RR.06-09-.
Hambleton, R. K., & Swaminathan, H., & Rogers, J. (1991). Fundamtals of item-response theory. Boston: Sage publications.
Hambleton, R. K., & Rodgers, J. (1995). Item bias review. Practical Assessment, Research, and Evaluation. 4(6). Retrieved November 18, 2006, from http://PAREonline.net/getvn.asp?v=4&n=6
Hambleton, R. K., & Jones, R.W. (1994). Comparison of empirical and judgmental procedures for detecting differential item functioning. Educational Research Quarterly. 18, 21–37.
Hambleton, R., (1993). Translating achievement tests for use in cross-national studies. European Journal of Psychological Assessment. 9(1), 57-68.
Harlow, S. C. (2011). Item fairness of the nonverbal subtests of the Stanford-Binet intelligence test, fifth edition, in a Latina (Unpublished Doctoral Dissertation), George Fox University.
Hessen, D.J. (2003). Differential item functioning: Types of DIF and observed score based detection methods (Unpublished Doctoral Dissertation). Amsterdam: University of Amsterdam.
Hidalgo, M. D., Gomez-Benito, J., & Zumbo, B. D. (2014). Binary logistic regression analysis for detecting differential item functioning: effectiveness of R2 and Delta log odds ratio effect size measures. Educational and Psychological Measurement. 74(6), 927-949.
Holland, P. W., & Thayer, D. T. (1988). Differential item functioning and the Mantel-Haenszel procedure. In H. Wainer & H. I. Braun (Eds.), Test validity (pp. 129-145). Hillsdale, NJ: Erlbaum.
Hulin, C. L., & Drasgow, F., & Komocar, J. (1982). Applications of item response theory to analysis of attitude scale translations. Journal of Applied Psychology. 67,        818-825.
Jane, J. S., Oltmanns, T. F., South, S. C., & Turkheimer, E. (2007). Gender bias in diagnostic criteria for personality disorders: An item response theory analysis. Journal of Abnormal Psychology. 116(1), 166-175.
Jin, Y., Myers, N. D., Ahn, S., & Penfield, R. D. (2012). A Comparison of uniform DIF effect size estimators under the MIMIC and Rasch models. Educational and Psychological Measurement. 73(2), 339-358.
Jodoin, M, G., & Gierl, M. J. (2000). Reducing type I error using an effect size measure with the logistic regression procedure for DIF detection. Paper presented at the Annual Meeting of the National Council on Measurement in Education (New Orleans, LA).
Johanson, G. A., & Osborn, C. J. (2004). Acquiescence as differential person functioning. Assessment & Evaluation in Higher Education. 29(5), 535-548.
Khedr, A. S. Y. (2013). The effects of test anxiety and item format on differential item function and test information function with first grade secondary school students. Egyptian Journal of Psychological Studies. 23(80), 1-25.
Linn, R. L. (1993). The use of differential item functioning statistics: A discussion of current practice and future implications. In P. W. Holland, and H. Wainer (Eds.), Differential item functioning (pp. 349-364). Hillsdale, NJ: Lawrence Erlbaum Associates, Publishers
Maller, S. J. (2001). Differential item functioning in the Wisc-III: item parameters for boys and girls in the national standardization sample. Educational and Psychological Measurement. 61(5), 793-817.
Mantel, N., & Haenszel, W. (1959). Statistical aspects of the analysis of data from retrospective studies of disease. Journal of the National Cancer Institute. 22, 719-748.
McLaughlin, M. E., & Drasgow, F. (1987). Lord's Chi-Square test of item bias with estimated and with known person parameters. Applied Psychological Measurement. 11, 161-173.
McBride, N. L. (2008). Differential item functioning on the international personality item pool's neuroticism scale (Unpulished Doctoral Dissertation). Faculty of the Virginia Polytechnic Institute and State Uiversity.
Mellenbergh, G. J. (1982). Contingency table models for assessing item bias. Journal of Educational Statistics. 7, 105-107.
Narayanan, P., & Swaminthan, H. (1996). Identification of items that show nonuniform DIF. Applied Psychological Measurement. 20(3), 257-274.
Pedrajita, J. Q., & Talisayon, V. M. (2009). Identifying biased test items by differential item functioning analysis using contingency table approaches: A comparative study. Education Quarterly. 67 (1), 21-43.
Penfield, R. D. (2005). DIFAS: Differential item functioning analysis system. Applied Psychological Measurement. 29(2), 150- 151.
Perkins, C. E. (2013). Differential item functioning in the K-SADS using diagnosis of major depressive disorder as a grouping variable (Unpublished Master Thesis). Vanderbilt University. USA.
Prieto, G., & Delgado, A. (2010). Fiabilidad y validez [Reliability and validity].PapelesdelPsicólogo, 31(1), 67-74. Review (Journal), 9(1). (Non-ISI/Non-SCOPUS Cited Publication.
Qi, C. H., & Marley, S. C. (2009). Differential item functioning analysis of the preschool language scale-4 between English-speaking Hspanic and European American children from low-income families. Topics in Early Childhood Special Education. 29(3), 171-180.
Ramsay, J. O. (2000). TESTGRAF: A program for the graphical analysis of multiple-choice test and questionnaire data [Computer program and manual]. Retrieved from http://www.psych.mcgill.ca/faculty/ramsay/ramsay.html
Rogers, H. J., & Swaminathan, H. (1993). A comparison of logistic regression and Mantel-Haenszel procedures for detecting differential item functioning. Applied Psychological Measurement. 17, 105-116.
Roussos, L., & Stout, W. F. (1996). A multidimensionality-based DIF analysis paradigm. Applied Psychological Measurement. 20, 355-371.
Salehi, M., & Tayebi, Z. (2012). Differential item functioning: implications for test validation. Journal of Language Teaching and Research. 3(1), 84-92.
Scott, N. W., & Fayers, P. M., Aaronson, N. K., Bottomley, A., de Graeff, A., Groenvold, M., Gundy, C., Koller, M., Petersen, M. A., Sprangers, M. A., the Eortc Quality of Life Group and the Quality of Life Cross-Cultural Meta-Analysis Group (2010). Differential item functioning (DIF) analyses of health-related quality of life instruments using logistic regression. Health and Quality of Life Outcomes, 8(1), 1-9.
Shealy, R., & Stout, W. F. (1993). A model based standardization approach that separates true bias DIF from group ability differences and detects test bias/DIF as well as item bias/DIF. Psychometrika. 159-194.
Sheppard, R., Han, K., Colarelli, S. M., Dai, G., & King, D. W. (2006): Differential item functioning by sex and race in the Hogan personality inventory. Assessment. 13(4), 442-453.
Sideridis, G., & Tsaousis, I. (2013). DIF analysis for item and test on the NCA tests: The General Ability Test (GAT) Art major. National Center for Assessment in Higher Education. TR035-2013. Ministry of Higher Education. Saudi Arabia.
Sisto, F. F. (2007). Dibujo de la figura humana: Análisis del funcionamiento diferencial de los criterios. Revista Interamericana de sicología/Interamerican Journal of Psychology. 41 (2), 215-220.
Swaminathan, H., & Rogers, H. J. (1990). Detecting differential item functioning using logistic regression procedures. Journal of Educational Measurement. 27, 361-370.
Swander, C. (1999). Assessing the differential item functioning of items and tests of a polytomous employee attitude survey (Unpublished Master Thesis), Faculty of the Virginia Polytechnic Institute and State University.
Teresi, J. (2004): Differential item functioning and health assessment. Columbia University Stroud Center and Faculty of Midicine.
Teresi, J. A., Ocepek-Welikson, K., Kleinman, M., Eimicke, J. P., Crane, P. K., Jones, R. N., Lai, J.-S., Cho, S. W., Hays, R. D., Reeve, B. B., Reise, S. P., Pilkonis, P. A., & Cella, D. (2009). Analysis of differential item functioning in the depression item bank from the patient reported outcome measurement information system: An item response theory approach. Psychology Science Quarterly. 51(2), 148-180.
Thissen, D. (2001). IRTLRDIF v2.b: Software for the computation of the statistics involved in item response theory likelihood-ratio tests for differential item functioning. University of North Carolina at Chapel Hill.
Uiterwijk, H., & Vallen, T. (2005). Linguistic sources of item bias for second-generation immigrants in Dutch tests. Language Testing. 22(2), 211-234.
Van de Vijver, F.J.R. (1994). Item bias: Where psychology and methodology meet. In A. Bouvy, F.J.R. van de Vijver, P Boski, & P. Schmitz (Eds.), Journeys into cross-cultural psychology (pp. 111-126). Lisse, Netherlands: Swets & Zeitlinger.
Van de Vijver, F. J. R., & Leung, K. (1997). Methods and data analysis for cross-cultural research. Thousand Oaks, CA: Sage.
Walker, C. (2011). What's the DIF? Why differential item functioning analyses are an important part of instrument development and validation. Journal of Psychoeducational Assessment. 29(4), 364-376
Walker, C. M., Beretvas, S. N., & Ackerman, T. A. (2001). An examination of conditioning variables used in computer adaptive testing for DIF. Applied Measurement in Education. 14, 3-16.
Wiberg, M. (2007). Measuring and detecting differential item functioning in criterion-referenced licensing test: A theoretic comparison of methods. Umea University.
Williams, S. (2010). Ability to organize questionnaire. University of Brighton publications.
Wu, L.M., & Adams, R., & Wilson, M., & Haldane, S. (2007). ACER ConQuest version 2.0 manual guide, Australian Council for Education Research, Ltd.
Zieky, M. (1993). Practical questions in the use of DIF statistics in test development. In P. W.Holland & H. Wainer (Eds.) Differential item functioning (pp. 337-347). Hillsdale, NJ: Erlbaum.
Zumbo, B. D. (1999). A handbook on the theory and methods of differential item functioning (DIF): logistic regression modeling as a unitary framework for binary and Likert-type (ordinal) item scores. Ottawa ON: directorate of human resources research and evaluation, department of national defense.
Zumbo, B. D., & Thomas, D. R. (1996). A measure of DIF effect size using logistic regression procedures. Paper presented at the National Board of Medical examiners, Philadelphia, PA.
Zwick, R., & Ercikan, K. (1989). Analysis of differential item functioning in the NAEP history assessment. Journal of Educational Measurement. 26, 55-66.