آزمون های ناپارامتری

آزمون‌های ناپارامتری

آزمون های ناپارامتری یکی از ابزارهای کاربردی در تحلیل آماری هستند که در شرایطی استفاده می‌شوند که داده‌ها از توزیع نرمال پیروی نمی‌کنند یا حجم نمونه‌ها کوچک است. برخلاف آزمون‌ های پارامتری که نیاز به فرض‌هایی مانند نرمال بودن توزیع، همگنی واریانس‌ها و اندازه‌گیری‌های فاصله‌ای دارند، آزمون های ناپارامتری بر پایه داده‌های رتبه‌ای یا اسمی طراحی شده‌اند و کمتر تحت تأثیر پیش‌فرض‌های آماری قرار می‌گیرند.

در این صفحه به بررسی دقیق تفاوت آزمون‌ های ناپارامتری و آزمون‌ های پارامتری پرداخته‌ایم و توضیح داده‌ایم که آزمون های ناپارامتری در چه موقعیت‌هایی کاربرد دارند. همچنین، با استفاده از یک جدول مقایسه‌ای، معادل ناپارامتری آزمون‌ های معروف پارامتری مانند t-test، ANOVA، و ضریب همبستگی پیرسون را معرفی کرده‌ایم تا انتخاب روش آماری برای تحلیل داده‌ها آسان‌تر شود. برای مطالعه بیشتر در زمینه اجرای آزمون‌ های پارامتری مربوط به میانگین جامعه، مطالعه‌ی نوشتار آزمون‌ های میانگین، خالی از لطف نیست.

اگر در حال انجام تحلیل آماری پایان‌نامه، پروژه تحقیقاتی یا تحلیل داده‌های غیر نرمال هستید، شناخت درست آزمون های ناپارامتری می‌تواند به شما در رسیدن به نتایج دقیق‌تر و معتبرتر کمک کند. در این محتوا راهنمایی جامع و کاربردی برای استفاده صحیح از آزمون‌ های ناپارامتری ارائه شده است.

آزمون های ناپارامتری شامل آزمون‌ های مانند آزمون من-ویتنی، ویلکاکسون، کروسکال-والیس، فریدمن، آزمون علامت، آزمون کای دو، آزمون مک‌نمار و اسپیرمن هستند که هر کدام معادل ناپارامتری یک آزمون پارامتری خاص در تحلیل آماری محسوب می‌شوند.

به منظور برقراری ارتباط با گروه داده پردازی ایران آمار جهت ثبت سفارش انجام پروژه‌ SPSS از لینک‌های زیر اقدام نمایید.

تاریخچه آزمون‌ های ناپارامتری

آزمون‌ های ناپارامتری به‌عنوان یکی از شاخه‌های کاربردی آمار استنباطی، تاریخچه‌ای نسبتا غنی و قابل توجه دارند. این آزمون‌ها در پاسخ به نیاز پژوهشگران برای تحلیل داده‌هایی توسعه یافتند که پیش‌فرض‌های سخت‌گیرانه آزمون‌ های پارامتری در آن‌ها برقرار نبود.

تاریخ آمار ناپارامتری به اوائل قرن هیجدهم میلادی برمی‌گردد. در سال 1710 میلادی مقاله‌ای با موضوع آمار نوزادان شهر لندن در سال‌های 1629 تا 1710 منتشر شد. و مدعی بودند که مشیت الهی بر این است که تعداد نوزادان پسر بیشتر از نوزادان دختر باشد. در حقیقت این ادعا موضوع یک آزمون ناپارامتری معروف است، که امروزه با عنوان آزمون نشانه شهرت دارد.

با اینحال آمار ناپارامتری بیش از دو قرن ناشناخته بود. در آن زمان، آمار کلاسیک عمدتاً بر توزیع‌های شناخته‌شده مانند توزیع نرمال تکیه داشت. اما در دهه‌های بعد، با گسترش کاربرد آمار در علوم رفتاری، پزشکی، اقتصاد و سایر حوزه‌هایی که با داده‌های غیرنرمال، رتبه‌ای یا کیفی سروکار دارند، محدودیت‌های روش‌های پارامتری بیش از پیش آشکار شد.

یکی از نخستین گام‌های مهم در توسعه آزمون‌ های ناپارامتری، ارائه آزمون نشانه (Sign Test) در اوایل قرن بیستم بود. این آزمون امکان مقایسه زوج‌های داده را بدون نیاز به توزیع خاصی فراهم می‌کرد. سپس در دهه ۱۹۴۰، فرانک ویلکاکسون (Frank Wilcoxon) آزمون‌های قدرتمندتری مانند Wilcoxon Signed-Rank Test و Wilcoxon Rank-Sum Test را معرفی کرد که گامی بزرگ در توسعه این حوزه محسوب می‌شوند.

در همان دوره، آزمون‌ های دیگری نیز مانند Mann–Whitney U (توسعه‌یافته توسط Mann و Whitney) و آزمون فریدمن برای تحلیل طرح‌های آزمایشی با داده‌های رتبه‌ای ارائه شدند. در همین زمان، آزمون کای‌دو (Chi-Square) که ابتدا برای تحلیل فراوانی‌ها در داده‌های طبقه‌ای توسعه یافته بود، جایگاه ویژه‌ای در میان آزمون‌ های ناپارامتری یافت.

دهه‌های پایانی قرن بیستم شاهد رشد چشمگیر علاقه به آزمون‌ های ناپارامتری بود. با افزایش توان محاسباتی و دسترسی به نرم‌افزارهای آماری، اجرای این آزمون‌ها ساده‌تر و سریع‌تر شد. پژوهشگران به مزایای آن‌ها در برخورد با داده‌های ناقص، انحراف از نرمال بودن، و شرایطی با حجم نمونه کم پی بردند.

در دنیای امروز، آزمون‌ های ناپارامتری نه‌تنها به‌عنوان جایگزینی برای روش‌های پارامتری در شرایط خاص، بلکه به‌عنوان ابزارهای اصلی تحلیل داده در بسیاری از پژوهش‌ها شناخته می‌شوند. پیشرفت‌های جدید در حوزه آمار ناپارامتری، همچون روش‌های بوت‌استرپ (Bootstrap) و تکنیک‌های مبتنی بر رتبه، نشان‌دهنده‌ی پویایی و توسعه‌پذیری بالای این شاخه از علم آمار است.

شناخت تاریخچه آزمون‌ های ناپارامتری به ما نشان می‌دهد که این روش‌ها نه صرفا راه‌حل‌هایی موقتی برای فرار از محدودیت‌های آماری، بلکه ابزارهایی علمی، دقیق و پرکاربرد هستند که در بستر زمان به بلوغ رسیده‌اند. آشنایی با سیر تحول آزمون‌ های ناپارامتری می‌تواند به درک بهتر مبانی و فلسفه‌ی استفاده از آن‌ها در تحلیل داده‌ها کمک کند.

انواع آزمون های ناپارامتری درspss

مقایسه آزمون های ناپارامتری و پارامتری

در تحلیل توصیفی داده‌ها و آمار استنباطی، انتخاب نوع آزمون آماری اهمیت بسزایی دارد. به‌طور کلی، آزمون‌های آماری در دو دسته‌ی  آزمون‌ های پارامتری و آزمون‌ های ناپارامتری قرار می‌گیرند. هر یک از این روش‌ها کاربردهای خاص خود را دارند و انتخاب درست بین آن‌ها می‌تواند بر دقت و اعتبار نتایج آماری تاثیر مستقیم بگذارد.

در علم آمار، انتخاب روش مناسب برای تحلیل داده‌ها تا حد زیادی به نوع توزیع جامعه آماری بستگی دارد. زمانی که اطلاعات کافی درباره شکل توزیع داده‌ها (مانند نرمال بودن یا نبودن آن‌ها) وجود داشته باشد، استفاده از روش‌های کلاسیک آماری یا همان آمار پارامتری منطقی‌تر و مؤثرتر است. اما در شرایطی که توزیع جامعه آماری ناشناخته، ناقص یا غیرقابل اعتماد باشد، استفاده از آزمون‌های ناپارامتری توصیه می‌شود.

آزمون های پارامتری چیست؟

در فرآیند استنباط آماری، با معلوم بودن نوع توزیع احتمال متغیر تصادفی استباط آماری انجام می‌گیرد. به بیان دیگر، زمانی که تحلیل‌گر به‌صورت قطعی یا با اطمینان قابل‌قبولی می‌داند داده‌ها از چه نوع توزیعی پیروی می‌کنند، می‌تواند با استفاده از مدل‌های آماری مبتنی بر پارامترهای جامعه، به تخمین، آزمون فرضیه و پیش‌بینی بپردازد. و  بعبارتی برآوریابی بر دانستن نوع توزیع اجرا می‌شود. این شاخه از تحلیل آماری که بر پایه‌ی شناخت توزیع و پارامترهای آن استوار است، آمار پارامتری نامیده می‌شود.

آزمون‌ های پارامتری بخشی از این نوع تحلیل هستند که بر پایه‌ی فرضیات مشخصی درباره‌ی جامعه آماری عمل می‌کنند. مهم‌ترین پیش‌فرض‌ها در این آزمون‌ها شامل نرمال بودن توزیع داده‌ها، همگنی واریانس‌ها بین گروه‌ها و مقیاس سنجش فاصله‌ای یا نسبی است. آزمون‌های پارامتری معمولاً روی پارامترهای خاصی از جامعه، مانند میانگین یا واریانس، متمرکز هستند. این آزمون‌ها زمانی به‌درستی عمل می‌کنند که داده‌ها شرایط آماری لازم را داشته باشند. در غیر این صورت ممکن است نتایج حاصل گمراه‌کننده یا فاقد اعتبار آماری باشند.

از جمله توزیع‌های رایج در آمار پارامتری می‌توان به توزیع های نرمال، t استیودنت، کای‌دو، F فیشر و پواسون (در داده‌های گسسته) اشاره کرد. این توزیع‌ها پایه ریاضی آزمون‌های پارامتری مانند تحلیل واریانس (ANOVA)، آزمون t تک نمونه‌ای و دو نمونه‌ای t-test، آزمون‌های همبستگی پیرسون، رگرسیون خطی و… هستند.

اما در مواردی که این پیش‌فرض‌ها برقرار نباشند، مثلاً داده‌ها توزیع نرمال ندارند یا مقیاس داده‌ها رتبه‌ای است، استفاده از روش‌های پارامتری نه‌تنها توصیه نمی‌شود، بلکه ممکن است نتایج تحلیل را به‌شدت مخدوش کند. در چنین شرایطی، آزمون‌ های ناپارامتری به‌عنوان جایگزینی انعطاف‌پذیر و مقاوم در برابر انحراف از پیش‌فرض‌ها مورد استفاده قرار می‌گیرند.

آزمون های ناپارامتری چیست؟

آزمون های ناپارامتری بر خلاف آزمون‌ های پارامتری، به توزیع خاصی از داده‌ها وابسته نیست و فرضیات سخت‌گیرانه‌ای درباره‌ی پارامترهای جامعه ندارد. این نوع آزمون‌ها معمولا زمانی استفاده می‌شوند که داده‌ها نرمال نیستند،حجم نمونه کوچک، مقیاس داده‌ها اسمی یا رتبه‌ای است. از پرکاربردترین آزمون‌ های ناپارامتری می‌توان به آزمون من‌ویتنی (Mann-Whitney U)، آزمون ویلکاکسون (Wilcoxon)، آزمون کای‌دو (Chi-Square)، آزمون نشانه (Sign Test) و آزمون فریدمن (Friedman) اشاره کرد.

تفاوت کلیدی بین آزمون های ناپارامتری و پارامتری
انتخاب بین آزمون‌ های ناپارامتری و پارامتری باید با در نظر گرفتن ماهیت داده‌ها و هدف تحلیل انجام شود. آزمون های ناپارامتری انعطاف‌پذیرتر است و در شرایطی که پیش‌فرض‌های آماری برقرار نیستند، انتخاب مناسب‌تری محسوب می‌شود. با این حال، اگر شرایط لازم برای آزمون پارامتری برقرار باشد، این نوع آزمون‌ها از قدرت آماری بیشتری برخوردارند و نتایج دقیق‌تری ارائه می‌دهند.

تقاوت آزمون های ناپارامتری و آزمون های پارامتری

آزمون های پارامتری دارای معادل  ناپارامتریک هستند:

معادل های پارامتری آزمون های ناپارامتری

کاربرد آزمون‌ های ناپارامتری در دنیای واقعی

آزمون‌ های ناپارامتری به‌عنوان ابزارهایی انعطاف‌پذیر و مقاوم در برابر نقض پیش‌فرض‌های آماری، نقش مهمی در تحلیل داده‌های پیچیده و نامعمول ایفا می‌کنند. برخلاف آزمون‌ های پارامتری که به نرمال بودن توزیع و ساختار عددی خاصی وابسته‌اند، آزمون های ناپارامتری با آزادی بیشتری نسبت به ویژگی‌های داده، امکان تحلیل آماری را حتی در شرایط دشوار فراهم می‌سازند.

۱. تحقیقات پزشکی و سلامت
در بسیاری از مطالعات پزشکی، داده‌ها از نوع رتبه‌ای یا اسمی هستند. به طور مثال، شدت درد در مقیاس لیکرت یا دسته‌بندی بیماران بر اساس وضعیت سلامت بیماران. در این موارد که پیش‌فرض‌های آزمون‌ های پارامتری برقرار نیستند، آزمون‌ های ناپارامتری مانند آزمون ویلکاکسون یا آزمون کروسکال والیس جایگزین مناسبی برای آزمون t یا ANOVA خواهند بود.

۲. علوم اجتماعی و روانشناسی
پرسش‌نامه‌های رایج در روان‌شناسی، جامعه‌شناسی و مدیریت اغلب داده‌هایی تولید می‌کنند که رتبه‌ای یا کیفی هستند. در این موارد، تحلیل‌گر آماری برای بررسی تفاوت‌ها یا روابط بین گروه‌ها، از آزمون‌ های ناپارامتری مانند آزمون فریدمن یا کای‌دو (Chi-Square) استفاده می‌کند.

۳. اقتصاد و بازار
داده‌های اقتصادی یا مالی ممکن است تحت تأثیر عوامل پرت یا ساختارهای نامعمول توزیعی باشند. در این شرایط که نرمال بودن داده‌ها زیر سوال می‌رود، استفاده از آزمون‌ های ناپارامتری برای تحلیل رفتار بازار یا مقایسه عملکرد شرکت‌ها رویکردی دقیق‌تر و واقع‌بینانه‌تر است.

۴. تحلیل‌های کوچک‌نمونه
زمانی‌که با حجم نمونه‌های محدود سروکار داریم و نمی‌توان به نرمال بودن داده‌ها اعتماد کرد، آزمون‌ های ناپارامتری راه‌حلی مناسب و معتبر محسوب می‌شوند. برای مثال، در پروژه‌های آزمایشی یا پژوهش‌های مقدماتی، آزمون‌ هایی چون Mann–Whitney U یا آزمون نشانه کاربرد زیادی دارند.

بطور کلی آزمون‌ های ناپارامتری نه‌تنها در شرایط خاص و چالش‌برانگیز، بلکه به‌عنوان گزینه‌ای قابل اطمینان در بسیاری از مطالعات علمی و حرفه‌ای مورد استفاده قرار می‌گیرند. آشنایی با این آزمون‌ها و دانستن اینکه در چه زمانی باید از آن‌ها استفاده کرد، یکی از مهارت‌های اساسی برای هر تحلیل‌گر آماری محسوب می‌شود.

آزمون دو جمله‌ای (ساده‌ترین آزمون های ناپارامتری)

یکی از ساده‌ترین و در عین حال کاربردی‌ترین روش‌های آزمون های ناپارامتری، آزمون نسبت یا آزمون دو جمله‌ای (Binomial Test) است. این آزمون زمانی به کار می‌رود که داده‌ها دارای دو حالت متقابل موفقیت یا شکست، بله یا خیر و تأیید یا رد، هستند. همچنین آزمون نسبت در آمار ناپارامتری، با فرضیات محدود و بدون نیاز به پیروی داده‌ها از توزیع نرمال، برای آزمون نسبت موفقیت در برابر یک مقدار فرضی به‌کار می‌رود. از آنجا که این آزمون ساختار ساده‌ای دارد، در حوزه‌هایی چون روان‌شناسی، علوم رفتاری، مطالعات بالینی و تحلیل بازار، یکی از پرکاربردترین روش‌های تحلیل در دسته آزمون های ناپارامتری قرار می‌گیرد.

کاربرد آزمون دوجمله ای (نسبت) در آزمون های ناپارامتری

در آزمون های ناپارامتری آزمون نسبت فرض صفر بیانگر عدم تاثیر متغیر و فرض مقابل بیانگر تاثیر متغیر است. هدف از اجرای آزمون این است که بررسی کنیم آیا نسبت مشاهده‌شده (مثلا تعداد بله‌ها در یک نظرسنجی) با مقدار فرضی تفاوت معناداری دارد یا خیر.

  • بررسی اینکه آیا بیش از نیمی از مشتریان، محصول خاصی را ترجیح می‌دهند.
  • ارزیابی اثربخشی یک درمان در صورتی که خروجی فقط پاسخ مثبت یا منفی باشد.
  • آزمون فرض در مورد میزان رضایت یا نارضایتی کاربران نسبت به یک خدمت مشخص.

از جمله مثال های آزمون دو جمله‌ای است.

مثال کاربردی آزمون های ناپارامتری دو جمله‌ای در SPSS

فرض کنید یک پژوهشگر قصد دارد بررسی کند که آیا نسبت کارکنان باتجربه و کم‌تجربه در یک سازمان برابر است یا خیر. برای انجام این تحلیل، می‌توان از آزمون دو جمله‌ای که یکی از رایج‌ترین آزمون های ناپارامتری است، استفاده کرد. در این روش، داده‌ها باید به صورت دودویی کدگذاری شوند. به عنوان مثال، عدد ۱ برای کارکنان باتجربه و عدد ۰ برای افراد کم‌تجربه در نظر گرفته می‌شود.

برای اجرای این آزمون در SPSS مراحل زیر را طی کنید:

  • بعد از وارد کردن داده‌ها در SPSS و تعریف آن ها در پنجره Variable View (کدگذاری متغیرها)، از منوی Analyze، مسیر  Nonparametric Tests > Legacy Dialogs > Binomial را بروید تا پنجره Binominal Test باز شود.

آزمون های ناپارامتری آزمون نسبت

  • متغیر مورد نظر  را به قسمت  Test Variable List منتقل کنید.
  • در کادر Define Dichotomy روی Cut Point بزنید و عدد 72 را وارد کنید.
  • مقدار نسبت فرضی را در بخش Test Proportion وارد کنید. به‌طور معمول، ۰٫۵ برای فرض تساوی بکار می‌رود.
  • برای اجرای آزمون های ناپارامتری روی گزینه OK کلیک کنید.

آزمون های ناپارامتری آزمون نسبت خروجی

زمانی که از آزمون نسبت در بین آزمون های ناپارامتری استفاده می‌کنیم، خروجی نرم‌افزار SPSS به‌صورت یک جدول نمایش داده می‌شود. این جدول شامل دو گروه مورد مقایسه است و اطلاعاتی نظیر تعداد مشاهدات هر گروه، نسبت مشاهده‌شده در نمونه، نسبت فرضی آزمون و سطح معناداری (Sig.) را نشان می‌دهد.

در این مثال، فرض برابری نسبت کارکنان باتجربه و کم‌تجربه آزمون شده بود. نتایج خروجی نشان داد که مقدار p کمتر از 0.05 بوده، بنابراین فرض صفر رد شده و نتیجه‌گیری شد که نسبت این دو گروه با یکدیگر برابر نیست. همچنین، فراوانی بالاتر کارکنان کم‌تجربه نشان می‌دهد که این گروه درصد بیشتری از جامعه نمونه را تشکیل داده‌اند.

نکته مهم در استفاده از این روش در آزمون های ناپارامتری آن است که اگر متغیر مورد بررسی دارای بیش از دو سطح باشد، دیگر نمی‌توان نسبت آزمون را ۰٫۵ در نظر گرفت. در چنین حالتی، باید نسبت مورد انتظار را با تقسیم عدد 2 به تعداد سطوح موجود محاسبه کرد.

در میان انواع مختلف آزمون های ناپارامتری، آزمون نسبت به‌دلیل سادگی اجرا، دقت بالا در تحلیل داده‌های دودویی، و بی‌نیازی از فرض نرمال بودن، جایگاه ویژه‌ای دارد. این آزمون به‌ویژه زمانی مفید است که با حجم نمونه‌های کوچک یا داده‌هایی مواجه هستیم که توزیع آن‌ها مشخص نیست. در چنین مواردی، آزمون نسبت انتخابی مناسب‌تر نسبت به آزمون‌های Z یا t برای بررسی نسبت‌ها خواهد بود.

آزمون علامت زوج-نمونه‌ای

در میان آزمون های ناپارامتری، از قابل‌ درک‌ترین روش‌ها برای مقایسه داده‌های جفت‌شده، آزمون علامت زوج‌نمونه‌ای یا آزمون نشانه (Sign Test) است. این آزمون زمانی به کار می‌رود که دو مجموعه داده وابسته (مثلاً قبل و بعد از مداخله) وجود داشته باشد و هدف، بررسی این است که آیا تغییری معنادار میان آن‌ها رخ داده یا خیر؛ بدون آن‌که نیاز باشد توزیع داده‌ها نرمال باشد

در آزمون های ناپارامتری، از این آزمون به‌عنوان جایگزینی برای آزمون t زوجی در شرایطی استفاده می‌شود که فرض نرمال بودن داده‌ها برقرار نباشد. بعبارتی از این آزمون برای مقایسه میانه‌ها در داده‌های جفتی یا یک نمونه استفاده می‌شود.

کاربرد آزمون علامت

  • مقایسه‌ی نتایج قبل و بعد از یک آموزش، درمان یا مداخله
  • تحلیل میزان رضایت مشتری قبل و بعد از بهبود یک خدمت
  • ارزیابی تفاوت نمرات در دو وضعیت متفاوت برای یک گروه ثابت

در همه این موارد، آزمون علامت به‌عنوان یکی از روش‌های مهم آزمون های ناپارامتری شناخته می‌شود، چرا که به فرض نرمال بودن توزیع یا برابری واریانس‌ها نیازی ندارد.

مثال کاربردی آزمون های ناپارامتری از نوع آزمون علامت زوج-نمونه‌ای

فرض کنید در یک مطالعه، هدف سنجش معناداری تفاوت بین حقوق اولیه و حقوق فعلی کارکنان است. از آنجا که داده‌های مربوط به حقوق ممکن است دارای توزیع نرمال نباشند، یا حجم نمونه محدود باشد، استفاده از روش‌های پارامتری مانند t-test ممکن است نتایج قابل اعتمادی ارائه ندهد. در چنین موقعیتی، به‌کارگیری یکی از آزمون‌های ناپارامتری مانند آزمون علامت زوج-نمونه‌ای (Sign Test) می‌تواند راه‌حل مناسبی باشد.

در این روش، به‌جای بررسی مقدار دقیق تفاوت‌ها، فقط جهت تفاوت‌ها (افزایش یا کاهش) در هر زوج داده بررسی می‌شود. به این صورت که برای هر کارمند، اختلاف بین حقوق اولیه و حقوق جاری محاسبه شده و مشخص می‌شود که آیا حقوق افزایش یافته، کاهش یافته یا بدون تغییر بوده است. سپس بر اساس تعداد موارد افزایش و کاهش، آزمون انجام می‌شود تا مشخص شود که این تفاوت‌ها از نظر آماری معنادار هستند یا خیر.

برای بررسی این ادعا،

آزمون نشانه آزمون های ناپارامتری

  • از منوی Analyze، روی Nonparametric Tests روی Legacy Dialogs و سپس روی  2Related Samples Test کلیک کنید.
  • متغیرهای مورد نظر را به کادر Test Pairs ببرید.
  • در بخش Test Type، گزینه Sign را فعال نمایید. این گزینه مربوط به اجرای آزمون نشانه است که یکی از مهم‌ترین ابزارهای آزمون‌ های ناپارامتری برای مقایسه‌های زوجی محسوب می‌شود.
  • برای اجرای آزمون روی OK بزنید.

خروجی آزمون نشانه آزمون های ناپارامتری

از آنجا که آزمون نشانه نیاز به هیچ فرضی درباره شکل توزیع داده‌ها ندارد، در رده‌ی اصلی‌ترین آزمون‌ های ناپارامتری قرار می‌گیرد. خروجی این آزمون در SPSS، شامل دو جدول است. در جدول اول تعداد حالت‌های مختلف و در جدول دوم مقدار آماره Z و معنی‌داری ارائه شده است.

تفاوت آزمون نشانه با آزمون نسبت در چارچوب آزمون های ناپارامتری

در حالی‌که آزمون نشانه برای داده‌های جفت‌شده و وابسته استفاده می‌شود، آزمون نسبت یا آزمون دو جمله‌ای برای تحلیل داده‌های دودویی مستقل در یک نمونه به‌کار می‌رود. هر دو آزمون بر پایه توزیع دو جمله‌ای هستند و جزء مهمی از مجموعه آزمون های ناپارامتری به‌شمار می‌روند. تفاوت اصلی در نوع داده و هدف مقایسه است.

آزمون نشانه به‌طور خاص برای داده‌های جفت‌شده و وابسته طراحی شده است. این آزمون زمانی به‌کار می‌رود که می‌خواهیم دو وضعیت برای یک واحد آزمون را با یکدیگر مقایسه کنیم. بطور مثال قبل و بعد از یک مداخله. تمرکز آزمون نشانه بر بررسی این است که آیا در کل، افزایش یا کاهش معنی‌داری در پاسخ‌ها وجود دارد یا خیر. به بیان ساده‌تر، این آزمون به علامت تفاوت (مثبت یا منفی بودن تفاوت) نه مقدار دقیق آن‌ها توجه می‌کند.

در مقابل، آزمون نسبت یا آزمون دو جمله‌ای برای تحلیل نسبت‌های دودویی در یک نمونه مستقل کاربرد دارد. هدف این آزمون، مقایسه فراوانی دو وضعیت گسسته مانند بله یا خیر، تأیید یا رد با یک نسبت نظری است. این آزمون فرض می‌کند که داده‌ها مستقل از یکدیگر هستند و ساختار جفت‌شدگی ندارند.

هر دو آزمون از ابزارهای مهم در آزمون های ناپارامتری هستند و هر کدام برای شرایط آماری خاصی طراحی شده‌اند. آزمون نشانه بیشتر زمانی استفاده می‌شود که با مقادیر جفت‌شده سر و کار داریم و به‌دنبال بررسی جهت تغییر هستیم. در حالی که آزمون نسبت به‌دنبال مقایسه یک نسبت واقعی با یک نسبت فرضی است. انتخاب آزمون مناسب در تحلیل داده‌های ناپارامتری به ساختار داده‌ها، هدف پژوهش، و نوع مقیاس اندازه‌گیری بستگی دارد.

مقایسه آزمون ها ناپارامتری وپارامتری

آزمون مک‌نمار

یکی از کاربردی‌ترین آزمون‌ های ناپارامتری برای تحلیل داده‌های زوجی در مقیاس اسمی دو مقداری، آزمون مک‌نمار (McNemar Test) است. این آزمون زمانی استفاده می‌شود که پژوهشگر بخواهد بررسی کند آیا بین دو وضعیت وابسته از یک متغیر کیفی دو حالته، تفاوت معناداری وجود دارد یا خیر. متغیرهایی که تنها دو حالت دارند، مانند بله یا خیر، موافق یا مخالف و در دو زمان مختلف یا تحت دو شرایط متفاوت اندازه‌گیری شده‌اند، بهترین موارد استفاده برای آزمون مک‌نمار هستند.

در دسته‌بندی آزمون‌ های ناپارامتری، آزمون مک‌نمار یکی از معدود آزمون هایی است که به‌طور خاص برای تحلیل داده‌های اسمی وابسته طراحی شده است. در حالی که بسیاری از آزمون‌ های ناپارامتری برای داده‌های ترتیبی یا پیوسته تعریف می‌شوند، مک‌نمار به تحلیل دقیق تغییر در پاسخ‌های دو حالته می‌پردازد (بررسی تغییرات در داده‌های دوحالتی (قبل و بعد)). این ویژگی، آن را به ابزاری ضروری برای تحلیل‌های پزشکی، علوم اجتماعی، روان‌شناسی و پژوهش‌های مدیریتی تبدیل کرده است.

مثال کاربردی آزمون های ناپارامتری مک‌نمار

فرض کنید در یک مطالعه، هدف بررسی این است که آیا شرکت در یک کارگاه آموزشی باعث تغییر نگرش کارکنان نسبت به استفاده از یک نرم‌افزار جدید شده است. برای این منظور، از کارکنان خواسته می‌شود قبل و بعد از دوره آموزشی به سؤالاتی با پاسخ بله یا خیر پاسخ دهند. از آنجا که پاسخ‌ها در دو زمان مختلف اما از یک فرد جمع‌آوری شده‌اند، داده‌ها زوجی و وابسته هستند. در این حالت، آزمون های ناپارامتری مک‌نمار برای بررسی معناداری تغییر در پاسخ‌ها به کار می‌رود.

  • در این آزمون های ناپارامتری داده‌ها باید از نوع کیفی دو ارزشی زوجی باشند. بعبارتی هر فرد یا واحد مورد بررسی باید دو بار  (قبل و بعد مداخله) سنجیده شود.
  • تحلیل این آزمون های ناپارامتری بر اساس یک جدول توافقی ۲×۲ انجام می‌شود. و تمرکز آن بر روی خانه‌هایی است که ناهمخوانی دارند. به زبان ساده، آزمون مک نمار به جای توجه به مواردی که تغییر نکرده‌اند، بر تعداد تغییرات واقعی در داده‌ها متمرکز است.
  • آماره آزمون آن از توزیع کای دو با یک درجه آزادی پیروی می‌کند.
  • تمرکز این آزمون های ناپارامتری روی مواردی است که پاسخ تغییر کرده باشد، نه آن‌هایی که ثابت مانده‌اند. بعبارتی افرادی که نظرشان تغییر کرده است.
  • در این آزمون های ناپارامتری فرض صفر بر این اساس تعریف می‌شود که تعداد تغییرات از بله به خیر و از خیر به بله به یک اندازه رخ داده‌اند.
  • اگر تفاوت معناداری بین تعداد این تغییرات مشاهده شود، می‌توان نتیجه گرفت که مداخله یا گذر زمان بر پاسخ افراد اثرگذار بوده است.

استفاده از آزمون های ناپارامتری مک‌نمار در شرایطی که داده‌ها وابسته و دو حالته باشند، یکی از راهکارهای دقیق و ساده در مجموعه آزمون‌های ناپارامتری محسوب می‌شود، به‌ویژه زمانی که داده‌ها از توزیع خاصی پیروی نمی‌کنند و روش‌های کلاسیک آماری کاربرد ندارند.

برای تحلیل این داده‌ها در SPSS، می‌توان از آزمون مک‌نمار که جزو آزمون‌ های ناپارامتری محسوب می‌شود استفاده کرد.

  • برای اجرای آزمون های ناپارامتری مک‌نمار در نرم‌افزار SPSS ابتدا باید متغیرهای مورد نظر خود را تعریف کنید. به این منظور وارد بخش Variable View شوید. متغیر اول را با نام Before که نشان‌دهنده وضعیت پاسخ آزمودنی‌ها قبل از مداخله و متغیر دوم را با نام After که وضعیت همان آزمودنی‌ها را بعد از مداخله نشان می‌دهد، نامگذاری کنید. هر دو متغیر از نوع Nominal و در قسمت Values کدگذاری کنید (تعریف متغیرها در SPSS).
  • از منوی Analyze، روی Nonparametric Tests و سپس روی Legacy Dialogs و 2Related Samples Test کلیک کنید.
  • متغیرها را به کادر Test Pairs ببرید.
  • در قسمت Test Type روی آزمون مک‌نمار کلیک کنید و سپس روی OK بزنید.

آزمون مک‌نمار از جمله آزمون های ناپارامتری

خروجی این آزمون ناپارامتری، شامل دو جدول است. در جدول اول، فراوانی ترکیبی دو متغیر و جدول دوم آماره آزمون و معنی‌داری نشان داده می‌شود. اگر مقدار سطح معنی‌داری کمتر از 0.05 باشد، فرض صفر رد می‌شود. این یعنی بین پاسخ‌های قبل و بعد تفاوت وجود دارد. در این مثال، با توجه به معنی‌داری مقدار آزمون مک‌نمار، نتیجه می‌گیریم که کارگاه آموزشی توانسته نگرش افراد نسبت به سرمایه‌گذاری را تغییر دهد.

آزمون کوکران

آزمون کوکران (Cochran’s Q Test) یکی از ابزارهای پرکاربرد در میان آزمون‌ های ناپارامتری است که برای بررسی تفاوت‌های متوالی در داده‌های دوتایی یا دودویی مورد استفاده قرار می‌گیرد. این آزمون به ویژه زمانی کاربرد دارد که محقق بخواهد تغییرات یا اثر مداخله یک متغیر بر روی دو وضعیت وابسته را بررسی کند و داده‌ها فرض توزیع نرمال را رعایت نمی‌کنند. بعبارتی برای مقایسه بیش از دو درمان یا شرایط در داده‌های دوحالتی استفاده می‌شود.

آزمون کوکران تعمیمی از آزمون مک نمار است و به‌طور خاص برای مقایسه زوج‌های مشاهداتی یا داده‌های وابسته در قالب جدول‌های 2×2 طراحی شده است. آماره این آزمون بر اساس تعداد تغییرات متضاد میان دو حالت محاسبه می‌شود و به محقق امکان می‌دهد تعیین کند که آیا تغییر مشاهده‌شده بین دو وضعیت، صرفاً ناشی از تصادف است یا تفاوت معناداری وجود دارد. از نکات مهم در این آزمون می‌توان به حساسیت آن نسبت به نمونه‌های کوچک و نیاز به داده‌های زوجی اشاره کرد.

کاربردهای آزمون کوکران در چارچوب آزمون‌ های ناپارامتری

آزمون کوکران یکی از ابزارهای مهم در میان آزمون‌ های ناپارامتری است و به محققان اجازه می‌دهد تا تغییرات و تفاوت‌های مرتبط با داده‌های دودویی یا زوجی را به‌طور دقیق تحلیل کنند. از کاربردهای اصلی این آزمون می‌توان به موارد زیر اشاره کرد:

  • ارزیابی اثربخشی چند روش درمانی یا آموزشی بر یک گروه ثابت: این آزمون امکان مقایسه چندین روش یا برنامه درمانی، آموزشی بر روی یک گروه یکسان از آزمودنی‌ها را فراهم می‌کند. با استفاده از آزمون کوکران می‌توان تعیین کرد که کدام روش‌ها تاثیر معناداری بر بهبود وضعیت افراد دارند.
  • تحلیل داده‌های پرسشنامه‌ای با پاسخ‌های دودویی: در بسیاری از مطالعات میدانی و پیمایشی، پاسخ‌ها تنها دو گزینه دارند (مثلاً بله، خیر یا موفق، ناموفق). آزمون کوکران در چارچوب آزمون‌ های ناپارامتری قادر است تغییرات پاسخ‌ها در شرایط مختلف را بررسی و تفاوت‌های معنادار را شناسایی کند.
  • مقایسه چند سیاست، محصول یا شرایط مختلف بر روی یک نمونه ثابت: این کاربرد در تحقیقات بازار و مدیریت سازمانی اهمیت دارد. برای مثال، اثرگذاری چند سیاست مدیریتی، محصول یا شرایط کاری متفاوت بر یک گروه یکسان از کارکنان یا مشتریان را می‌توان با آزمون کوکران تحلیل نمود و تعیین کرد که کدام گزینه‌ها تغییرات قابل توجهی ایجاد می‌کنند.

استفاده از آزمون کوکران در چارچوب آزمون‌ های ناپارامتری باعث می‌شود تحلیل‌ها انعطاف‌پذیر و قابل اعتماد باشند، به ویژه زمانی که داده‌ها از توزیع نرمال پیروی نمی‌کنند یا پاسخ‌ها محدود به گزینه‌های دودویی هستند. این ویژگی، آزمون کوکران را به ابزاری حیاتی برای تحلیل داده‌های زوجی و بررسی تغییرات معنادار در مطالعات تجربی و میدانی تبدیل می‌کند.

مثال کاربردی آزمون کوکران در چارچوب آزمون های ناپارامتری

فرض کنید در یک پژوهش، هدف بررسی این است که آیا سه روش تبلیغاتی (A، B و C) تأثیر متفاوتی بر جذب مشتری دارند یا خیر. برای این منظور، گروهی متشکل از ۱۵ مشتری بالقوه مورد بررسی قرار می‌گیرد و از هر فرد پرسیده می‌شود که آیا نسبت به هر یک از روش‌های تبلیغاتی واکنش مثبت نشان می‌دهد یا خیر.

  • برای انجام آزمون های ناپارامتری کوکران در SPSS، ابتدا داده ها را در نرم افزار SPSS تعریف کنید. نوع داده کدگذاری شده را عددی و مقیاس آن را اسمی دودویی (0 و 1) قرار دهید.
  • از منوی Analyze مسیر Nonparametric Tests → Legacy Dialogs → K Related Samples را انتخاب کنید.
  • متغیرها را به کادر Variable Test ببرید.
  • در کادر Test Type روی گزینه CochransQ کلیک کنید و سپس روی OK بزنید.

آزمون ناپارامتری کوکران

خروجی آزمون کوکران در چارچوب آزمون‌ های ناپارامتری شامل دو جدول است. جدول اول، فراوانی متغیرها و جدول دوم به ترتیب تعداد داده های هر متغیر، مقدار آماره کوکران، درجه آزادی و معنی‌داری را نشان می‌دهند.

آزمون من-ویتنی (آزمون U)

آزمون من–ویتنی (که گاهی به آن Wilcoxon rank-sum گفته می‌شود)، یکی از روش‌های آزمون های ناپارامتری برای مقایسه دو گروه مستقل است. هدف اصلی آن بررسی این پرسش است که آیا توزیع مشاهدات در دو گروه یکسان است یا اینکه یکی از گروه‌ها تمایل دارد مقادیر بزرگ‌تری (یا کوچک‌تری) داشته باشد. این آزمون به‌جای مقایسه میانگین‌ها، روی رتبه‌ (ranks) داده‌ها کار می‌کند و برای داده‌های رتبه‌ای یا داده‌هایی که فرض نرمال بودن را نقض می‌کنند بسیار مناسب است.

آزمون من–ویتنی به‌عنوان یکی از پرکاربردترین آزمون های ناپارامتری زمانی مورد استفاده قرار می‌گیرد که شرایط آزمون‌ های میانگین (پارامتری) مانند t-test مستقل برقرار نباشد. به طور مشخص زمانی به کار می‌رود که متغیر وابسته در مقیاس ترتیبی (Ordinal) اندازه‌گیری شده باشد یا فاصله‌ها بین داده‌ها چندان قابل اعتماد نباشند. همچنین در مواقعی که مفروضات آزمون t مستقل، مانند نرمال بودن داده‌ها یا برابری واریانس‌ها، نقض شده باشد. علاوه بر این، برای اجرای صحیح آزمون های ناپارامتری از نوع من-ویتنی باید چند فرض اساسی رعایت شود:

  • مشاهدات دو گروه باید کاملاً مستقل از یکدیگر باشند و هیچ نوع ارتباط یا جفت‌شدگی بین آن‌ها وجود نداشته باشد.
  • داده‌ها باید حداقل ماهیت رتبه‌ای داشته باشند، به این معنا که بتوان هر جفت مشاهده را با هم مقایسه کرد (بزرگ‌تر یا کوچک‌تر بودن).
  • اگر هدف اصلی مقایسه میانه‌ها باشد، لازم است که شکل توزیع دو گروه مشابه باشد. در غیر این صورت، نتیجه آزمون بیشتر نشان‌دهنده تفاوت در میانگین رتبه‌ها خواهد بود و تفسیر آن باید با دقت بیشتری انجام شود.

به طور خلاصه، آزمون من–ویتنی یک ابزار قدرتمند در خانواده آزمون های ناپارامتری است که امکان تحلیل داده‌های غیرنرمال یا رتبه‌ای را فراهم می‌کند و به پژوهشگران اجازه می‌دهد حتی در شرایطی که مفروضات کلاسیک نقض می‌شوند، همچنان نتایج معنادار و قابل اتکا به دست آورند.

آزمون من–ویتنی در مجموعه آزمون های ناپارامتری برای مقایسه دو گروه مستقل استفاده می‌شود. این آزمون به جای مقایسه میانگین‌ها، بر اساس رتبه‌بندی داده‌ها کار می‌کند و به همین دلیل برای داده‌های غیرنرمال یا رتبه‌ای بسیار کاربردی است.

نحوه محاسبه آزمون من-ویتنی در چارچوب آزمون های ناپارامتری

فرض کنید دو گروه A: [5, 7, 9] و B: [2, 4, 8] داریم.

  • تمام مقادیر دو گروه را ترکیب کرده و از کوچک به بزرگ مرتب کنید.
  • به هر مقدار رتبه اختصاص دهید. در صورت وجود مقادیر برابر (ties)، رتبه‌ها به‌صورت میانگین محاسبه می‌شوند.
  • بعد از رتبه‌بندی داده‌ها، مجموع رتبه‌های هر گروه را محاسبه کنید و به‌صورت R1 و R2 بنویسید. گروه A برابر با 13 و گروه B برابر با 8 می‌شود.
  • آماره U برای گروه اول و دوم به ترتیب به شکل زیر محاسبه می‌شود:

آزمون های ناپارامتری - من-ویتنی

  • چون آزمون به‌دنبال حداکثر تفاوت بین دو گروه است. مقدار کوچکتر (Minimum U) بهتر نشان می‌دهد که یک گروه چقدر نسبت به گروه دیگر رتبه‌های بالاتری یا پایین‌تری گرفته است. بنابراین در همه منابع آماری، آماره نهایی آزمون من-ویتنی همان 𝑈=min(𝑈1,𝑈2) در نظر گرفته می‌شود و بر اساس آن مقدار p-value محاسبه می‌گردد.

برای نمونه‌های نسبتاً بزرگ (معمولاً هر کدام ≥ 20)، توزیع آماره U تقریباً نرمال در نظرگرفته می‌شود و می‌توان با استانداردسازی U مقدار z به‌دست آورد.

در صورتی که در داده‌ها مقادیر برابر (ties) وجود داشته باشد، لازم است واریانس آماره آزمون های ناپارامتری به‌صورت ویژه اصلاح شود تا تأثیر این تساوی‌ها در نتایج نهایی لحاظ گردد. این اصلاح باعث می‌شود برآورد آماری دقیق‌تر و واقعی‌تر باشد. خوشبختانه در اغلب نرم‌افزارهای آماری، این فرایند به‌طور خودکار انجام می‌شود و نیازی به محاسبه دستی نیست. این ویژگی یکی از مزایای مهم آزمون های ناپارامتری مانند آزمون من–ویتنی است که تحلیل داده‌های غیرنرمال را ساده‌تر و قابل‌اعتمادتر می‌کند.

اگر مقدار U آزمون های ناپارامتری کوچک یا مقدار z بزرگ و p-value کمتر از سطح معنی‌داری باشد، اختلاف بین دو گروه معنادار است. و مقدار کوچک U (یا مقدار z بزرگ در قدرمطلق و p-value کوچک) نشان‌دهنده اختلاف معنی‌دار بین دو گروه است.

تفسیر دقیق «چه چیزی» اختلاف دارد به پرسش پژوهشی بازمی‌گردد: این آزمون نشان می‌دهد که توزیع‌های دو گروه متفاوتند یا یکی از آن‌ها به‌طور کلی مقادیر بزرگ‌تری نسبت به دیگری دارد، اما لزوماً به‌تنهایی نشانگر فرق میانگین نیست.

در تحلیل نتایج آزمون های ناپارامتری من–ویتنی، علاوه بر مقدار U و سطح معناداری (p-value)، معمولاً اندازه اثر نیز بررسی می‌شود تا شدت تفاوت بین دو گروه مشخص گردد. در خانواده آزمون های ناپارامتری، اندازه اثر را می‌توان به کمک شاخص‌هایی مانند AUC (مساحت زیر منحنی) یا مفهوم احتمال برنده‌شدن (Probability of Superiority) تبیین کرد.

اندازه اثر نشان می‌دهد احتمال آن‌که یک نمونهٔ تصادفی از گروه اول مقدار بزرگ‌تری نسبت به یک نمونهٔ تصادفی از گروه دوم داشته باشد چقدر است. هرچه قدر اندازه اثر به ۱ نزدیک‌تر باشد، تفاوت بین گروه‌ها بیشتر و اندازه اثر قوی‌تر است.

در واقع، آزمون من–ویتنی نه‌تنها مشخص می‌کند که توزیع داده‌ها در دو گروه متفاوت است، بلکه با محاسبه اندازه اثر، میزان برتری یا اختلاف میان آن‌ها را نیز به‌صورت عددی نشان می‌دهد. این ویژگی باعث می‌شود آزمون من–ویتنی یکی از دقیق‌ترین و کاربردی‌ترین آزمون های ناپارامتری در تحلیل داده‌های غیرنرمال باشد.

آزمون t مستقل فرض می‌کند که داده‌ها فاصله‌ای، نرمال و واریانس‌ها قابل قیاس هستند و عملا روی میانگین‌ها تمرکز دارد. در مقابل، آزمون ناپارامتری من-ویتنی به مقایسه رتبه‌ها می‌پردازد و برای داده‌های غیرنرمال، دارای برتری است. با این حال، این دو آزمون پارامتری و ناپارارمتری همواره معادل نیستند. در شرایط خاص (مثلاً توزیع هم‌شکل، اختلاف فقط در میانه) نتایج قابل مقایسه‌اند، اما در غیر این‌صورت پیام هر آزمون متفاوت خواهد بود. لذا قبل از انتخاب آزمون باید هدف (میانگین در مقابل توزیع کلی) و شکل توزیع‌ها را در نظر گرفت.

مثال کاربردی آزمون های ناپارامتری من-ویتنی

فرض کنید در یک پژوهش، هدف بررسی این است که آیا میزان رضایت شغلی بین دو گروه از کارکنان زن و مرد تفاوت معناداری دارد یا خیر. نتایج آزمون نرمال بودن داده‌ها (Shapiro–Wilk) نشان می‌دهد که توزیع متغیر رضایت شغلی نرمال نیست. بنابراین، به جای آزمون t مستقل، از آزمون من–ویتنی که یکی از روش‌های معتبر در میان آزمون‌ های ناپارامتری است، استفاده می‌شود.

  • بعد از وارد کردن داده ها در نرم افزار SPSS، متغیر گروهی جنسیت و متغیر وابسته نمره رضایت شغلی را کدگذاری کنید.
  • از منوی بالای نرم‌افزار مسیر Analyze → Nonparametric Tests → Legacy Dialogs → 2 Independent Samples را انتخاب کنید.
  • در پنجره باز شده، متغیر رضایت شغلی را در بخش Test Variable List و متغیر جنسیت را در بخش Grouping Variable قرار دهید.
  • روی دکمه Define Groups بزنید. گروه 1 را برابر با عدد 1 (مرد) و گروه 2 را برابر با عدد 2 (زن) تعریف کنید.
  • گزینه Mann–Whitney U را تیک بزنید.
  • روی دکمه OK کلیک کنید تا خروجی در پنجره Output نمایش داده شود.

آزمون من ویتنی از جمله آزمون های ناپارامتری

خروجی آزمون های ناپارامتری در نرم افزار SPSS، جدولی به نام Test Statistics است، که شامل مقادیر U آماره آزمون من–ویتنی، Z مقدار نرمال‌سازی‌شده آزمون و Asymp. Sig. (2-tailed) سطح معنی‌داری (p-value) است. اگر مقدار Sig < 0.05 باشد، می‌توان نتیجه گرفت که بین دو گروه تفاوت معناداری وجود دارد. یعنی سطح رضایت شغلی بین زنان و مردان به‌طور معناداری متفاوت است.

آزمون من–ویتنی فقط نشان می‌دهد که توزیع داده‌ها بین دو گروه متفاوت است، اما مشخص نمی‌کند کدام گروه میانگین رتبه بالاتری دارد. برای تفسیر جهت تفاوت، باید به جدول میانگین رتبه‌ای در خروجی SPSS نگاه کنید. گروهی که میانگین رتبه بالاتری دارد، دارای مقدار بیشتری از متغیر مورد بررسی است.

آزمون من–ویتنی ابزاری کارآمد در مجموعه آزمون های ناپارامتری است که امکان مقایسه دقیق بین دو گروه مستقل را بدون نیاز به فرض نرمال بودن داده‌ها فراهم می‌کند. با استفاده از این آزمون در SPSS می‌توانید تحلیل‌های آماری خود را حتی روی داده‌های رتبه‌ای یا غیرنرمال به شکل معتبر و علمی انجام دهید.

آزمون کروسکال-والیس (آزمون H)

در تحلیل‌های آماری، هنگامی که بخواهیم بیش از دو گروه مستقل را مقایسه کنیم و فرضیات پارامتریک همچون نرمال بودن توزیع‌ها یا واریانس‌های برابر برقرار نباشند، از آزمون‌ های ناپارامتری بهره می‌برند. آزمون کروسکال-والیس، که به آن آزمون H نیز گفته می‌شود، یکی از مهم‌ترین و شناخته‌شده‌ترین گزینه‌ها در زمینه آزمون های ناپارامتری است. این آزمون در واقع توسعه‌ای از آزمون من–ویتنی برای حالت بیشتر از دو گروه (k گروه) است.

هدف این آزمون های ناپارامتری این است که بررسی کند آیا میانگین رتبه‌های (rank) گروه‌ها تفاوت معناداری دارد یا خیر. به عبارت دیگر، آیا حداقل یکی از گروه‌ها از نظر موقعیت توزیع متفاوت ظاهر شده است؟

برای آنکه نتیجه آزمون کروسکال-والیس معتبر و قابل استناد باشد، چند فرض اساسی باید رعایت شود:

  • نمونه‌ها مستقل باشند. بعبارتی هیچ مشاهده‌ای در یک گروه نباید با مشاهده‌ای در گروه دیگر وابسته باشد.
  • متغیر کمی وابسته دست‌کم در مقیاس رتبه‌ای (Ordinal) یا در مقیاس فاصله‌ای/نسبت با نقض فرض نرمال بودن باشد.
  • شکل توزیع گروه‌ها مشابه باشد (به ویژه اگر مقایسه بر مبنای میانه‌ها انجام می‌شود)، اگر شکل توزیع‌ها متفاوت باشد، نتیجه آزمون بیشتر بر مقایسه میانگین رتبه‌ها تأکید دارد.
  • حجم نمونه‌ها در گروه‌ها نسبتا کافی باشد (برای تقریب کای‌دو معتبر)، معمولا هر گروه حداقل پنج مشاهده داشته باشد.

محاسبه آزمون کروسکال-والیس مشابه رتبه‌بندی در آزمون من–ویتنی انجام می‌شود، با تفاوت اینکه این بار بیش از دو گروه در کار هستند.

تمام مشاهدات همه گروه‌ها را با هم ترکیب کنید و از کوچک به بزرگ مرتب نمایید. سپس به هر مشاهده یک رتبه (rank) دهید. در صورت تساوی مقادیر (ties)، به رتبه میانگین رتبه‌های ممکن تخصیص می‌دهیم. برای هر گروه، مجموع رتبه‌های آن گروه را محاسبه کنید. این مقادیر را با 𝑅𝑖 نشان دهید که i شاخص گروه iام است. آماره آزمون H به‌صورت زیر محاسبه می‌شود:

آزمون کروسکال والیس از جمله آزمون های ناپارامتری

که در آن N کل تعداد مشاهدات در همه گروه‌ها، k تعداد گروه‌ها، ni تعداد مشاهدات در گروه i است. آماره آزمون دارای توزیع کای دو با k-1 درجه آزادی است.

اگر تساوی (ties) وجود داشته باشد، معمولا ضریب اصلاحی برای H لحاظ می‌شود تا تأثیر تساوی‌ها در محاسبه در نظر گرفته شود.

در این آزمون های ناپارامتری، فرض صفر (H₀) برابر با توزیع مشاهدات در همه گروه‌ها از یک جمعیت (میانه‌ها برابر) و فرض مقابل(H₁) برابر با این است که حداقل یکی از گروه‌ها تفاوت معناداری دارند. اگر مقدار H محاسبه‌شده بزرگتر از مقدار بحرانی جدول کای دو (یا مقدار p کمتر از سطح معنی‌داری مانند 0.05) باشد، فرض صفر رد می‌شود و نتیجه می‌گیریم که حداقل یکی از گروه‌ها با دیگران تفاوت دارد.

آزمون‌های Post-hoc پس از آزمون کروسکال-والیس در آزمون‌ های ناپارامتری

اگر نتیجه آزمون کروسکال-والیس معنادار شود، یعنی بین گروه‌ها تفاوت وجود دارد، این آزمون به‌تنهایی نمی‌گوید کدام گروه‌ها با یکدیگر تفاوت دارند. برای شناسایی دقیق این تفاوت‌ها باید از آزمون‌های Post-hoc استفاده کرد که در چارچوب آزمون‌ های ناپارامتری تعریف می‌شوند.
هدف این مرحله آن است که نتایج دقیق‌تر و علمی‌تر به‌دست آید و از بروز خطا در نتیجه‌گیری جلوگیری شود. در پژوهش‌های دانشگاهی و پایان‌نامه‌ها، معمولاً گزارش نتیجه به این صورت نوشته می‌شود:

نتایج آزمون کروسکال-والیس نشان داد تفاوت معناداری بین گروه‌ها وجود دارد (H=؟, p<0.05). برای شناسایی گروه‌های متفاوت، آزمون‌های پس از آن با روش Dunn و اصلاح بونفرونی انجام شد که نشان داد تفاوت معنادار بین گروه A و گروه C وجود دارد.

در ادامه سه روش متداول Post-hoc را که پس از آزمون های ناپارامتری کروسکال-والیس استفاده می‌شوند، به‌صورت علمی مورد بررسی قرار گرفته است.

مقایسه‌های جفتی با آزمون Mann–Whitney U و اصلاح Bonferroni/Holm

یکی از ساده‌ترین روش‌های Post-hoc در آزمون‌ های ناپارامتری، استفاده از آزمون Mann–Whitney برای مقایسه جفتی بین گروه‌ها است. در این روش، پس از اجرای آزمون های ناپارامتری کروسکال-والیس و مشاهده‌ی نتیجه معنادار، بین هر دو گروه به‌صورت جداگانه آزمون Mann–Whitney انجام می‌شود.

اما چون این مقایسه‌ها چندین بار تکرار می‌شوند، احتمال خطای نوع اول (Type I Error) افزایش می‌یابد. برای جلوگیری از این خطا از روش‌های اصلاحی مانند اصلاح Bonferroni یا اصلاح Holm استفاده می‌شود.

در نرم افزار SPSS، در قسمت Define Groups به ترتیب گروه ها را دوبه‌دو تعیین کنید و مراحل را برای مقایسه همه گروه‌ها تکرار کنید. در اینجا سطح خطا باید اصلاح گردد. به‌عنوان مثال، اگر سه گروه دارید، سه مقایسه جفتی انجام می‌شود و باید مقدار α تقسیم بر 3 شود.

آزمون Dunn’s Test — بهترین روش Post-hoc در آزمون‌ های ناپارامتری

آزمون Dunn یکی از دقیق‌ترین روش‌ها برای انجام مقایسه‌ها پس از آزمون کروسکال-والیس است. این آزمون از رتبه‌های کل داده‌ها استفاده می‌کند و مستقیما با آزمون کروسکال-والیس هم‌راستا است.

در این روش، تفاوت میانگین رتبه‌ها بین گروه‌ها محاسبه و سپس با استفاده از توزیع نرمال استاندارد، آماره z به‌دست می‌آید. در صورت وجود داده‌های تکراری (ties)، واریانس به‌صورت خودکار اصلاح می‌شود.

آزمون Dunn در بسیاری از مطالعات پژوهشی به عنوان روش استاندارد Post-hoc در آزمون‌ های ناپارامتری توصیه می‌شود، زیرا هم از رتبه‌ها استفاده می‌کند و هم کنترل دقیق خطا را ممکن می‌سازد.

برای اجرای این آزمون های ناپارامتری در نرم افزار SPSS، با استفاده از افزونه SPSS Extension Hub، در منوی اصلی SPSS مسیر Extensions → Extension Hub را طی کنید. در نوار جست‌وجو عبارت Dunn Test یا Nonparametric Post Hoc را تایپ کنید. افزونه مربوطه (مثلاً Dunn’s Test for Kruskal–Wallis) را نصب و فعال کنید. پس از نصب، در مسیر زیر گزینه جدیدی اضافه می‌شود:

Analyze → Nonparametric Tests → K Independent Samples → Post Hoc (Dunn)

متغیرها را انتخاب کرده و آزمون را اجرا کنید.

روش Dwass–Steel–Critchlow–Fligner (DSCF)

روش DSCF یکی از پیشرفته‌ترین و دقیق‌ترین روش‌های Post-hoc در آزمون‌ های ناپارامتری است. این روش برای هر جفت گروه مقایسه‌های زوجی را بر اساس بازرتبه‌بندی (re-ranking) انجام می‌دهد.

در نسخه‌های استاندارد SPSS این روش به‌صورت پیش‌فرض وجود ندارد، اما می‌توان آن را از طریق افزونه‌های خاص یا نرم‌افزارهای مکمل مانند Jamovi یا SAS Integration اجرا کرد. در SPSS داده‌ها را آماده کنید و سپس با فرمت .sav ذخیره کنید. فایل را در Jamovi باز کرده و از مسیر زیر بروید:

Analyses → Nonparametric Tests → Kruskal–Wallis → Post Hoc → DSCF

گروه‌ها را انتخاب کنید و نرم‌افزار به‌صورت خودکار مقایسه‌های جفتی را با روش DSCF انجام می‌دهد.

آزمون من-ویتنی که برای مقایسه‌های جفتی ساده و قابل اجرا در SPSS مناسب است و با اصلاح بونفرونی می‌توان خطای آماری را کنترل کرد. آزمون Dunn’s Test که به‌عنوان دقیق‌ترین روش Post-hoc در چارچوب آزمون های ناپارامتری شناخته می‌شود و با اصلاح Holm یا Bonferroni، نتایج قابل اعتماد‌تری ارائه می‌دهد. روش DSCF (Dwass–Steel–Critchlow–Fligner) که برای پژوهش‌های پیشرفته‌تر و داده‌های پیچیده توصیه می‌شود و دقت آماری بالاتری دارد.

در مجموع، آزمون Dunn بهترین توازن میان دقت آماری و سهولت اجرا را در میان آزمون های ناپارامتری Post-hoc ارائه می‌دهد، در حالی که من-ویتنی گزینه‌ای ساده برای پژوهش‌های آموزشی و DSCF گزینه‌ای پیشرفته برای مطالعات حرفه‌ای محسوب می‌شود.

بنابراین، انتخاب روش مناسب Post-hoc در آزمون کروسکال–والیس باید بر اساس نوع داده، هدف پژوهش و سطح تخصص پژوهشگر انجام شود تا نتایج حاصل از آزمون های ناپارامتری از اعتبار علمی بالایی برخوردار باشند.

مثال کاربردی آزمون های ناپارمتری کروسکال-والیس

فرض کنید در یک مطالعه، هدف بررسی این است که آیا بین سه گروه از دانشجویان که با روش‌های آموزشی متفاوتی آموزش دیده‌اند (گروه‌های A، B و C)، از نظر نمره درسی تفاوت معناداری وجود دارد یا خیر. پس از بررسی نرمال بودن داده‌ها مشخص می‌شود که توزیع نمرات نرمال نیست. از این رو، به جای آزمون‌ های پارامتری، از آزمون های ناپارامتری کروسکال–والیس برای مقایسه گروه‌ها استفاده می‌شود.

برای اجرای آزمون کروسکال-والیس در SPSS مراحل زیر را دنبال کنید:

  • داده‌ها را وارد نرم افزار SPSS کنید.
  • از منوی Analyze → Nonparametric Tests → Legacy Dialogs → K Independent Samples را انتخاب کنید.
  • متغیر وابسته (نمره) را در بخش Test Variable List و متغیر گروهی (روش آموزشی) را در Grouping Variable قرار دهید.
  • روی دکمه Define Groups کلیک و بیشترین و کمترین مقادیر گروه‌ها (عدد1 و 3) را تعیین کنید.
  • گزینه Kruskal-Wallis H را فعال کرده و سپس روی OK بزنید.

آزمون های ناپارامتری کروسکال-والیس

خروجی آزمون کروسکال-والیس شامل جدولی به نام Ranks (میانگین رتبه هر گروه) و جدول Test Statistics (با مقدار H، df و Sig) است.

آزمون مبتنی بر ردیف‌ها (آزمون گردش)

آزمون گردش (Runs Test یا Wald–Wolfowitz runs test) یکی از آزمون های ناپارامتری است که برای بررسی تصادفی بودن مشاهدات یا  ترتیب مشاهدات به کار می‌رود. این آزمون نیازی به فرض نرمال بودن توزیع ندارد و بر پایه‌ی ترتیب و علامت داده‌ها عمل می‌کند، به همین دلیل در پژوهش‌های آماری و تحلیل داده‌های تجربی بسیار پرکاربرد است.

واژه‌ی گردش یا Run در آزمون های ناپارامتری به معنی دنباله‌ای از داده‌های مشابه و پشت‌سرهم است. به‌عبارت دیگر، گردش یک بخش پیوسته از داده‌ها است که تمام عناصر آن دارای یک ویژگی مشترک‌اند . مثلا همگی مثبت یا همگی منفی هستند.

هدف اصلی آزمون گردش این است که بررسی کند آیا توالی داده‌ها به‌صورت تصادفی رخ داده است یا خیر. در فرض صفر، داده‌ها تصادفی فرض می‌شوند و انتظار می‌رود تعداد گردش‌ها در محدوده‌ی نرمالی قرار گیرد. اگر تعداد گردش‌ها بیش از حد زیاد باشد، داده‌ها نوسان شدیدی بین حالت‌های مختلف دارند (مثلاً مثبت و منفی) و ممکن است نشانه‌ای از بی‌ثباتی یا رفتار غیرتصادفی باشند. اگر تعداد گردش‌ها خیلی کم باشد، داده‌ها تمایل به تشکیل خوشه‌ها یا روندهای پیوسته دارند، که نشان‌دهنده‌ی نبود تصادفی بودن است.

کاربردهای آزمون گردش در تحلیل داده‌ها

آزمون گردش یکی از ابزارهای مهم در آزمون های ناپارامتری است که در موقعیت‌های مختلف آماری به کار می‌رود، از جمله:

  • بررسی تصادفی بودن یک دنباله: در این حالت، داده‌ها بر اساس میانه یا مقدار مرجع به علامت‌های مثبت و منفی تبدیل می‌شوند. سپس با شمارش تعداد گردش‌ها، مشخص می‌شود آیا ترتیب داده‌ها تصادفی است یا خیر.
  • مقایسهٔ دو نمونهٔ مستقل (آزمون Wald–Wolfowitz): در این کاربرد، داده‌های دو گروه مستقل ترکیب می‌شوند و هر مشاهده بر اساس منبع خود (مثلاً گروه X یا گروه Y) علامت‌گذاری می‌شود. سپس با محاسبه تعداد گردش‌ها بررسی می‌شود که آیا داده‌ها به‌صورت تصادفی در کل مجموعه توزیع شده‌اند یا تفاوت معناداری بین گروه‌ها وجود دارد.
  • ارزیابی تولیدکننده اعداد تصادفی (RNG Test): در علوم داده و شبیه‌سازی، آزمون گردش برای ارزیابی تولیدکننده‌های اعداد تصادفی (Random Number Generators) به کار می‌رود. در این آزمون، توالی‌های دودویی (۰ و ۱) بررسی می‌شوند تا مشخص شود آیا واقعا تصادفی تولید شده‌اند یا خیر.

شرایط اجرا و فرض‌های آزمون های ناپارامتری از نوع گردش

برای اینکه نتایج آزمون گردش معتبر باشد، باید چند شرط آماری رعایت شود:

  1. ترتیب داده‌ها باید بر اساس زمان یا موقعیت مشخص و معنی‌دار باشد.
  2. در حالت دودویی (+/−)، مقادیر مساوی با میانه معمولا از تحلیل حذف می‌شوند یا روش خاصی برای آن‌ها اعمال می‌شود.
  3. برای نمونه‌های بزرگ، توزیع تعداد گردش‌ها تقریبا نرمال است و می‌توان از آماره z برای آزمون استفاده کرد. و برای نمونه‌های کوچک، بهتر است از روش دقیق (Exact Test) یا جدول‌های آماری استاندارد استفاده شود.
  4. آزمون گردش تنها به ترتیب و علامت داده‌ها توجه دارد و فاصله عددی بین مشاهدات را نادیده می‌گیرد. بنابراین در مواردی که بزرگی اختلاف‌ها اهمیت دارد، باید از سایر آزمون های ناپارامتری مانند من-ویتنی یا کروسکال-والیس استفاده کرد.

به‌طور خلاصه، آزمون گردش یکی از ابزارهای ساده ولی قدرتمند در آزمون های ناپارامتری است که برای بررسی الگوهای تصادفی در داده‌ها کاربرد دارد. این آزمون به پژوهشگر کمک می‌کند تشخیص دهد که آیا داده‌ها به‌صورت تصادفی توزیع شده‌اند یا الگویی در ترتیب آن‌ها وجود دارد. کاربرد آن در حوزه‌های مختلف از جمله تحلیل سری‌های زمانی، کنترل کیفیت آماری، شبیه‌سازی و علوم داده بسیار رایج است.

مثال کاربردی آزمون گردش در مجموعه آزمون های ناپارامتری

فرض کنید در یک پژوهش هدف بررسی تصادفی بودن نمرات 20 دانش‌آموز است. برای انجام این آزمون که آیا نمرات واقعا به‌طور تصادفی نوسان دارند یا روند خاصی در آن‌ها دیده می‌شود، از آزمون های ناپارامتری گردش استفاده می‌شود. برای این منظور:

  • ابتدا داده‌ها به ترتیب زمان ثبت نمرات وارد نرم افزار SPSS کنید.
  • از منوی Analyze → Nonparametric Tests → Runs → Runs Test پنجره‌ Run Test را باز کنید.
  • در پنجره‌ی بازشده، متغیر Score (نمره) را به قسمت Test Variable List منتقل کنید.
  • در همین پنجره می‌توانید انتخاب کنید که معیار تعیین علامت‌ها بر اساس چه مقداری باشد:

گزینه‌ی Median (میانه) معمولا به‌صورت پیش‌فرض فعال است. یعنی نرم‌افزار داده‌ها را به دو گروه تقسیم می‌کند. داده‌هایی که بیشتر از میانه هستند علامت مثبت (+) می‌گیرند. داده‌هایی که کمتر از میانه هستند علامت منفی (−) می‌گیرند. سپس تعداد گردش‌ها را در این توالی علامت‌گذاری‌شده محاسبه می‌کند.

  • روی گزینه‌ی OK کلیک کنید تا آزمون اجرا شود.

آزمون گردش از جمله آزمون های ناپارامتری

خروجی آزمون های ناپارامتری گردش شامل 4 جدول است. جدول Test Value (میانه)، مقدار میانه‌ای است که SPSS برای داده‌ها محاسبه کرده است. جدول Number of Runs، تعداد گردش‌های واقعی در داده‌ها را نشان می‌دهد. جدول Z-Value و Significance (Asymp. Sig)، به ترتیب آماره آزمون و سطح معنی‌داری (p-value) هستند.

اگر مقدار Sig > 0.05 باشد، فرض صفر (تصادفی بودن داده‌ها) رد نمی‌شود. یعنی داده‌ها به‌صورت تصادفی توزیع شده‌اند.

اگر مقدار Sig < 0.05 باشد، فرض صفر رد می‌شود. یعنی توالی داده‌ها تصادفی نیست و احتمال وجود الگو یا روند خاص وجود دارد.

آزمون فریدمن

در بسیاری از مطالعات، پژوهشگر با شرایط یا زمان‌های مختلف، نمرات یا مقادیر یک گروه را اندازه‌گیری می‌کند. در چنین موقعیتی، داده‌ها بین شرایط مختلف وابسته (همبسته یا جفت‌شده) هستند و نمی‌توان آن‌ها را مانند داده‌های مستقل تحلیل کرد. اگر تعداد شرایط (یا زمان‌ها) بیشتر از دو باشد، آزمون پارامتری رایج آن ANOVA با اندازه‌های تکراری است. اما اگر داده‌ها نتوانند مفروضات آزمون پارامتری (مانند نرمال بودن خطاها یا همگنی واریانس‌ها) را ارضا کنند، باید به آزمون های ناپارامتری مراجعه کرد.

این آزمون برای مقایسه بیش از دو گروه وابسته استفاده می‌شود و معادل ناپارامتری تحلیل واریانس با اندازه‌های تکراری است. در ادبیات آماری، آزمون فریدمن به‌عنوان تعمیم آزمون نشانه (sign test) برای بیش از دو گروه تلقی شده است. همچنین مقالات در حوزه آزمون های ناپارامتری، آزمون فریدمن را به عنوان جایگزینی برای ANOVA با اندازه‌های تکراری معرفی کرده‌اند.

در ادامه، کلیه ابعاد این آزمون، از مفروضات تا نکات اجرایی، تحلیل نتایج، روش‌های پس‌تست (Post-hoc) و محدودیت‌ها تشریح داده شده است.

کاربردهای آزمون های ناپارامتری فریدمن

آزمون فریدمن از جمله آزمون های ناپارامتری است، که برای مقایسه بیش از دو وضعیت یا شرط روی یک مجموعه بلوک‌های وابسته کاربرد دارد:

به طور معمول، از آزمون های ناپارامتری از نوع فریدمن زمانی استفاده می‌شود که در یک طرح، با بلوک کامل سروکار داشته باشید و هر بلوک (مثلاً هر فرد یا هر نمونه آزمایشی) تحت چند وضعیت متفاوت مورد ارزیابی قرار گیرد. همچنین، هنگامی که با داده‌های وابسته در بیش از دو حالت روبه‌رو هستید. مثلا آزمون های ناپارامتری فریدمن در روان‌شناسی، برای اندازه‌گیری شدت یک واکنش در افراد در سه زمان (پیش‌درمان، میان‌درمان، پس‌درمان)، یا در حوزه پزشکی بالینی برای مقایسه‌ی چند روش درمانی روی یک گروه از بیماران، ابزار مناسبی به شمار می‌رود.

در مواقعی که مفروضات آزمون‌های پارامتری از جمله تحلیل واریانس با اندازه‌های تکراری برقرار نیستند، استفاده از آزمون‌های ناپارامتری مانند آزمون فریدمن توصیه می‌شود. به عنوان مثال، اگر داده‌ها توزیع نرمال نداشته باشند، دارای چولگی یا واریانس‌های نابرابر باشند، یا نقاط پرت در آن‌ها مشاهده شود، آزمون فریدمن می‌تواند به شکلی مقاوم‌تر نتایج قابل اتکایی ارائه دهد.

همچنین، زمانی که داده‌ها به صورت رتبه‌ای یا ترتیبی هستند. مانند مقیاس‌های لیکرت، ارزیابی‌های کیفی یا رتبه‌بندی آزمون های ناپارامتری فریدمن انتخابی ایده‌آل محسوب می‌شود. در این نوع داده‌ها، به جای مقایسه‌ی مقادیر عددی دقیق، مقایسه‌ی رتبه‌ها انجام می‌گیرد و آزمون فریدمن با تبدیل مقادیر به رتبه، امکان تحلیل تفاوت میان شرایط مختلف را فراهم می‌کند.

بطور کلی، اگر تمامی شراطی زیر برقرار باشد، از آزمون های ناپارامتری فریدمن می‌توان استفاده کرد. در غیر اینصورت اگر فقط دو شرط برقرار باشد، از آزمون ویلکاکسون (Wilcoxon signed-rank) و اگر گروه‌ها مستقل باشند، آزمون های ناپارامتری کروسکال–والیس مناسب است. اگر داده‌ها فاقد برخی مشاهدات باشند یا طرح بلوک ناقص باشد، آزمون توسعه‌یافته‌ای مانند Durbin – Skillings–Mack ممکن است مناسب‌تر باشد. شرایط آزمون فریدمن:

  • مشاهدات درون هر بلوک وابسته و بین بلوک‌ها مستقل باشند.
  • اندازه‌گیری‌ها قابلیت رتبه‌بندی دارند یا مفروضات نرمال بودن ANOVA برقرار نیست.
  • طرح کامل باشد (هر بلوک تمامی شرایط را دارد). اگر مقادیر گمشده زیاد باشد یا طرح بلوک ناقص باشد، باید سراغ روش‌هایی مثل Skillings–Mack یا مدل‌های رتبه‌ای دیگر رفت.
  • هدف مقایسه موقعیت مرکزی/رتبه‌ای بین بیش از دو گروه وابسته است.

در آزمون های ناپارامتری فریدمن، فرض صفر برابر با توزیع مقادیر (میل یا موقعیت مرکزی) شرایط مختلف یکسان است. یعنی تفاوت معناداری بین شرایط وجود ندارد. و فرض مقابل برابر با حداقل در یکی از شرایط، توزیع متفاوت است (یا به عبارت دیگر، رتبه میانگین آن شرایط با دیگر شرایط تفاوت دارد). در عمل، اگر p-value حاصل کمتر از سطح معناداری شود، فرض صفر رد می‌شود و نتیجه می‌گیریم حداقل یک جفت از شرایط متفاوت هستند.

اگر مقادیر در یک بلوک برابر باشند، باید رتبه همسان داده شوند، ضریب تصحیح لازم است. اگر تعداد تساوی‌ها زیاد باشد، قدرت آزمون کاهش می‌یابد. آزمون فریدمن نسبت به ANOVA تکراری در هنگامی که مفروضات پارامتری برقرار باشد، قدرت کمتری دارد، ولی در داده‌های غیر نرمال یا با مشاهدات پرت، ممکن است عملکرد بهتری داشته باشد. در مطالعات جدید، روش‌هایی برای بهبود تقریب یا تبدیل فروزان فریدمن مطرح شده‌اند که خطای نوع اول را کمتر کنند.

اگر اندازه نمونه n خیلی کوچک باشد، تقریب خی‌دو ممکن است مناسب نباشد و باید از جدول‌های دقیق استفاده کرد. به‌عنوان راهنما، برای  n<10 یا k>5 احتیاط کنید.

هنگامیکه فرض صفر رد می‌شود، ممکن است بخواهید بدانید کدام جفت شرایط متفاوت‌اند. روش‌های آزمون نمنای (Nemenyi) بر مبنای اختلاف میان رتبه‌های میانگین، روش‌های تصحیح ضرایب (مثلاً Bonferroni یا Holm) در مقایسه‌های دوجمله‌ای، در برخی نرم‌افزارها، گزینه «Multiple comparisons after Friedman» وجود دارد و روش‌های دقیق‌تر و جدیدتر مانند آزمون‌های exact برای مقایسه‌های جفتی رتبه‌ها وجود دارند.

مراحل آزمون های ناپارامتری فریدمن

در ادامه مراحل گام به گام محاسبه آزمون فریدمن ذکر شده است.

فرض کنید در یک مطالعه با n بلوک (مثلاً افراد) و k شرط (مثلا زمان‌ها یا روش‌ها) ماتریس داده‌ها xi1, …, xik به صورت n×k هستند. هر بلوک را از کوچک به بزرگ رتبه بندی می‌کنیم. ماتریس رتبه‌ها به‌صورت rij نشان داده می‌شود. اگر در داخل یک بلوک دو یا چند مقدار برابر باشند (تساوی)، به آن‌ها رتبه همسان داده می‌شود (میانگین رتبه‌های ممکن). مجموع رتبه‌ها در هر ستون (شرط)، میانگین رتبه‌ها و آمار آزمون فریدمن به‌ترتیب به‌صورت

آزمون فریدمن

هستند. اگر داده‌ها دارای تساوی رتبه (ties) باشند، باید یک ضریب تصحیح برای تساوی استفاده شود. در این حالت، معمولاً عبارت زیر به عنوان ضریب تصحیح در مخرج اضافه می‌شود:

آزمون فریدمن تصحیح

مثال کاربردی آزمون های ناپارامتری از نوع فریدمن

فرض کنید در یک مطالعه، هدف بررسی تأثیر سه روش تدریس مختلف (کلاس حضوری، آموزش آنلاین و آموزش ترکیبی) بر میزان یادگیری دانشجویان است. برای این منظور، ۲۰ دانشجو در هر سه روش آموزش شرکت می‌کنند و نمره‌ی عملکرد آن‌ها در هر حالت ثبت می‌شود. از آنجا که تمام دانشجویان در هر سه روش شرکت کرده‌اند، داده‌ها وابسته هستند و نمی‌توان از آزمون‌های پارامتری معمول مانند ANOVA استفاده کرد. در این شرایط، از آزمون فریدمن که یکی از مهم‌ترین آزمون‌ های ناپارامتری برای مقایسه‌ی بیش از دو وضعیت وابسته است، بهره می‌گیریم. برای اجرای آزمون قریدمن در نرم‌افزار SPSS مراحل زیر را دنبال کنید.

  • در پنجره Data View، سه ستون ایجاد کنید، که هر کدام نشان‌دهنده یکی از شرایط یا روش‌های تدریس باشد. بعد از وارد کردن داده‌ها در نرم افزار SPSS، برای انجام آزمون مسیر زیر را دنبال کنید.

Analyze → Nonparametric Tests → Legacy Dialogs → K Related Samples

  • هر سه متغیر را انتخاب کرده و به بخش Test Variables منتقل کنید.
  • تیک گزینه Friedman را فعال کنید (در قسمت Test Type).
  • روی OK کلیک کنید تا آزمون اجرا شود.

آزمون فریدمن در SPSS

خروجی این دستور سامل دو جدول، میانگین رتبه‌ای و آماره آزمون و معنی‌داری است. چون آزمون روی رتبه‌ها انجام می‌شود، نمی‌توان گفت مثلا میانگین واقعی در شرط A بیشتر است، بلکه باید گفت رتبه میانگین شرط A نسبت به دیگر شرایط بالاتر است. بنابراین در تفسیر تحقیق، توجه کنید که این تفاوت بالقوه ممکن است ناشی از اختلاف در موقعیت مرکزی باشد، نه لزوما اندازه دقیق اختلاف.

آزمون‌ های ناپارامتری قادر هستند که داده‌های رتبه‌ای، طبقه‌ای یا غیرنرمال را تحلیل کنند و به پژوهشگران امکان می‌دهند نتیجه‌گیری‌های آماری معتبر داشته باشند. برخی از مهم‌ترین آزمون‌ های ناپارامتری که در تحقیقات کاربرد گسترده دارند عبارتند از:

آزمون رتبه علامت‌دار ویلکاکسون

آزمون ویلکاکسون رتبه علامت‌دار یکی از پرکاربردترین آزمون‌ های ناپارامتری مناسب برای مقایسه داده‌های جفتی وابسته است و زمانی کاربرد دارد که توزیع اختلافات داده‌ها نرمال نباشد. این آزمون تفاوت میانه بین دو حالت یا زمان متفاوت برای یک گروه را بررسی می‌کند. این آزمون جایگزین ناپارامتری آزمون t زوجی است و برای بررسی تفاوت میانه بین دو حالت استفاده می‌شود. به عنوان مثال، می‌توان نمرات قبل و بعد از یک مداخله آموزشی یا درمانی را با استفاده از این آزمون مقایسه کرد.

آزمون رتبه مجموع ویلکاکسون

این آزمون که گاهی با نام آزمون من-ویتنی (Mann–Whitney) نیز شناخته می‌شود، برای مقایسه دو گروه مستقل به کار می‌رود و جایگزین ناپارامتری آزمون t مستقل است. این آزمون زمانی استفاده می‌شود که داده‌ها رتبه‌ای باشند یا نرمال نباشند و امکان مقایسه گروه‌ها بدون فرض‌های پارامتری فراهم می‌کند. به‌طور مثال مقایسه‌ی نمرات رضایت شغلی بین زنان و مردان زمانی که داده‌ها رتبه‌ای باشند، می‌توان از آزمون های ناپاارامتری ویلکاکسون استفاده کرد.

آزمون کندال

آزمون کندال یکی از آزمون‌ های ناپارامتری همبستگی رتبه‌ای است. این آزمون برای سنجش میزان همبستگی و توافق بین رتبه‌ها مورد استفاده قرار می‌گیرد. این آزمون برای داده‌های رتبه‌ای یا زمانی مناسب است که چند ارزیاب یا مشاهده‌کننده رتبه‌های متفاوتی به یک مجموعه داده داده‌اند. این آزمون نسبت به داده‌های پرت مقاوم است و زمانی که حجم نمونه کوچک باشد، عملکرد بهتری نسبت به اسپیرمن دارد. همبستگی بین دو متغیر یا بین رتبه‌های افراد را ارزیابی می‌کند. بطور مثال برای بررسی میزان توافق بین دو داور در ارزیابی کیفیت پروژه‌های پژوهشی، از این آزمون استفاده می‌شود.

آزمون اسپیرمن

ضریب همبستگی اسپیرمن یک روش ناپارامتری برای سنجش رابطه بین دو متغیر رتبه‌ای یا داده‌های عددی غیرنرمال است. این آزمون جایگزین ناپارامتری ضریب همبستگی پیرسون محسوب می‌شود، بطوریکه همبستگی بین دو متغیر رتبه‌ای یا داده‌های عددی غیرنرمال را می‌سنجد. برای مثال برای بررسی رابطه بین میزان رضایت مشتری و زمان پاسخ‌دهی در خدمات آنلاین این آزمون مناسب است.

آزمون کای‌دو

آزمون‌ های ناپارامتری کای‌دو یکی از پرکاربردترین روش‌های آماری برای داده‌های طبقه‌ای هستند. برای بررسی استقلال یا ارتباط بین متغیرهای طبقه‌ای کاربرد دارد و به پژوهشگر کمک می‌کند بررسی کند که آیا رابطه معناداری بین دو متغیر کیفی وجود دارد یا خیر. این آزمون در تحلیل جداول فراوانی و داده‌های دسته‌بندی شده استفاده می‌شود. آزمون های ناپارامتری کای دو شامل چند نوع اصلی است که هرکدام کاربرد و هدف متفاوتی دارند.

آزمون کای‌دو استقلال (Chi-square test of independence): برای بررسی وجود یا عدم وجود رابطه بین دو متغیر کیفی مورد استفاده قرار می‌گیرد.

آزمون کای‌دو برای جداول چنددرجه‌ای (Larger contingency tables): جهت تحلیل جداول چندسطحی با بیش از دو طبقه در هر متغیر از این آزمون استفاده می‌شود.

آزمون فیشر (Fisher’s Exact Test): برای داده‌های دسته‌بندی‌شده با حجم نمونه کوچک و زمانی که مفروضات آزمون کای‌دو نقض شود، مناسب است.

آزمون کای‌دو نیکویی برازش (Chi-square goodness-of-fit): برای مقایسه‌ی توزیع مشاهدات با توزیع مورد انتظار این آزمون به کار می‌رود.

استفاده از آزمون‌ های ناپارامتری به پژوهشگران اجازه می‌دهد بدون نگرانی از نقض فرض‌های کلاسیک، تحلیل‌های آماری دقیق و قابل اعتماد انجام دهند. در صفحات بعدی، هر یک از این آزمون‌ها به تفصیل معرفی شده و روش انجام، کاربردها و مثال‌های عملی آن ارائه می‌شود تا پژوهشگران بتوانند بهترین انتخاب را برای تحلیل داده‌های خود داشته باشند.

جهت سفارش پروژه با نرم افزار SPSS از طریق صفحه‌ی زیر با ما در ارتباط باشید

انجام پروژه SPSS

جهت سفارش پروژه با نرم افزار استتا از طریق صفحه‌ی زیر با ما در ارتباط باشید

انجام پروژه استتا

جهت سفارش پروژه با نرم افزار R از طریق صفحه‌ی زیر با ما در ارتباط باشید

انجام پروژه R

جهت دسترسی به آموزش ایویوز از طریق صفحه‌ی زیر با ما در ارتباط باشید

آموزش ایویوز

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *