در این آموزش مفهوم همخطی و نحوهی شناسایی آن و رفع همخطی در ایویوز بیان شده است. عدم وجود همخطی در ایویوز از فروض کلاسیک رگرسیونی نیست اما برقرار بودن این فرض در برآورد و تخمین مدلی کارا، سازگار و بهتر ارائه میدهد. در مواجه با ارور near singular matrix چه کنیم؟ این ارور مشکل همخطی در ایویوز را بیان میکند.
همخطی در ایویوز چیست
همخطی یا چندخطیبودن (Multicollinearity) یکی از مشکلات رایج در مدلهای رگرسیون است که میتواند نتایج تحلیلهای آماری را تحریف کند. در نرمافزار ایویوز (EViews) که بهطور گسترده برای تحلیل سریهای زمانی و مدلهای رگرسیون استفاده میشود، همخطی میتواند به صورت ناپیدا ظاهر شود و تأثیرات منفی بر روی اعتبار نتایج داشته باشد.
همخطی در ایویوز در مدل وابستگی و همبستگی شدید متغیرهای مستقل با هم را بیان میکند. به صورتی که یک ار متغیرهای مستقل رابطهی ریاضی مستقیمی با متغیر مستقل دیگر داشته باشد؛ وقتی متغیرهای مستقل باهم همخطی دارند، اندازهی دترمینان ماتریس مستقل به صفر نزدیک است. این بحث باعث عدم دسترسی به ماتریس معکوس متغیرها و به تبع آن محروم شدن از محاسبهی پارامترهای مدل خواهد شد.
همخطی چیست
همخطی زمانی رخ میدهد که دو یا چند متغیر مستقل در مدل رگرسیون با هم رابطه بسیار نزدیکی داشته باشند. این مشکل میتواند باعث افزایش خطای استاندارد ضرایب رگرسیونی و کاهش دقت نتایج مدل شود.
شناسایی همخطی در ایویوز
برای تشخیص همخطی در ایویوز، میتوان از روشهای مختلفی استفاده کرد. یکی از رایجترین روشها، بررسی ضریب همبستگی (Correlation Coefficient) بین متغیرهای مستقل است. اگر ضریب همبستگی بین دو متغیر بسیار بالا باشد (معمولاً بالای 0.8)، احتمال وقوع همخطی در ایویوز وجود دارد. همچنین میتوان از آزمون VIF (Variance Inflation Factor) برای بررسی دقیقتر همخطی در ایویوز استفاده کرد.
برای این کار از جدول ضرایب همبستگی (این لینک) میتوان استفاده کرد، اما این جداول اختلالهای پیچیدهتر را نمیتوانند تشخیص دهند. به همین منظور از معیار VIF استفاده باید شود. معیار VIF عامل تورم واریانس است. در نرم افزار ایویوز پس از برآورد مدل از مسیر View/Coefficient Diagnostics/Variance Inflation Factors جدولی ظاهر خواهد شد که ستون Centered VIF مقادیر متمرکز عامل تورم واریانس را نشان خواهد داد. این آماره اگر کمتر از 10 باشد همخطی در ایویوز بین متغیرهای مستقل وجود ندارد.
همانطور که در تصویر بالا مشخص است در ستون انتهایی عدد 14.4 و 19.57 بیش نر از 10 هستند و نیاز به رفع همخطی در مدل ضروری است. اگر در مدل تخمین زده شده، ضریب تعیین مدل (R-squared) مقدار عددی بالایی (نزدیک به یک) داشته باشد ولی متغیرهای مدل معنادار نباشند، احتمالا متغیرها دارای همخطی هستند.
رفع همخطی در ایویوز
در تحلیلهای رگرسیون، همخطی در ایویوز یا چندخطیبودن (Multicollinearity) زمانی رخ میدهد که متغیرهای مستقل در مدل رگرسیون بهصورت خطی به یکدیگر وابسته باشند. این مسئله باعث بروز خطا در نتایج مدل میشود و میتواند مانع از درک صحیح تأثیرات متغیرها بر متغیر وابسته شود. نرمافزار ایویوز یکی از پرکاربردترین ابزارها برای تحلیلهای اقتصادی و آماری است و ارائه راهکارهای مناسب برای رفع همخطی در این نرمافزار اهمیت بالایی دارد.
یکی از راهکارهای مؤثر در رفع یا کاهش همخطی، افزایش حجم دادهها است. با افزایش تعداد مشاهدات در تحلیل رگرسیون، تأثیرات همخطی در ایویوز بهطور نسبی کاهش مییابد. این روش بهویژه زمانی مفید است که همخطی ناشی از کمبود دادهها باشد. با اضافه کردن دادههای جدید، الگوهای همبستگی بین متغیرها ممکن است تغییر کرده و به رفع همخطی کمک کند.
دومین اقدام این است که از متغیرهایی که دچار همخطی در ایویوز هستند Log یا Ln یا از دادهها معکوس گرفته شود.
روش بعدی کنار گذاشتن یکی از متغیرهایی است که همخطی با متغیر مستقل دیگر دارد. یکی از سادهترین راهکارها برای رفع همخطی، حذف یک یا چند متغیر مستقل است. زمانی که همخطی بهطور شدید بین دو یا چند متغیر وجود دارد و نتایج تحلیل را بهطور چشمگیری تحت تأثیر قرار میدهد، میتوان یکی از متغیرهایی که بیشترین vif را با سایر متغیرها دارد، حذف کرد.
روش هم تحت عنوان تکنیک رگرسیون مرزی است که در آموزشهای بعدی بیان خواهد شد.
رگرسیون جزئی یکی دیگر از روشهای مؤثر برای حل مشکل همخطی در تحلیلهای رگرسیون است. در این روش، تأثیر متغیرهای مستقل بهصورت جزئی و بر مبنای متغیر وابسته سنجیده میشود. PLS مشابه با تحلیل مولفههای اصلی عمل میکند، اما با این تفاوت که هم به واریانس متغیرهای مستقل و هم به متغیر وابسته توجه میکند. به همین دلیل، در مواردی که همخطی شدید است، استفاده از این روش میتواند نتایج قابلاطمینانتری ارائه دهد.
در مواردی که حذف متغیرها امکانپذیر نیست، ترکیب متغیرها میتواند گزینه مناسبی باشد. اگر چند متغیر مستقل همبستگی بالایی با هم دارند، میتوان آنها را در یک شاخص ترکیبی قرار داد یا از تحلیل مولفههای اصلی (Principal Component Analysis – PCA) استفاده کرد. در این روش، متغیرهای همبسته بهصورت یک مجموعه تبدیل میشوند که تغییرات مشترک آنها را خلاصه میکند. PCA به طور خاص یک ابزار قوی برای کاهش ابعاد دادهها و حذف همخطی است.
رگرسیون ریدج یکی دیگر از روشهای معمول برای رفع همخطی در ایویوز است که با اضافه کردن یک مقدار کوچک به قطر اصلی ماتریس همبستگی، مشکل همخطی را برطرف میکند. این روش با محدود کردن ضرایب رگرسیون به مقدار معینی، مانع از تغییرات شدید در اثر همخطی میشود. رگرسیون ریدج برای مدلهایی که همخطی شدید دارند، نتایج بهتری نسبت به رگرسیون خطی معمولی ارائه میدهد.
نادیده گرفتن همخطی در ایویوز
همخطی یا چندخطیبودن (Multicollinearity) در مدلهای رگرسیونی، یکی از چالشهای رایج است که میتواند باعث کاهش دقت ضرایب و عدم تفسیر درست روابط بین متغیرها شود. با این حال، در برخی مواقع خاص، نادیده گرفتن همخطی در ایویوز (EViews) میتواند راهکاری منطقی و حتی ضروری باشد.
در موارد زیر میتوان اثر همخطی را نادیده گرفت:
1- زمانی که VIF بین متغیرهای کنترلی بالا باشد، نادیده گرفتن همخطی بستگی به شرایط و هدف مدل دارد. به طور کلی، همخطی بین متغیرهای کنترلی میتواند در موارد خاصی نادیده گرفته شود، اما نه همیشه. این مسئله به اهداف تحلیلی، اهمیت متغیرهای کنترلی و تأثیر آنها بر دقت و تفسیر مدل بستگی دارد.
2- زمانی که متغیر موهومی دارای VIF بزرگی باشد.
3- در بسیاری از مدلهای رگرسیونی در ایویوز، تمرکز اصلی بر پیشبینی متغیر وابسته است و تفسیر دقیق ضرایب متغیرهای مستقل اهمیت کمتری دارد. در این شرایط، وجود همخطی ممکن است باعث تغییرات زیاد در ضرایب رگرسیونی شود، اما به شرطی که دقت پیشبینی کاهش نیابد، همخطی میتواند نادیده گرفته شود. به عبارت دیگر، اگر پیشبینی مدل به طور کلی درست باشد، همخطی مشکلی ایجاد نخواهد کرد. در مدلهایی که برای پیشبینی قیمت سهام یا نرخ بهره استفاده میشوند، دقت پیشبینی اهمیت بیشتری نسبت به تفسیر دقیق روابط بین متغیرهای مستقل دارد.
4- اگر تمام نتایج مدل بدون اشکال باشد.
5- در برخی تحلیلهای اقتصادی و مالی، همه متغیرهای مستقل انتخاب شده در مدل ضروری هستند و حذف یا ترکیب آنها میتواند به کاهش کیفیت مدل منجر شود. در این موارد، با وجود همخطی، این متغیرها باید در مدل باقی بمانند زیرا بهطور تئوریک و تجربی اهمیت دارند. در این شرایط، ممکن است همخطی نادیده گرفته شود. اگر در یک مدل رگرسیونی به بررسی تأثیر همزمان تحصیلات، تجربه کاری، و سن بر درآمد خانوار پرداخته شود، این متغیرها ممکن است همبستگی بالایی با یکدیگر داشته باشند، اما حذف هر کدام از آنها منجر به کاهش ارزش تبیین مدل میشود.
همخطی در تحلیل رگرسیونی یک مشکل جدی است که میتواند منجر به نتایج نادرست شود. در ایویوز، با استفاده از روشهای تشخیصی مانند ضریب همبستگی و VIF میتوان همخطی را شناسایی و سپس با استفاده از روشهای مناسب آن را برطرف کرد.
با درک کامل مفهوم همخطی و ابزارهای ایویوز، میتوان از بروز این مشکل جلوگیری کرد و نتایج آماری دقیقتری به دست آورد.
برای انجام پژوهش با نرم افزار ایویوز از لینک زیر اقدام نمایید.
جهت سفارش پروژه با نرم افزار ایویوز از طریق صفحهی زیر با ما در ارتباط باشید
جهت سفارش پروژه با نرم افزار استتا از طریق صفحهی زیر با ما در ارتباط باشید
جهت سفارش پروژه با نرم افزار R از طریق صفحهی زیر با ما در ارتباط باشید
سلام
واقعا عالی هستید
من تقریبا صفرتا صد ایویز را ازاین سایت یاد گرفتم.
سلام برای داده های ترکیبی هم از همین روش باید همخطی را بررسی کرد؟
سلام از روش VIF میتونید استفاده کنید