آمار، اطلاعات پردازش شده ای است که از طریق محاسبات ریاضی داده های خام به دست می آید. داده ها ارقام هستند که در جداول و نمودارهای آمار توصیفی ارائه می شوند.
داده های تحقیق شواهدی اند که زیربنای پاسخ به سؤال تحقیق هستند و می توانند برای تأیید یافته ها استفاده شوند. ممکن است داده ها کمی یا کیفی باشند که توسط محققان با روشهای مختلف جمعآوری شدهاند.
تحلیل آماری به معنای بررسی روندها، الگوها و روابط با استفاده از داده ها است.
برای نتیجه گیری معتبر تجزیه و تحلیل آماری، نیاز به مشخص کردن فرضیه ها در شروع فرآیند پژوهش است. سپس پژوهشگر با توجه به جامعه آماری و روش های نمونه گیری و جامعه آماری حجم نمونه را انتخاب و به جمع آوری داده ها بگردازد.
پس از جمع آوری داده های پژوهش، آن ها را با استفاده از آمار توصیفی سازماندهی و به صورت خلاصه در پژوهش باید ارائه داد.
به طور مثال تصویر زیر برای داده های سری زمانی، نمودار میله ای متغیر درآمد دولت ها از فروش نفت کشورهای مختلف را بصورت میانگین نشان می دهد.
در مرحله بعد از نمایش توصیفی از داده های سری زمانی به صورت میانگین، میانه، انحراف معیار، بیشترین مقدار و کمترین مقدار از آزمون های مناسب برای تشخیص مسیر پژوهش و تایید یا رد فرضیه ها باید پرداخت.
به طور مثال برای داده های سری زمانی و داده های ترکیبی از آزمون های مانایی برای تشخیص مدل صحیح باید استفاده کرد.
نمونه گزارش از آزمون مانایی با یافتن آزمون مناسب ریشه واحد (لوین لین چو، دیکی فولر، دیکی فولر تعمیم یافته، فیشر و …) را در تصویر زیر مشاهده می کنید.
در آمار و اقتصادسنجی بعد از مشخص شدن مانایی متغیرها و نوع فرآیند سری زمانی، نحوه مدل سازی داده ها را باید مشخص کرد.
در مدل های آماری و اقتصادسنجی فروض کلاسیک رگرسیون باید برقرار باشند. از فروض کلاسیک به موارد زیر می توان اشاره کرد.
از فروض کلاسیک رگرسیون نرمال بودن میانگین باقی مانده ها است. فرض صفر این آزمون نرمال نبودن باقی مانده ها است. عدم برقراری این فرض منجر به اریبی شدید در ضرایب مستقل می شود. این آزمون با آماره جارک-برا سنجیده می شود.
فرض رگرسیون خطی دیگر به روش حداقل مربعات معمولی اینست که تمامی جملات پسماند دارای واریانس برابر هستند. برای بررسی این فرض آزمون وايت از استفاده شده است.
جملات خطا نباید همبستگی معناداری باهم داشته باشند.در صورت وجود خودهمبستگی ضرایب برآورد شدهی مدل کارا نخواهند بود و منجر به گزارش بالای کاذب ضریب تعیین می شود. این آزمون توسط آماره دوربین واتسون و آزمون خودهمبستگی سریالی براش-گادفری گزارش می شود.