در این فرمول x، مقادیر مستقل و y، مقادیر متغیر وابسته و b، a، ضرایبى هستند که از فرمول‌هاى زیر محاسبه مى‌شوند:
(۳-۸)
و
(۳-۹)
b= -a
وقتى این مقادیر محاسبه شد، مى‌توان به x مقادیر مختلف داد و مقدار y را محاسبه کرد و پس از محاسبه مختصات حداقل دو نقطه در دستگاه (یعنى x و y هر یک)، مى‌توان خط رگرسیون را در دستگاه مختصات ترسیم نمود.
آزمون همبستگی پیرسون[۷]
ضریب همبستگی پیرسون که به نام های ضریب همبستگی گشتاوری و یا ضریب همبستگی مرتبه صفر نیز نامیده می‌شود، توسط سرکارل پیرسون معرفی شده است. این ضریب به منظور تعیین میزان رابطه، نوع و جهت رابطه بین دو متغیر فاصله‌ای یا نسبی و یا یک متغیر فاصله‌ای و یک متغیر نسبی به کار برده می‌شود. در واقع این ضریب، متناظر پارامتری ضریب همبستگی اسپیرمن[۸] می‌باشد. چندین روش محاسباتی معادل می‌توان برای محاسبه این ضریب تعریف نمود.
در این تحقیق از فرمول زیر استفاده می‌گردد:
(۳-۱۰)
ضریب همبستگی پیرسون بین ۱- و ۱ تغییر می‌کند. اگر ۱ r =بیانگر رابطه مستقیم کامل بین دو متغیر است؛ رابطه مستقیم یا مثبت به این معناست که اگر یکی از متغیرها افزایش (کاهش) یابد، دیگری نیز افزایش (کاهش) می‌یابد.
۱- r = نیز وجود یک رابطه ی معکوس کامل بین دو متغیر را نشان می‌دهد. رابطه معکوس یا منفی نشان می‌دهد که اگر یک متغیر افزایش یابد متغیردیگر کاهش می‌یابد و بالعکس.
زمانی که ضریب همبستگی برابر صفر است نشان می‌دهد که بین دو متغیر رابطه خطی وجود ندارد. صفر بودن ضریب همبستگی تنها عدم وجود رابطه خطی بین دو متغیر را نشان می‌دهد ولی نمی‌توان مستقل بودن دو متغیر را نیز نتیجه گرفت. هنگامی که ضریب همبستگی پیرسون بین دو متغیر صفر باشد، این متغیرها تنها در صورتی مستقل از یکدیگرند که توزیع متغیرها نرمال باشد. همچنین وجود همبستگی بین دو متغیر تنها نشان دهنده این است که افزایش یا کاهش یک متغیر چه تاثیری بر افزایش یا کاهش متغیر دیگر دارد ولی این همبستگی ضرورتاً نشانگر رابطه علّی بین متغیرها نمی‌باشد. بنابراین باید بین مفاهیم همبستگی و رابطه علّت و معلولی تفاوت قائل شد. به بیان دیگر ممکن است دو متغیر همبستگی داشته باشند ولی لزومی ندارد که یکی از متغیرها علت و دیگری معلول باشد، علاوه بر این عوامل متعدد دیگری نیز می‌توانند بر ضریب همبستگی اثرگذار باشند.
عامل تورم وایانس ([۹]VIF)
عامل تورم واریانس شدت همخطی چندگانه را در تحلیل رگرسیون کمترین مربعات معمولی ارزیابی می‌کند. در واقع یک شاخص معرفی می‌گردد که بیان می‌دارد چه مقدار از تغییرات مربوط به ضرایب برآورد شده بابت همخطی افزایش یافته است. شدت همخطی چندگانه را با بررسی بزرگی مقدار VIF می‌توان تحلیل نمود. به عنوان یک قاعده تجربی، اگر مقدار VIF بزرگنر از ۵ باشد همخطی چندگانه بالا می‌باشد (توجه شود که در برخی موارد عدد ۱۰ نیز به عنوان آستانه معرفی می‌گردد، مانند مونتگمری و پک[۱۰] (۱۹۹۲)).
برای محاسبه این ضریب تنها از متغیرهای مستقل (پیشگو) استفاده می‌گردد. به عنوان مثال اگر ۳ متغیر مستقل وجود داشته باشد و هدف تعیین مقدار VIF مربوط به متغیر اول باشد، معادله رگرسیون متغیر اول برروی دو متغیر دوم، با بهره گرفتن از رویه کمترین مربعات معمولی برازش داده شده و مقدار ضریب تعیین[۱۱] برای این مدل محاسبه می‌گردد. آنگاه مقدار VIF مذکور برابر معکوس نمودن این مقدار بعد از عمل تفاضل‌گیری آن از عدد یک خواهد بود. به همین صورت برای دو متغیر دیگر نیز مقدار این ضریب محاسبه می‌گردد.
در محاسبه VIF:
الف)کمترین مقدار این ضریب مثبت یک و بیشترین مقدار مثبت بینهایت می‌باشد.
ب) درصورت وجود تنها یک متغیر مستقل، مقدار VIF برابر یک می‌باشد.
ج) درصورت وجود دو متغیر مستقل در مدل، مقدار VIF برای هر دو متغیر برابر می‌باشد.
ضریب تعیین
ضریب تعیین قدرت توضیح دهندگی مدل را نشان می‌دهد. ضریب تعیین نشان می‌دهد که چند درصد از تغییرات متغیر وابسته توسط متغیرهای مستقل توضیح داده می‌شود. تغییرات کل متغیر وابسته برابر است با تغییرات توضیح داده شده توسط رگرسیون بعلاوه تغییرات توضیح داده نشده.
با توجه به اینکه:
SST: مجموع توان دوم خطاها زمانی که از متغیرهای مستقل (X ها) استفاده نمی‌کنیم.
SSE: مجموع توان دوم خطاها زمانی که از متغیرهای مستقل (X ها) استفاده می‌کنیم.
(۳-۱۱)
SSR = SST – SSE
SSR را مجموع توان دوم رگرسیون می نامیم و کاهش در مجموع توان دوم خطا‌ها به خاطر استفاده از متغیر های مستقل (x ها) را نشان می‌دهد. هر چه SSR بزرگتر باشد بهتر است و اگر SSR = 0 باشد، رابطه رگرسیونی اصلاً کاربرد نداشته است.
می‌دانیم SSR کاهش تغییر پذیری (خطا) به خاطر استفاده از متغیرهای مستقل است. نسبت این کاهش را با R2 نشان داده و ضریب تعیین می‌نامیم.
R2 = SSR/SST
(۳-۱۲)
بنابراین مقادیری که R2 می‌تواند اختیار کند بین صفر و یک می باشد؛ که:
اگرR2 = ۱ باشد آن گاه SSR=SST یا به عبارتی SSE = 0، یعنی زمانی که از متغیرهای مستقل استفاده می‌کنیم هیچ خطایی وجود ندارد که این بهترین حالت ممکن است.
اگر R2 = ۰ باشد آن گاه SSR=0 یا به عبارتی SSE = SSR یعنی استفاده از متغیرهای مستقل هیچ تاثیری بر برآورد خط رگرسیونی ندارد.
آماره دوربین – واتسن[۱۲]
آماره دوربین-واتسن[۱۳] یک آماره آزمون می‌باشد که برای بررسی وجود خود همبستگی[۱۴] (رابطه بین مقادیر که با تاخیر[۱۵] زمانی مشخص از یکدیگر جدا شده‌اند) بین باقیمانده‌ها در تحلیل رگرسیون استفاده می‌گردد. مقدار این آماره همواره بین ۰ تا ۴ قرار می‌گیرد که آستانه‌های مورد پذیرش آن به صورت زیر است:
مقدار ۲ برای این آماره نشانگر عدم وجود خود همبستگی می‌باشد که حالت مطلوب در فرضیات اصلی مربوط به باقیمانده‌ها در تحلیل رگرسیون می‌باشد. مقدار کمتر از ۲ همبستگی پیاپی مثبت (نوعی همبستگی پیاپی می‌باشد که در آن مقدار باقیمانده مثبت برای یک مشاهده شانس مثبت بودن باقیمانده مشاهده دیگر را افزایش می‌دهد و بالعکس) و مقدار بیشتر از ۲ این آماره همبستگی پیاپی منفی را در بین باقیمانده نشان می‌دهد. لازم به ذکر است مقدار آماره آزمون اگر کمتر از ۱ یا بیشتر از ۳ باشد زنگ هشدار برای وجود خود همبستگی مثبت یا منفی بین باقیمانده می‌باشد. به طور کلی اگر این آماره به صفر نزدیک باشد نشان دهنده همبستگی مثبت و اگر به ۴ نزدیک باشد نشان دهنده همبستگی منفی است و اگر این آماره بین ۵/۱ تا ۵/۲ باشد جای هیچ نگرانی نیست.
اگر همبستگی بین خطاها را با نشان دهیم، در این صورت آماره دوربین واتسون، به کمک رابطه زیر تعیین می‌شود:
(۳-۱۳)
DW= 2(1-)

دانلود متن کامل پایان نامه در سایت jemo.ir موجود است