آکادمیا کافه
راهنما و آموزش نرم افزار SPSS - نسخه قابل چاپ

+- آکادمیا کافه (https://www.academiacafe.com/pf)
+-- انجمن: نرم‌افزارها (https://www.academiacafe.com/pf/Forum-%D9%86%D8%B1%D9%85%E2%80%8C%D8%A7%D9%81%D8%B2%D8%A7%D8%B1%D9%87%D8%A7)
+--- انجمن: راهنمای نرم‌افزارهای تخصصی (https://www.academiacafe.com/pf/Forum-%D8%B1%D8%A7%D9%87%D9%86%D9%85%D8%A7%DB%8C-%D9%86%D8%B1%D9%85%E2%80%8C%D8%A7%D9%81%D8%B2%D8%A7%D8%B1%D9%87%D8%A7%DB%8C-%D8%AA%D8%AE%D8%B5%D8%B5%DB%8C)
+--- موضوع: راهنما و آموزش نرم افزار SPSS (/Thread-%D8%B1%D8%A7%D9%87%D9%86%D9%85%D8%A7-%D9%88-%D8%A2%D9%85%D9%88%D8%B2%D8%B4-%D9%86%D8%B1%D9%85-%D8%A7%D9%81%D8%B2%D8%A7%D8%B1-SPSS)

صفحات 1 2 3 4 5 6 7 8 9 10 11 12 13 14


راهنما و آموزش نرم افزار SPSS - Nasim67 - 03-03-2012

در این تاپیک نرم افزار آماری SPSS که مخفف Statistical Package for Social Sciences می باشد و به دلیل امکانات نسبتا کامل و ساده بودن،به یکی از پرکاربردترین نرم افزارهای آماری تبدیل شده است،توضیح داده می شود.

از همه شما عزیزان تقاضا می شود در صورتیکه کتاب یا لینک مناسبی برای آموزش این نرم افزار سراغ دارید،آن ها را در این تاپیک با سایرین به اشتراک بگذارید.

با تشکر


RE: معرفی SPSS - Nasim67 - 03-03-2012

یکی از کتاب های معروف آموزشی در این زمینه،کتاب " تحلیل های آماری با استفاده از SPSS " نوشته: " دکتر منصور مومنی و علی فعال قیومی " می باشد که به همراه یک سی دی از آخرین ورژن این نرم افزار است.
در این کتاب در حین آموزش مثال هایی هم آورده شده ولی حسن آن وجود فصل دوازدهم کتاب است که سه پروژه کاربردی در زمینه مالی،حسابداری و مدیریت دولتی ارائه نموده است.



RE: راهنمای نرم افزار SPSS - Nasim67 - 07-03-2012


توجه توجه!!
در اینجا میتونید از برنامه ی آموزشی SPSS ارائه شده در دپارتمان ریاضیات Central Michigan University استفاده کنید.

از دستش ندید!!چون کاملا با شیوه های نوین آموزشی منطبق است و برای آموزش هر مفهوم کلیپ هایی قرار داده،همچنین دارای مجموعه پروژه ها و داده هایی برای تمرین است.

موفق باشید



RE: راهنمای نرم افزار SPSS - Nasim67 - 20-05-2012

در کنار کتاب دکتر منصور مومنی که در پست شماره 2 معرفی شد، کتاب "کاربرد آمار و نرم افزار SPSS در تحلیل داده ها" از آقای "احمد غیاثوند" نیز پیشنهاد می شود.
این دو کتاب در کنار هم بسیار مفید خواهند بود.حتما هردو را مطالعه نمایید.


RE: راهنمای نرم افزار SPSS - MaMi - 21-06-2012

انتخاب مناسب آزمون آماری در SPSS

یکی از مهم ترین سوالاتی که در انجام پژوهش های آماری مطرح می شود انتخاب مناسب روش تحلیل آماری در تحقیقات میدانی است. معمولا نوع آزمون های آماری از فاکتورهای ویژگیهای نمونه، انواع داده ها و همچنین نوع تحلیلی که مورد نیاز آمارگر است، مشخص می شود. این تحلیل ها به دوبخش عمده ی آمار ناپارامتری و پارامتری بر می گردد. در تحقیقات میدانی، حجم زیادی از داده های آماری به عنوان نمونه گردآوری می شود که از طریق آنها می توان به سوالات و فرضیه های تحقیق پاسخ داد. سوالات تحقیق بایستی براساس اهداف تحقیق (هدف کلی و جزیی) طراحی شوند تا نتیجه ی تجزیه و تحلیل آنها، بیانگر واقعی هدف تحقیق باشد. معمولا اگر محقق بدون به کار بردن آمار به تحلیل داده ها بپردازد نتیجه آن واقعی نخواهد بود و محقق به مشکل برخواهد خورد. لذا دانستن آمار و نکات ریز آماری از ضروریات فرایند تحقیق و پژوهش است.
استنباط آماری در واقع یک نوع نتیجه گیری کلی از جز به کل است و با آزمایش و خطا همراه است. یک جنبه از استنباط آماری محاسبه برآوردهایی از پارامترهای جامعه است مثل میانگین یا واریانس جامعه از طریق آماره های نمونه مانند میانگین یا واریانس نمونه.
در آمار استنباطی روش های گوناگونی برای تجزیه و تحلیل داده های آماری وجود دارد که هر یک برای نوع خاصی از داده ها و همین طور نوع خاصی از سوالات مورد استفاده قرار می گیرند.

برخی از پژوهش گرها انتخاب یک آزمون آماری را وابسته به موارد زیر می دانند:
1- نقشه یا طرح تحقیق
2- هدف تحقیق
3- طبیعت داده ها (تعداد متغیرها، کمی یا کیفی، پیوسته یا گسسته)
4- ویژگی های نمونه (تعداد گروه های مورد بررسی، نرمال بودن یا نبودن جامعه)
5- نوع استنباط مورد نیاز (توصیف جامعه، مقایسه اختلاف دو یا چند گروه، سنجش رابطه بین دو یا چند متغیر)

به طور کلی هدف هر آزمون آماری تعیین این مطلب است که آیا داده های نمونه، دلایل کافی برای رد یک فرضیه یا حدس آماری در مورد جامعه ارائه می دهد یا خیر؟ بهتر است قبل از انتخاب یک آزمون آماری بتوانیم به سوالات زیر پاسخ دهیم:
• فرضیه تحقیق چیست؟
• نوع داده ها چیست؟
• توزیع ویژگی مورد بررسی در جامعه نرمال است یا خیر؟
• چه تعداد متغیر بررسی می شوند؟
• چند گروه مقایسه می شوند؟
• گروه های مورد بررسی مستقلند یا خیر؟

در حالت کلی قبل از هر چیز باید به نرمالیتی توزیع متغیر بپردازیم؛ به طور کلی اگر توزیع متغیر نرمال باشد از آزمون های t و یا آنالیز واریانس و در صورت نرمال نبودن توزیع متغیر از آزمون های ناپارانتری استفاده می شود. در نمودارهای زیر نحوه ی انتخاب آزمون ها را به ترتیب برای یک و دو و بیشتر از دو متغیر را رسم کرده ایم.

[عکس: 16111592471027573835_thumb.jpg]
[عکس: 24402343861616697484_thumb.jpg]
[عکس: 17341742101137544312_thumb.jpg]

باید توجه کرد زمانی که پای دو یا بیش از دو متغیر در میان است علاوه بر روابط میان خود داده ها؛ رابطه ی میان هر دو متغیر نیز مهم است. اینکه جنس دو متغیر چه باشد؟ میان آنها همبستگی وجود دارد یا خیر؟ سوالاتی هستند که باید از خود قبل از انتخاب آزمون ها پرسید. همانطور که در نمودار 2 نشان دادیم، برای بررسی رابطه ی بین دو متغیر وقتی هر دو متغیر پیوسته باشند از آزمون ضریب همبستگی برای بررسی رابطه بین آنها استفاده می کنیم و چنانچه یکی از متغیرها پیوسته و دیگری گسسته باشد از آنالیز واریانس و در حالتی که هر دو متغیر کیفی باشند از آزمون کای دو کمک می گیریم. همینطور در نمودار 3 به راحتی می توان دریافت در صورتی که متغیرها برای یک گروه به کار برده شوند از تحلیل عاملی یا آنالیز واریانس با اندازه های مکرر و یا رگرسیون چندگانه استفاده می شود. از تحلیل ممیزی و آنالیز واریانس چندگانه نیز برای بررسی بیش از دو گروه استفاده می شود.

در اینجا به بسیاری از سوالاتی که مطرح می شوند پاسخ می دهیم:
بسیاری از آزمون های آماری بر فرض نرمالیتی جامعه استوارند آزمون هایی که با این جامعه ها سر و کار دارند آزمون های پارامتری هستند مانند آزمون t، و در مقابل آزمون های ناپارامتری دیگر فرض نرمالیتی را ندارند مانند آزمون های رتبه ای از قبیل آزمون من-ویتنی، یا کروسکال والیس.

برخی مواقع به راحتی می توان بر اساس نرمال بودن یا نبودن توزیع متغیرها گفت که کدام نوع از آزمون های پارامتری یا ناپارامتری را به کار گیریم. اگر متغیر مورد بررسی رتبه ای باشد مثل رتبه بندی رضایت کارمندان(کم- متوسط- زیاد) آن گاه توزیع نرمال ندارد لذا از آزمونهای ناپارامتری بهره می گیریم.
اما نمی توان گفت که وقتی داده ها کمی هم باشند حتما از آزمونهای پارامتری استفاده می کنیم. در مواردی پیش می اید که داده ها کمی بوده اما تعدادشان اندک است در این مواقع، آزمون کولموگروف-اسمیرنف هم نمی تواند نرمال بودن داده ها را تعیین کند چرا که برای داده هایی با حجم بزرگتر کاراست. لذا تشخیص اینکه این داده ها نرمال هستند یا خیر بسیار مشکل است در این مواقع برخی از آماردانان از آزمون های پارامتری استفاده کرده و ادعا دارند که در نرمال بودن داده ها مشکلی ایجاد نمی شود. اما برخی دیگر آزمون های ناپارامتری را به کار می برند.

جدول زیر می تواند شما را در انتخاب آزمون مناسب استقلال یاری کند...

[عکس: 66747956300694987313_thumb.jpg]

جدول زیر نیز شما را در انتخاب آزمون های آماری مناسب در همبستگی آنها یاری می کند. نوع ضریب همبستگی؛ بسته به نوع متغیر ها تعیین می شود.

[عکس: 13364829068475067659_thumb.jpg]




RE: راهنمای نرم افزار SPSS - MaMi - 22-06-2012

رگرسیون خطی با روش بوت استراپ (Bootstrap)

به دو صورت می توان رگرسیون خطی را در SPSS انجام داد. به آدرس زیر بروید:

Analyze > Regression > Linear

[عکس: 26981291115012968669_thumb.jpg]

در کادر محاوره زیر باید؛
• متغیر مستقل خود را انتخاب کنید (xvar)
• متغیر وابسته را مشخص کنید (yvar)
سپس یک خروجی خوب از جداول دریافت کنید.

[عکس: 89552469199605890122_thumb.jpg]

معادله های رگرسیونی شما در اولین ستون از اعداد، در زیر جدولی با عنوان coefficients موجودند. همچنین می توانید R و R^2 را در خلاصه خروجی هایتان(model summary) ببینید.

رگرسیون خطی با روش بوت استراپ (Bootstrap) در SPSS:
از راه دیگری نیز می توان رگرسیون خطی را انجام داد. به آدرس زیر بروید:
Analyze > Regression > Non-linear

[عکس: 14170627234696213980_thumb.jpg]
تعجب نکنید؛ بله از رگرسیون غیر خطی هم شما می توانید رگرسیون خطی را انجام دهید. در این قسمت شما باید؛
• متغیر وابسته خود را پیدا کنید (yvar)
• مدل رگرسیونی خود را در قسمت model expression توصیف کنید؛ به این صورت

Constant(ثابت)+ xvar(متغیر مستقل)*slope(شیب)

• در زیر پارامترها مشخص کنید کدام یک مقادیر شما "ثابت" و کدام "شیب" هستند.

[عکس: 06183149447416904457_thumb.jpg]

• برای انجام شبیه سازی bootstrap به گزینه options بروید و در آن گزینه Bootstrap estimates of standard error را فعال کنید. به طور پیش فرض SPSS در قسمت Sequential Quadratic Programming مقادیری را در نظر گرفته است. می توانید با سلیقه خود این مقادیر را تغییر دهید اما مقادیر خود پیش فرض به خوبی می تواند مدل را برازش دهد.
[عکس: 70116924355140093751_thumb.jpg]

حال باید در قسمت parameters منوی use starting values from previous analysis را فعال کنید تا گزبنه OK در کادر محاوره nonlinear regression فعال شود. این بار خروجی شامل تمام متن ها است. معادله رگرسیونی شما دو بار داده خواهد شد (که یکسان خواهند بود) با حد اطمینانی که پارامتری اندازه گیری شده در بخش بالایی، و بوت استراپ در بخش پایین تخمین زده می شود. R^2 را می توانید در بالای معادله رگرسیون بالایی در خروجی ببینید.



RE: راهنمای نرم افزار SPSS - MaMi - 23-06-2012

محاسبه تابع چند جمله ای در نرم افزار SPSS

در برخی موقعیت های پژوهشی محقق با یک متغیر وابسته گسسته مواجه است. برای پیش بینی ابعاد آن بهتر است از یک روش لجیت چند جمله ای استفاده نماید. مثلا محققی می خواهد بداند چه متغیر هایی بر انتخاب برند های یک دوربین دیجیتال اثر گذار هستند. به منظور محاسبه Multinomial Logistic Regression در این نرم افزار بهتر است از روش برنامه نویسی استفاده نمایید.
در مثالی که می خواهیم با SPSS حل کنیم شامل735 نفر از افرادی که در انتخاب سه برند شرکت داشته اند را مورد توجه قرار داده ایم. متغیر های سن و جنسیت را نیز برای هر یک از این افراد در فایل داده داریم. هدف در اینجا این است که مشخص کنیم کدامیک از متغیر های سن و جنسیت در تفکیک ابعاد این سه برند از یکدیگر مهم هستند. با استفاده از دستور آمار توصیفی می توانیم وضعیت انتخاب در هر یک از سطوح این برند ها را مشخص کنیم.

[عکس: 13910119483229435300_thumb.jpg]
نتایج نشان می دهد در این نمونه 207 نفر برند اول، 307 نفر برند دوم و 221 نفر مشتری برند سوم هستند. حال باید دستور زیر را وارد کنیم.
sort cases by brand
temporary
split file by brand
descriptive var = age female
split file off

[عکس: 58661422564328699178_thumb.jpg]
نتایج آماره های توصیفی در ارتباط با هر یک از سطوح در جدول فوق آمده است. با نگاهی مشخص می شود که این تحلیل به تحلیل تشخیصی که یک تکنیک چند متغیره است قرابت دارد. این روش نسبت به تحلیل تشخیصی به لحاظ محدود نبودن به روش های اندازه گیری کمّی، منعطف تر است. برای محاسبه این رگرسیون باید دستور زیر را وارد کنیم.
nomreg brand (base = first) with female age
print = lrt cps mfi parameter summary
خروجی نرم افزار SPSS به شرح زیر خواهد بود؛

[عکس: 36521916145836612229_thumb.jpg]
[عکس: 08645599465069653207_thumb.jpg]
در این روش، برند اول به عنوان گروه مرجع تعیین می شود. به عنوان مثال مشخص می شود که یک واحد تغییر در متغیر سن سبب افزایش نسبت 368/0 در لگاریتم برند دو به یک می شود و این مقدار برای برند سه به یک 686/0 محاسبه شده است. لذا مشخص می شود با افزایش سن شانس انتخاب برند های دو و سه نسبت به برند اول بیشتر می شود. این مقادیر به خودی خود تفسیر نمی شوند و باید مقادیر اکسپوننشیال را که با نماد Exp(B) نشان داده می شود را تفسیر نمود. برای مقدار اول 45/1 محاسبه شده است. یعنی افراد مسن تر نسبت به جوان تر ها 5/1 برابر برند دوم را نسبت به برند اول بیشتر انتخاب می کنند. نتایج نشان می دهد در تفکیک سطوح برند های اول به دوم و دوم به سوم هر دو متغیر سن و جنسیت تاثیر گذار هستند زیرا هر دو سطح دارای sig زیر 05/0 هستند.همچنین نتایج نشان می دهد زنان نسبت به مردان بیشتر برند های دوم و سوم را انتخاب می کنند.
در کاربرد این روش باید دقت شود که حجم نمونه باید بالا بوده این روش دارای شاخص های فیت مناسبی نبوده و مقادیر ضرایب تعیین آن چندان کارا نیستند. لیکن به طور کلی این روش شناسی از دقت مطلوبی در تفکیک سطوح متغیر وابسته برخور دار است. در این مقاله عمدتا نحوه محاسبه این روش در SPSS مورد توجه بوده و برای مفاهیم پایه آن باید به کتاب های مرجع مانند Agresti مراجعه نمود.



RE: راهنمای نرم افزار SPSS - MaMi - 28-06-2012

آموزش نحوه محاسبه مدل رگرسیون لجستیک Binomial logistic regression در نرم‌افزار SPSS

در بسیاری از پژوهش ها متغیر وابسته مورد مطالعه ماهیتا یک متغیر گسسته است که برای برآورد رخداد هر یک از سطوح نیازمند استفاده از رگرسیون های کیفی هستیم. رگرسیون های با متغیر وابسته گسسته دارای انواع مختلفی هستند که با توجه به ماهیت متغیر وابسته تعیین می شوند. اگر متغیر وابسته دو بعدی (dichotomous) باشد رگرسیون لجستیک Binomial (or binary) logistic regression برای بیان پیش بینی استفاده می شود.

منظور از دو وجهی بودن، رخ داد یک واقعه تصادفی در دو موقعیت ممکنه است. به عنوان مثال خرید یا عدم خرید، ثبت نام یا عدم ثبت نام، ورشکسته شدن یا ورشکسته نشدن و ... متغیر هایی هستند که فقط دارای دو موقعیت هستند و مجموع احتمال هر یک آنها در نهایت یک خواهد شد. کاربرد این روش عمدتا در ابتدای ظهور در مورد کاربرد های پزشکی برای احتمال وقوع یک بیماری مورد استفاده قرار می گرفت، اما امروزه در تمام زمینه های علمی کاربرد وسیعی یافته است. به عنوان مثال مدیر سازمانی می خواهد بداند در مشارکت یا عدم مشارکت کارمندان کدام متغیر ها نقش پیش بینی دارند؟ مدیر تبلیغاتی می خواهد بداند در خرید یا عدم خرید یک محصول یا برند چه متغیر هایی مهم هستند؟ یک مرکز تحقیقات پزشکی می خواهد بداند در مبتلا شدن به بیماری عروق کرنری قلب چه متغیر هایی نقش پیش بینی کننده دارند؟ تا با اطلاع رسانی از احتمال وقوع کاسته شود.

مشخصا در این موقعیت پژوهشی نمی توان از رگرسیون های معمولی برای پیش بینی رخداد این متغیر های وابسته استفاده نمود. در این نوع از رگرسیون از نسبت برتری odds که نسبت (p/(1-p) می باشد استفاده می شود و برای به دست آوردن مدل لوجیت از این رابطه باید از آن لگاریتم گرفت. بنابراین مدل عمومی رگرسیون لجستیک به شکل زیر خواهد بود...




RE: راهنمای نرم افزار SPSS - MaMi - 30-06-2012

مدلسازی Hierarchical log-linear analysis برای تحلیل داده های طبقه ای در نرم افزار SPSS

یکی از موانعی که در توسعه تحقیقات پرسشنامه ای وجود دارد، ترتیبی و کیفی بودن غالب طیف های مورد استفاده در آن است. از اینرو به اعتقاد غالب آماردانان اطلاعات پرسشنامه ای از آنجا که عموما در قالب طیف هایی چون لیکرت به دست می آید، بهتر است که با روش های کیفی و طبقه ای مورد تحلیل قرار گرفته و تا حد ممکن از روش های کمی کمتر و با احتیاط استفاده شود. یکی از روش های بسیار مطرح برای تحلیل این دسته از داده ها روش HILOG یا تحلیل سلسله مراتبی مدل لگاریتم خطی است. General Loglinear Modeling، Logit Regression ، Tobit و Poisson regression نیز در این ارتباط مورد توجه هستند.
این روش را می توان تحلیل جداول توافقی چند طرفه دانست. برای برازش مجموعه ای از مدل های ممکنه لگاریتمی خطی سلسله مراتبی بر روی جداول توافقی مذکور با استفاده از الگوریتم برازش توزیع آماری به واسطه از سر گیری های متعدد، این روش داده پردازی طبقه ای کاربرد فراوانی دارد. این مدل ها در واقع روابط بین متغیر های طبقه ای را مشخص می کنند. در این روش هر دو نوع ورود متغیر؛ پسرونده و پیشرونده در مدل مورد توجه هستند. به طور کلی تحلیل های لگاریتمی خطی که دارای انواع مختلفی هستند، برای شناسایی مدل هایی که به شناسایی روابط بین متغیر های ترتیبی یا کیفی می پردازند استفاده می شود. این کار از طریق شمارش سلول های جداول توافقی چند راهه و بر روی متغیر های مورد مطالعه انجام می شود. به عنوان مثال در یک تحقیق، محقق علاقه مند است تا بداند بعد از تبلیغات محیطی در یک نمایشگاه، در تمایل مصرف کنندگان به استفاده از پودر شوینده شرکت و همچنین محصولات شرکت رقیب، متغیر های طبقه ای چون سختی آب(ملایم، متوسط و سخت)، تجربه قبلی استفاده از این دو نوع محصول و دمای آب(سرد و گرم) و همچنین تمایل به برند چه نقشی دارند؟
در این آموزش سعی می شود تا با ارائه این مثال واقعی، ابعاد این تکنیک آماری تشریح شوند. برای این منظور نرم افزار های SPSS و SAS بیشتر از سایر نرم افزار های داده پردازی مورد توجه هستند که در این آموزش از SPSS استفاده شده است.
به عنوان مثال در نظر بگیرید یک شرکت ارائه اشتراکات مجلات مختلف، با ارسال ماهیانه ایمیل به آدرس الکترونیکی افراد موجود در دیتا بیس خریداری شده، اشتراک های موجود را اطلاع رسانی می کند. ولی نرخ پاسخ و ثبت بسیار کم است. از آنجا که این کار برای شرکت هزینه زیادی را به دنبال داشته است، این شرکت به دنبال این است تا مطالعه کند اگر ایمیل را فقط برای کسانیکه ثبت اشتراک روزنامه را داشته اند و احتمال ثبت اشتراک مجله برای این گروه نیز بیشتر است ارسال کند، می تواند پاسخ هایی بهتری را دریافت کند. یا وضعیت درآمدی پاسخ دهندگان کنونی چگونه است؟ در صورتیکه این دو متغیر که به عنوان دو راه حل مطرح هستند در پیش بینی وضعیت میزان ثبت اشتراکات مشخص شود، آنگاه شرکت می تواند با اطمینان نسبت به تغییر دیتابیس خود عمل نماید. لذا در این مثال طبقات درآمدی، وضعیت اشتراک روزنامه و وضعیت ثبت اشتراک مجله را در بین 6400 نفر از افراد دیتابیس موجود مورد توجه قرار دادند. داده ها به این شکل وارد نرم افزار می شوند:

[عکس: 85252665486106633591_thumb.jpg]

از منوی آنالیز مدل لگاریتمی را مانند تصویر زیرین انتخاب می نمائیم.

[عکس: 90878417422205961659_thumb.jpg]

در این مرحله هر سه متغیر موجود یعنی، طبقات درآمدی، وضعیت اشتراک روزنامه و وضعیت ثبت اشتراک مجلات را وارد کادر Factor وارد کرده و سپس متغیر درآمد را انتخاب نمود و کلید Define Range را انتخاب می کنیم تا طبقات این متغیر را برای نرم افزار معرفی کنیم.

[عکس: 38982971274069402453_thumb.jpg]

برای متغیر میزان درآمد چهار سطح را در نظر گرفته ایم لذا خواهیم داشت:

[عکس: 31405683494608564673_thumb.jpg]

برای متغیر وضعیت ثبت اشتراک روزنامه نیز، آنرا انتخاب و کلید Define Range را انتخاب و دو مقدار صفر و یک را تعریف می کنیم زیرا این متغیر دارای دو سطح بلی و خیر است.

[عکس: 14191938970951331463_thumb.jpg]

برای متغیر وضعیت ثبت اشتراک مجلات نیز، آنرا انتخاب و کلید Define Range را انتخاب و دو مقدار صفر و یک را تعریف می کنیم زیرا این متغیر نیز دارای دو سطح بلی و خیر است. سپس کلید OK را انتخاب کنید تا مدل Run شود.
برای انجام مراحل بالا در قالب دستورات کد نویسی نرم افزار کافی است کد زیر را در ادیتور وارد کنید:

HILOGLINEAR
inccat(1 4) news(0 1) response(0 1) /METHOD=BACKWARD
/CRITERIA MAXSTEPS(10) P(.05) ITERATION(20) DELTA(.5)
/PRINT=FREQ RESID
/DESIGN .
بخش اول خروجی به نحوه بهینه سازی و اشباع مدل اشاره دارد. به قسمت Backward Elimination Statistics خروجی توجه کنید. در این قسمت برای مدسازی ترکیب های لگاریتمی وجود دارند.

[عکس: 92156136944927411276_thumb.jpg]
[عکس: 46825732019892336425_thumb.jpg]

در Step 0 تعامل این سه متغیر مورد آزمون قرا گرفته است. به منظور آزمون این تعامل سه عاملی، این تعامل از مدل کنار گذاشته شده است. با استفاده از آماره کای اسکویر معنی داری این حذف باید مورد آنالیز قرار گیرد. از آنجا که این حذف دارای سطح معنی داری بالاتر از 1/0 در این مرحله است، باید از مدل کنار گذاشته شود. به عبارت دیگر این مدل نمی تواند بیانگر خصوصیات رفتاری داده های مشاهده شده باشد.
لذا در Step 1 تعاملات دو به دو مورد توجه قرار گرفتند. وجود سطح معنی دار کمتر از 05/0 برای هر حذف در این مرحله بیانگر اهمیت ان تعامل است در غیر این صورت آن تعامل نیز حذف می شود. از آنجا که در این مرحله، برای هر سه تعامل دو به دو سطح معنی داری کمتر از 05/0 محاسبه شده است، لذا نیازی به بررسی سایر ترکیب ها نیست و مدل نهایی انتخابی بیانگر تعامل دو به دوی متغیرهای مورد مطالعه است. لذا میزان ثبت اشتراک روزنامه با میزان درآمد، میزان ثبت اشتراک مجلات با میزان درآمد، و میزان ثبت اشتراک روزنامه با میزان ثبت مجلات در ارتباط دو به دو هستند. لذا این شرکت باید نسبت به ارتقای دیبا بیس خود بر اساس دو متغیر کسانی که در سال گذشته ثبت روزنامه داشته اند و در طیف های درآمدی مختلف هستند اقدام نماید.

[عکس: 85567743263000502818_thumb.jpg]

عدم معنی داری آماره های برازش به معنای پذیرش فرض صفر مبنی بر برازش داده ها دارد و این موضوع اعتبار مدل را تصدیق می کند. اگر این سطح معنی دار باشد به معنای بیان ضعیف روابط موجود در بین داده ها بوده و اعتبار مدل پیشنهادی ضعیف است. برای اطلاع از وضعیت توزیع این دو آماره می توانید به بخش مقادیر محاسبه شده و مورد انتظار در جدول Cell Counts and Residuals نگاه کنید که در واقع نزدیکی این پیش بینی به معنای قدرت خطی لگاریتمی در بیان روابط موجود و بر اساس آماره کای اسکویر است. در این آموزش سعی بر مطرح نمودن روش پیاده سازی لگاریتمی سلسله مراتبی در نرم افزار SPSS بود.



RE: راهنمای نرم افزار SPSS - MaMi - 02-07-2012

نحوه محاسبه حداقل مربعات دو مرحله ای در نرم افزار SPSS


Two Stage Least Squares (2SLS) Regression
رگرسیون حداقل مربعات دو مرحله ای یک روش پیشرفته رگرسیونی برای پوشش مدل هایی است که خاصیت بازگشتی بودن را که مفروضه اصلی رگرسیون خطی عمومی است، را نقض می کنند. به ویژه مدل هایی که محقق باید همبستگی بین یک یا تعداد بیشتری از متغیر های پیش بین خود را با متغیر وابسته مدل از نقطه نظر خطای اندازه گیری چک نماید. مدل رگرسیون عمومی فرض می کند که خطا ها در متغیر وابسته با متغیر های مستقل همبسته نیستند. زمانیکه این پیش فرض محقق نشود مثلا زمانیکه رابطه به صورت دو طرفه وجود داشته باشد، بر آورد رگرسیونی OLS معتبر نخواهد بود. رگرسیون 2SLS از متغیر هایی با حداکثر کارایی که با خطا ها نا همبسته هستند برای برآورد ارزش متغیر های مساله ساز در فاز اول استفاده نموده و سپس استفاده از این مقادیر تعریف شده برای برآورد مدل رگرسیون خطی و پیش بینی تغییرات متغیر وابسته(فاز دوم).
به عنوان مثال محققی علاقه مند است مطالعه کند که آیا میزان تقاضا برای یک برند خاص در یک کشور به قیمت آن برند و درآمد مشتریان بالفعل وابسته است یا خیر؟ مشکل این محقق برای استفاده از روش OLS این است که بین قیمت و تقاضا رابطه دو طرفه وجود دارد یعنی قیمت تعیین کننده تقاضا و تقاضا نیز تعیین کننده قیمت می تواند باشد. این حالت تحت عنوان حلقه های بازخوردی در مدلسازی آماری مطرح است. لذا در این حالت بهترین مدل برای برآورد این وضعیت با توجه به شرایط بیان شده حداقل مربعات دو مرحله ای است. در این مدل درامد مشتریان به همراه متغیر باز تعریف شده قیمت برای محاسبه یک پروکسی که با میزان خطای متغیر وابسته ناهمبسته است، مورد استفاده قرار می گیرد. این پروکسی در فاز اول تعریف می شود و در فاز دوم به عنوان متغیر مستقل وارد مدل می شود. در واقع این پروکسی برای از بین بردن وجود این رابطه دو طرفه بین قیمت و تقاضا است.
نرم افزار هایی چون SAS ،Eviews ،SHAZAM و ... می توانند محاسبه رگرسیون حداقل مربعات دو مرحله ای را انجام دهند. لیکن محاسبه با بسته نرم افزاری SPSS به دلیل سهولت کاربرد، کاربرد وسیع تری دارد. لذا در این مقاله با این نرم افزار یک نمونه مساله با این روش مورد تحلیل قرار می گیرد.
مثال: یک شرکت بازار یابی، فروش کالای چند رسانه ای و کتاب های آموزشی یک کمپانی را در اختیار گرفته است و به ازای فروش محصولات تولیدی این کمپانی درصدی را از آن دریافت می کند. این شرکت به کمک ارسال ایمیل محصولات موجود را به اطلاع اعضای سایت خود می رساند. در این رابطه این شرکت می خواهد مدلی را برای کل خرید هایی که به واسطه این ایمیل ها انجام می شود طراحی نماید تا به این وسیله متغیر های اصلی پیش بینی کننده میزان فروش خود را تعیین نماید.
مشاور بازار یابی این شرکت به عنوان محقق در نظر گرفته است که متغیر میزان کل فروش را به عنوان متغیر وابسته و متغیر های میزان تخفیف های ارائه شده توسط این سایت برای خرید های اینترنتی به صورت ماهیانه و تعداد پیشنهاد های ارائه شده به هر فرد برای خرید هر دو دسته کالا را به عنوان متغیر های پیش بینی کننده و متغیر های مرتبط با تخفیف خرید اینترنتی را به عنوان متغیر های کمکی وارد مدل نماید.
از آنجائیکه تخفیف ماهیانه مستقل از پیشنهاد های فروش خاص ارائه شده برای هر فرد است لیکن بر فروش این اقلام تایثر گذار است. از اینرو میزان فروش و میزان تخفیف با یکدیگر دارای رابطه دو سویه هستند و باید میزان فروش این اقلام را به عنوان متغیر های Lag یا متغیر های نگه داشته شده در اولین فاز در نظر بگیریم. لذا ابتدا به مسیر زیر وارد شده و گزینه Create Time series… را انتخاب می کنیم.

[عکس: 02948837470735372751_thumb.jpg]

سپس میزان خرید این دو قلم کالا را انتخاب کرده و به کادر سمت راست منتقل می کنیم. و نوع تابع را روی Lag قرار می دهیم.

[عکس: 36509399838826775257_thumb.jpg]

حال باید از خانواده رگرسیون ها، در نرم افزار SPSS گزینه Two Stage Least Squares را انتخاب کنیم.

[عکس: 23309036091835558587_thumb.jpg]

حال باید در این مرحله متغیر تعداد کل خرید هایی که به واسطه ایمیل های ارسالی دریافت شده است را قسمت متغیر وابسته مدل وارد کنیم. زیرا هدف از این مطالعه شناسایی عواملی بود که تعداد کل این خرید را شناسایی می کنند تا در آینده این شرکت تبلیغاتی بتواند تمام برنامه های خود را بازار یابی هدفمند تر روی این عوامل متمرکز نماید.
سپس باید تعداد پیشنهاد های ارائه شده برای خرید کتاب و همچنین محصولات پند رسانه ای به همراه نوع پرداخت را که به دو فرم چک های بانکی و تحویل در هنگام دریافت محصول و پرداخت از طریق کارت های اعتباری است را به قسمت متغیر های پیش بینی کننده یا Explanatory وارد می کنیم. در این مرحله باید متغیر های مشکل ساز را در قسمت بهینه ساز یا سودمند سازی متغیر وارد کنیم. این متغیر ها نوع پرداخت هزینه، تخفیف ارائه شده برای خرید اینترنتی کتاب و تخفیف ارائه شده برای خرید اینترنتی چند رسانه ای و متغیر سودمند شده میزان فروش این اقلام است. سپس کلید OK را می زنیم.

[عکس: 16778332603557072933_thumb.jpg]

برای استفاده از بخش برنامه نویسی نرم افزار در قسمت ادیتور باید دستور زیر را وارد کرد.

[عکس: 27809839451410062970_thumb.jpg]

اولین خروجی این نرم افزار مربوط به بخش توصیفی متغیر های وارد شده به مدل است.

[عکس: 57974949588258211529_thumb.jpg]

متغیر هایی که تحت عنوان Predictor مشخص شده اند متغیر هایی هستند که اثر آنها ابتدا در مقایسه با متغیر های سودمند شده برای کنترل میزان خطای به وجود آمده در رابطه با متغیر وابسته محاسبه می شود. متغییر هایی که تحت عنوان predictor and instrumental نام گذاری شده اند آنهایی هستند که برای محاسبه واقعی اثر متغیر های پیش بین مورد استفاده قرار می گیرند و برای خود آنها نیز ضرایب محاسبه می شود ولی برای متغیر هایی که فقط instrumental هستند، اثر کلی آنها در برآورد واقعی ضرایب متغری های پیش بین محاسبه می شود ولیکن برای آنها ضرایب محاسبه نمی شود.
در بخش بعدی خروجی، مقدار Multiple R یا همان ضریب همبستگی چند گانه که بیان رابطه خطی بین متغیر های پیش بینی کننده و متغیر مشاهده شده است، نشان از یک رابطه نسبتا متوسط تا ضعیف بین متغیر های پیش بینی کننده وارد شده به مدل و متغیر وابسته مدل دارد. توان دوم آن را که با R Square نمایش می دهند بین می کند که 14 درصد از میزان فروش محصولات این شرکت از طریق کانال ایمیل توسط متغیر های مورد مطالعه محقق قابل پیش بینی است. مقدار Adjusted نیز عمدتا برای مقایسه بین مدل ها کاربرد دارد.

[عکس: 93073163527488210677_thumb.jpg]

جدول تحلیل واریانس نشان می دهد که در برآورد ضرایب رگرسیونی و میزان باقیمانده، اعتبار قابل قبولی برای مدل رگرسیونی وجود دارد زیرا که مقدار سطح معنی داری آن زیر 05/0 است.

[عکس: 96276509742356118248_thumb.jpg]

در نهایت ضرایب متغیر های وارد شده به مدل در این بخش مشخص می شود که از روی این جدول می توان مدلی که محقق به دنبال ان بود را برای شرکت مورد نظر در تصمیم گیری ارائه نمود.

[عکس: 54705524951504498483_thumb.jpg]

خلاصه این مدل به این ترتیب است که نشان می دهد میزان کلی فروش تابعی از این متغیر ها است:

Y= -1.511 + 0.353 * buycd + 0.189 * buybk + 0.130 * offer_type1 + 0.303 * offer_type2

میزان سطح معنی داری برای متغیر نوع پرداخت اول که از طریق کارت های اعتباری است بیشتر از 05/0 محاسبه شده است، لذا سطح کلی فروش را این نوع پرداخت نمی تواند به خوبی متمایز کند. در حالیکه این مقدار برای نوع پرداخت دوم که از طریق پرداخت هنگام دریافت محصول بوده است به دلیل کمتر بودن سطح معنی داری از 05/0، از قابلیت خوبی برای تبیین میزان کلی فروش برخور دار است. لذا در ارائه پیشنهاد های خرید، پیشنهاد هایی که پرداختشان از طریق پرداخت هنگام دریافت بوده است از قابلیت خوبی در پیش بینی متغیر وابسته یعنی میزان فروش برخور دار است و این گونه پیشنهاد های خرید بیشتر به خرید دو قلم کالا منجر شده است. این وضعیت برای پیشنهاد های خرید چند رسانه ای در مقابل کتاب نیز صادق است. از اینرو نتیجه می شود گرفت که روش های بازار یابی کنونی شرکت برای فروش کلی این دو قلم کالا در بازه زمانی مورد مطالعه روی فروش چند رسانه ای و به شرط پرداخت در هنگام دریافت بیشتر موثر بوده است. لذا فروش کتاب از طریق این سیستم چندان اقتصادی به نظر نمی رسد و روش بازار یابی کتاب باید تغییر کند. همچنین باید توجه کرد که متغیر های پیش بین مورد مطالعه بیشتری برای بررسی عوامل تبیین کننده میزان فروش این شرکت باید مورد مطالعه قرار گیرد.