آخرین خبرها
خانه / تحلیل رگرسیون / محاسبه رگرسیون ترتیبی در نرم افزار SAS

محاسبه رگرسیون ترتیبی در نرم افزار SAS

به منظور بررسی و مطالعه در مورد متغیر های پیش بین موثر بر ابعاد یک متغیر گسسته از رگرسیون های ترتیبی استفاده می شود. این روش رگرسیونی مبتنی بر روش حداکثر درستنمایی است. این روش در مقابل روش هایی چون تحلیل تشخیصی که روشی صرفا کمّی است بسیار کامل بوده و امروزه در تمام حوزه هایی که شانس رخ داد تصادفی هر یک از ابعاد یک متغیر وابسته را بخواهند برآورد کنند مورد استفاده قرار می گیرد. به عنوان مثال یک شرکت بازار یابی می خواهد در مورد متغیر های پیش بین موثر بر میزان علاقه مندی افراد به محصولات یک شرکت تولید خودرو معادله رگرسیونی را براورد نماید. به این منظور با یک طیف لیکرت میزان علاقه مندی افراد را به محصولات این شرکت در قالب چهار گروه مورد بررسی قرار می دهد. یا میزان علاقه مندی افراد به سه اندازه تپلت ها تحت تاثیر چه متغیر هایی است؟ یا اینکه یک موسسه آموزشی علاقه مند است تا مطالعه کند متغیر های اصلی روی میزان علاقه مندی دانشجویان به ثبت نام در قالب سه طیف بسیار علاقه مند، علاقه مند و تا حدی چه متغیر هایی هستند. میزان تحصیلات والدین، دولتی یا خصوصی بودن موسسه قبلی و نمره معدل دوره قبلی فرد مورد توجه قرار گرفته و به عنوان متغیر مستقل مورد مطالعه قرار گرفتند. در ادامه با تعریف داده ای فرضی این مثال در نرم افزار SAS حل می شود.

ابتدا در محیط برنامه نویسی SAS دستور زیر را وارد می کنیم:

proc freq data = “آدرس فایل داده”;
tables apply;
tables pared;
tables public;
run;

با این دستور می توان آماره توصیفی داده های وارد شده را مشاهده نمود. به عنوان مثال ۲۲۰ نفر از افراد مورد مطالعه علاقه تا حدی داشته و ۴۰ نفر بسیار مشتاق بوده اند. ۳۳۷ نفر تحصیلات والدینشان غیر مرتبط با رشته فرد متقاضی و ۶۳ نفر تحصیلات والدینشان مرتبط بوده است. ۳۴۳ نفر قبلا در موسسه دولتی و ۵۷ نفر در موسسه خصوصی دوره قبلی خود را طی کرده اند.

The FREQ Procedure

                                  Cumulative    Cumulative
APPLY    Frequency     Percent     Frequency      Percent
———————————————————-
۰         ۲۲۰       ۵۵٫۰۰           ۲۲۰        ۵۵٫۰۰
۱         ۱۴۰       ۳۵٫۰۰           ۳۶۰        ۹۰٫۰۰
۲          ۴۰       ۱۰٫۰۰           ۴۰۰       ۱۰۰٫۰۰
Cumulative    Cumulative
PARED    Frequency     Percent     Frequency      Percent
———————————————————-
۰         ۳۳۷       ۸۴٫۲۵           ۳۳۷        ۸۴٫۲۵
۱          ۶۳       ۱۵٫۷۵           ۴۰۰       ۱۰۰٫۰۰
Cumulative    Cumulative
PUBLIC    Frequency     Percent     Frequency      Percent
———————————————————–
۰         ۳۴۳       ۸۵٫۷۵           ۳۴۳        ۸۵٫۷۵
۱          ۵۷       ۱۴٫۲۵           ۴۰۰       ۱۰۰٫۰۰

در صورتیکه بخواهیم میانگین متغیر ها را نیز داشته باشیم دستور زیر را وارد می کنیم.

proc means data = ” آدرس فایل داده”;
var gpa;
run;

نکته اصلی اینجا است که اجرای این مدل نیازمند این است که در هر سلول حداقل تعدادی از افراد قرار گیرند. به این منظور از دستور زیر استفاده می شود.

proc freq data = ” آدرس فایل داده “;
tables apply*pared / nopercent norow nocol missprint;
tables apply*public / nopercent norow nocol missprint;
run;

اگر در خروجی سلولی خالی نبوده و یا مقدار آن کوچک نباشد می توان این روش را اجر نمود. دستور اصلی برای اجرای این برنامه به شرح زیر است:

proc logistic data = ” آدرس فایل داده” desc;
model  نام متغیر وابسته= نام های متغیر های مستقل با یک فاصله بین;
run;

خروجی نرم افزار به شرح زیر خواهد بود:

The LOGISTIC Procedure
Number of Observations Read         ۴۰۰
Number of Observations Used         ۴۰۰
Response Profile
Ordered                      Total
Value        APPLY     Frequency

       ۱            ۲            ۴۰
۲            ۱           ۱۴۰
۳            ۰           ۲۲۰

Score Test for the Proportional Odds Assumption

Chi-Square       DF     Pr > ChiSq

    ۴٫۸۴۴۶        ۳         ۰٫۱۸۳۵

Model Fit Statistics

                             Intercept
Intercept            and
Criterion          Only     Covariates

AIC             ۷۴۵٫۲۰۵        ۷۲۷٫۰۲۵
SC              ۷۵۳٫۱۸۸        ۷۴۶٫۹۸۲
-۲ Log L        ۷۴۱٫۲۰۵        ۷۱۷٫۰۲۵

جهت مقایسه بین مدل های مختلف این آماره ها مورد استفاده قرار می گیرند. به عبارت دیگر مقادیر این آماره ها در تست بین مدل ها و کارایی انها مورد استفاده قرار می گیرد.

Testing Global Null Hypothesis: BETA=0

Test                 Chi-Square       DF     Pr > ChiSq

Likelihood Ratio        ۲۴٫۱۸۰۴        ۳         <.0001
Score                   ۲۳٫۴۸۰۴        ۳         <.0001
Wald                    ۲۴٫۳۳۳۷        ۳         <.0001

آماره کای اسکویر برای تست حداکثر درستنمایی معنی دار بوده و نشان می دهد در تابع حداقل یک متغیر مستقل وجود دارد که توانایی پیش بینی ابعاد متغیر وابسته را دارد.

Analysis of Maximum Likelihood Estimates

                                 Standard          Wald
Parameter      DF    Estimate       Error    Chi-Square    Pr > ChiSq

Intercept 2     ۱     -۴٫۲۹۸۳      ۰٫۸۰۹۲       ۲۸٫۲۱۸۹        <.0001
Intercept 1     ۱     -۲٫۲۰۲۹      ۰٫۷۸۴۴        ۷٫۸۸۶۹        ۰٫۰۰۵۰
PARED           ۱      ۱٫۰۴۷۸      ۰٫۲۶۸۴       ۱۵٫۲۳۵۰        <.0001
PUBLIC          ۱     -۰٫۰۵۸۵      ۰٫۲۸۸۶        ۰٫۰۴۱۱        ۰٫۸۳۹۳
GPA             ۱      ۰٫۶۱۵۶      ۰٫۲۶۲۶        ۵٫۴۹۶۳        ۰٫۰۱۹۱

در این قسمت مشخص می شود که دو متغیر مستقل معدل و تحصیلات والدین دارای نقش معنی داری بر سطوح متغیر وابسته هستند. سطح معنی داری این متغیر های مستقل با استفاده از اماره والد محاسبه می شود.

 Odds Ratio Estimates

             Point          ۹۵% Wald
Effect    Estimate      Confidence Limits

PARED        ۲٫۸۵۱       ۱٫۶۸۵       ۴٫۸۲۶
PUBLIC       ۰٫۹۴۳       ۰٫۵۳۶       ۱٫۶۶۱
GPA          ۱٫۸۵۱       ۱٫۱۰۶       ۳٫۰۹۶

نتایج نشان می دهد در صورتیکه میانگین معدل یک واحد افزایش یابد احتمال اینکه فردی از گروه علاقه مندی تا حدی به گروه بالاتر رود ۱٫۸۵ واحد افزایش می یابد. در مورد متغیر تحصیلات والدین نیز این امر صادق است و در صورتیکه والدین تحصیلات مرتبط با رشته تحصیلی دانشجو داشته باشند این میزان ۲٫۸۵ واحد افزایش می یابد. به عبارت دیگر در بین متغیر های مستقل متغیر های تحصیلات والدین و نمره معدل دارای نقش های معنی دار به لحاظ اماری هستند و نوع موسسه قبلی فرد در این بین نقشی ندارد. در این مقاله سعی بر معرفی روش رگرسیون ترتیبی در آموزشی نرم افزار SAS” href=”http://academy.kishmehr.org/essays.php?category=2&title=SAS” target=”_blank”>نرم افزار  SAS بود. علاقه مندان به کسب اطلاعات نظری در مورد روش رگرسیون ترتیبی به سایت ها و منبع زیر مراجعه کنند.

۱٫ http://www.stat.ufl.edu/~aa/cda/cda.html
۲٫ https://webspace.utexas.edu/dpowers/www
۳٫ Afifi, A, Clark, V and May, S. 2004. Computer-Aided Multivariate Analysis. 4th ed. Boca Raton, Fl: Chapman & Hall/CRC.

منبع: http://www.iranresearches.ir

“پروژه های آماری خود را به ما بسپارید”
اجرا و تحلیل انواع مختلف مدل های رگرسیونی و تحلیل پایان نامه، توسط متخصصان گروه آماردانان ایران زمین در سریعترین زمان و با کمترین هزینه

درباره‌ kashani

یک نظر

  1. رسول حداد تبريزي

    با سلام
    احتياج به نرم افزار sas قابل نصب در محيط مكينتاش هستم. لطفا در خصوص خريد اين نوع نرم افزار كمكم فرماييد.
    با تشكر
    حداد تبريزي

جوابی بنویسید

ایمیل شما نشر نخواهد شدخانه های ضروری نشانه گذاری شده است. *

*