آخرین خبرها
خانه / نرم افزار STATA / آموزش نحوه محاسبه تابع دو جمله ای اصلاح شده( Exact Logistic) در نرم افزار Stata

آموزش نحوه محاسبه تابع دو جمله ای اصلاح شده( Exact Logistic) در نرم افزار Stata

هنگامی که متغیر وابسته یک متغیر گسسته و دو بعدی باشد، برای پیش بینی ابعاد آن باید از روش رگرسیون دو جمله ای استفاده کرد. این روش رگرسیونی به حجم نمونه حساس است. روش اصلاح شده رگرسیون لجستیک یا دو جمله ای برای رفع این ضعف طراحی شده است. نرم افزار STATA نسخه ۱۰ به بالا توانایی محاسبه این روش نسبتا جدید را داراست. به عنوان مثال محققی علاقه مند است متغیر هایی که سبب انتخاب یا عدم انتخاب یک برند تلفن همراه می شوند را شناسایی کند. به این منظور دو متغیر جنسیت و سابقه خرید از این برند را به عنوان متغیر های مستقل مورد مطالعه قرار داده است. در این تحقیق ۳۲ نفر مشارکت داشتند به دلیل کم بودن حجم نمونه استفاده از رگرسیون لجستیک معمول، امکان پذیر نیست.

شکل کلی ورود داده ها باید به شکل زیر باشد:

input gender  cumr    accept       n
۰        ۰        ۰        ۱۲
۰        ۰        ۱         ۰
۰        ۱        ۰         ۴
۰        ۱        ۱         ۴
۱        ۰        ۰         ۴
۱        ۰        ۱         ۱
۱        ۱        ۰         ۰
۱        ۱        ۱         ۷
end

با ورود دستور زیر در خط فرمان می توان تعداد فراوانی متغیر های تحقیق را مشاهده نمود.

-> tabulation of نام متغیر    


Gender      |      Freq.     Percent        Cum.
————+———————————–
۰ |         ۲۰       ۶۲٫۵۰       ۶۲٫۵۰
۱ |         ۱۲       ۳۷٫۵۰      ۱۰۰٫۰۰
————+———————————–
Total |         ۳۲      ۱۰۰٫۰۰

Cumr        |      Freq.     Percent        Cum.
————+———————————–
۰ |         ۱۷       ۵۳٫۱۲       ۵۳٫۱۲
۱ |         ۱۵       ۴۶٫۸۸      ۱۰۰٫۰۰
————+———————————–
Total |         ۳۲      ۱۰۰٫۰۰

با ورود دستور زیر می توان جدول توافقی را مشاهده نمود.

tabulate نام اولین متغیر نام دومین متغیر [fw=n]

که نتیجه به تفکیک برای تمام متغیر های مورد مطالعه به شکل زیر خواهد شد.

tabulate gender cumr [fw=n]

           |        cumr
Gender     |         ۰          ۱ |     Total
———–+———————-+———-
۰ |        ۱۲          ۸ |        ۲۰
۱ |         ۵          ۷ |        ۱۲
———–+———————-+———-
Total |        ۱۷         ۱۵ |        ۳۲

tabulate female accept [fw=n]

           |         accept
gender |         ۰          ۱ |     Total
———–+———————-+———-
۰ |        ۱۶          ۴ |        ۲۰
۱ |         ۴          ۸ |        ۱۲
———–+———————-+———-
Total |        ۲۰         ۱۲ |        ۳۲

tabulate cumr accept [fw=n]

           |         accept
Cumr   |         ۰          ۱ |     Total
———–+———————-+———-
۰ |        ۱۶          ۱ |        ۱۷
۱ |         ۴         ۱۱ |        ۱۵
———–+———————-+———-
Total |        ۲۰         ۱۲ |        ۳۲

برای گرفتن یک خروجی کلی از وضعیت متغیر ها از دستور زیر استفاده می شود.

test groups = group(نام متغیر دوم نام متغیر اول), label
tabulate groups نام متغیر وابسته [fw=n]

خروجی زیر حاصل این دستور است.

group(gend |         accept
er cumr  ) |         ۰          ۱ |     Total
———–+———————-+———-
۰ ۰ |        ۱۲          ۰ |        ۱۲
۰ ۱ |         ۴          ۴ |         ۸
۱ ۰ |         ۴          ۱ |         ۵
۱ ۱ |         ۰          ۷ |         ۷
———–+———————-+———-
Total |        ۲۰         ۱۲ |        ۳۲

این جداول نشان می دهند ۳۲ مشارکت کننده در تحقیق وجود داشتند که ۱۲ نفر خریدار این فناوری بودند و ۲۰ نفر خریدار این فناوری نبودند. ۲۰ نفر از افراد را مردان و ۱۲ نفر را زنان تشکیل می دهند. ۱۵ نفر قبلا خریدار این محصول بوده و ۱۷ نفر سابقه استفاده از این محصول را نداشتند. نتایج نشان می دهد که ۷ نفر از زنان خریدار این محصول هستند و ۴ نفر از مردان خریدار این محصول هستند.
برای بررسی تاثیر متغیر های جنسیت و داشتن سابقه خرید قبلی از محصولات این شرکت؛ بر خرید یا عدم خرید این محصول جدید شرکت، می توان از رگرسیون لجستیک معمولی و جداول توافقی استفاده نمود. هر دوی این روش ها به دلیل اینکه در این مطالعه حجم نمونه کم است از قابلیت مناسبی برخوردار نیستند. به عنوان مثال با به کارگیری روش لجستیک معمولی حتی بعد از ۲۰۰ بار از سر گیری تابع برازش که روشی مرسوم در روش های مبتنی بر بیشینه درستنمایی است، مدل برازش نیافت لذا باید از دستور رگرسیون لجستیک اصلاح شده یا تابع دو جمله ای اصلاح شده استفاده نمود.
لذا باید دستور زیر را در پنل command وارد نمود یا از مسیر موجود در statistics استفاده نمود.

exlogistic accept gender cumr, coef nolog

خروجی زیر حاصل این دستور است.

Exact logistic regression                        Number of obs =        ۳۲
Model score   =  ۱۸٫۷۵۱۷۶
Pr >= score   =    ۰٫۰۰۰۰
—————————————————————————
accept|      Coef.       Suff.  ۲*Pr(Suff.)     [۹۵% Conf. Interval] ————-+————————————————————-
gender |   ۲٫۳۳۶۵۹۲*          ۸      ۰٫۰۳۰۲      .۲۰۴۴۹۴۲       +Inf
cumr   |   ۳٫۴۳۵۸۰۷*         ۱۱      ۰٫۰۰۰۳      ۱٫۴۰۵۹۳۴       +Inf
—————————————————————————
(*) median unbiased estimates (MUE)

/* rerun to obtain odds ratios */

exlogistic

Exact logistic regression                        Number of obs =        ۳۲
Model score   =  ۱۸٫۷۵۱۷۶
Pr >= score   =    ۰٫۰۰۰۰
—————————————————————————
accept| Odds Ratio       Suff.  ۲*Pr(Suff.)     [۹۵% Conf. Interval] ————-+————————————————————-
gender |   ۱۰٫۳۴۵۹۲*          ۸      ۰٫۰۳۰۲      ۱٫۲۲۶۹۰۴       +Inf
cumr   |   ۳۱٫۰۵۶۴۵*         ۱۱      ۰٫۰۰۰۳      ۴٫۰۷۹۳۳۳       +Inf
—————————————————————————
(*) median unbiased estimates (MUE)

/* rerun to obtain score estimates */

exlogistic, coef test(score)

Exact logistic regression                        Number of obs =        ۳۲
Model score   =  ۱۸٫۷۵۱۷۶
Pr >= score   =    ۰٫۰۰۰۰
—————————————————————————
accep |      Coef.       Score    Pr>=Score     [۹۵% Conf. Interval] ————-+————————————————————-
gender |   ۲٫۳۳۶۵۹۲*   ۶٫۶۸۵۹۷۴      ۰٫۰۱۵۱      .۲۰۴۴۹۴۲       +Inf
cumr   |   ۳٫۴۳۵۸۰۷*   ۱۴٫۷۸۳۶۱      ۰٫۰۰۰۱      ۱٫۴۰۵۹۳۴       +Inf
—————————————————————————
(*) median unbiased estimates (MUE)

بر اساس خروجی های موجود ۲٫۳۴ ضریب تابع لوجیت برای متغیر جنسیت و ۳٫۴۴ برای متغیر سابقه خرید قبلی از شرکت است. مقادیر odds در در خروجی بعدی دیده می شود. نتایج برای دو متغیر نشان می دهد این متغیر ها هر دو دارای سطح معنی داری زیر ۰۵/۰ هستند. مقادیر فوق بر اساس روش تخمین نا اریب میانه یا MUE که روشی کارا در نمونه های کوچک است محاسبه شده است.
نتایج نشان می دهد برای خریدارن قبلی شانس خرید ۰۶/۳۱ برابر بیشتر از افرادی بوده که مشتری این شرکت نبوده اند. لذا مشخص می شود کیفیت و سابقه کار این شرکت تاثیر مثبتی بر خرید سایر محصولات آن داشته است. همچنین ۳۵/۱۰ برابر شانس خرید در مورد مردان بیشتر از زنان است. با توجه به نوین بودن این روش تحلیل چند متغیره شاخص های ارزیابی و برازش مدل در مراحل ابتدایی هستند و هنوز شاخص محکمی در دسترس نیست. در این مقاله هدف ارائه روش محاسبه تابع دو جمله ای اصلاح شده بود و علاقه مندان جهت کسب اطلاعات بیشتر می توانند به منبع زیر مراجعه کنند.

  • Hirji, K.F. 2006. Exact Analysis of discrete data. Boca Raton: Chapman & Hall

http://statcamp.blogfa.com

درباره‌ kashani

جوابی بنویسید

ایمیل شما نشر نخواهد شدخانه های ضروری نشانه گذاری شده است. *

*