آزمون اهمیت آماری در ضرایب همبستگی

ساخت وبلاگ

اخیراً ، من مجبور شدم تعیین كنم كه آیا دو ضریب همبستگی محاسبه شده از نظر آماری تفاوت معنی داری با یکدیگر دارند. در اصل ، دو نوع سناریو وجود دارد: (i) شما می خواهید دو همبستگی وابسته را مقایسه کنید یا (ب) می خواهید دو همبستگی مستقل را با یکدیگر مقایسه کنید. اکنون می خواهم هر دو مورد را پوشش دهم و روشهای تعیین اهمیت آماری را ارائه دهم.

دو همبستگی مستقل

این مورد استفاده در شرایطی اعمال می شود که شما دو همبستگی داشته باشید که از نمونه های مختلف حاصل می شود و از یکدیگر مستقل هستند. به عنوان مثال این است که شما می خواهید بدانید که آیا قد و وزن به همان روش برای دو گروه اجتماعی مجزا با هم ارتباط دارد یا خیر. شکل زیر چنین موردی را نشان می دهد:

ما می توانیم به این فکر کنیم که X و Y برای اولین گروه اجتماعی قد و وزن نشان می دهد و A و B آن را برای گروه دوم اجتماعی نشان می دهد. بنابراین ما هیچ همبستگی همپوشانی نداریم و از این رو ، هیچ همبستگی وابسته ای نداریم و می توانیم روی یک آزمون اهمیت مستقل تمرکز کنیم.

دو همبستگی وابسته (همپوشانی)

از نظر من - مورد بسیار جالب تر این است که می خواهید اهمیت آماری بین دو همبستگی وابسته را تعیین کنید. برای مثال ، می خواهم یک مورد استفاده قبلی را که با آن ارائه شده است توصیف کنم. من با محاسبه نمرات ارتباط معنایی بین مفاهیم کار می کردم. با این حال ، یافتن یک روش خوب برای ارزیابی نمرات تولید شده بسیار دشوار است. اما ، یک مجموعه داده ارزیابی گسترده به نام Wordsimilarity-353 وجود دارد. این استاندارد طلا شامل 353 جفت کلمه است که در آن نمرات مربوط به ارتباط مربوطه را می شناسید که توسط انسان قضاوت شده است. از این رو ، شما از همان جفت های کلمه استفاده می کنید و با استفاده از روش خود نمرات مربوط به معنایی را محاسبه می کنید. سرانجام ، شما ضریب همبستگی بین هر دو بردار را که نشان دهنده صحت روش شما است محاسبه می کنید. با این حال ، مجموعه بزرگی از روش های خوب عملکرد وجود دارد. به عنوان مثال ، یکی از بهترین موارد ، ESA [1] نامیده می شود که با همبستگی رتبه Spearman 0. 75 به پایان می رسد. حال فرض کنید روش شما نمره همبستگی 0. 76 را دریافت می کند و می خواهید قضاوت کنید که آیا پیشرفت های قابل توجهی در نتایج شما وجود دارد یا خیر. این ممکن است یک سوال قانونی باشد به خصوص به دلیل مجموعه داده های استاندارد طلای کوچک. از آنجا که هر دو روش در حال محاسبه ضرایب همبستگی در برابر استاندارد طلا هستند ، ما باید با همبستگی های وابسته کنار بیاییم. این در شکل زیر تجسم شده است:

ما می توانیم به این فکر کنیم که x به عنوان استاندارد طلای Wordsimarility-353 ، شما نتایج ما و z بودن با روش ESA است. ما علاقه مندیم که آیا نمره همبستگی XY (نشان دهنده صحت روش ما) از نظر آماری با XZ متفاوت است (نشان دهنده صحت روش ESA). با این حال ، برای محاسبه این موضوع ، ما همچنین باید ضریب همبستگی بین Y و Z را بدانیم.

مواد و روش ها

در گذشته ، من به دو روش محاسبه اهمیت آماری برای موارد فوق الذکر می رسیدم. مورد اول با جزئیات در روش های آماری کتاب برای روانشناسی شرح داده شده است [2]. این دو راه حل برای هر دو مورد مستقل و وابسته است. برای مورد مستقل ، یکی از اساساً از انتقال z فیشر برای ضرایب همبستگی استفاده می کند [3] و سپس فرضیه تهی را آزمایش می کند که P1-P2 = 0. مورد وابسته ، کمی پیچیده تر است. با این حال ، این کتاب یک روش توسط Steiger [4] را نشان می دهد که اصطلاحاتی را توصیف می کند که چگونه خود این دو تست همبستگی دارند. اجرای کار برای هر دو روش به صورت بسته R وجود دارد.

روش دوم توسط G. Zou [5] است و همچنین روش هایی را برای هر دو مورد وابسته و مستقل نشان می دهد. مزیت این روش تأیید عدم تقارن توزیع نمونه برای همبستگی های منفرد است و فقط به فواصل اطمینان نیاز دارد. نتایج منجر به فواصل اطمینان می شود که در صورتی که فاصله شامل صفر نباشد ، می توان فرضیه تهی را رد کرد. کد R برای این روش موجود است.

از آنجا که من عمدتاً با پایتون کار می کنم ، با کمبود اجرای پایتون برای همه روشها مقابله کردم. از این رو ، من یک اسکریپت پایتون را به صورت آنلاین قرار داده ام که بر اساس استنادهای فوق الذکر و کدهای R ساخته شده است. من امیدوارم که این به کسی کمک کند و در صورت بروز سوالات ، لطفاً از آنها در اینجا یا در صفحه GitHub سؤال کنید. هرچند باید توجه داشت که حتی اگر ما بتوانیم دو ضرایب همبستگی را با هم مقایسه کنیم ، لزوماً به معنای ایده خوبی نیست و ممکن است به شدت به مورد استفاده بستگی داشته باشد. برای یک بحث کوتاه در مورد این موضوع ، می خواهم به یک پست وبلاگ مراجعه کنم.

[1] E. Gabrilovich و S. Markovitch ، "محاسبه ارتباط معنایی با استفاده از تجزیه و تحلیل معنایی مبتنی بر ویکی پدیا" ، در مجموعه مقالات بیستمین کنفرانس مشترک بین المللی هوش مصنوعی ، 2007 ، صص 1606-1611.[2] D. C. Howell ، روش های آماری برای روانشناسی ، Cengage Leaing ، 2011. [3] R. A. Fisher ، "در مورد خطای احتمالی ضریب همبستگی استنباط شده از یک نمونه کوچک ،" مترون ، جلد. 1 ، صص 3-32 ، 1921. [4] J. H. Steiger ، "آزمایش برای مقایسه عناصر یک ماتریس همبستگی ،" بولتن روانشناختی ، جلد. 87 ، ISS. 2 ، ص. 245 ، 1980. [5] G. Y. Zou ، "به سمت استفاده از فواصل اطمینان برای مقایسه همبستگی ها." ، روش های روانشناختی ، جلد. 12 ، ISS. 4 ، صص 399-413 ، 2007.

استراتژی برای تحلیل فاندمنتال...
ما را در سایت استراتژی برای تحلیل فاندمنتال دنبال می کنید

برچسب : نویسنده : سعید شیخ‌زاده بازدید : 28 تاريخ : سه شنبه 24 مرداد 1402 ساعت: 11:31