اهمیت اندازه اثرها

اهمیت اندازه اثرها

اهمیت اندازه اثرها ، ما در مورد استفاده و استفاده نادرست از تست های آماری در مقالات تحقیقات علمی پزشکی بحث کردیم و بیان داشتیم که آزمون معنی داری باید تنها زمانی مورد استفاده قرار گیرد که از یک نمونه به جامعه تعمیم داده شود، یعنی داده های نمونه استفاده می شود. نتیجه گیری را برای همه اعضای جامعه مورد مطالعه تعمیم دهید. مهمتر از آن، آزمون‌های معناداری که با شرکت‌کنندگان بسیار کم یا بیش از حد انجام می‌شود، می‌تواند گمراه‌کننده باشد. یعنی مطالعاتی که شامل تعداد بسیار کمی از شرکت کنندگان است، فاقد قدرت آماری برای تشخیص یک اثر مرتبط بالینی است. در مقابل، در مطالعات با حجم نمونه بزرگ، حتی اثرات کوچک احتمالاً از نظر آماری معنی دار ارزیابی می شوند در حالی که این اثرات ممکن است فاقد هرگونه ارتباط بالینی باشند. این معایب نشان می‌دهد که آزمایش اهمیت آماری به تنهایی کافی‌ترین روش برای ارزیابی وجود اثر بالینی مرتبط نیست. آزمون معنی‌داری اطلاعات کمی را در مورد اندازه یک اثر مشاهده‌شده منتقل می‌کند، به عنوان مثال، «اثر به‌دست‌آمده چقدر بزرگ است؟» برای مثال، آزمایش‌های آماری و مقادیر P متناظر، ارزیابی اینکه آیا اثری که در مطالعه A کوچک‌تر یا بزرگ‌تر است، غیرممکن است. یک اثر ارزیابی شده در مطالعه B.

هیئت تحریریه مجلات بررسی شده سعی کرده اند محققان را تشویق کنند تا اظهارات مربوط به اهمیت آماری را با نتایج بالینی معنادارتر، یعنی نتایج مستقل از اندازه نمونه و/یا مقیاس اندازه گیری، تکمیل کنند. به طور خاص، به اصطلاح اندازه های اثر، روشی برای تعیین کمیت بزرگی یک اثر، علاوه بر آزمایش اهمیت توصیه می شود. از این رو، سؤالی که محققان پزشکی باید روی آن تمرکز کنند این نیست که “آیا اثر درمانی وجود دارد؟” بلکه “تاثیر درمانی چقدر است؟”

هدف مقاله حاضر اطلاع رسانی به محققین پزشکی در مورد مفهوم “اندازه اثر” است. این مقاله به منظور ارائه یک نمای کلی جامع از تمام اندازه های اثر نیست، بلکه صرفاً با هدف بحث در مورد مزایا و معایب این مفهوم و اغلب موارد است. انواع استفاده شده از آن

اهمیت اندازه اثرها
اهمیت اندازه اثرها – تزیسمی

فهرست مطالب

چرا اندازه های افکت؟- اهمیت اندازه اثرها

از آنجایی که آزمون های آماری و به طور خاص تر، مقادیر P تحت تأثیر حجم نمونه یک مطالعه قرار می گیرند، نمی توان میزان یک اثر را با استفاده از آزمون فرضیه های آماری به تنهایی تخمین زد (یعنی «معنی دار» یا «غیر معنی دار»).

دو مطالعه ساختگی را در نظر بگیرید که در آنها درمان های A و B برای افسردگی با گروه دارونما مقایسه شده است. هر دو مطالعه به این نتیجه رسیدند که در 80 درصد از بیماران مشمول، افسردگی پس از درمان وجود نداشت (یعنی اندازه گیری نتیجه: “افسردگی وجود ندارد” در مقابل “افسردگی موجود”)، در حالی که در هر دو مطالعه “فقط” 20٪ از گروه دارونما عدم وجود افسردگی را نشان دادند. افسردگی. از این رو، دو روش درمانی اثر بالینی یکسانی را نشان می‌دهند، یعنی هر دو روش درمانی خطر نسبی درمان را در مقابل دارونما 4 نشان می‌دهند. در هر گروه فقط 20 نفر را شامل می شد. از آنجایی که مقادیر P به شدت به حجم نمونه مورد استفاده بستگی دارد، مقدار P مطالعه اول بسیار کوچکتر از مطالعه دوم خواهد بود. در این صورت می توان به راحتی نتیجه گرفت که درمان B نسبت به درمان A پایین تر است، اما همانطور که از این مثال نشان داده شد، این نتیجه کاملاً نادرست است. برای غلبه بر این مشکل می توان از افزودن “اندازه های اثر” استفاده کرد.

اندازه اثر به بزرگی یک نتیجه اشاره دارد. روش های مختلفی برای محاسبه اندازه یک اثر وجود دارد. اصطلاح اندازه اثر می‌تواند به اندازه‌های اثر غیر استاندارد (مثلاً تفاوت بین میانگین‌های گروه، ریسک نسبی یا نسبت شانس) یا اندازه‌های اثر استاندارد شده (مانند “همبستگی” یا “d کوهن”) اشاره داشته باشد.

اندازه های اثر غیر استاندارد: نسبت خطر و احتمال نسبی- اهمیت اندازه اثرها

هدف بسیاری از مقالات تحقیقاتی توصیف مزایای احتمالی یک درمان یا درمان (جدید) بر روی یک متغیر نتیجه باینری، یعنی وجود یا عدم وجود بیماری است. این مقالات اغلب نتایج خود را («اثرات») از نظر ریسک نسبی (RR) یا نسبت شانس (OR) گزارش می‌کنند. از آنجایی که گرایشی وجود دارد که فکر کنیم این دو اندازه اثر مشابه هستند، اغلب، به اشتباه، به جای یکدیگر استفاده می‌شوند. قبل از توصیف RR و OR، ابتدا باید اصطلاح “ریسک مطلق” را درک کنیم. ریسک مطلق ریسکی است که بدون مقایسه با هیچ خطر دیگری بیان می شود، این فقط یک احتمال است که یک رویداد خاص رخ می دهد، به عنوان مثال. خطر ابتلای فردی به اختلال افسردگی 5 درصد است.

ریسک نسبی- اهمیت اندازه اثرها

ریسک نسبی (RR) مقایسه ای بین سطوح مختلف خطر است و اغلب در مطالعات آینده نگر (مانند مطالعات کوهورت و مطالعات تجربی) استفاده می شود. یعنی RR نسبت احتمال وقوع یک رویداد در یک گروه به احتمال وقوع آن رویداد در گروه دیگر است. به عنوان مثال، اگر خطر نسبی افسردگی برای زنان در مقایسه با مردان 1.14 باشد، این بدان معناست که زنان 14 درصد بیشتر از مردان در معرض ابتلا به افسردگی هستند. یک راه برای تعریف این است

که در آن RR خطر نسبی گروه 1 در مقابل گروه 2 است، a1 و a2 تعداد رویدادهای درون گروه 1 و 2 است و n1 و n2 به ترتیب تعداد کل افراد در گروه 1 و 2 هستند. از این رو، RR نسبت نسبت افرادی است که در معرض آن قرار گرفتند و نتیجه یا شرایط را ایجاد کردند به نسبت افرادی که در معرض قرار نگرفته بودند و نتیجه یا شرایط را ایجاد کردند.

نسبت شانس- اهمیت اندازه اثرها

نسبت شانس (OR) نسبتی از دو شانس است. «شانس» به عنوان تعداد رویدادها (مثلاً بیمار) تقسیم بر تعداد غیر رویدادها (مثلاً سالم) در یک گروه محاسبه می شود. سپس OR با تقسیم شانس یک گروه (به عنوان مثال گروه درمان) بر شانس گروه دیگر (به عنوان مثال گروه کنترل)، همانطور که در فرمول زیر نشان داده شده است، محاسبه می شود.

که در آن OR نسبت شانس گروه 1 به گروه 2 است، a1 و a2 به ترتیب تعداد رویدادها (“بیماری”) در گروه 1 و 2 است و b1 و b2 تعداد غیر رویدادها (“سالم”) هستند. در گروه 1 و 2. اغلب، ORها در مطالعات گذشته نگر برای ارائه تقریبی از خطر نسبی استفاده می شوند.

درک شهودی نسبت شانس ممکن است سخت باشد (یعنی OR 6 به معنای “شش برابر بیشتر احتمال تجربه نتیجه در دست” نیست). در نتیجه، نسبت‌های شانس اغلب به عنوان معادل ریسک نسبی تفسیر می‌شوند. با این حال، OR تنها زمانی شبیه به RR است که خطر اولیه یک رویداد (یعنی شیوع نتیجه در دست) کم باشد. اگر شیوع یک وضعیت یا رویداد خاص افزایش یابد، تفاوت بزرگتری بین RR و OR آشکار می شود.

وضعیت فرضی زیر را در نظر بگیرید: زنان در 80 درصد مواقع به افسردگی مبتلا می شوند در حالی که مردان در 70 درصد موارد. بنابراین شانس برای زنان 4 (80/20) و 2.3 برای مردان (70/30) است. از این رو، نسبت شانس زنان نسبت به مردان 1.7 (4/2.3) خواهد بود. با این حال، این نتیجه گیری که زنان 70 درصد بیشتر در معرض ابتلا به افسردگی هستند، خطر ابتلا به افسردگی را برای زنان بیش از حد برآورد می کند، زیرا خطر نسبی “فقط” 1.14 (80/70) است.

این مثال نشان می‌دهد که تفسیر یک OR به‌گونه‌ای که گویی یک RR است، وقتی به این نتیجه می‌رسد که اندازه اثر بزرگ‌تر از چیزی است که واقعاً هست، نادرست است. این بدان معنا نیست که RR ها بر OR ها برتری دارند یا برعکس. هر دو محاسبات ریسک در یک “مقیاس” متفاوت اندازه گیری می شوند و هر دو دارای عناصر مثبت و منفی خود هستند و اغلب در طرح های مطالعاتی مختلف استفاده می شوند.

اهمیت اندازه اثرها
اهمیت اندازه اثرها – تزیسمی

اندازه های اثر استاندارد: همبستگی و D کوهن- اهمیت اندازه اثرها

هنگامی که مطالعات با مقیاس‌های اندازه‌گیری مختلف مقایسه می‌شوند، اندازه‌های اثر استاندارد بر اندازه‌های اثر غیراستاندارد ترجیح داده می‌شوند. اندازه اثر استاندارد مقایسه بین مطالعات را تسهیل می کند (به عنوان مثال در متاآنالیز) (نقل به 12).

همبستگی

اندازه اثری که محققان پزشکی ممکن است با آن آشنا باشند همبستگی است. همبستگی تعیین می کند که تا چه حد دو متغیر عددی «متناسب» با یکدیگر هستند و وابستگی خطی نشان می دهند. به عنوان مثال، سطح کلسترول (mmol/l) با سن مرتبط است، یعنی کلسترول به طور کلی با افزایش سن افزایش می یابد. چندین ضریب همبستگی وجود دارد که ضریب همبستگی پیرسون (‘r’) متداول ترین آنهاست. این ضریب همبستگی پیرسون از تقسیم کوواریانس (sxy) دو متغیر بر حاصل ضرب انحراف معیار آنها (sx و sy) به دست می آید:

همبستگی از “بدون رابطه خطی” (r = 0) تا “رابطه خطی کامل” (r = 1 نشان دهنده یک رابطه خطی مثبت کامل و r = -1 نشان دهنده یک رابطه خطی منفی کامل) است. به عبارت دیگر، اگر مقادیر دو متغیر را در برابر یکدیگر رسم کنید (نقاط پراکندگی)، اگر امکان ترسیم یک بیضی در اطراف نقاطی وجود داشته باشد که بتوان آن را با یک خط مستقیم به سمت بالا یا پایین تقریب زد، همبستگی زیاد است. همبستگی معنادار بین دو متغیر لزوماً به معنای ارتباط قوی نیست، به عنوان مثال. اگر حجم نمونه 50 باشد، همبستگی های پیرسون 0.28 یا بالاتر از نظر آماری معنی دار هستند در حالی که همبستگی <0.30 به ندرت یک ارتباط قوی در نظر گرفته می شود.

کوهن د- اهمیت اندازه اثرها

هنگام مقایسه مقدار میانگین یک متغیر عددی بین دو گروه می توان از d کوهن استفاده کرد. به عنوان مثال، میانگین سطح کلسترول (mmol/l) بیماران دیابتی در مقابل بیماران بدون دیابت یا میانگین نمره در پرسشنامه افسردگی بیماران قلبی عروقی در مقابل بدون بیماری قلبی عروقی) (نقل5). این تفاوت استاندارد شده بین دو میانگین، ȳ1-ȳ2 را نشان می دهد که در واحدهای انحراف استاندارد بیان می شود، یعنی تقسیم بر انحراف استاندارد درون گروهی (تلفیقی) داده های موجود، sy. فرمول محاسبه d کوهن به صورت زیر است:

البته، تفسیر اندازه d کوهن باید در چارچوب مطالعه مورد نظر انجام شود، اما پیشنهاد شده است که مقدار 0.2 یا کمتر را باید یک اثر کوچک در نظر گرفت، مقداری بین 0.2 و 0.5 به عنوان یک اثر. اندازه افکت متوسط و مقدار 0.8 یا بزرگتر به عنوان افکت بزرگ. این نشان می‌دهد که، اگرچه یک اثر مشاهده‌شده ممکن است از نظر آماری معنی‌دار باشد، اما زمانی که به d کوهن 0.1 مرتبط می‌شود، ممکن است کم‌اهمیت باشد (نقل5). d کوهن نیز اغلب در محاسبات اندازه نمونه استفاده می شود، جایی که d کوهن کمتر نشان دهنده نیاز به حجم نمونه بزرگتر است.

بحث و توصیه

همانطور که قبلاً گفته شد، عبارت “این یک اثر قابل توجه است” می تواند بسیار گمراه کننده باشد زیرا اهمیت آماری به اندازه اثر، تعداد شرکت کنندگان در نمونه، طرح تحقیق و آزمون آماری مورد استفاده بستگی دارد. از این رو، حتی اثرات بی اهمیت نیز می توانند از نظر آماری معنی دار شوند، و بالعکس، یعنی اثرات مرتبط بالینی لازم نیست از نظر آماری معنی دار باشند. به غیر از اظهارات مربوط به اهمیت آماری، محققان همچنین باید اندازه اثر به دست آمده را گزارش کنند.

اندازه اثر، از جمله نمونه های ذکر شده در بالا، محققان پزشکی را قادر می سازد تا قدرت رابطه بین متغیرها را اندازه گیری کنند. بر خلاف آزمون معنی‌داری، اندازه اثر (استاندارد) این فرصت را به محققان پزشکی می‌دهد تا درمان‌ها یا درمان‌های گزارش‌شده را برای مثال، در کارآزمایی‌های تصادفی‌سازی‌شده و کنترل‌شده مختلف مقایسه کنند. با این حال، محققان باید در نظر داشته باشند که مقایسه اندازه‌های اثر (مثلاً بین مطالعاتی که درمان‌های مختلف را ارزیابی می‌کنند) تنها در صورتی مفید است که نحوه محاسبه اندازه این اثرات قابل مقایسه باشد. به این معنا که مطالعاتی که به طور قابل ملاحظه ای در مورد طراحی یا روش مورد استفاده متفاوت است، می تواند مقایسه اندازه اثر را پیچیده کند و بنابراین می تواند به راحتی به نتیجه گیری های نادرست منجر شود.

با توجه به اینکه اندازه اثر گزارش تفسیر نتایج مطالعات پزشکی را تسهیل می‌کند، محققان پزشکی به شدت تشویق می‌شوند تا اندازه‌های اثر را برای پاسخ به این سوال ارائه دهند که “تاثیر چقدر است؟” با دانش و تخصص متخصصان پزشکی در مورد آنها پژوهشگر و حوزه تخصص انجام شده، سپس با استفاده از این اندازه‌های اثر، می‌تواند تعیین کند که آیا اثر مشاهده‌شده از نظر بالینی مرتبط است یا خیر.

در نتیجه، اندازه‌های اثر (استاندارد شده) باید به آزمایش معنی‌داری اضافه شود تا بتوان در مورد یافتن اثر مرتبط بالینی تصمیم گرفت، تا به تعیین حجم نمونه برای مطالعه احتمالی آینده کمک کند، و مقایسه بین مطالعات در متاآنالیز را تسهیل کند.

یک دیدگاه ثبت کنید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *