تحلیل آماری

تحلیل آماری در انجام پایان نامه به معنای بررسی روندها، الگوها و روابط با استفاده از داده های کمی است. این یک ابزار تحقیقاتی مهم است که توسط دانشمندان، دولت ها، مشاغل و سایر سازمان ها استفاده می شود.

برای نتیجه گیری معتبر، تجزیه و تحلیل آماری نیاز به برنامه ریزی دقیق از همان آغاز فرآیند تحقیق دارد. شما باید فرضیه های خود را مشخص کنید و در مورد طرح تحقیق، حجم نمونه و روش نمونه گیری تصمیم گیری کنید.

پس از جمع آوری داده ها از نمونه خود، می توانید داده ها را با استفاده از آمار توصیفی سازماندهی و خلاصه کنید. سپس، می‌توانید از آمار استنباطی برای آزمایش رسمی فرضیه‌ها و تخمین‌هایی درباره جمعیت استفاده کنید. در نهایت، می توانید یافته های خود را تفسیر و تعمیم دهید.

فهرست مطالب

مثال: سوال علّی تحقیق

آیا مدیتیشن می تواند عملکرد امتحان را در نوجوانان بهبود بخشد؟
مثال: سوال تحقیق همبستگی
آیا بین درآمد والدین و معدل دانشگاهی (GPA) رابطه وجود دارد؟

مرحله 1: فرضیه های خود را بنویسید و طرح تحقیق خود را برنامه ریزی کنید

برای جمع آوری داده های معتبر برای تجزیه و تحلیل آماری، ابتدا باید فرضیه های خود را مشخص کنید و طرح تحقیق خود را برنامه ریزی کنید.

نوشتن فرضیه های آماری در تحیل آماری

هدف پژوهش اغلب بررسی رابطه بین متغیرها در یک جامعه است. شما با یک پیش بینی شروع می کنید و از تجزیه و تحلیل آماری برای آزمایش آن پیش بینی استفاده می کنید.

فرضیه آماری روشی رسمی برای نوشتن پیش‌بینی در مورد یک جمعیت است. هر پیش‌بینی تحقیق به فرضیه‌های صفر و جایگزین تبدیل می‌شود که می‌توانند با استفاده از داده‌های نمونه آزمایش شوند.

در حالی که فرضیه صفر همیشه هیچ تاثیری یا عدم رابطه بین متغیرها را پیش‌بینی می‌کند، فرضیه جایگزین پیش‌بینی تحقیق شما از یک اثر یا رابطه را بیان می‌کند.

مثال: فرضیه های آماری برای آزمایش یک اثر

فرضیه صفر: یک تمرین مراقبه 5 دقیقه ای هیچ تاثیری بر نمرات آزمون ریاضی در نوجوانان نخواهد داشت.
فرضیه جایگزین: یک تمرین مراقبه 5 دقیقه ای نمرات آزمون ریاضی را در نوجوانان بهبود می بخشد.

مثال: فرضیه های آماری برای آزمون همبستگی

فرضیه: درآمد والدین و معدل در دانشجویان ارتباطی با صفر وجود ندارد.
فرضیه جایگزین: درآمد والدین و معدل در دانشجویان همبستگی دارند.

طرح تحقیق خود را برنامه ریزی کنید

طرح تحقیق استراتژی کلی شما برای جمع آوری و تجزیه و تحلیل داده ها است. این آزمون های آماری را تعیین می کند که می توانید بعداً برای آزمایش فرضیه خود از آنها استفاده کنید.

ابتدا تصمیم بگیرید که آیا تحقیق شما از طرح توصیفی، همبستگی یا آزمایشی استفاده خواهد کرد. آزمایش‌ها مستقیماً بر متغیرها تأثیر می‌گذارند، در حالی که مطالعات توصیفی و همبستگی فقط متغیرها را اندازه‌گیری می‌کنند.

در یک طرح آزمایشی، می‌توانید با استفاده از آزمون‌های آماری مقایسه یا رگرسیون، یک رابطه علت و معلولی (به عنوان مثال، تأثیر مراقبه بر نمرات آزمون) را ارزیابی کنید.
در یک طرح همبستگی، می توانید روابط بین متغیرها (به عنوان مثال، درآمد والدین و معدل) را بدون هیچ گونه فرض علیت با استفاده از ضرایب همبستگی و آزمون های معناداری بررسی کنید.
در یک طرح توصیفی، می‌توانید با استفاده از آزمون‌های آماری، ویژگی‌های یک جمعیت یا پدیده (به عنوان مثال، شیوع اضطراب در دانشجویان ایالات متحده) را برای استنتاج از داده‌های نمونه مطالعه کنید.
طرح تحقیق شما همچنین به این موضوع مربوط می شود که آیا شرکت کنندگان را در سطح گروهی یا فردی یا هر دو مقایسه خواهید کرد.

در طراحی بین آزمودنی‌ها، نتایج در سطح گروه شرکت‌کنندگانی را که در معرض درمان‌های مختلف قرار گرفته‌اند (مثلاً کسانی که تمرین مدیتیشن انجام داده‌اند در مقابل کسانی که انجام نداده‌اند) مقایسه می‌کنید.
در یک طرح درون آزمودنی، اقدامات مکرر شرکت‌کنندگانی را که در تمام درمان‌های یک مطالعه شرکت کرده‌اند (مثلاً نمرات قبل و بعد از انجام تمرین مراقبه) مقایسه می‌کنید.
در طرح ترکیبی (فاکتوری)، یک متغیر بین آزمودنی‌ها تغییر می‌کند و متغیری دیگر در درون آزمودنی‌ها تغییر می‌کند (مثلاً نمرات پیش‌آزمون و پس‌آزمون از شرکت‌کنندگانی که تمرین مدیتیشن را انجام داده‌اند یا انجام نداده‌اند).

اندازه گیری متغیرها در تحلیل آماری

هنگام برنامه ریزی یک طرح تحقیق، باید متغیرهای خود را عملیاتی کنید و دقیقاً تصمیم بگیرید که چگونه آنها را اندازه گیری کنید.

برای تجزیه و تحلیل آماری، مهم است که سطح اندازه‌گیری متغیرهای خود را در نظر بگیرید، که به شما می‌گوید چه نوع داده‌هایی دارند:

داده های طبقه بندی نشان دهنده گروه بندی است. اینها ممکن است اسمی (به عنوان مثال، جنسیت) یا ترتیبی (مثلاً سطح توانایی زبان) باشند.
داده های کمی نشان دهنده مقادیر هستند. اینها ممکن است در مقیاس فاصله ای (مثلاً نمره آزمون) یا مقیاس نسبت (مثلاً سن) باشند.
بسیاری از متغیرها را می توان در سطوح مختلف دقت اندازه گیری کرد. به عنوان مثال، داده های سنی می تواند کمی (8 ساله) یا طبقه ای (جوان) باشد. اگر متغیری به صورت عددی کدگذاری شود (مثلاً سطح توافق از 1 تا 5)، به طور خودکار به این معنی نیست که به جای طبقه بندی، کمی است.

شناسایی سطح اندازه گیری برای انتخاب آمار مناسب و آزمون های فرضیه مهم است. به عنوان مثال، شما می توانید میانگین امتیاز را با داده های کمی محاسبه کنید، اما نه با داده های طبقه بندی.

در یک مطالعه تحقیقاتی، همراه با اندازه گیری متغیرهای مورد علاقه خود، اغلب داده هایی را در مورد ویژگی های شرکت کننده مرتبط جمع آوری می کنید.

مرحله 2: جمع آوری داده ها از نمونه

جمعیت در مقابل نمونه
در بیشتر موارد، جمع‌آوری داده‌ها از هر عضوی از جمعیتی که علاقه‌مند به مطالعه آن هستید، بسیار دشوار یا پرهزینه است. در عوض، داده ها را از یک نمونه جمع آوری خواهید کرد.

تجزیه و تحلیل آماری به شما امکان می دهد تا زمانی که از روش های نمونه گیری مناسب استفاده می کنید، یافته های خود را فراتر از نمونه خود اعمال کنید. شما باید نمونه ای را هدف بگیرید که نماینده جامعه باشد.

نمونه گیری برای تجزیه و تحلیل آماری

دو رویکرد اصلی برای انتخاب نمونه وجود دارد.

نمونه گیری احتمالی: هر یک از اعضای جامعه از طریق انتخاب تصادفی شانس انتخاب برای مطالعه را دارند.
نمونه گیری غیراحتمالی: برخی از اعضای جامعه به دلیل معیارهایی مانند سهولت یا انتخاب داوطلبانه، بیشتر از سایرین برای مطالعه انتخاب می شوند.
در تئوری، برای یافته های بسیار قابل تعمیم، باید از روش نمونه گیری احتمالی استفاده کنید. انتخاب تصادفی سوگیری نمونه‌گیری را کاهش می‌دهد و تضمین می‌کند که داده‌های نمونه شما در واقع نمونه‌ای از جامعه است. هنگامی که داده ها با استفاده از نمونه گیری احتمالی جمع آوری می شوند، می توان از آزمون های پارامتریک برای استنتاج های آماری قوی استفاده کرد.

اما در عمل، به ندرت امکان جمع آوری نمونه ایده آل وجود دارد. در حالی که نمونه‌های غیر احتمالی بیشتر احتمال دارد که سوگیری داشته باشند، جذب و جمع‌آوری داده‌ها از آنها بسیار آسان‌تر است. آزمون‌های ناپارامتریک برای نمونه‌های غیراحتمالی مناسب‌تر هستند، اما استنباط‌های ضعیف‌تری در مورد جامعه ایجاد می‌کنند.

اگر می‌خواهید از آزمون‌های پارامتریک برای نمونه‌های غیر احتمالی استفاده کنید، باید موارد زیر را بیان کنید:

نمونه شما نماینده جمعیتی است که یافته های خود را به آن تعمیم می دهید.
نمونه شما فاقد سوگیری سیستماتیک است.
به خاطر داشته باشید که اعتبار خارجی به این معنی است که شما فقط می توانید نتیجه گیری خود را به دیگرانی که ویژگی های نمونه شما را به اشتراک می گذارند تعمیم دهید. به عنوان مثال، نتایج حاصل از نمونه‌های غربی، تحصیل کرده، صنعتی، ثروتمند و دموکرات (مثلاً دانشجویان کالج در ایالات متحده) به طور خودکار برای همه جمعیت‌های غیرعجیب قابل استفاده نیست.

اگر آزمون‌های پارامتریک را برای داده‌های نمونه‌های غیر احتمالی اعمال می‌کنید، حتماً در مورد محدودیت‌های تا چه حد می‌توان نتایج خود را تعمیم داد، در بخش بحث خود توضیح دهید.

یک روش نمونه گیری مناسب ایجاد کنید

بر اساس منابع موجود برای تحقیق خود، در مورد نحوه جذب شرکت کنندگان تصمیم بگیرید.

آیا منابعی برای تبلیغ گسترده مطالعه خود، از جمله خارج از محیط دانشگاه خود خواهید داشت؟
آیا ابزاری برای استخدام یک نمونه متنوع خواهید داشت که نشان دهنده یک جمعیت گسترده باشد؟
آیا زمانی برای تماس و پیگیری با اعضای گروه های غیرقابل دسترسی دارید؟

مثال: نمونه برداری (آزمایش) تحلیل آماری

جمعیت مورد علاقه شما دانش آموزان دبیرستانی شهر شما هستند. شما با سه مدرسه خصوصی و هفت مدرسه دولتی در مناطق مختلف شهر تماس بگیرید تا ببینید آیا می توانید آزمایش خود را برای دانش آموزان کلاس یازدهم انجام دهید یا خیر.
شرکت کنندگان شما توسط مدارس خود انتخاب می شوند. اگرچه شما از نمونه غیر احتمالی استفاده می کنید، اما هدف شما نمونه ای متنوع و نماینده است.

حجم نمونه کافی را محاسبه کنید

قبل از استخدام شرکت کنندگان، با بررسی سایر مطالعات در زمینه خود یا با استفاده از آمار، در مورد حجم نمونه خود تصمیم بگیرید. نمونه‌ای که خیلی کوچک است ممکن است نماینده نمونه نباشد، در حالی که نمونه‌ای که خیلی بزرگ است پرهزینه‌تر از آنچه لازم است خواهد بود.

تعداد زیادی ماشین حساب اندازه نمونه آنلاین وجود دارد. بسته به اینکه آیا زیر گروه دارید یا اینکه مطالعه شما چقدر باید دقیق باشد (به عنوان مثال، در تحقیقات بالینی) از فرمول های مختلفی استفاده می شود. به عنوان یک قاعده کلی، حداقل 30 واحد یا بیشتر در هر زیرگروه ضروری است.

برای استفاده از این ماشین حساب ها، باید این مولفه های کلیدی را درک کرده و وارد کنید:

سطح اهمیت (آلفا): خطر رد یک فرضیه صفر واقعی که مایل به پذیرش آن هستید، معمولاً 5٪ تعیین می شود.
قدرت آماری: احتمال اینکه مطالعه شما اثری با اندازه معین را تشخیص دهد، اگر وجود داشته باشد، معمولاً 80٪ یا بیشتر.
اندازه اثر مورد انتظار: یک نشانه استاندارد از اینکه نتیجه مورد انتظار مطالعه شما چقدر بزرگ خواهد بود، معمولا بر اساس سایر مطالعات مشابه.
انحراف استاندارد جمعیت: برآورد پارامتر جمعیت بر اساس مطالعه قبلی یا مطالعه آزمایشی خودتان.

مرحله 3: داده های خود را با آمار توصیفی خلاصه کنید

هنگامی که تمام داده های خود را جمع آوری کردید، می توانید آنها را بررسی کرده و آمار توصیفی را محاسبه کنید که آنها را خلاصه می کند.

داده های خود را در تحلیل آماری بررسی کنید

روش های مختلفی برای بررسی داده های شما وجود دارد، از جمله موارد زیر:

سازماندهی داده ها از هر متغیر در جداول توزیع فرکانس.
نمایش داده ها از یک متغیر کلیدی در نمودار میله ای برای مشاهده توزیع پاسخ ها.
تجسم رابطه بین دو متغیر با استفاده از نمودار پراکندگی.
با تجسم داده‌های خود در جداول و نمودارها، می‌توانید ارزیابی کنید که آیا داده‌های شما از توزیع اریب یا نرمال پیروی می‌کنند و آیا داده‌های پرت یا گمشده وجود دارد یا خیر.

توزیع نرمال به این معنی است که داده‌های شما به طور متقارن در اطراف مرکزی توزیع می‌شوند که بیشتر مقادیر در آن قرار دارند و مقادیر در انتهای انتهایی آن کاهش می‌یابد.

در مقابل، یک توزیع اریب نامتقارن است و مقادیر بیشتری در یک طرف نسبت به طرف دیگر دارد. شکل توزیع مهم است که به خاطر داشته باشید زیرا فقط برخی از آمار توصیفی باید با توزیع های اریب استفاده شوند.

نقاط دورافتاده شدید نیز می‌توانند آمارهای گمراه‌کننده ایجاد کنند، بنابراین ممکن است به یک رویکرد سیستماتیک برای مقابله با این مقادیر نیاز داشته باشید.

معیارهای گرایش مرکزی را محاسبه کنید

معیارهای گرایش مرکزی توصیف می کنند که بیشتر مقادیر در یک مجموعه داده کجا قرار دارند. سه معیار اصلی گرایش مرکزی اغلب گزارش می شود:

حالت: محبوب ترین پاسخ یا مقدار در مجموعه داده ها.
میانه: مقدار دقیقاً در وسط مجموعه داده در هنگام سفارش از کم به زیاد.
میانگین: مجموع همه مقادیر تقسیم بر تعداد مقادیر.
با این حال، بسته به شکل توزیع و سطح اندازه گیری، تنها یک یا دو مورد از این معیارها ممکن است مناسب باشد. به عنوان مثال، بسیاری از ویژگی های جمعیت شناختی را فقط می توان با استفاده از حالت یا نسبت ها توصیف کرد، در حالی که متغیری مانند زمان واکنش ممکن است اصلاً حالت نداشته باشد.

اندازه گیری تغییرپذیری را محاسبه کنید

اندازه‌گیری‌های تغییرپذیری به شما می‌گویند که مقادیر در یک مجموعه داده چقدر پراکنده هستند. چهار معیار اصلی تغییرپذیری اغلب گزارش شده است:

محدوده: بالاترین مقدار منهای کمترین مقدار مجموعه داده.
محدوده بین چارکی: محدوده نیمه میانی مجموعه داده.
انحراف استاندارد: فاصله متوسط بین هر مقدار در مجموعه داده شما و میانگین.
واریانس: مربع انحراف معیار.
یک بار دیگر، شکل توزیع و سطح اندازه‌گیری باید راهنمای انتخاب آمار تنوع شما باشد. محدوده بین چارکی بهترین معیار برای توزیع های اریب است، در حالی که انحراف استاندارد و واریانس بهترین اطلاعات را برای توزیع های نرمال ارائه می دهد.

مرحله 4: فرضیه ها را آزمایش کنید یا با آمار استنباطی تخمین بزنید

عددی که یک نمونه را توصیف می کند، آمار نامیده می شود، در حالی که عددی که یک جامعه را توصیف می کند، پارامتر نامیده می شود. با استفاده از آمار استنباطی، می توانید بر اساس آمار نمونه در مورد پارامترهای جمعیت نتیجه گیری کنید.

محققان اغلب از دو روش اصلی (به طور همزمان) برای استنتاج در آمار استفاده می کنند.

برآورد: محاسبه پارامترهای جمعیت بر اساس آمار نمونه.
آزمون فرضیه: فرآیندی رسمی برای آزمایش پیش‌بینی‌های پژوهشی در مورد جامعه با استفاده از نمونه‌ها.
برآورد کردن
شما می توانید دو نوع تخمین از پارامترهای جمعیت را از آمار نمونه انجام دهید:

تخمین نقطه ای: مقداری که بهترین حدس شما را از پارامتر دقیق نشان می دهد.
تخمین بازه ای: محدوده ای از مقادیر که بهترین حدس شما را از کجای پارامتر نشان می دهد.

همیشه خطا در برآورد وجود دارد، بنابراین باید یک فاصله اطمینان را نیز به عنوان تخمین فاصله ارائه کنید تا تغییرپذیری حول یک تخمین نقطه را نشان دهید.

یک فاصله اطمینان از خطای استاندارد و نمره z از توزیع نرمال استاندارد استفاده می کند تا جایی که معمولاً انتظار دارید پارامتر جمعیت را در بیشتر مواقع پیدا کنید.

تست فرضیه تحلیل آماری

با استفاده از داده های یک نمونه، می توانید فرضیه هایی را در مورد روابط بین متغیرها در جامعه آزمایش کنید. آزمون فرضیه با این فرض شروع می شود که فرضیه صفر در جامعه صادق است و شما از آزمون های آماری برای ارزیابی اینکه آیا فرضیه صفر قابل رد است یا خیر، استفاده می کنید.

آزمون‌های آماری تعیین می‌کنند که اگر فرضیه صفر درست باشد، داده‌های نمونه شما در توزیع مورد انتظار داده‌های نمونه کجا قرار می‌گیرند. این تست ها دو خروجی اصلی را ارائه می دهند:

یک آمار آزمون به شما می گوید که چقدر داده های شما با فرضیه صفر آزمون تفاوت دارد.
اگر فرضیه صفر واقعاً در جامعه صادق باشد، یک مقدار p احتمال به دست آوردن نتایج را به شما می گوید.
آزمون های آماری در سه نوع اصلی ارائه می شوند:

آزمون‌های مقایسه تفاوت‌های گروهی را در نتایج ارزیابی می‌کنند.
آزمون های رگرسیون روابط علت و معلولی بین متغیرها را ارزیابی می کنند.
آزمون های همبستگی روابط بین متغیرها را بدون فرض علیت ارزیابی می کنند.
انتخاب آزمون آماری شما به سؤالات تحقیق، طرح تحقیق، روش نمونه گیری و ویژگی های داده بستگی دارد.

تست های پارامتریک تحلیل آماری

آزمون‌های پارامتریک استنباط‌های قدرتمندی در مورد جامعه براساس داده‌های نمونه ایجاد می‌کنند. اما برای استفاده از آنها باید برخی از مفروضات را رعایت کرد و فقط می توان از برخی از انواع متغیرها استفاده کرد. اگر داده‌های شما این مفروضات را نقض می‌کنند، می‌توانید تبدیل داده‌های مناسب را انجام دهید یا به جای آن از آزمون‌های ناپارامتریک جایگزین استفاده کنید.

رگرسیون میزان تغییرات یک متغیر پیش‌بینی‌کننده را به تغییر در متغیر(های) پیامد مدل می‌کند.

یک رگرسیون خطی ساده شامل یک متغیر پیش‌بینی‌کننده و یک متغیر نتیجه است.
رگرسیون خطی چندگانه شامل دو یا چند متغیر پیش‌بینی‌کننده و یک متغیر نتیجه است.
آزمون های مقایسه معمولاً میانگین گروه ها را با هم مقایسه می کنند.

آزمون t دقیقاً برای 1 یا 2 گروه است که نمونه کوچک است (30 یا کمتر).
یک آزمون z دقیقاً برای 1 یا 2 گروه است که نمونه بزرگ است.
ANOVA برای 3 یا بیشتر گروه است.
آزمون‌های z و t بر اساس تعداد و نوع نمونه‌ها و فرضیه‌ها دارای زیرگروه‌هایی هستند:

اگر فقط یک نمونه دارید که می خواهید آن را با میانگین جامعه مقایسه کنید، از آزمون تک نمونه ای استفاده کنید.
اگر اندازه‌گیری‌های زوجی (طراحی درون آزمودنی‌ها) دارید، از آزمون نمونه‌های وابسته (جفتی) استفاده کنید.
اگر اندازه گیری های کاملاً مجزا از دو گروه بی همتا (طراحی بین آزمودنی ها) دارید، از آزمون نمونه های مستقل (جفت نشده) استفاده کنید.
اگر انتظار دارید بین گروه ها در جهت خاصی تفاوت وجود داشته باشد، از تست یک دم استفاده کنید.
اگر هیچ انتظاری برای جهت تفاوت بین گروه ها ندارید، از آزمون دو طرفه استفاده کنید.
تنها آزمون همبستگی پارامتریک، r پیرسون است. ضریب همبستگی (r) قدرت رابطه خطی بین دو متغیر کمی را به شما می گوید. این آزمون از حجم نمونه شما برای محاسبه میزان تفاوت ضریب همبستگی با صفر در جامعه استفاده می کند.

مرحله 5: نتایج خود را تفسیر کنید

مرحله نهایی تجزیه و تحلیل آماری، تفسیر نتایج شما است.

اهمیت آماری
در آزمون فرضیه ها، اهمیت آماری معیار اصلی برای نتیجه گیری است. شما مقدار p خود را با سطح معنی داری (معمولاً 0.05) مقایسه می کنید تا تصمیم بگیرید که آیا نتایج شما از نظر آماری معنی دار هستند یا غیر معنی دار. تنها در صورتی که فرضیه صفر در جامعه صادق باشد، احتمال وقوع چنین نتیجه ای بسیار کم است.

اندازه اثر

یک نتیجه آماری معنی دار لزوماً به این معنی نیست که برنامه های کاربردی زندگی واقعی یا نتایج بالینی مهمی برای یک یافته وجود دارد.

در مقابل، اندازه اثر نشان دهنده اهمیت عملی نتایج شما است. مهم است که اندازه افکت ها را همراه با آمار استنباطی خود برای تصویر کاملی از نتایج خود گزارش دهید. همچنین اگر در حال نوشتن مقاله ای به سبک APA هستید، باید تخمین فاصله اندازه افکت ها را گزارش کنید.

اشتباهات تصمیم گیری

خطاهای نوع اول و دوم اشتباهاتی هستند که در نتیجه گیری تحقیق انجام می شود. خطای نوع I به معنای رد فرضیه صفر زمانی است که واقعاً درست است، در حالی که خطای نوع II به معنای عدم موفقیت در رد فرضیه صفر در صورت نادرست است.

شما می توانید با انتخاب سطح اهمیت بهینه و اطمینان از قدرت بالا، خطر این خطاها را به حداقل برسانید. با این حال، یک معاوضه بین این دو خطا وجود دارد، بنابراین یک تعادل خوب ضروری است.

 

یک دیدگاه ثبت کنید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *