آمار زیستی و ادبیات دامپزشکی
فصل پنجم کتاب اتیجر – راهنمای جامع درک و ارزیابی انتقادی مقالات علمی
???? هدف این فصل: این فصل به دامپزشکانی اختصاص دارد که میخواهند بدون درگیر شدن با ریاضیات پیچیده، مفاهیم آماری پایه را بفهمند تا بتوانند مقالات علمی را به صورت انتقادی بخوانند و تصمیمات بالینی بهتری بگیرند.
???? مدل آماری و انواع متغیرها
مدل آماری چیست؟ یک عبارت ریاضی که متغیرهای پیشبین (مستقل) را به متغیرهای پیامد (وابسته) مرتبط میکند. بهترین مدل، مدلی است که با کمترین تعداد پیشبین بتواند پیامد را توضیح دهد (به این میگویند صرفهجویی - parsimony).
انواع متغیرها (جدول ۵.۲)
???? آمار توصیفی – شناخت داده
تمایل مرکزی (Central Tendency)
- میانگین (Mean): برای دادههای نرمال (توزیع زنگی شکل) استفاده میشود
- میانه (Median): برای دادههای غیرنرمال یا دارای نقاط پرت (outlier) استفاده میشود
- نما (Mode): مقداری که بیشترین تکرار را دارد
پراکندگی (Dispersion)
- انحراف معیار (SD): پراکندگی دادههای فردی را نشان میدهد. هرچه بیشتر باشد، دادهها پراکندهتر هستند.
- دامنه بین چارکی (IQR): فاصله چارک ۱ تا ۳. برای دادههای غیرنرمال بهتر از SD است.
- خطای استاندارد میانگین (SEM): عدم قطعیت برآورد میانگین را نشان میدهد.
هرچه حجم نمونه بیشتر باشد، SEM کوچکتر میشود و برآورد ما از میانگین دقیقتر است.
???? آزمون فرضیه و معنیداری آماری (NHST)
فرضیهها
- H₀ (فرضیه صفر - Null Hypothesis): میگوید "هیچ تفاوتی وجود ندارد". این فرضیهای است که ما سعی میکنیم آن را رد کنیم.
- Hₐ (فرضیه جایگزین - Alternative Hypothesis): میگوید "تفاوت وجود دارد". این همان چیزی است که تحقیق به دنبال اثبات آن است.
مقدار P (P-value)
مقدار P احتمال این است که دادههای مشاهده شده (یا شدیدتر از آن) را تحت شرایط H₀ (عدم تفاوت) مشاهده کنیم.
- P کوچک → شواهد علیه H₀ قوی است → تفاوت معنیدار است
- مرسوم است P < 0.05 را به عنوان "معنیدار آماری" در نظر میگیریم
خطاهای آماری
توان آماری (Statistical Power)
توان آماری = 1 - β = توانایی تشخیص درست یک تفاوت واقعی
- هدف ایدهآل: Power ≥ 0.8 (۸۰٪)
- توان پایین → خطر بالای خطای نوع دوم (گفتیم تفاوت ندارد در حالی که دارد)
???? اندازه اثر (Effect Size) و فاصله اطمینان (CI)
چرا اندازه اثر مهم است؟ P-value فقط میگوید "آیا تفاوت تصادفی است یا نه" اما نمیگوید تفاوت چقدر بزرگ است یا از نظر بالینی مهم است یا نه.
اندازههای اثر رایج
- خطر نسبی (Relative Risk - RR): نسبت خطر در گروه درمان به گروه کنترل. RR < 1 یعنی درمان مفید است.
- نسبت شانس (Odds Ratio - OR): نسبت شانس مواجهه در گروه بیمار به گروه سالم. OR < 1 یعنی درمان مفید است.
- تعداد مورد نیاز برای درمان (Number Needed to Treat - NNT): به شما میگوید برای جلوگیری از یک رویداد بد، چند بیمار باید درمان شوند. NNT کوچک = درمان مؤثرتر.
- کوهن d (Cohen's d): تفاوت استاندارد شده بین دو میانگین. ۰.۲ = کوچک، ۰.۵ = متوسط، ۰.۸ = بزرگ.
فاصله اطمینان (Confidence Interval - CI)
فاصله اطمینان ۹۵٪ محدودهای است که با ۹۵٪ اطمینان شامل مقدار واقعی در جامعه میشود.
- باریک = دقیق (معمولاً حجم نمونه بزرگ)
- عریض = عدم قطعیت بالا (اغلب حجم نمونه کوچک)
- اگر فاصله اطمینان شامل ۱ باشد (برای RR و OR) یا شامل ۰ باشد (برای تفاوت میانگینها)، نتیجه معنیدار نیست.
???? انواع طراحی مطالعه
???? آزمونهای آماری رایج (جدول ۵.۳)
⚠️ خطاها و دامهای رایج (جدول ۵.۵)
در طراحی مطالعه
- ❌ عدم تحلیل توان پیشینی (a priori power analysis) – مهمترین خطا! اگر حجم مناسب را محاسبه نکنید، مطالعه شما ممکن است توان کافی نداشته باشد.
- ❌ حجم نمونه ناکافی → توان پایین
- ❌ متغیرهای بیش از حد → کاهش توان، نتایج مخدوش
- ❌ عدم گروه شاهد مناسب → نمیتوانید مقایسه معنیدار انجام دهید
در نمونهگیری
- ❌ نمونه غیرنماینده → نتایج قابل تعمیم به جمعیت هدف نیست
- ❌ عدم کورسازی (blinding) → سوگیری (bias)
- ❌ نمونهگیری در دسترس (convenience sampling) → مشکل شایع در مطالعات دانشگاهی
در تحلیل داده
- ❌ استفاده از آزمون آماری اشتباه → نتیجه نامعتبر
- ❌ عدم تست توزیع نرمال → ممکن است آزمون اشتباهی استفاده شود
- ❌ عدم تصحیح برای مقایسههای چندگانه → افزایش خطای نوع اول (مثبت کاذب)
- ❌ پی-هکینگ (P-hacking) – انجام تحلیل زیرگروهی انتخابی تا به P<0.05 برسید. این کار غیراخلاقی است و نتایج غیرقابل تکرار میدهد.
در تفسیر و گزارشدهی
- ❌ اتکای بیش از حد به P-value – P به تنهایی کافی نیست. همیشه اندازه اثر و فاصله اطمینان را بررسی کنید.
- ❌ نادیده گرفتن خطای نوع دوم – "عدم تفاوت معنیدار" ممکن است به دلیل توان پایین باشد.
- ❌ همبستگی ≠ علیت! دو متغیر ممکن است مرتبط باشند، اما این ثابت نمیکند یکی علت دیگری است.
- ❌ عدم گزارش قصد درمان (ITT) – در کارآزماییها، حذف بیمارانی که درمان را کامل نکردهاند باعث سوگیری میشود.
✅ چکلیست ارزیابی انتقادی مقاله
قبل از اینکه نتیجه یک مقاله را بپذیرید، این سوالات را بپرسید:
- آیا حجم نمونه کافی بود؟ (آیا تحلیل توان انجام شده؟)
- آیا آزمون آماری با نوع متغیر مناسب است؟
- آیا توزیع نرمال بررسی شده؟ (اگر نه، آزمون ناپارامتریک لازم است)
- آیا فاصله اطمینان و اندازه اثر گزارش شده؟
- آیا نتیجه از نظر بالینی مهم است؟ (نه فقط آماری)
- آیا مطالعه کور (blinded) بوده؟
- آیا گروه شاهد مناسب وجود دارد؟
- آیا خطاهای نوع اول (مقایسههای چندگانه) تصحیح شده؟
???? جمعبندی نهایی (سه پیام کلیدی)
- P-value فقط یک ابزار است، نه پاسخ نهایی. همیشه اندازه اثر و فاصله اطمینان را بررسی کنید تا اهمیت بالینی را ارزیابی کنید.
- "عدم تفاوت معنیدار" به معنای "اثر وجود ندارد" نیست. ممکن است مطالعه توان کافی برای تشخیص تفاوت نداشته باشد. قبل از نتیجهگیری، توان آماری را بررسی کنید.
- برای ارزیابی انتقادی یک مقاله، به طراحی مطالعه، حجم نمونه، آزمون آماری مناسب و گزارش اندازه اثر توجه کنید. از چکلیست خطاهای بالا استفاده کنید.
منبع: فصل پنجم کتاب اتیجر (Ettinger, 2020) – ترجمه و تحلیل تخصصی برای دامپزشکان و دانشجویان دامپزشکی










