آخرین گزارش ۷ اردیبهشت؛ چرا آمار کرونا را دیگر “به‌روز” نمی‌کنیم؟

۹ اردیبهشت ۱۳۹۱

بعد از ارائه ۴۷ گزارشِ روزانه از آمار مبتلایان به ویروس کووید-۱۹ در کل ایران و به تفکیک استان‌ها، ما در وب‌سایت 31، تصمیم گرفتیم از روز ۸ اردیبهشت صفحه ویژه “کرونا” و آمار مرتبط با آن را در وب‌سایت خودمان”به‌روز” نکنیم. دلیل ما هم اینست که گزارش‌های وزارت بهداشت در مورد مبتلایان به کرونا در ایران از مرحله “خطای سیستماتیک” به مرحله “عددسازی” رسیده است.

از ابتدای انتشار شیوع خبرهای مرتبط با کرونا در ایران (اول اسفند ۱۳۹۰)، وزارت بهداشت آمار روزانه مبتلایان به ویروس کرونا را در سطح کشور و به تفکیک استان‌ها منتشر می‌کرد. ما هم از روز ۲۰ اسفند تصمیم گرفتیم آمار روزانه را در نمودارهای تعاملی مختلف و از طریق صفحه ویژه کرونا و پلتفورمی که برای آن تهیه کردیم در اختیار مخاطبان خودمان قرار دهیم. هرچند به درستی، این ادعا مطرح بود که وزارت بهداشت، آمار مبتلایان را کمتر از مقدار واقعی ارائه می‌کند اما تصویر ما این بود – و همچنان هست – که از آغازِ انتشارِ خبرهای مرتبط با کرونا، خطای وزارت بهداشت در ارائه آمار واقعی، مبتنی بر یک خطای سیستماتیک است. به این معنی که بر اساس دستورالعمل‌ها و فرمول‌های مشخص درون‌سازمانی، محاسبهِ آمار مبتلایان بر اساس روند مشخصی -هرچند اشتباه- صورت می‌گیرد و این امر در کل کشور به صورت یکسان انجام می‌شود. در چنین حالتی اگر حتی داده‌های خام، اعداد واقعی مبتلایان را نمایان نکنند، اما بررسی روند و الگوهای آماری به خصوص در مواردی مانند مقایسه استان‌ها و تحلیل وضعیت آن‌ها نسبت به یکدیگر و همچنین محاسبه تغییرات استانی در روزهای متفاوت، می‌تواند اطلاعات مفیدی از هر استان به ما بدهد. به این معنی که شاید رقم واقعی تعداد مبتلایان درست نباشد، اما الگوی رفتاری استان‌ها در مواردی مانند شدت یا نفوذ ویروس در استان، لزوما نادرست نیست.

توقف انتشار آمار استانی توسط وزارت بهداشت

وزارت بهداشت از روز ۴ فروردین اعلام کرد که آمار مبتلایان را به تفکیک استان منتشر نخواهد کرد و صرفا به ارائه آمار کشوری بسنده می‌کند. برای توجیه این امر، وزارت بهداشت دلایلی مطرح کرد و از جمله مدعی شد چون برخی استان‌ها مبتلایان کمتری دارند، مردم ممکن است به این استان‌ها بروند و باعث شیوع بیشتر ویروس کرونا در استان‌های – به اصطلاح سفید – شوند. فارغ از اینکه چنین ادعایی در سفر به استان‌هایِ به اصطلاح کم‌خطر و تغییر محل زندگی، هرچند به‌صورت محدود، چندان عقلانی نیست، روندِ ارائه آمار استانی در روزهای آینده نادرستی این ادعا را نشان می‌دهد. چون از همان روز ۴ فروردین، اتفاقا آمار استان‌هایی که شیوع کرونا در آنها کمتر بود به صورت روزانه توسط دانشگاه‌های علوم پزشکی این استان‌ها منتشر می‌شد (به عنوان مثال نگاه کنید به گزارش‌های روزانه در استان‌های کهگیلویه، بوشهر، چهارمحال، هرمزگان و سیستان).

اتفاقا پس از این تاریخ یعنی ۴ فروردین، آمار مبتلایان در استان‌هایی اعلام نمی‌شد که شیوع کرونا در آنها خیلی زیاد بود مانند گیلان، مازندران، تهران، قم، البرز و اصفهان. به عبارت درست‌تر، روند ارائه گزارش‌های استانی در مورد مبتلایان به کرونا از ۴ فروردین به بعد،  دقیقا برخلاف دلایلی است که وزارت بهداشت مطرح کرده بود. جدول زیر آمار مبتلایان از روز ۵ فروردین تا ۷ اردیبهشت را به صورت تجمعی در استان‌های ایران نشان می‌دهد. اعداد جدول از گزارش‌های رسمی دانشگاه‌های علوم پزشکی کل کشور استخراج شده است. هرجا که عدد صفر وارد شده به این معنی است که در استان مورد نظر یا در تاریخ مورد نظر، گزارشی ارائه نشده است.

باوجود عدم ارائه آمار استانی به صورت رسمی توسط وزارت بهداشت، ما در وب‌سایت 31، با ۱- تجمیع آمار روزانه دانشگاه‌های علوم پزشکیِ استان‌ها که در ۱۵ تا ۲۰ استان به صورت روزانه ارائه می‌شد و ۲- تهیه سه مدل شبیه‎سازی شده از وضعیت استان‌ها در روزهای قبل و ۳- در نظرگرفتن متغیرهای مستقلِ تاثیرگذار بر تعداد کل مبتلایان به ویروس کووید-۱۹ در استان‌ها (شامل نسبت سنی در استان، میزان شهرنشینی در استان و تعداد بخش‌های مراقبت‌های ویژه آی سی یو و سی سی یو. این سه متغیر از تحلیل رگراسیون آمار کرونا در ایران بدست آمده‌اند. در مقاله‌ای که در تحلیل آمار مبتلایان به کرونا ارائه خواهیم کرد در مورد این روش تحلیل به صورت کافی توضیح می‌دهیم)، برآورد خودمان را از وضعیت مبتلایان به کرونا به تفکیک استان‌ها ارائه می‌کردیم.

بدیهی است که هر نوع مدل آماری و تحلیل داده‌ها مبتنی بر شبیه‌سازی و پیش‌بینی، نمی‌تواند بدون خطا باشد. ما بر اساس به‌روزرسانی و تنظیم هر روزه مدل، سعی در کاهش این خطا داشتیم، اما در مورد احتمال و شیوه یا شیوه‌های خطاهای ممکن هم آگاه بودیم. اما همانطور که گفته شد تا زمانی که خطای مبتنی بر ورود داده خام، سیستماتیک باشد، تحلیل الگوهای رفتاری در استان‌های مختلف از لحاظ آماری قابل دفاع است. امری که طی روزهای اخیر به دلیل “عددسازی” در آمار روزانه مبتلایان به کرونا توسط وزارت بهداشت دیگر ممکن نیست.

از خطای سیستماتیک تا عددسازی

اولین علامت از احتمال وجود نوعی عددسازی در داده‌های وزارت بهداشت، در آمار گزارش‌شدهِ روز ۴ اردیبهشت نمایان و همان روز در صفحات تلگرام و توییتر با مخاطبانمان به اشتراک گذاشته شد. مطابق یافته‌های ما، آمار مبتلایان بر اساس گزارش‌ رسمی وزارت بهداشت در کل کشور (تجمعی، همه استان‌ها) با آماری که از گزارش‌های روزانه مبتلایان توسط دانشگاه‌های علوم پزشکی منتشر می‌شد همخوانی نداشت. به این معنی که وزارت بهداشت در این روز، تعداد مبتلا‌شدگان در کل کشور را ۱۰۳۰ نفر اعلام کرد، درحالی که آمار مبتلاشدگان در ۱۸ استان کشور بر اساس گزارش روزانه دانشگاه‌های علوم پزشکی ۱۰۱۷ نفر بود. به عبارت بهتر از لحاظ تئوریک، برای ۱۳ استان کشور منطقا تنها وجود ۱۳ مبتلا در روز ۴ اردیبهشت امکان‌پذیر می‌شد. از جمله این ۱۳استان می‌توان به آذربایجان شرقی، اردبیل، گیلان، البرز، خراسان رضوی، قم، لرستان، یزد و همدان اشاره کرد که وضعیت کرونا در آنها قرمز و آمار مبتلایان بالاست. به عنوان مثال در آذربایجان شرقی، یک روز پیش‌تر در ۳ اردیبهشت، حدود ۱۴۰ مورد مبتلای جدید گزارش شده بود.

در حالت بسیار خوش‌بینانه و با کمترین احتمال ممکن، می‌توان چنین فرض کرد که این تناقض به دلیل تفاوتِ زمانِ ارائه گزارش توسط وزارت بهداشت و دانشگاه‌های علوم پزشکی در طول یک روز است. به عنوان مثال وزارت بهداشت ساعت ۲ بعد از ظهر، گزارش خود را اعلام می‌کند در صورتی که فرضا آمار جدید دانشگاه علوم پزشکی مرتبط با استان اردبیل ساعت ۶ بعد از ظهر منتشر شده است. اگر این فرضِ خوش‌بینانه را بپذیریم، پس باید این تفاوت عددی، در آمار روزهای بعد در سطح کشوری نمایان شود. امری که نه تنها محقق نشد بلکه در روز ۸ اردیبهشت، تعداد آمار روزانه مبتلایان در ۲۰ استان کشور که توسط دانشگاه‌های علوم پزشکی منتشر شده (۱۰۱۱ مبتلا) از آمار کل کشور که توسط سخنگوی وزارت بهداشت اعلام شده (۹۹۱) به اندازه ۲۰ مبتلا بیشتر است. یعنی در ۱۱ استان، شامل آذربایجان شرقی، اردبیل، البرز، خراسان رضوی و شمالی، قزوین، گلستان، گیلان، لرستان، همدان و یزد نه تنها تعداد کل مبتلایان افزایش نداشته بلکه احتمالا باید از تعداد مبتلایان روزانه این استان‌ها ۲۰ واحد کم کنیم تا به عدد وزارت بهداشت برسیم. امری که بدیهی است امکان‌پذیر نیست و از لحاظ آماری هم ترکیب‌بندی استانیِ آن قابل دفاع نخواهد بود.

بر این اساس، گزارشی که در روز ۷ اردیبهشت منتشر کردیم، آخرین گزارش به روز شده توسط ما در مورد مبتلایان به ویروس کرونا و با تفکیک استان‌ها خواهد بود. ما در عین حال تحلیل خودمان از تعداد مبتلایان واقعی به کرونا در ایران را نیز – مبتلایان واقعی تا روز ۷  اردیبهشت – طی دو روز آینده منتشر خواهیم کرد.

CONTACT US

t

Sending

Log in with your credentials

Forgot your details?