۹ اردیبهشت ۱۳۹۱
بعد از ارائه ۴۷ گزارشِ روزانه از آمار مبتلایان به ویروس کووید-۱۹ در کل ایران و به تفکیک استانها، ما در وبسایت 31، تصمیم گرفتیم از روز ۸ اردیبهشت صفحه ویژه “کرونا” و آمار مرتبط با آن را در وبسایت خودمان”بهروز” نکنیم. دلیل ما هم اینست که گزارشهای وزارت بهداشت در مورد مبتلایان به کرونا در ایران از مرحله “خطای سیستماتیک” به مرحله “عددسازی” رسیده است.
از ابتدای انتشار شیوع خبرهای مرتبط با کرونا در ایران (اول اسفند ۱۳۹۰)، وزارت بهداشت آمار روزانه مبتلایان به ویروس کرونا را در سطح کشور و به تفکیک استانها منتشر میکرد. ما هم از روز ۲۰ اسفند تصمیم گرفتیم آمار روزانه را در نمودارهای تعاملی مختلف و از طریق صفحه ویژه کرونا و پلتفورمی که برای آن تهیه کردیم در اختیار مخاطبان خودمان قرار دهیم. هرچند به درستی، این ادعا مطرح بود که وزارت بهداشت، آمار مبتلایان را کمتر از مقدار واقعی ارائه میکند اما تصویر ما این بود – و همچنان هست – که از آغازِ انتشارِ خبرهای مرتبط با کرونا، خطای وزارت بهداشت در ارائه آمار واقعی، مبتنی بر یک خطای سیستماتیک است. به این معنی که بر اساس دستورالعملها و فرمولهای مشخص درونسازمانی، محاسبهِ آمار مبتلایان بر اساس روند مشخصی -هرچند اشتباه- صورت میگیرد و این امر در کل کشور به صورت یکسان انجام میشود. در چنین حالتی اگر حتی دادههای خام، اعداد واقعی مبتلایان را نمایان نکنند، اما بررسی روند و الگوهای آماری به خصوص در مواردی مانند مقایسه استانها و تحلیل وضعیت آنها نسبت به یکدیگر و همچنین محاسبه تغییرات استانی در روزهای متفاوت، میتواند اطلاعات مفیدی از هر استان به ما بدهد. به این معنی که شاید رقم واقعی تعداد مبتلایان درست نباشد، اما الگوی رفتاری استانها در مواردی مانند شدت یا نفوذ ویروس در استان، لزوما نادرست نیست.
توقف انتشار آمار استانی توسط وزارت بهداشت
وزارت بهداشت از روز ۴ فروردین اعلام کرد که آمار مبتلایان را به تفکیک استان منتشر نخواهد کرد و صرفا به ارائه آمار کشوری بسنده میکند. برای توجیه این امر، وزارت بهداشت دلایلی مطرح کرد و از جمله مدعی شد چون برخی استانها مبتلایان کمتری دارند، مردم ممکن است به این استانها بروند و باعث شیوع بیشتر ویروس کرونا در استانهای – به اصطلاح سفید – شوند. فارغ از اینکه چنین ادعایی در سفر به استانهایِ به اصطلاح کمخطر و تغییر محل زندگی، هرچند بهصورت محدود، چندان عقلانی نیست، روندِ ارائه آمار استانی در روزهای آینده نادرستی این ادعا را نشان میدهد. چون از همان روز ۴ فروردین، اتفاقا آمار استانهایی که شیوع کرونا در آنها کمتر بود به صورت روزانه توسط دانشگاههای علوم پزشکی این استانها منتشر میشد (به عنوان مثال نگاه کنید به گزارشهای روزانه در استانهای کهگیلویه، بوشهر، چهارمحال، هرمزگان و سیستان).
اتفاقا پس از این تاریخ یعنی ۴ فروردین، آمار مبتلایان در استانهایی اعلام نمیشد که شیوع کرونا در آنها خیلی زیاد بود مانند گیلان، مازندران، تهران، قم، البرز و اصفهان. به عبارت درستتر، روند ارائه گزارشهای استانی در مورد مبتلایان به کرونا از ۴ فروردین به بعد، دقیقا برخلاف دلایلی است که وزارت بهداشت مطرح کرده بود. جدول زیر آمار مبتلایان از روز ۵ فروردین تا ۷ اردیبهشت را به صورت تجمعی در استانهای ایران نشان میدهد. اعداد جدول از گزارشهای رسمی دانشگاههای علوم پزشکی کل کشور استخراج شده است. هرجا که عدد صفر وارد شده به این معنی است که در استان مورد نظر یا در تاریخ مورد نظر، گزارشی ارائه نشده است.
باوجود عدم ارائه آمار استانی به صورت رسمی توسط وزارت بهداشت، ما در وبسایت 31، با ۱- تجمیع آمار روزانه دانشگاههای علوم پزشکیِ استانها که در ۱۵ تا ۲۰ استان به صورت روزانه ارائه میشد و ۲- تهیه سه مدل شبیهسازی شده از وضعیت استانها در روزهای قبل و ۳- در نظرگرفتن متغیرهای مستقلِ تاثیرگذار بر تعداد کل مبتلایان به ویروس کووید-۱۹ در استانها (شامل نسبت سنی در استان، میزان شهرنشینی در استان و تعداد بخشهای مراقبتهای ویژه آی سی یو و سی سی یو. این سه متغیر از تحلیل رگراسیون آمار کرونا در ایران بدست آمدهاند. در مقالهای که در تحلیل آمار مبتلایان به کرونا ارائه خواهیم کرد در مورد این روش تحلیل به صورت کافی توضیح میدهیم)، برآورد خودمان را از وضعیت مبتلایان به کرونا به تفکیک استانها ارائه میکردیم.
بدیهی است که هر نوع مدل آماری و تحلیل دادهها مبتنی بر شبیهسازی و پیشبینی، نمیتواند بدون خطا باشد. ما بر اساس بهروزرسانی و تنظیم هر روزه مدل، سعی در کاهش این خطا داشتیم، اما در مورد احتمال و شیوه یا شیوههای خطاهای ممکن هم آگاه بودیم. اما همانطور که گفته شد تا زمانی که خطای مبتنی بر ورود داده خام، سیستماتیک باشد، تحلیل الگوهای رفتاری در استانهای مختلف از لحاظ آماری قابل دفاع است. امری که طی روزهای اخیر به دلیل “عددسازی” در آمار روزانه مبتلایان به کرونا توسط وزارت بهداشت دیگر ممکن نیست.
از خطای سیستماتیک تا عددسازی
اولین علامت از احتمال وجود نوعی عددسازی در دادههای وزارت بهداشت، در آمار گزارششدهِ روز ۴ اردیبهشت نمایان و همان روز در صفحات تلگرام و توییتر با مخاطبانمان به اشتراک گذاشته شد. مطابق یافتههای ما، آمار مبتلایان بر اساس گزارش رسمی وزارت بهداشت در کل کشور (تجمعی، همه استانها) با آماری که از گزارشهای روزانه مبتلایان توسط دانشگاههای علوم پزشکی منتشر میشد همخوانی نداشت. به این معنی که وزارت بهداشت در این روز، تعداد مبتلاشدگان در کل کشور را ۱۰۳۰ نفر اعلام کرد، درحالی که آمار مبتلاشدگان در ۱۸ استان کشور بر اساس گزارش روزانه دانشگاههای علوم پزشکی ۱۰۱۷ نفر بود. به عبارت بهتر از لحاظ تئوریک، برای ۱۳ استان کشور منطقا تنها وجود ۱۳ مبتلا در روز ۴ اردیبهشت امکانپذیر میشد. از جمله این ۱۳استان میتوان به آذربایجان شرقی، اردبیل، گیلان، البرز، خراسان رضوی، قم، لرستان، یزد و همدان اشاره کرد که وضعیت کرونا در آنها قرمز و آمار مبتلایان بالاست. به عنوان مثال در آذربایجان شرقی، یک روز پیشتر در ۳ اردیبهشت، حدود ۱۴۰ مورد مبتلای جدید گزارش شده بود.
در حالت بسیار خوشبینانه و با کمترین احتمال ممکن، میتوان چنین فرض کرد که این تناقض به دلیل تفاوتِ زمانِ ارائه گزارش توسط وزارت بهداشت و دانشگاههای علوم پزشکی در طول یک روز است. به عنوان مثال وزارت بهداشت ساعت ۲ بعد از ظهر، گزارش خود را اعلام میکند در صورتی که فرضا آمار جدید دانشگاه علوم پزشکی مرتبط با استان اردبیل ساعت ۶ بعد از ظهر منتشر شده است. اگر این فرضِ خوشبینانه را بپذیریم، پس باید این تفاوت عددی، در آمار روزهای بعد در سطح کشوری نمایان شود. امری که نه تنها محقق نشد بلکه در روز ۸ اردیبهشت، تعداد آمار روزانه مبتلایان در ۲۰ استان کشور که توسط دانشگاههای علوم پزشکی منتشر شده (۱۰۱۱ مبتلا) از آمار کل کشور که توسط سخنگوی وزارت بهداشت اعلام شده (۹۹۱) به اندازه ۲۰ مبتلا بیشتر است. یعنی در ۱۱ استان، شامل آذربایجان شرقی، اردبیل، البرز، خراسان رضوی و شمالی، قزوین، گلستان، گیلان، لرستان، همدان و یزد نه تنها تعداد کل مبتلایان افزایش نداشته بلکه احتمالا باید از تعداد مبتلایان روزانه این استانها ۲۰ واحد کم کنیم تا به عدد وزارت بهداشت برسیم. امری که بدیهی است امکانپذیر نیست و از لحاظ آماری هم ترکیببندی استانیِ آن قابل دفاع نخواهد بود.
بر این اساس، گزارشی که در روز ۷ اردیبهشت منتشر کردیم، آخرین گزارش به روز شده توسط ما در مورد مبتلایان به ویروس کرونا و با تفکیک استانها خواهد بود. ما در عین حال تحلیل خودمان از تعداد مبتلایان واقعی به کرونا در ایران را نیز – مبتلایان واقعی تا روز ۷ اردیبهشت – طی دو روز آینده منتشر خواهیم کرد.