علیرضا اشراقی ۲۲ اردیبهشت ۱۳۹۹
یک فرضیهی رایج و جا افتاده وجود دارد؛ اینکه قم مبدا پیدایش و انتشار کرونا در ایران است، و اگر قم قرنطینه میشد، بقیه ایران از بلای بیماری در امان میماند. تحلیل آمار مرگ و میر استانی در زمستان ۱۳۹۸ (که اخیرا سازمان ثبت احوال ارایه کرده) فرضیه و پرسش دیگری را تقویت میکند: اینکه افزایش چشمگیر آمار مرگ و میر زمستانی در گیلان و شش استان دیگر نشان میدهد که قرنطینهی قم به تنهایی نمیتوانست نتیجهای داشته باشد.
در این نوشته من کمی با این پرسش کلنجار رفتهام. اول، توضیح میدهم که بر مبنای این آمار گیلان هم پرخطر بود. و دوم، قرنطینه در آغاز شیوع بیماری وقتی میتوانست اثربخش باشد که حداقل هفت استان – شامل، تهران، گیلان، مازندران، البرز، قم، اصفهان و گلستان – را در بر میگرفت. همینجا تکلیف را روشن کنم که من به این آمار چشمبسته اعتماد ندارم و حق میدهم که شما هم نداشته باشید. اما فعلا چیز دیگری دستمان نیست. در ضمن، این آمار فقط به ما شواهد تازهای برای حدس زدن میدهد، همین و بس. هیچکدام از این حدسها را به صرف این آمار نمیتوان محکم و متقن تلقی کرد.
مرگ و میر در سطح ملی یا استانی؟
سازمان ثبت احوال از سال ۱۳۹۲ آمار فوت را هم به تفکیک فصل و هم به تفکیک استان منتشر میکند. در سالهای گذشته آمار زمستان در اواخر فروردین و یا اوایل اردیبهشت منتشر میشد و معمولا هم جلب توجه نمیکرد. با شیوع کرونا و نگرانی افکار عمومی یکباره اهمیت سیاسی یک مشت عدد معلوم شد. ثبت احوال از اسفند گذشته، ارایهی آمار لحظه به لحظه را متوقف کرد. اخباری هم منتشر شد (مثلا در شرق یا ایلنا) که ممکن است آمار فوت زمستان اصلا منتشر نشود. بالاخره ثبت احوال در روز ۱۹ اردیبهشت آمار را منتشر کرد.
این آمار در مورد علت مرگ اطلاعاتی به ما نمیدهد؛ چنین اطلاعاتی معمولا در سالنامهی اماری جمعیتی ارایه میشود که هر ساله در نیمهی تابستان منتشر میشده است. اما با داشتن برآوردی از آمار کل اسناد وفات در زمستان سال ۱۳۹۸ و مقایسهی آن با سالهای پیشین – حداقل از سال ۱۳۹۲ به بعد که آمار فوت به تفکیک فصل اعلام میشده – میتوان بررسی کرد که آیا تفاوت معنیداری در تعداد فوتشدگان سال ۱۳۹۸ نسبت به سالهای گذشته وجود دارد یا نه.
با یک نگاه سرسری به این آمار در سطح ملی، جواب اتفاقا منفی است. البته تعداد فوتشدگان در زمستان ۱۳۹۸ نسبت به سال ۱۳۹۷ حدود ۴درصد و تقریبا به میزان ۴۵۰۰ نفر بیشتر شده است. (آمار رسمی قربانیان کرونا تا پایان زمستان ۱۲۸۴ نفر اعلام شد.) اما افزایش ۴درصدی چیزی استثنایی نیست و در سالهای پیشتر هم موارد مشابهی وجود داشته است: به عنوان مثال افزایش مرگ و میر در زمستان ۱۳۹۶ نسبت به سال ۱۳۹۵ حدود ۶ درصد، و در زمستان ۱۳۹۳ نسبت به سال ۱۳۹۲ نیز حدود ۸ درصد بوده است. به عبارت دیگر، در سالهایی هم که مصیبت کرونا در کار نبود، آمار ثبت احوال نوسان مرگ و میر را نشان میدهد. فرصت نداشتم آمار تفکیکی علت مرگ را ببینم اما کنجکاوم که دلیل این جهش در سالهای ۱۳۹۳ و ۱۳۹۶ چه میتواند باشد؟
اما اگر آمار مرگ و میر را در سطح استانی بررسی کنیم به نتایج معناداری میرسیم. اول این که، افزایش قابل اعتنای فوتشدگان در زمستان ۱۳۹۳ نسبت به ۱۳۹۲ و در زمستان ۱۳۹۶ نسبت به ۱۳۹۵، ناشی از تغییرات در برخی از استانهاست و نه همهی کشور. دوم این که، همین گونه تغییر در برخی از استانها در زمستان ۱۳۹۸ نسبت به سال ۱۳۹۷ هم مشاهده میشود. با این تفاوت که اتفاقا در استانهایی که افزایش مرگ و میر در زمستان ۱۳۹۸ چشمگیر بوده، در سالهای پیش از آن نرخ تقریبا ثابت و یکدستی وجود داشته است. برای این استانها این زمستان ۱۳۹۸ است که نسبت به سالهای قبل غیرعادی است (به غیر از تهران که از روند کشوری پیروی میکند و البته انتظاری جز این هم نیست). جالبتر اینکه، استانهایی که در زمستان ۱۳۹۸ آمار فوت بیشتری از سالهای پیشین داشتهاند، همانهایی هستند که بیشترین تعداد مبتلایان به کرونا را هم تا پایان اسفند ۱۳۹۸ به خود اختصاص داده بودند.
نمودار میلهای زیر، تفاوت آمار فوتشدگان در سال ۱۳۹۸ را در سه وضعیت میسنجد: با یک سال پیشتر (یعنی ۱۳۹۷)، همچنین با میانگین سالهای گذشته، و بالاخره با میانگین سه سال گذشته (یعنی ۱۳۹۵ تا ۱۳۹۷).
دادهها برای نمایش بهتر، بر اساس تفاوت نسبت به سال قبل به صورت نزولی مرتب شدهاند. واضح است که در یک دسته از استانها این تفاوت زیاد و به لحاظ آماری قابل اعتنا است: اینها هفت استان تهران، گیلان، قم، مازنداران، البرز، اصفهان و گلستان هستند که بیشترین آمار رسمی مبتلایان به ویروس کرونا را نیز تا پایان اسفند ۱۳۹۸ داشتند. از این هفت استان از چهارم فروردین ۱۳۹۹ (همان وقتی که دولت از اعلام آمار مبتلایان به تفکیک استان امتناع کرد) تا امروز دیگر آمار تجمعی منتشر نشده است، به غیر از یک مورد برای البرز و اصفهان. منابع خبری محلی بقیهی استانها اما با وجود منع دولت، همچنان آمار استانی را روزانه اعلام میکردند.
خوشهبندی استانها
دیدیم که تعداد فوتشدگان در زمستان ۱۳۹۸ نسبت به سال قبل در هفت استان تفاوت قابل اعتنایی دارد، و این تفاوت با آمار مبتلایان به کرونا در همین استانها میتواند رابطه داشته باشد. حالا استانها را در خوشههای جدا طبقهبندی و از لحاظ آماری بررسی میکنم تا ببینم آیا تفاوت این خوشهها معنیدار است؟
همانطور که در نمودار پایین میبینید، استانهای ایران از منظر تعداد مرگ و میر در زمستان ۱۳۹۸ نسبت به سال پیشاش، با دو متغیر دیگر (یکی میانگین سالهای ۱۳۹۲ تا ۱۳۹۷، و دیگری میانگین سه سال گذشته یعنی از ۱۳۹۵ تا ۱۳۹۷) در چهار خوشهي جدا قرار گرفتهاند. این چهار خوشه، طوری دستهبندی شدهاند که تفاوت آنها به لحاظ آماری معنیدار باشد. نکتهی جالب در این خوشهبندی این است که در کنار تهران – با بیشترین تغییر نسبت به میانگین سه سال (و یا سالهای) گذشته – این استان گیلان است که با تهران همخوشه است. گیلان از منظر دو شاخص از این سه شاخص (یعنی تفاوت با سال گذشته و تفاوت با میانگین سالهای گذشته)، بیشترین تغییرات مرگ و میر را به خودش اختصاص میدهد. مازندران و قم در یک خوشه هستند؛ گلستان، اصفهان و البرز نیز کنار هماند؛ و سایر استانهای کشور در یک خوشهی مجزا قرار دارند. در این نمودار همچنین میتوانید تغییرات سالیانهی چهار استانی که بیشترین میزان افزایش آمار فوت در زمستان ۱۳۹۸ را داشتهاند ملاحظه کنید. افزایش شیب خط بین سالهای ۱۳۹۷ و ۱۳۹۸ را میبینید.
گیلان، قم، مازندران و داستان قرنطینه
دیدیم که تفاوت تغییرات مرگ و میر در زمستان ۹۸ نسبت به سال(های) گذشته در استان گیلان محسوستر از سایر استانها، و حتی تهران و قم، است. دولت ایران اولین مورد رسمی مبتلا به کرونا را برای روز دوم اسفند ثبت کرده است. تا اخر اسفند، تعداد مبتلایان به ویروس کرونا در استان گیلان طبق گزارشهای رسمی تقریبا برابر با قم شده بود.
نمیتوانیم به لحاظ آماری نتیجهی قاطعی بگیریم و کل رقم افزایشیافتهی مرگ و میر را به شیوع کرونا در استان گیلان نسبت دهیم. به عبارت دیگر، نمیتوانیم ادعای وجود رابطهی علت و معلولی داشته باشیم. اما میتوانیم مدعی شویم که افزایش آمار زمستانی مرگ و میر در استان گیلان با شیوع کرونا در ایران رابطهی قابل اعتنای آماری دارد و این رابطه در مواردی خارج از روند کلی سایر استانها هم هست.
به عنوان مثال، به خط رگرسیون در نمودار پایین سمت چپ توجه کنید (در تلفن همراه: نمودار بالایی). این خط، بهترین تبیین عددی از تغییر تعداد فوتشدگان در زمستان ۱۳۹۸ نسبت به میانگین شش سال گذشته را نشان میدهد. فاصلهی عدد واقعی نسبت به عدد مدلسازیشده توسط خط رگرسیون در استان گیلان بیش از سایر استانهاست. (و البته نمرهی تبیین مدلسازی خط هم حدود ۰.۶۶ است.)
حالا اگر گیلان را از نمودار سمت راست خارج کنیم (در تلفن همراه: نمودار پایینی)، نمرهی تبیین مدلسازی خط بهتر میشود (۰.۸۱) و این بار استان مازندران است که بیشترین فاصله را با خط خواهد داشت، هرچند این فاصله کمتر از قبل است. به هر میزان که استانهای پرخطر دیگر شامل قم، اصفهان، گلستان و البرز را از مدل خارج کنیم، خطِ رگرسیون بهتر میتواند مدل ما را تبیین کند. به عبارت دیگر، روند تغییرات آمار مرگ و میر در سال ۱۳۹۸ به سالهای گذشته نزدیکتر خواهد شد. (عامدانه استان تهران را در اینجا در نظر نگرفتم؛ همانطور که در نمودار خطی پیشین مشاهده میکنید، تهران از روند کلی در سطح ملی پیروی میکند. در ضمن، سیستان و بلوچستان هم روندی متفاوت با بقیه دارد: مرگ و میر در این استان کاهشی بوده است).
اگر حوصلهی ور رفتن دارید، شما هم میتوانید با انتخاب یا حذف استان(ها) از فیلتر بالای این دو نمودار، ترکیبهای مختلف را امتحان کنید. تغییرات روی نمودار سمت راست (در تلفن همراه: نمودار پایینی) نشان داده میشود. برای مشاهدهی نمرهی تبیین خط رگرسیون هم، کافی است روی خط بروید تا معادلهی رگرسیون، نمرهی تبیینِ آن (R-Squared) و اعتبار مدل (P-Value) را ببینید.
اینجا میشود کمی جسارت به خرج داد و فرض قابل تاملی مطرح کرد: اینکه لزوما مبدا شیوع ویروس کرونا تنها از یک استان (قم) نبوده است. گیلان هم میتواند یکی از گزینههای آغاز گسترش و همهگیری این ویروس باشد. در اینصورت حتی با قرنطینه کردن قم هم تضمینی برای کنترل بیماری وجود نمیداشت. برای کنترل ویروس کرونا حداقل هفت استان با مرزهای مشترک باید همزمان قرنطینه میشدند.
البته که همهی این حرفها حاصل کمی ورانداز کردن و بالاپایین کردن آمار سازمان ثبت احوال بود. آزمون درست و دقیق این فرضها محتاج اطلاعات به مراتب بیشتری است که نداریم. آنچه که بر اساس آمار دولتی منتشر شده در خصوص مبتلایان به کرونا در اسفند ۹۸ و آمار مرگ و میر در زمستان همین سال در اختیار داریم، چنین فرضهایی را تقویت میکند.