У Минздрава коронавирус в Беларуси идет на спад: а вот что говорит матстатистика
Министерство здравоохранения продолжает уверенно сообщать о спаде заболеваемости коронавирусом в Беларуси. Так, 29 июня ведомство сообщило, что ряд больниц в Минске и областных центрах начинают работу в обычном режиме после перепрофилирования под лечение COVID-19. За последние две недели число новых случаев коронавируса, выявляемых за сутки, снизилось с 800 до почти 300. Умирают от COVID-19 в Беларуси в сутки, по официальным данным, не более семи человек на протяжении всей пандемии.
Официальной статистике верят не все, и сегодня Office Life приводит разбор статистики коронавируса в Беларуси с применением теории вероятности и математической статистики, который сделал инженер, системный администратор из Минска Игорь Гречихин. Следите за руками.
«Смотрю я на белорусскую ковидную статистику и не знаю, смеяться или плакать: каждый день стабильно одно и то же количество и новых случаев, и новых смертей. Мало кто сомневается, что все эти цифры спускаются сверху, но я задумался: а можно ли это доказать? Мало ли, вдруг я чего-то не понимаю, а там реально такие цифры?

И в помощь нам приходит чудесная наука теории вероятностей. Она говорит о том, что если события случайны, независимы и равновероятны, то они подчиняются распределению Пуассона. Если мы рассмотрим, например, количество смертей от коронавируса в сутки, то заметим, что если не идеально, то по крайней мере очень близко этот показатель подходит по таким критериям. Не идеально — это значит, что, например, если мы возьмем временной интервал, на котором смертность растет или падает, то события будут не равновероятны, и это уже не Пуассон.
И тем не менее мы здесь кое-что можем узнать. У случайной величины можно посчитать некоторые параметры. Например, математическое ожидание — это, по-простому, средняя величина. А еще — дисперсию, т. е. среднее отклонение от средней величины. (Тонкости вроде квадратичности я опускаю, будем ловить суть.) И вот что замечательно: если процесс пуассоновский, т. е. по-настоящему случайный, то дисперсия в точности равна матожиданию! Красивая наука, согласитесь?
Процесс, в принципе, может быть случайным, но не пуассоновским — например, если вероятность меняется. И тогда дисперсия окажется больше, чем матожидание. Но что интересно, она может быть только больше и никак не меньше! Если она оказывается меньше, это значит, что процесс уже не случайный, а подвержен некоторому управлению извне. Например, если мне каждый день падает ровно один кирпич на голову, то дисперсия будет нулевая, и кирпичами однозначно кто-то управляет.
А теперь давайте применим это наше ценное знание к статистике по ковиду, благо она есть в свободном доступе и при этом совершенно официальная почти от всех стран. Например, здесь. Воспользуемся всемогущим «Экселем», посчитаем по разным странам матожидание с дисперсией и сравним. Я взял период 22 дня — с 4 по 25 июня, посчитал матожидание М и дисперсию D, а также отношение D/M, чтобы оценить, что из них больше и насколько. Поскольку меня интересовало сравнение с Беларусью, я брал те страны, где в это время смертность была примерно такая же (у нас в это время было около пяти смертей в сутки). То есть я не брал страны с большой смертностью (больше 30 в день) и с совсем маленькой (меньше двух).
Для начала взял страны, данным от которых, как мне кажется, можно доверять (Нидерланды, кстати, по смертности к нам ближе всех). Вот что я получил:
Нидерланды: M = 5,59 D = 19,59 D/M = 6,53
Португалия: M = 4,64 D = 7,48 D/M = 1,25
Ирландия: M = 3,09 D = 7,51 D/M = 2,43
Польша: M = 13,50 D = 46,83 D/M = 3,47
Германия: M = 14,64 D = 161,96 D/M = 11,07
Франция: M = 28,68 D = 363,75 D/M = 12,68
Швеция: M = 31,27 D = 832,30 D/M = 26,61
Как видим, ни у одной страны D/M не опускается ниже единицы, и это значит, что мы не можем упрекнуть их в том, что они каким-то образом влияют на статистику. Это не значит, что они не влияют, — может, и влияют, но уличить их в этом мы не можем. Кстати, высокий показатель D/M говорит о том, что манипуляций, скорее всего, нет, ибо нет никакого смысла в том, чтобы устраивать принудительный разброс значений в разные стороны. Такой высокий показатель может означать, что это были последствия вспышек заболевания (Германия, Швеция) либо заболеваемость шла на спад (Нидерланды).
Затем я взял страны, к которым у меня меньше доверия. Может быть, и напрасно я некоторых подозреваю, но смотрим, однако.
Украина: M = 15,09 D = 36,37 D/M = 2,41
Молдова: M = 8,73 D = 8,40 D/M = 0,96Армения: M = 10,32 D = 14,61 D/M = 1,42
Турция M = 19,86 D = 11,55 D/M = 0,58
Саудовская Аравия: M = 38,59 D = 17,87 D/M = 0,46
Арабские Эмираты: M = 1,73 D = 0,97 D/M = 0,56
Кувейт M = 4,95 D = 5,66 D/M = 1,14
Тут надо сказать, что у Кувейта в первые 4 дня смертность была сильно повышена, за счет этого и показатель вырос. Если взять не 3 недели, а только последние 2 (считать можно и так, это диапазон, а не целевая выборка), то получим:
Кувейт M = 4,27 D = 2,92 D/M = 0,69
Во-первых, видим, что у Молдовы рыльце в пушку. Не сильно, т. е. это не разнарядка по всей стране — я думаю, это из-за Приднестровья, по которому не смогли собрать статистику и нарисовали недостающее наугад.
Дальше Турция с ее 0,58, это совсем не удивляет. Ну и «богатенькие Буратины» тоже были вполне ожидаемы — смертность у них явно под жестким контролем, больные там умирают только по распоряжению короля или эмира. Про Украину с Арменией ничего сказать не могу, не пойманы. Очень может быть, что и честно собирают статистику.
Ну и наконец, наша родная Беларусь: M = 5,51 D = 0,92 D/M = 0,17
Мы, конечно, с нашими 0,17 вне конкуренции. Я поздравляю Министерство здравоохранения! Здесь мы видим, что без его высочайшего позволения больные не могут ни вздохнуть, ни... умереть, даже спокойно. Никакой случайностью здесь и не пахнет. На самом деле, конечно, все грустно, а статистика эта форменная липа. Такие данные можно смело игнорировать — это то же самое, что их нет вообще. Собственно, что и требовалось доказать.

Можно еще добавить, что если бы смертность снижали не спусканием цифр сверху, а какими-то другими способами — хотя бы даже проверенным методом исключения из умерших от ковида больных с сопутствующими заболеваниями, — то распределение все равно осталось бы пуассоновским, т. е. по-настоящему случайным».
Фото: Министерство здравооханения