voron

Когда модель реально работает

Это вам не эпидемиология, у нас реально как предсказано — так и выходит.

Во второй день и ондулятор по оси примерно выставили, и монохроматор пробили! Вот что значит предусмотреть на линии правильную диагностику.

voron

Москва - UPDATE 18/05/2020

Предсказания от 7 мая сбываются с поразительной точностью по числу новых выявляемых случаев (рис. 1). Синие точки — это новые данные, полученные после построения модели. Честно говоря, я сам очень удивился. Где-то через неделю станет виден результат недавних изменений режима: открытия части предприятий с одной стороны и обязательного масочно-перчаточного режима — с другой.

Рис. 1. Ежедневное число новых выявляемых случаев.
Рис. 1. Ежедневное число новых выявляемых случаев.
Collapse )
voron

Москва - UPDATE 07.05

Уже почти две недели прошло: как же развивается ситуация?

Во-первых, лучше, чем я ожидал (тьфу-тьфу-тьфу). Все-таки рост очевидно замедляется, похоже, что проходим пик (фазы «молота», разумеется — фаза «танца» будет длиться еще долго).

Так как данных всё больше, то модель становится всё ближе к реальности. Можно уже смотреть не на наклон интегральных кривых в логарифмических координатах, а на цифры ежедневного прироста в координатах линейных.

Можно более-менее уверенно уточнить следующие параметры:
— задержка по времени между статистикой новых случаев и статистикой новых смертей равна 8 дням (у Медузы получилось 11 дней, неплохое совпадение).
— crude mortality ratio с поправкой на этот сдвиг составляет 1.7%. Исходя из обычного предположения, что смерти фиксируются более-менее все, а истинная смертность около 1%, получается, что регистрируется около 58% всех случаев (у Медузы получилась похожая цифра).
Как видите, если число смертей умножить на 58 и сдвинуть на 8 дней, то графики почти идеально совпадают (это бегущее среднее за 7 дней, иначе очень шум большой), рис. 1.

Рис. 1. Бегущее среднее за 7 дней по ежедневному приросту выявленных случаев и новых смертей (умноженных на 58 и сдвинутых на 8 дней).
Рис. 1. Бегущее среднее за 7 дней по ежедневному приросту выявленных случаев и новых смертей (умноженных на 58 и сдвинутых на 8 дней).
Collapse )
voron

UPDATE по моделям

Первое. Как мои модели недельной давности?

Москва:

Красные точки - это данные, которые появились после предсказания. Данные по смертности воспроизводятся с пугающей точностью. Данные по выявленным случаям начали отставать последние три дня, но это согласуется с новостями о том, что в Москве чуть замедлили темпы тестирования из-за нехватки расходников.

Швеция:

В Швеции замедление чуть лучше, чем ожидалось. Вообще похоже, что Швеция практически вышла на плато.


Второе. Как выглядят страны в сравнении?

Темпы прироста смертей в абсолютных цифрах:

Испания почти затормозила, как и Италия. Франция идет почти неотличимо от Италии. Штаты бьют рекорды в абсолютных цифрах, но последние дней 10 видно замедление. Германия тормозит на неплохом уровне, Дания - лучше всех, Швеция где-то между ними. Россия выглядит вполне неплохо, но в отличие от других стран темп роста был изначально невысоким, но он сохраняется. А другие вначале шли гораздо быстрее, но и быстрее затормозили.

Темпы прироста в относительных цифрах:

Тут тоже видно отличное торможение Испании, Франция неотличима от Италии, а Дания очень близка с Германией. НО: тут видно, что в Швеции на самом деле дела не очень (даже хуже, чем в Штатах), а Россия выглядит еще лучше: у остальных стран такой низкий темп роста наблюдался на гораздо более поздних этапах.

Третье. Немного про российскую статистику.

В принципе, низкие темпы роста вполне объяснимы ранним введением довольно жестких (некоторые даже считают - чересчур жестких) мер. Плюс большие расстояния, относительно низкая плотность и мобильность населения. Плохо во второй производной: рост пусть и небольшой, но он не замедляется. Вторая российская аномалия - очень низкая отношение смертей к числу выявленных случаев. Ну для сравнения: в России выявлено 75 тысяч случаев, а в Бельгии - 45 тысяч. Но при этом в Бельгии 6917 смертей, а в России - 681. То есть разница огромная.
В рамках предположения что смерти считают более-менее правильно, а вот выявляемость может отличаться на порядок, это означает, что в России выявляют гораздо больше процентов случаев вируса. И это хорошо согласуется с официальными данными по тестированию: Россия на втором месте в мире по количеству сделанных тестов, уступая только США. Второй возможный фактор - демография. В России просто очень мало в сравнении с Западной Европой представителей основной группы риска: мужчин за 90 лет. Третий возможный фактор - генетика (см. ниже).


Четвертое. Новые соображения по моделированию.

На этой неделе появилось сразу несколько относительно достоверных оценок реальной смертности. Ученые попытались в нескольких регионах во-первых, посчитать недоучтенные смерти от вируса (сравнивая цифры с прошлыми годами), а во-вторых, понять, сколько людей реально переболело вирусом (проводя скрининг на антитела). У всех получается реальная смертность около 1% от всех заразившихся. Это много. Я, честно говоря, надеялся на 0.1%. Но будем исходить из этой цифры.
Кроме того, судя по графикам для разных стран, R0 падает сам по себе со временем, даже если ничего не меняется. Этому, возможно, есть математическое объяснение. Проще говоря, простая модель предполагает, что в среднем каждый инфицированный заражает R0 новых людей. Но в реальности-то люди разные. Это в среднем у каждого, скажем, 10 контактов в день. А в реальности у одного 100 контактов в день, а у многих других по одному. А если начинается эпидемия, то активные заражаются быстро, заражают многих вокруг, но быстро же и выбывают из процесса. А среди оставшихся средний R0, ясное дело, падает. Но как это учитывать - непонятно.

Пятое. Про генетику.

Я понимаю, что никакого научного базиса под этим (пока?) нет, но карта распространенности гаплогруппы R1b очень похожа на карту мест, где вирус особо лютует и смертность самая плохая:

Это все требует проверки, но если связь есть, то есть шансы на более легкое протекание в России.


Шестое. Про глобальную стратегию.

Судя по всему, все пытаются тянуть до появления вакцины или пока вирус сам собой вдруг чудом не зачахнет. Никто не готов открыто пожертвовать процентом населения, даже если это будут в-основном старики. Это значит, что карантинные меры должны быть с одной стороны максимально строгими (чем строже меры, тем больше людей спасут), но с другой стороны - такие, чтобы их можно было держать хотя бы до осени.

Седьмое. Обновленные модели с учетом вышесказанного и новых данных.

Москва:

Прогноз ОЧЕНЬ неточный, кривая может загнуться вниз очень быстро. Хотя я пока предпосылок не вижу.
Число смертей в день в линейной шкале:

По модели сегодня всего 153 тысячи москвичей заражались (либо имеют иммунитет, либо сейчас заразны или болеют, либо в инкубационном периоде).

Швеция:

Похоже, что Швеция вышла на бесконечное плато по примерно 150 смертей в день. С одной стороны, реанимации не перегружены, а с другой стороны - возвращения к нормальной жизни в ближайшем времени ждать не стоит...
По модели только 530 тысяч шведов заражались (в категории removed).
voron

Москва

Как справедливо заметил брат, имеет смысл рассматривать Москву как отдельный кластер.

Моя модель при условно "оптимистическом сценарии".
И это если ничего не изменится по сравнению с сегодняшним днем.




* эпидемия пройдет примерно к июню
* официально будет около 1.3 млн переболевших (реально - почти 9 миллионов, среди них большинство бессимптомных)
* около 18 тысяч смертей в итоге
* в пике будет порядка 650 смертей в день (в двадцатых числах мая)
* карантин в каком-то виде сохранится до июня.

И да - разумеется, многие ключевые параметры неизвестны даже примерно, так что всё это во многом вилами по воде писано.

Замечу, что вообще карантин можно будет начать снимать где-то в середине мая, но это будет очень сложно сделать психологически, т.к. смертность все еще будет идти вверх и не дойдет до пика.

P.S. Кстати, Швеция выглядит очень похоже. Примерно такое же население, примерно такая же скорость распространения эпидемии сейчас. Только на две недели обгоняет по времени.
voron

Итальянская коррекция и сценарии выхода.

И снова эпиграф из SAS:


Думаю, что уже можно с некоторым осторожным оптимизмом сказать, что Италия взяла ситуацию под контроль и прошла пик. С одной стороны я рад за итальянцев, с другой стороны это дает некоторую новую пищу для диванной аналитики.

Во-первых, мы можем провести "коррекцию" относительно временнóго лага между диагностикой и смертью. В прошлый раз, кстати, я и с китайскими данными слегка облажался и не ту цифру посмотрел, так что в модели V2 небольшая ошибка. А тут интереснее выходит:


У Италии сдвиг по времени намного меньше: 4 дня против 7 дней у Китайцев. По некоторым косвенным признакам остальные европейцы тоже ближе к Италии, чем к Китаю по этому параметру. Почему - точно не знаю. Вероятно, тесты стали делать быстрее. Плюс многие высказывают сомнения по поводу достоверности китайской статистики.

Скажем, обновленная самая оптимистическая модель Италии (истинная смертность 0.2%, реальная выявляемость 2%) выглядит так:



Тут что важно: Италия победила вспышку не потому что все переболели, а потому что карантин (т.е. как сейчас в Китае). В самом лучшем случае у них будет 13 миллионов людей с иммунитетом - но 47 миллионов без иммунитета. А значит, от новой вспышки и второй/третьей/четвертой волны они защищены только санитарным кордоном и блок-постом. В связи с этим вопрос: а дальше что?

Сценарий выхода номер 1:
"Китайский" вариант. Так как вирус внутри страны уничтожен, страна постепенно возвращается к нормальной жизни, снимаются все внутренние ограничения, но устраивается жесточайший и тотальный контроль на границах. ВСЕ прибывающие в страну либо поголовно тестируются, либо выдерживаются в строгом карантине. С учетом того, что тесты становятся все быстрее (уже речь о нескольких часах до выдачи результата, а гипотетически и десятиминутный экспресс-тест может появиться) это в принципе реализуемо. Но в Европе с ее открытыми внутренними сухопутными границами это будет не очень просто.

Сценарий выхода номер 2:
Тактика "broaden the curve". Постепенно то снимая, то усиливая внутренние карантинные меры, правительство пытается регулировать нагрузку на госпитали, чтобы всё равно все переболели, но постепенно. В этом сценарии все равно предполагается заплатить тот же налог костлявой, но в рассрочку. Грубо говоря, если реальная смертность от вируса 0.2%, а для образования стадного иммунитета нужны 70% переболевших, то получается 60млн*0.7*0.002 = 84 тысячи смертей. 26 тысяч у них УЖЕ будет практически без вариантов, так что для Италии цена сценария №2 - это 58 тысяч жизней. Это к вопросу о моральном и этическом выборе.

Ну и напоследок апдейт по странам в "оптимистической" модели (смертность 0.2%):

Франция:

В конце 35% населения по-прежнему уязвимы и возможна вторая (хоть и более слабая) волна.

Германия:

Остается 25% не переболевших, практически "стадный иммунитет" получен.

Швеция:

Остается 6% не переболевших.

Дания:

Остается 29% не переболевших.
voron

Продолжая разглядывать графики (часть 3)

Я тут вот что подумал - ведь по китайским данным можно статистически оценить задержку по времени от получения положительного теста до смерти. Причем не только среднюю, но и грубо распределение, если оно достаточно широкое.
У Китая довольно хорошо сходятся графики зарегистрированных случаев и смертей, если взять "crude death ratio" 4.5% и что смерть наступает с равной вероятностью на 9, 10 и 11 дни после тестирования.
Тогда модельный зараженный ведет себя так:
день 0 - инфицирование
день 3 - человек становится заразным
день 5 - у человека появляются симптомы и ему ставится положительный тест
день 7 - человек перестает заражать окружающих
день 14 - человек умирает с вероятностью m/3
день 15 - человек умирает с вероятностью m/3
день 16 - человек умирает с вероятностью m/3

Что это нам дает? Теперь мы можем привязаться к коэффициенту выявления, который строго коррелирует со смертностью. Скажем, для Швеции смертность не может быть больше 3%, т.к. иначе в какой-то момент тесты показывали бы больше, чем было в действительности. Швеция удобна для моделирования тем, что тут до сих пор карантина нет, и ничто не искривляет идеальные экспоненты.
Если предположить, что в начале, пока было мало больных, тестированием выявляли 75% больных, то смертность получается 1.7%.


Очень хорошо виден момент, когда шведы перестали тестировать всех подряд и стали тестировать только тяжелых. И сегодняшнее число выявленных случаев мало связано с реальностью.
Это "тяжелый" сценарий: если ничего не делать, то через месяц будет пик смертности по 10 тысяч человек в день, и общее число смертей 161 тысяча. А если завтра введут карантин и уполовинят скорость распространения, то в пике будет "всего" 2 тысячи смертей в день, а итоговое число смертей - 98 тысяч.

"Легкий сценарий" для Швеции: допустим, что в самый лучший момент выявляли всего 10% зараженных. Тогда смертность составляет 0.2%, пиковое число смертей - по 1300 в день, всего смертей - 19 тысяч (если ничего не делать и дальше).



Думаю, что истина где-то посередине. Через 20 дней уже можно будет сказать, по какому сценарию мы движемся.

Кстати, интересно, что у Франции в такой модели "выявляемость" совершенно постоянна - и в начале эпидемии, и в самом разгаре. Если взять смертность в 1%, то французы с завидной стабильностью выявляют 6% носителей вируса.
voron

оптимистические сценарии

ОК, давайте попробуем в модель, простую как валенок.

- Как только человек заражается вирусом, он исключается из числа восприимчивых (т.е. повторно заразиться нельзя).
- Три дня у него инкубационный период.
- После этого он становится заразным и два дня заражает людей вокруг (в постоянной вероятностью n, умноженной на долю восприимчивого населения)
- После он становится больным (появляются симптомы), и еще два дня продолжает заражать людей вокруг.
- После этого он перестает заражать людей. И либо через шесть дней умирает с определенной вероятностью, либо в конце концов выздоравливает.

Численность населения страны мы знаем, изначально все считаются восприимчивыми (без иммунитета). Два оставшихся параметра (день начала эпидемии и коэффициент размножения) подгоняются под данные о смертности. Количество изначальных заразных (один или десять) роли почти не играет, это просто сдвигает на несколько суток "нулевой день".

Главная проблема - что мы даже близко не знаем настоящее значение смертности. Как я понимаю, страна с самым широкомасштабным тестированием, где тестируют почти всех подряд - это Исландия. Кстати, они сообщают, что примерно половина больных вообще без симптомов. Конечно, статистика у них пока скромная, но на 1220 выявленных зараженных 2 смерти, то есть 0.16%. Если я возьму цифру в 0.1% - это точно не будет преуменьшением, это примерно как у плохого сезонного гриппа.

Погнали.
Франция (население 67 млн):


Обратите внимание: в этой модели карантинные меры получаются гораздо более действенными, снижение скорости распространения на 42%.
Итоги:
- фактически эпидемия закончится через 1.5 месяца
- 58 тысяч смертей
- примерно 8.9 миллиона (13%) НЕ переболеют, но будут защищены "стадным иммунитетом".

Италия (население 60.5 млн):

По моей модели получается, что первое серьезное изменение скорости распространения было 28 февраля (на 56%), а национальный lockout 8 марта уменьшил ещё на 21%. Кто-нибудь знает, что произошло в Италии 28 февраля?
Итоги:
- фактически эпидемия закончится через 1.5 месяца
- 42 тысячи смертей
- примерно 18.8 миллионов (31%) НЕ переболеют, но будут защищены "стадным иммунитетом". Сравните с Францией. Хоть это и против интуиции, но чем быстрее идет эпидемия, тем большая доля населения окажется не затронута благодаря стадному иммунитету.

Швеция (население 10.1 млн):

Итоги:
- фактически эпидемия закончится через месяц с небольшим
- 10 тысяч смертей
- примерно 300 тысяч (3%) НЕ переболеют, но будут защищены "стадным иммунитетом".

Модель для России пока построить не могу, слишком мало данных. Посмотрим через неделю.

Чтобы посчитать самые важный сегодня параметр - нагрузку на больницы, надо еще знать точный процент больных, которым требуется госпитализация, на какой день болезни госпитализируют и сколько дней больной остается в больнице.

В этой модели во всех странах получается, что реальное число зараженных на порядки больше официально выявленных. Особенно катастрофично с этим было в самом начале эпидемии в Италии. В день, когда у них было официально подтверждено 76 случаев, на самом деле было 11 тысяч больных и еще 36 тысяч уже заразных...
voron

продолжая разглядывать графики (пугающие выводы)

(English version below)

Все умные люди сейчас оперируют SEIR эпидемиологической моделью, которая работает очень точно, и ключевые параметры которой для COVID-19 уже довольно точно известны. На основе этой модели принимают решение о введении строгих карантинных мер на уровне правительств.
Есть даже хорошие онлайн-калькуляторы (https://gabgoh.github.io/COVID/index.html)

Я решил взять Францию и проверить мои подозрения из прошлого поста, где на логарифмических графиках очевидного эффекта от lockout-карантинов не видно. Когда объясняют, как важно вводить карантин как можно раньше, предполагается, что скорость распространения после введения падает в разы. Но сейчас мы можем проделать обратное моделирование - посмотреть, насколько упала скорость распространения в реальности.
Я подгонял модель под число смертей, т.к. это наиболее надежная сейчас метрика.
Выглядит это так:


Для Франции введение режима lockout снизило скорость распространения всего на 34%! Да, это тоже немало. На сегодняшний день эта мера сохранила полторы тысячи жизней. В течение ближайших трех недель это сохранит еще около 70 тысяч жизней. Но R0 даже и близко не подошел к единице, то есть все это - лишь растягивание кривой. Мне не хотелось бы пугать, но в обоих случаях (с введением карантина или без него) модель выводит примерно на 600 тысяч смертей в конце эпидемии. И это я брал достаточно консервативную оценку смертности в 1% и вообще не рассматривал проблему перегрузки здравоохранения - то есть предполагая, что число коек, ИВЛ и врачей неограничено.

Какие я вижу сценарии:
1 - "белый лебедь". Случится что-то хорошее, что резко изменит ситуацию. Например, вирус сам помрет с наступлением лета. Или разработают доступную и эффективную терапию, которая снизит смертность и нагрузки на больницы на порядок. Или появится массовая эффективная вакцина.
2 - реально будет очень много смертей. Как с испанкой.
3 - развитые страны попытаются ввести реально жесткий карантин, как в Китае. И тогда сегодняшние меры нам покажутся цветочками.

Никогда я так не хотел оказаться дураком, который не знает и не понимает чего-то простого.




English version:

Today scientists operate with the SEIR epidemiological model, which is quite accurate, and its parameters for COVID-19 are known quite well now. Governments use SEIR model to decide when to start different isolation and self-quarantine measures.
There are user friendly online calculators as well (https://gabgoh.github.io/COVID/index.html)

I decided to take France as an example and to check my suspicions from the previous post. Because I haven't seen obvious lockout effect in log plots. When people explain the importance of restrictive measures and their timing, usually it is assumed that the spread rate is reduced drastically (e.g. 50% or 60%). Today we can do a backwards calculation and see how efficient were these measures in real life. I fit the model to the lethal case numbers, because it is the most reliable metrics at the moment.
That's how it looks:


In France lockout slowed down infection spread rate only by 34%! Yes, that is also something. By today this measure saved around 1500 lives. Within next three weeks it would save another 70 thousand. But R0 is still far from unity, so all this is just a curve broadening. I don't want to freak out, but in both cases (with and without lockout) the model predicts a death toll of about 600 thousand when the epidemic ends. And I used a relative conservative death rate of 1% and did not consider a healthcare system overload problem, e.g. assumed unlimited number of hospital beds, ventilators and doctors.

What scenarios do I see now:
1 - "white swan". Something good would happen and would change the situation dramatically. E.g. virus spread would stop with the summer. An effective therapy would appear, which would reduce the mortality rate and hospitals load by order of magnitude. A massive and efficient vaccine would appears.
2 - there would be really a lot of deaths. Something comparable to the Spanish flu.
3 - developed countries would try soon to introduce a really strict "China style" quarantine, and today's measures would be nothing.

I never wished so much to be a fool, who doesn't understand or see something simple and basic.