Введение. В литературе и ряде крупных международных и отечественных исследований отмечается влияние метеорологических и сезонных факторов на развитие инфаркта миокарда [1-3, 5]. Оценка риска и ущерба от климатических изменений, внедрение новых технологий, позволяющих учитывать в процессе лечения все факторы, влияющие на здоровье человека, - важные задачи, которые стоят перед современной медициной [3, 6].
В [4] авторами впервые был проанализирован эффект влияния метеорологических переменных на заболеваемость ИМ у населения Воронежской области в 2014 г. Однако база пациентов, поступивших с диагнозом инфаркт миокарда в больницы Воронежской области в 2014 г., была неполной, т.к. это был первый год централизованного сбора данных для ведения областного регистра ИМ.
Целью работы является представление результатов подобного анализа по неперсонифицированным данным областного регистра ИМ за 2015 и 2016 г. и сравнение их с результатами 2014 г. Для расчетов использовалась программа Statistica 13. Архивы погоды за 2014-2016 г. для отыскания зависимости от метеорологических факторов были взяты с сайта rp5.ru.
Рассмотрим основные характеристики представленных наборов данных:
2014 г. - 3333 пациента, поступивших с диагнозом ИМ в больницы Воронежской области, 579 летальных случаев ИМ (17.3%), средний возраст пациента - 66.5 лет, среднее число ИМ в день - 9.13; женщин 38.6%, мужчин 61.4%; жителей г. Воронежа 46,4%, жителей области 53,6%;
2015 г. - 3802 пациента, 640 летальных случаев ИМ (16.8%), средний возраст - 66.5 лет, среднее число ИМ в день - 10.42; женщин 38.6%, мужчин 61.4%;
2016 г. - 3819 пациентов, 626 летальных случаев ИМ (16.6%), средний возраст - 66 лет, среднее число ИМ в день - 10.42; женщин 37.7%, мужчин 62.3%.
Проверка по критерию χ2 дает основание предположить, что случайная величина, характеризующая число инфарктов миокарда в сутки в Воронежской области, в 2014 и 2015 г. подчиняется закону распределения Пуассона, что согласуется с результатами подобных исследований в других регионах [1,2], однако в 2016 г. гистограмма не имеет четко выраженного пика и гипотеза о распределении Пуассона отвергается.

Рис. 1. Проверка распределения по закону Пуассона для количества ИМ в 2015 и 2016 г.
Выявление влияния сезонных и других периодических факторов. Влияет ли сезонность на развитие инфаркта миокарда? Многие исследования указывают на существование такой зависимости [3], однако достоверно сезонное влияние метеорологических факторов на данный момент не оценено. Информация в литературе о влиянии метеорологических факторов противоречива и требует дополнительной проверки [5].
Дисперсионный анализ, проведенный по средним значениям количества ИМ в Воронежской области по сезонам, дал следующие результаты (рис. 2):
в 2014 г.: F(3, 361)=1.49, p=0.217>0.05 - не выявлено значимых различий среднего числа ИМ в разные сезоны;
в 2015 г.: F(3, 361)=6.55, p=0.00025<0.05 - выявлено значимое различие среднего числа ИМ в разные сезоны;
в 2016 г.: F(3, 362)=11.99, p=0<0.05 - выявлено значимое различие среднего числа ИМ в разные сезоны.

Рис. 2. Среднее количество ИМ по сезонам (2014 г. - короткий пунктир, 2015 г. - длинный пунктир, 2016 г. - сплошная линия).
Явные пики наблюдаются в весенний период, а в 2014 - весенний и осенний период. Полученные результаты не согласуются с выводами, которые представлены в литературных источниках [2, 3]. Скачок числа инфарктов в Воронежской области наблюдается весной и осенью, а не зимой или летом, когда могли наблюдаться аномально низкие или высокие температуры воздуха.
Дисперсионный анализ, проведенный по средним значениям количества ИМ по месяцам, выявил различия среднего числа ИМ в разные месяцы (рис. 3) в 2014-2016 г.
Более детальный анализ показал, что эти различия обусловлены:
- в 2014 г. - пиком в ноябре (р=0,001847);
- в 2015 г. - высокими значениями в марте (p=0,022195), апреле (p=0,012307), и низкими значениями в декабре (p=0,020977);
- в 2016 г. - высокими значениями в марте (p=0,001728), апреле (p=0,004547), мае (p=0,027187) и низкими значениями в декабре (p=0,009225); выделены месяцы, в которые наблюдалось значимое отклонение числа ИМ в день от среднегодового числа ИМ в день.

Рис. 3. Среднее количество ИМ по месяцам (2014 г. - короткий пунктир, 2015 год - длинный пунктир, 2016 г. - сплошная линия).
По архиву погоды за 2014 г. был обнаружен значимый пик атмосферного давления в ноябре, что могло бы объяснять пик ИМ в ноябре 2014 г. Однако в 2015-2016 г. такой зависимости не наблюдается. Можно сделать предположение, что в месяцы, обуславливающие значимое превышение среднего числа ИМ по месяцам, были самые сильные перепады температуры, которые возникают в периоды межсезонья.
Дисперсионный анализ по дням недели выявил значимое различие среднего значения числа ИМ в разные дни недели для каждого из трех лет (рис. 4).

Рис. 4. Среднее количество ИМ по дням недели (2014 г. - короткий пунктир, 2015 г. - длинный пунктир, 2016 г. - сплошная линия).
На графике виден явный всплеск ИМ по понедельникам в 2014 (p=0,0000) и 2015 г. (p=0,00005) и значимое уменьшение количества ИМ в выходные (p=0,00001). В 2016 г. наблюдается примерно одинаковое количество ИМ в будние дни и значимое уменьшение количества ИМ в выходные дни (p=0,00001). Таким образом, «эффект выходных» обнаружен во всех трех годах, а «эффект понедельника» в 2014 и 2015 г.
Анализ влияния метеорологических факторов. При анализе влияния метеорологических факторов использовались данные только о жителях г. Воронежа, так погодные условия в районах области могут отличаться. В ходе проверки влияния различных погодных факторов на развитие ИМ по выборке за 2014 г. [4], лучшие результаты показала связь с атмосферным давлением. Проведем аналогичный анализ для 2015-2016 г. с помощью модели распределенных лагов.
Модели распределенных лагов применяются в статистическом и эконометрическом анализе в случаях, когда влияние одних факторов на другие проявляется спустя время, с некоторым временным запаздыванием - лагом, что имеет место в рассматриваемой задаче. Пусть исследуется показатель Y (зависимая переменная). Его значение в текущий момент времени - yt. зависит от значений независимой переменной Х в текущий и предшествующие моменты времени. Модель распределенных лагов описывает зависимость между этими двумя переменными с помощью линейного соотношения:

где βi (i=0..q) - краткосрочный мультипликатор, характеризующий изменение среднего значения Y в момент времени t под воздействием единичного изменения переменной X в момент времени t-q.
В табл. 1-3 приведены результаты оценки качества построенных моделей распределенных лагов по выборкам за 2014-2016 г. В качестве зависимой переменной yt использовалось число ИМ в день t, в качестве независимой xt-q - средняя величина атмосферного давления в день t-q.
Таблица 1. Анализ распределенных лагов для зависимости ИМ от АД 2014 г.

Результаты показывают, что в 2014 имеется достаточно сильная зависимость между числом ИМ в день t и атмосферным давлением в день t и в предшествующие ему 5 дней (R2=0.8947). Уравнение этой зависимости имеет вид:

При этом имеет место 4-х дневное запаздывание влияния, так как самую большую значимость имеет коэффициент регрессии β4 (p=0,02).
На рис. 5 в качестве примера приведен график количества реальных и предсказанных по модели распределенных лагов ИМ за 13 дней 2015 г. Видно, что модель распределенных лагов хорошо предсказывает динамику изменений количества ИМ (коррелирует с ним), но не сами значения.

Рис. 5. График реальных и предсказанных по модели распределенных лагов ИМ за 13 последовательных дней 2015 г. (сплошная линия - реальное кол-во ИМ, пунктир - предсказанное кол-во ИМ).
Таблица 2. Анализ распределенных лагов для зависимости ИМ от АД 2015 г.

Результаты 2015 г. показывают, что имеется сильная линейная зависимость между переменными (F-статистика=529.4, R2=0.89). Уравнение этой зависимости:

При этом самую большую значимость имеет двухдневное запаздывание влияния (p=0,04).
Таблица 3. Анализ распределенных лагов для зависимости ИМ от АД 2016 г.

В 2016 также обнаружена сильная зависимость (F-статистика=433.2, p=0, R2=0.88). Уравнение этой зависимости имеет вид:

При этом самую большую значимость имеет двухдневное запаздывание влияния (p=0,04).
Таким образом, не только в 2014, но и в 2015-2016 г. подтвердилось, что атмосферное давление действительно имеет воздействие на частоту развития ИМ у населения Воронежской области. При этом по виду полученных зависимостей можно сделать вывод, что негативное влияние на развитие ИМ оказывают колебания атмосферного давления в течение 5 дней, предшествующих заболеванию (так как коэффициенты построенных уравнений регрессии имеют разные знаки). Однако все построенные модели имеют одинаковое чередование знаков β0, β1, β2, β3, что позволяет сделать общее для всех трех лет предположение, что рост числа инфарктов будет происходить в дни с низким атмосферным давлением, которым предшествовало два дня с высоким АД, которым, в свою очередь предшествовал день с низким АД.
Анализ выживаемости по модели Кокса. Регрессия Кокса или модель пропорциональных рисков - это метод прогнозирования риска наступления некоторого события для рассматриваемых объектов и оценка влияния заранее определенных независимых переменных (предикторов) на этот риск. Риск рассматривается как функция, зависящая от времени. Согласно модели Кокса риск наступления события hi(t) у i-го объекта к моменту времени t имеет вид:
hi(t)= h0(t)×exp( β1 Xi1+ β2 Xi2+… βp Xip),
где h0(t) — базовый риск наступления события, одинаковый для всех объектов; Xik—независимые переменные, называемые ковариатами, характеризующие значение k-го признака у i-го объекта; β1, …, βp — коэффициенты, которые показывают влияние каждого признака на функцию риска.
Модель Кокса - это одна из наиболее общих регрессионных моделей, поскольку она не связана с какими-либо предположениями относительно распределения времени выживания и может рассматриваться как в некотором смысле непараметрическая. Модель Кокса имеет очень широкое применение в медицине (как одна из моделей анализа выживаемости) [3, 4]. Одним из ее преимуществ является то, что она с высокой степенью достоверности позволяет оценить не только значимость построенной модели в целом, но и значимость отдельных предикторов модели.
В нашем случае модель Кокса использовалась для выявления влияния метеорологических факторов на смертность после ИМ. Зависимая переменная - время жизни. Независимые переменные - метеорологические факторы. Времена жизни: для умерших - от развития ИМ до смерти, для выживших - от развития ИМ до выписки. Полные данные - летальный исход, неполные - успешное лечение (в модель Кокса для более объективного анализа добавляют цензурированные наблюдения, в нашем случае это пациенты, успешно завершившие лечение).
Анализ по выборке за 2014 г.: случаи летального исхода - 459 человек, добавленное число выживших - 213. Независимые переменные - атмосферное давление и скачки температуры в день развития ИМ (именно эти погодные факторы показали наибольшее влияние на прогноз выживаемости после ИМ в 2014 г.). Результаты анализа представлены в табл. 4.
Таблица 4. Оценка параметров модели Кокса 2014 г.

В целом, построенная модель значима (общий уровень значимости модели проверяется по критерию χ2, и он довольно высок: χ2=11,388; при этом p=0,003<0,05). Значимость отдельных переменных модели оценивается с помощью критерия Вальда. Параметр «относительный риск» показывает чувствительность модели к изменениям отдельных переменных (если риск меньше единицы, то повышение данного показателя положительно сказывается на времени жизни, если больше единицы - отрицательно). Так как значение критерия Вальда для каждого предиктора достаточно высоко и при этом p<0,05 для обеих переменных, можно сделать вывод, что скачки температуры и атмосферное давление в день развития ИМ действительно имеют связь со смертностью от ИМ.
Анализ по выборке за 2015 г.: случаи летального исхода - 640 человек, добавленные выжившие - 304. Независимые переменные - атмосферное давление, максимальная по модулю температура в день развития ИМ (так как в 2015-2016 г. лучшую значимость показали не скачки температуры, а максимальная по модулю температура воздуха за день). Результаты анализа представлены в табл. 5.
Таблица 5. Оценка параметров модели Кокса 2015 г.

Модель значима (χ2=15,1663; при этом p=0,00051<0,05). Критерий Вальда для каждого предиктора достаточно высок и при этом p<0,05 для обеих переменных.
Анализ по выборке за 2016 г.: случаи летального исхода - 626 человек, добавленные выжившие - 309, независимые переменные: атмосферное давление, максимальная по модулю температура в день развития ИМ. Результаты анализа представлены в табл. 6. Модель значима (χ2=14,9788; p=0,00056<0,05). Критерий Вальда для каждого предиктора достаточно высок и при этом p<0,05 для обеих переменных. Можно сделать вывод, что максимальная температура и атмосферное давление в день развития ИМ действительно имеют связь со смертностью от ИМ.
Таблица 6. Оценка параметров модели Кокса 2016 г.

Заключение. Таким образом, проведенный статистический анализ данных по выборкам 2015 и 2016 г. подтверждает предположения, которые были сделаны при анализе выборки за 2014 г. [4] , что месяц, день недели и атмосферное давление с лагом 5, имеют влияние на возникновение у населения Воронежской области инфаркта миокарда. В ходе вычислительных экспериментов также было отмечено, что на риск смертности после ИМ негативное влияние оказывает низкое атмосферное давление в день ИМ (2014-2016 г.) большие по модулю скачки температуры (2014 г.), большая по модулю температура (2015-2016 г).
