Решение о регистрации выдано: Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций. ЭЛ № ФС 77 - 68501, от 27 января 2017.
Live and bio-abiotic systems
ISSN 2308-9709 (Online)
Научное электронное периодическое издание
Южного федерального университета.

Гибридная модель прогнозирования на основе интеллектуальных агентов

УДК: 519.7:614.4
DOI: 10.18522/2308-9709-2014-9-25
186
Для задачи прогнозирования инфекционной динамики разработана гибридная модель на основе интеллектуальных агентов. Сформированные как рекуррентные нейросети, интеллектуальные агенты взаимодействуют на основе Марковской цепи. Гибридная модель прогнозирования инфекционной динамики отличается следующими преимуществами от традиционных математических моделей: учет взаимосвязей многочисленных параметров эпидемии, возможность масштабирования и настройки модели для разных типов эпидемий.

Ключевые слова: нелинейная динамическая система, обучение, прогнозирование инфекционной динамики

The hybrid forecasting model on the basis of intellectual agents The hybrid model on the basis of intellectual agents is developed for the task of infectious dynamics prediction. Intellectual agents are created as recurrent neural networks and interact on the basis of the Markov chain. In comparison with traditional mathematical models the hybrid forecasting model of infectious dynamics has following advantages: take into account epidemic’s numerous parameters, possibility of model’s scaling and setup for different types of epidemics.

Keywords: non-linear dynamic system, training, prediction of infectious dynamics

Введение

В современном мире инфекционные болезни остаются одной из ведущих причин преждевременной смерти людей. В эпидемиологии моделирование имеет важные исследовательские цели для прогнозирования характера эпидемического процесса и для определения стратегии служб здравоохранения [1]. В данной статье рассматривается инфекционная динамика — пространственно-временные процессы распространения и изменения эпидемий инфекционных болезней. Факторы урбанизации, нарастающее ухудшение социально-экологических и санитарно-гигиенических условий проживания сотен миллионов людей в развивающихся и развитых странах мира, всё возрастающие миграционные потоки, процессы глобализации — способствуют быстрому распространению инфекционных заболеваний и усложняют инфекционную динамику и, соответственно, требуют адекватную по сложности модель. Для формирования сценариев развития инфекционной динамики разработана гибридная модель на основе интеллектуальных агентов, отличающаяся следующими преимуществами от традиционного математического моделирования: учет взаимосвязей многочисленных параметров эпидемического процесса, возможность масштабирования и настройки модели для разных типов эпидемий при различных условиях, подробная детализация инфекционной динамики при пространственно-временном моделировании. Накопленные статистические данные, описывающие многолетнюю динамику эпидемий, включая сезонные циклы, использованы для настройки гибридной модели в форме фенотипа, эффективно формирующего тенденции и уровни развития основных показателей эпидемического процесса. Разработанная гибридная модель на основе интеллектуальных агентов с требуемой точностью оценивает: число контактов, степень риска инфицирования, пороги заболевания, возрастное и территориальное распределение заболеваемости. Информационное моделирование эпидемического процесса на основе гибридных вычислений обеспечивает эффективное планирование профилактических и противоэпидемических мероприятий, выбор оптимальных путей борьбы с эпидемическим распространением вирусов.

1. Формализация инфекционной динамики как интеллектуальной мультиагентной системы на плоскости

Инфекционная динамика представляет собой сложную систему, имеющую три аспекта: пространственный, временной и предметный, отражающий инфекционную специфику. Указанные аспекты в рамках объектно-ориентированного подхода формируют для инфекционной динамики, как объекта, три соответствующих метода. В данном исследовании для реализации пространственного, временного и предметного методов используются, соответственно, фрактальный граф, Марковская цепь и рекуррентная нейросеть NARX. Для реализации взаимосвязи указанных методов в данном исследовании модель инфекционной динамики формируется как мультиагентная система на плоскости [2], то есть как совокупность автономных интеллектуальных агентов, взаимодействующих друг с другом [3]. Отдельные объекты заражения рассматриваются как материальные точки — агенты с характеристиками интеллектуальности, описанными в таблице 1. Поведение агентов определяется динамикой объектов заражения и ограничениями, является следствием их взаимодействий с другими агентами. Ставится задача оценить пространственное распределение эпидемий и задач распространения в динамике человеческих инфекций.

Таблица 1 — Характеристики интеллектуальности агентов

Сенсорика

S

0

Реагирует на инфекционный контакт

Память

М1

1

С памятью на прошедшие события (конечной)

М2

1

С кратковременной и долговременной памятью

М3

1

Обучаемый (наращивает долговременную память)

М4

0

Хранит информацию по инфекционному контакту

Моторика (действия во времени)

Т1

0

Действует только в реальном времени

Т2

2

Визуализирует степень тяжести заболевания

Т3

1

Среда существования задается до моделирования

Все подверженные заражению объекты и их взаимодействия соответствуют вершинам и ребрам цветного графа (рис. 3). Агент инкапсулируется вершиной. Трудно реализуемые в традиционных математических моделях пространственные аспекты динамики (составляющие параметр Т3) в разработанной гибридной модели инкапсулируются фенотипом как структура фрактального графа [3], то есть структуры фенотипа и фрактального графа идентичны. Каждый цвет визуализирует степень тяжести заболевания. Модель процессов распространения реализована как вероятностная мультиагентная система на основе Марковской цепи.

Мультиагентная система (МАС) A={A1,…, An} состоит из конечного множества {A1,…, An} взаимодействующих интеллектуальных агентов Ai. Интеллектуальный агент а имеет выходной канал Oa и входной канал Ia. Текущие значения выходного и входного канала агента a составляют его текущее локальное состояние OMa=<Oa,Ia>.

Каждая пара агентов a, b из A имеет канал связи CHab (ребро фенотипа, соединяющее вершины a и b), по которому агенты a и b взаимодействуют. Агенты a и b из A взаимодействуют между собой посредством процедуры inf(t, Oa,Ob), в результате которой для агентов a и b формируются входные сигналы, соответственно, Ia и Ib. Для объектов заражения, моделируемых агентами a и b, инфекционная динамика указанного взаимодействия соответствует инфекционному контакту, специфику которого моделирует процедура inf(t, Oa,Ob). Взаимодействие агентов a,b рассматривается как случайная величина, задаваемая конечным дискретным распределением вероятностей. Через pab(t) обозначим вероятность того, что a воздействует на агента b в момент времени t ≥ 1. Например, pab(1)=1 означает, что агенты a,b взаимодействуют между собой в момент времени t=1. С каждым агентом из A связано его действие, реализуемое рекуррентной нейросетью.

Глобальное состояние S системы A включает в себя локальные состояния ее агентов и состояния всех ее (n2-n) каналов:

S = <O1,…,On; CH1,2, CH2,1,… , CHn-1,n, CHn,n-1>.

Обозначим через Sмножество всех глобальных состояний мультиагентной системы A.Тогда одношаговая семантика мультиагентной системы A задает отношение перехода (за один шаг) на множестве SA, а вероятности pi,j(t) индуцируют вероятности таких переходов p(S, S').

В соответствии с вышеприведенным определением семантики с мультиагентной системой A можно связать Марковскую цепь MC(A) с множеством состояний SA и вероятностями переходов p(S, S') между ними. Поведение A в начальном глобальном состоянии S0 описывается фенотипом, представляющим дерево TA(S0) возможных траекторий этой цепи, начинающихся с S0. Узлы этого дерева динамически меняются, и фенотип переходит из состояния S, соответствующего времени t, в состояние S', соответствующее времени (t+1). Процесс перехода формализуется выражением .

Структура дерева TA(S0) представлена цветным графом (рис. 1б). Дерево цветов используется как генотип (слева). Каждый лист этого дерева представляет ряд вершин или ребер графа фенотипа (инкапсулирующих значения параметров) и имеет уникальный цвет, визуализирующий специфику эпидемии, например на рис. 1бд, визуализирована степень заболевания (сплошная линия — здоров, штриховая линия — легкая степень инфекции, штрихпунктирная — тяжелая степень инфекции). Модель допускает задание следующих 4 цветов (для трех множеств агентов): здоровых (делится на два подмножества: иммунные и восприимчивые), носителей инфекции и больных.

Вершины графа фенотипа представляют рекуррентные нейросети NARX, а ребра графа — связи между ними. Параметры (хранящиеся в генотипе) состоят из вершин (рекуррентных нейросетей) и вероятностных связей для каждого соединения между вершинами (ребро).

Рис. 1. — Примеры генотипа, фенотипа, нейросетевой вершины

Листья этого дерева представляют вершины и ребра одного цвета графа фенотипа, формирующие соответствующие нейросети (рис. 1б). В частности каждый лист определяет множество вершин и ребер одного цвета и хранит соответствующий набор параметров фенотипа, то есть смещения и веса рекуррентной нейросети (для цвета вершины) и вероятностные веса соединения между вершинами (для цвета ребра). Все вершины фенотипа используют архитектуру двухслойной рекуррентной нейросети (рис. 1в). Вход и выход i-ой вершины фенотипа — параметры, характеризующие соответственно i-ый объект заражения и его инфекционное воздействие. Граф фенотипа представляет собой нелинейную динамическую систему, реализующую инфекционную динамику.

2. Реализация гибридной модели прогноза инфекционной динамики

Реализация гибридной модели прогноза инфекционной динамики проходит в 2 этапа:

I этап: формирование и настройка фенотипа F.

1 шаг: формируется фрактальный граф (вершины которого могут быть локализованы на карте территории эпидемии, например, города). Фрактальные графы формируются операцией замены вершины затравкой, т. е. некоторым связанным графом [5]. За один шаг наращивания исходный граф «прирастает» целым графовым ансамблем — затравкой. Формируем вершины затравки для отдельно взятых членов семьи, состоящей из человек, проживающих вместе. Соединим две различные вершины i и j ребром с весовым коэффициентом pi,j, пропорциональным степени бытового контакта между членами семьи и, достаточной для заражения друг друга исследуемым инфекционным заболеванием. В случае заражения людей инфекционным заболеванием, передающимся воздушно-капельным путём от одного из членов семьи, риск заражения имеют все остальные члены семьи, и весовой коэффициент полагается равным 1. Продолжая процесс моделирования распространения инфекции от человека к человеку, на этапе n=1 граф, описывающий контакты в семье, будет представлять собой n1 -вершинный полный граф G1. На этапе n=2 граф, описывающий контакты семей, проживающих, на одной лестничной площадке, представляется как G2, его можно получить из графа G1, применяя случайным образом операцию затравки к каждой его вершине. Продолжая этот процесс, можно описать контакты всего многоэтажного дома, жилого квартала, микрорайона, города и т. д. Повторяя этот процесс, структура контактов будет представлять собой фрактальный граф G, порождённый двумя полными затравками H1 и H2. Всякий предфрактальный граф Gi, i=1,…l, взятый из траектории построения фрактального графа G, является структурой контактов на -м этапе.

Структура сформированного фрактального графа соответствует структуре фенотипа F (рис. 1б).

2 шаг: с целью уменьшения разнообразия состояний объекта заражения [6], статистическая информация формирует выборку V с выходом у (кодируемым как качественный упорядоченный признак уi), имеющим семантику степени заболевания объекта заражения (по умолчанию i=1,…4, у кодируется следующим образом: (1,0,0,0) — здоров, иммунитет; (1,1,0,0) — здоров, восприимчив; (1,1,1,0) — носитель; (1,1,1,1) — больной). Входные параметры обучающей выборки V включают контагиозность заболевания С, инкубационный период для больных IPs и для носителей IPc, длительность заболевания и другие признаки, характеризующие конкретную инфекцию. Настроенная на обучающей выборке V рекуррентная нейросеть модели нелинейной авторегрессии с внешними входами (nonlinear autoregressive with exogenous inputs model — NARX) с двумя скрытыми нейронами и временной задержкой, соответствующей средней продолжительности инфекционной болезни, формирует вершины фенотипа F.

II этап: функционирование гибридной модели прогноза инфекционной динамики

1 шаг: для t = 0 инициируется начальное глобальное состояние S=S0, описываемое фенотипом F, сформированным на I этапе. Задаются входные параметры модели: Qh — количество здоровых, Qs — количество больных, Qc — количество носителей и Ql — иммунная прослойка.

ID[0]=S. Узлы фенотипа F динамически меняются и фенотип переходит из состояния S, соответствующего времени t, в состояние S', соответствующее времени (t+1). Процесс перехода формализуется выражением .

2 шаг: формируется матрица информационной динамики ID, ID[0]=S.

FOR Y=1:NY (NY>5)

FOR E=1:END

FOR t=1:7 выполняется процедура формирования состояния эпидемиологической системы из состояния S, соответствующего времени t, в состояние S', соответствующее времени (t+1).

Algorithm

На основе ID[t, E, Y] вычисляются: число контактов, степень риска инфицирования, возрастное и территориальное распределение заболеваемости на день t.

3 шаг: Если NY>5, то на основе матрицы информационной динамики ID[t, E, Y], описывающей весь временной интервал информационной динамики, вычисляются эпидемические пороги:

1. Рассчитать среднее значение заболеваемости:

где — множество заболеваемости гриппом за E-тую неделю неэпидемического периода за Ni

2. Рассчитать среднее квадратичное отклонение:

3. Рассчитать верхнюю толерантную границу:

где  — значение критерия Стьюдента для доверительной вероятности 95% с  степенями свободы. Значения критерия Стьюдента с различными степенями свободы представлены в табл.2.

Таблица 2- Значения критерия Стьюдента

Количество степеней свободы

Значения критерия Стьюдента для доверительной вероятности 95%

2

4,303

3

3,182

4

2,776

5

2,571

6

2,445

7

2,365

8

2,306

9

2,262

10

2,228

Разработанную гибридную модель информационной динамики можно легко настроить с учетом конкретных условий задачи моделирования, в том числе выполнять шаг 2 не в цикле, а по условию, например, пока порог заболеваемости не снизится до требуемого пользователем уровня.

Гибридная модель прогноза инфекционной динамики, позволяющей моделировать взаимодействие до 100000 агентов, транслирует структурные и функциональные аспекты эпидемиологической системы, то есть осуществляет структурно-параметрический синтез инфекционной динамики.

Сформированная за 2 этапа, гибридная модель информационной динамики реализована с использование среды Matlab Simulink, отличающейся от линейки аналогичных средств высокой производительностью, широким набором интеллектуальных методов.

Разработанная на основе интеллектуальных агентов гибридная модель была настроена с учетом конкретных условий инфекционной динамики гриппа в г. Абакане. Фенотип был развернут на карте города Абакана. Такт — временной единичный шаг соответствовал 1 дню. Шаг 2 выполнялся не в цикле, а по условию, пока порог заболеваемости не снизится до требуемого пользователем уровня. На 2-ом шаге был добавлен следующий алгоритм оперативного анализа эпидемической ситуации

1. Вычислить интенсивный показатель (на 10000 агентов) текущей заболеваемости гриппом и ОРВИ в каждой возрастной группе и суммарно по всему населению в данном городе за семь тактов, который вычисляется:

где N — количество больных; Q — количество агентов в данной возрастной группе; I — интенсивный показатель.

2. Сравнение данных по заболеваемости для текущего t с контрольным уровнем в абсолютных показателях и с эпидемическими порогами предыдущих семи тактов.

3. Определить темп прироста заболеваемости для текущего t=i по отношению к предыдущему (i-1) в каждой возрастной группе и для всего населения в абсолютных и интенсивных показателях:

где Рі — заболеваемость на момент t=i.

4. Темп прироста заболеваемости гриппом и ОРВИ более чем 20% служит дополнительным признаком развития эпидемии гриппа.

5. Для оценки развития текущей эпидемиологической ситуации в модели использовались все три способа в комплексе (контрольный уровень заболеваемости в абсолютных показателях, эпидемические пороги в относительных показателях, темп прироста заболеваемости).

6. Признаком окончания эпидемии является снижение интенсивного показателя заболеваемости гриппом и ОРВИ к эпидемическому порогу.

Проведено сравнение разработанной гибридной модели инфекционной динамики, настроенной на статистические данные инфекционной динамики гриппа в г. Абакане за 2012 г., рекуррентной нейросети NARX и метода «пошаговой регрессии» («stepwise regression» с помощью функции STEPWISE программного продукта MATLAB). Все три указанные модели имели одинаковое количество параметров. Сформированные в результате вычислительных экспериментов модельные данные инфекционной динамики, использовались для оценки значений коэффициентов детерминации моделей (таблица 3).

Таблица 3- Значения коэффициентов детерминации

Вид модели

Коэф. детерминации R2

гибридная

0,98

NARX

0,88

STEPWISE

0,86

Согласно статистическому смыслу коэффициента детерминации, гибридная модель объясняет больший процент дисперсии критериального показателя (98%), чем NARX (88%) и метод «пошаговой регрессии» (86%). Гибридная модель, имеющая минимальное значение функционала качества (значение выражения (1-R2)=0,12, где R2 — коэффициент детерминации), является моделью более оптимальной структуры, чем NARX и метод «пошаговой регрессии». Среднеквадратическая оценка разницы между общим числом больных агентов в каждый момент модельного времени и количеством реально больных гриппом горожан в тот же момент времени для гибридной модели составила 0,23% от максимального числа одновременно больных горожан за рассмотренный 2012 г., что позволяет считать модель адекватной. Инкапсулированная гибридной моделью, динамика топологических свойств процесса порождения фрактального графа обеспечивает достоверный прогноз развития эпидемии, выявляет кластеры заражения и очаги эпидемий по заданному графу, отражающему степень заражённости безымунной инфекцией. В отличие от рекуррентной нейросети NARX и метода «пошаговой регрессии», показывающих немедленное угасание вспышки инфекции, разработанная гибридная модель выявила сценарии повторного заражения большей части узлов, доступных для заражения вирусом.

Разработанная гибридная модель прогнозирования инфекционной динамики на основе интеллектуальных агентов с требуемой точностью оценивает: число контактов, степень риска инфицирования, пороги заболевания, возрастное и территориальное распределение заболеваемости. Процесс настройки указанной гибридной модели (I этап: формирование и настройка фенотипа F) обеспечивает адаптивность гибридной модели к изменениям в свойствах системы инфекционной динамики. Процесс функционирования гибридной модели прогнозирования инфекционной динамики (II этап: функционирование гибридной модели) обеспечивает требуемый уровень точности и быстродействия. Быстродействие реализованной гибридной модели в среднем в два раза ниже чем NARX, однако допускает использование первой в реальном и/или опережающем времени.

Заключение

Таким образом, разработанная на базе синтеза нейронных сетей (НС), Марковских цепей, фрактальных графов гибридная модель прогнозирования инфекционной динамики на основе интеллектуальных агентов обеспечивает вычисление: количественного значения уровня иммунитета каждого человека к конкретному инфекционному заболеванию; эпидемического порога определённого инфекционного заболевания; минимальных условий локализации инфекции на каждом этапе распространения. Разработанная гибридная модель прогнозирования инфекционной динамики обеспечивает требуемый уровень точности и быстродействия, адаптивна к изменениям в свойствах системы инфекционной динамики, допускает использование в реальном и/или опережающем времени.

Список литературы

  1. Зуева Л. П., Яфаев Р. Х. Эпидемиология: Учебник // СПб: ООО Издательство ФОЛИАНТ, 2005. — 752с.
  2. Тарасов В. Б. От многоагентных систем к интеллектуальным организациям: философия, психология, информатика // М.: Эдиториал УРСС, 2002. — 352 с.
  3. Wooldridge M. An Introduction to Multi-Agent Systems // John Wiley and Sons. 2002. — 376 p.
  4. https://ru.wikipedia.org/wiki/Закон_необходимого_разнообразия
  5. А. А. Кочкаров, Р. А. Кочкаров, Предфрактальные графы в проектировании и анализе сложных структур, Препринты ИПМ, 2003, 010, 21 с.
  6. Url:Http://www.keldysh.ru/papers/2003/prep10/prep2003_10.html (дата обращения: 15. 09.14).
  7. Кроновер Р. М. Фракталы и хаос в динамических системах. Основы теории // М.: Постмаркет, 2000.- 352с.

References

  1. Zueva L. P., Yafaev R. X. E’pidemiologiya: Uchebnik // SPb: OOO Izdatel’stvo FOLIANT, 2005. — 752 p.
  2. Tarasov v. B. Ot mnogoagentnyx sistem k intellektual’nym organizaciyam: filosofiya, psixologiya, informatika // M.: E’ditorial URSS, 2002. — 352 p.
  3. Wooldridge M. An Introduction to Multi-Agent Systems // John Wiley and Sons. — 2002. — 376 p.
  4. https://ru.wikipedia.org/wiki/Zakon_neobxodimogo_raznoobraziya
  5. A. A. Kochkarov, R. A. Kochkarov, Predfraktal’nye grafy v proektirovanii i analize slozhnyx struktur, Preprinty IPM, 2003, 010, 21 p.
  6. Url:Http://www.keldysh.ru/papers/2003/prep10/prep2003_10.html (data obrashheniya: 15. 09.14).
  7. Kronover R. M. Fraktaly i xaos v dinamicheskix sistemax. Osnovy teorii // M.:Postmarket, 2000.- 352 p.