Интеллектуальные системы в клинической медицине. Синтез плана лечения на основе прецедентов
Авторы: Г.И.Назаренко, Г.С. Осипов, А.Г. Назаренко, А. И.Молодченков
В работе рассматривается применение систем правил в задачах клинической медицины. Рассматривается формирование првавил по примерам на основе AQ метода. Предлагается метод синтеза плана лечения на основе прецедентов.
Статья была опубликована в журнале "Информационные технологии и вычислительные системы" 1/2010
Введение
Применение методов искусственного интеллекта в медицине обычно связывают с возникновением экспертных систем в середине восьмидесятых годов прошлого века как результата 30-летнего академического периода исследований в области искусственного интеллекта. Основополагающие соображения на этот счет высказал Э.Фейгенбаум на 5-й Объединенной конференции по искусственному интеллекту в 1977 году. Суть их состояла в том, что специалисты достигают высоких результатов, накапливая знания и опыт; если же интеллектуальные программы будут организованы так, что смогут действовать подобным образом, то и они смогут достичь высоких реультатов.
Одной из первых систем, испльзовавших знания для решения задач, была экспертная система DENDRAL [1], разработанная в Стэнфордском университете и предназначенная для порождения формул химических соединений на основе спектрального анализа. В настоящее время DENDRAL поставляется покупателям вместе со спектрометром. Первой собствено медицинской экспертной системой стала система MYCIN [2], предназначенная для диагностики и лечения инфекционных заболеваний крови.
Система CASNET [3] предназначена для диагностики и выбора стратегии лечения глаукомы. Система DXplain [4] – пример интеллектуальной системы поддержки клинических решений, используется для ассистирования в процессе диагностики и содержит в своей базе знаний симптомы, лабораторые данные и процедуры, связывающие их со списком диагнозов. Она обеспечивает поддержку и обоснование дифферециальных диагнозов и последующих исследований [5]. В её базе даных содержится 4500 клинических манифестаций , которые связаны асоциативными связями более чем с 2000 различных нозологий.
Система Germwatcher [6] была разработана в помощь больничному эпидемиологу. Содержит большой объем даных по различным микробиологическим культурам. Включает базу знаний, основанную на правилах, которая используется для генерации гипотез о возможых инфекциях.
Система PEIRS [7] интерпретирует и комментирует отчеты по химическим патологиям. В систему встроен модуль автоматического машинного обучения, которыый позволяет патологу создавать новые правила без участия инженера пмо знаниям. В настоящее время создано 2300 таких правил. На построение каждого нового правла требуется около минуты. Ежедневно система комментирует 100 отчетов в области газового состава артериальной крови, теста толерантности глюкозы и др. Система Puff [8] предназначена для интерпретации результатов функционального пульманологического теста. Она использует прецедентную информацию; в её базе прецедентов содержатся десятки тычяч случаев. Имеется коммерческая версия системы, несколько сотен копий которой внедрено в ряде стран.
Среди отечественных разработок отметим систему для синдромной диагностики неотложных состояний у детей ДИН [9], созданную в Московском НИИ педиатрии и детской хирургии. Эта система содержит информацию о 42 синдромах, которые представляют собой список диагностических предложений-гипотез. Так как выбор лечения во многом определяется прогнозом возможных осложнений, в системе описаны взаимосвязи синдромов, определяемые причинно-следственными, временными и ассоциативными отношениями.
Программный комплекс Айболит [10] предназначен для диагностики, классификации и коррекции терапии острых расстройств кровообращения у детей. Он создан в Центре сердечно-сосудистой хирургии имени А.Н. Бакулева и активно применяемый при оперативных вмешательствах и выборе послеоперационного лечения в условиях реанимационного отделения. Система включает математическую модель кровообращения, «реагирующую» на поступающую с датчиков текущую информацию. Она позволяет не только проводить диагностику и оценку состояния больного, но и помогать при выборе и последующей коррекции лечебных мероприятий.
Система HELP [11] – полная госпитальная информационная система, основанная на технологиях искусственного интеллекта. Она поддерживает не только стандартные функции госпитальных информационных систем, но функции поддержки принятия решений. Эти функции инкорпорированы в рутиные приложеия госпитальной системы. Они поддерживают клинический процесс тревожными сигналами и напоминаниями, интерпретацией данных, выработкой предложений по управлению процессом лечения и клиническими протоколами. Эти функции могут активироваться из обычных приложений или включаться самостоятельно после ввода клинических данных в компьютерную историю болезни.
Отметим ещё систему SETH [12], область применения которой – токсичность лекарственных средств. Система основана на моделировании экспертных рассуждений, берущих в расчет для каждого токсикологичекого класса клинические симптомы и применяемые дозы. Система выполняет мониторинг лечебного процесса, направленный на контроль взаимодействия взаимоисключения лекарств.
Итак, сегодня тенологии искусственного интеллекта применяются в самых различных областях клинической медицины. Кратко охарактеризуем эти области.
Подача тревожных сигналов и напоминаний. Речь идет о мониторинге пациентов в реальном времени посредством прикроватных мониторов.Экспертные системы встраиваются в такие мониторы и оценивают состояния пациентов и их изменения. Они могут также напоминать о необходимости или порядке приема лекарств и посылать напоминания, например, по электронной почте.
Ассистирование в процессе диагнстики. В сложных случаях или в случаях недостаточного опыта диагноста соответствующая экспертная система может оказать помощь на основе исследования данных о пациенте.
Поиск подходящих случаев (прецедентов). Например, в интернете или в локальной базе данных. Такая интеллектуальная система (агент) должна обладать знаниями об основных характеристиках пациента и понимать, что в каждом случае означает слово «подходящий».
Контроль и планирование терапии. Интеллектуальная система может контролировать неполноту, ошибки существующего лечебного процесса или недостаточный учет специфических характеристик пациента в принятом плане лечения.
Распознавание и интерпретация образов. Достаточно большое число медицинских образов допускают автоматическую интерпретацию: от плоских рентгеновских снимков до более сложных образов наподобие ангиограмм и результатов томографических исследований.
Таким образом, речь идёт о широком применении интеллектуальных систем в различных областях медицины. Это обстоятельство требует анализа их теоретических основ и для дальнейшего расширения сферы применения.
В настоящей работе рассмотрены особенности медицинских экспертных систем (МЭС), в качестве основного способа представления знаний в которых выступают системы правил и предложены некоторые механизмы, расширяющие возможности их использования в клинической медицине.
1. Архитектурные особенности МЭС, основанных на правилах
Один из наиболее распространенных подходов подходов предусматривает выделение на самом высоком уровне описания экспертных систем следующих трех компонент: рабочей памяти (или, как иногда говорят, глобальной базы данных), множества правил, выполняющих некоторые действия в рабочей памяти (а иногда и во внешней среде) и некоторой стратегии управления, в соответствии с которой происходит выбор правил для применения.
Правила применяются к рабочей памяти. В состав каждого правила входит условие, которому текущее состояние рабочей памяти может удовлетворять, либо нет. Правило может быть применено, если условие выполнено. Применение правила изменяет состояние рабочей памяти. Стратегия управления выбирает, какое именно правило из числа применимых следует использовать и прекращает вычисления, когда состояние рабочей памяти удовлетворяет целевому условию.
С точки зрения архитектуры такой подход обладает следующими существенными отличиями от архитектур традиционных программных систем:
- рабочая память доступна всем правилам;
- отсутствуют вызовы правил из других правил;
- отсутствует априорно заданный алгоритм решения задачи (т.е. порядок выполнения правил) – алгоритм решения задачи является одним из результатов её решения;
- данные и результаты вычислений становятся доступными правилам только через рабочую память.
Далее перейдем к более детальному изложению основных рахитектурных идей систем такого рода [13, 14].
1.1.Правила для представления знаний
Определение 1.1. Правилом называется упорядоченная тройка множеств П = , где С – условие правила;
А — множество добавляемых правилом фактов;
D — множество фактов, удаляемых правилом.
В правилах атомарные формулы P1, P2, ..., из множеств С, А и D превращаются в факты в процессе применения правила, т.е. в результате выполнения соответствующих подстановок (m1 , m2 ,…, mn) на места свободных переменных (x1 ,x2 ,…,xn) и проверки для каждой формулы Pi (x1 ,x2 ,…,xn ) из С условия (m1 , m2 ,…, mn) I(Pi), т.е. выполнимости в текущем состоянии рабочей памяти.
Определение 1.2. Будем говорить, что условие правила выполнено, если в текущем состоянии рабочей памяти выполнена каждая из атомарных формул условия
Определение 1.2.3. Правило применимо к состоянию рабочей памяти, если его условие выполнено в этом состоянии.
1.2.Рабочая память
Рабочая память должна быть согласована с множеством правил. Такое согласование выполняется следующим образом: пусть П — некоторое множество правил; С, A и D — объединения условий, множеств добавляемых фактов и множеств удаляемых фактов по всему множеству П. М — множество индивидов предметной области. Тогда для каждой n — местной атомарной формулы рабочая память должна содержать n — местное конечное отношение
, где I — интерпретирующее отображение (Рис.1)
Рис. 1. (Стрелками показано отображение I)
1.3. Стратегии управления
Стратегия управления предназначена для организации процесса вычислений.
В самом общем виде её можно описать следующим образом:
Шаг 1 выбрать очередное правило из множества правил;
Шаг 2 проверить выполнимость условия правила в текущем состоянии рабочей памяти;
Шаг 3 если условие правила выполнено, поместить правило в конфликтное множество;
Шаг 4 если множество применимых правил исчерпано, выбрать какое - либо правило из конфликтного множества правил и применить его;
Шаг 5 перейти к шагу 1.
Условиями остановки являются пустое конфликтное множество, либо получение решения.
2. Особенности применения медицинских экспертных систем, основанных на правилах, для решения различных медицинских задач
2.1. Задачи дифференциальной диагностики
В диагностических задачах в качестве фактов выступают манифестации, симптомы, диагностические признаки - как положительные, так и отрицательные или исключающие; так назывемые обусловленные признаки - признаки, осутствие которых обладает большим диагностическим значением, чем их присутствие. В качестве специального подмножества множества фактов выступает множество нозологических форм. В процессе диагностики некоторые из них выступают в роли гипотез, которые, в свою очередь, приобретают статус диагнозов по завершении диагностического процесса. С содержательной точки зрения симптомы и признаки являются следствиями тех или иных заболеваний и, поэтому, при построении правил следует правильно учитывать существующие каузальные связи.
В самом общем случае при построении правил дифференцициальной диагностики следует выделять следующие их виды:
а) правила, пополняющие множество гипотез на основе учета положительных признаков Р+; эти правила (в более привычной записи) имеют вид: <УСЛОВИЕ> <СПИСОК ДОБАВЛЯЕМЫХ ФАКТОВ>.
В правилах такого вида в качестве условия выступает некоторое множество симптомов (манифестаций, признаков), а в качестве списка добавляемых фактов – возможные заболевания (нозологические формы), пополняющие множество гипотез Н;
б) правила, пополняющие множество учитываемых признаков Р на основе расширенного множества гипотез Н; формально эти правила выглядят так же как правила типа (а), однако, роль условия в них играют гипотезы из расширенного множества гипотез, а роль добавляемых фактов – новые признаки, которые не были учтены на первых итерациях правил типа а) и которые должны быть подвергнуты исследованию (или, как будем говорить, тестированию);
в) правила редуцирующие множество гипотез Н на основе учета исключающих признаков Р-: <УСЛОВИЕ> <СПИСОК УДАЛЯЕМЫХ ФАКТОВ>. В условии этого правила содержатся признаки, выполнение (наличие) которых исключает из множества Н гипотезы, содежащиеся в списке удаляемых фактов.
г) правила, редуцирующие множество гипотез на основе учета отсутствующих обусловленных признаков. Выглядят они так же, как и правила типа (в), однако применяются в случае ложности условия.
д) последний тип правил-правила дифференцирования множества гипотез. На самом деле – это метаправила и выглядят они, в простейшем случае, следующим образом: если правило П1 содержит в списке добавляемых фактов множество гипотез h1H, а правило П2 – множество гипотез h2
H и <УСЛОВИЕ>(П1)
<УСЛОВИЕ>(П2), то множество гипотез h1 удаляется из списка гипотез H.
Возможны и правила некоторых иных типов, но сейчас на них мы не будем останавливаться, а перейдем к сратегии управления D. Идея её состоит в последовательном испытании правил каждого из типов и применении тех из них, условия которых окажутся выполненными в текущем состоянии рабочей памяти.
2.2. Стратегия D (диференциаьной диагностики)
Шаг 1. Выбрать очередное правило типа (а), проверить выполнимость его условия в текущем состоянии рабочей памяти и, если условие выполнено, применить правило, т.е.пополнить множество гипотез Н.
Шаг 2. Выбрать очередное правило типа (б), проверить выполнимость его условия на текущем множестве гипотез Н и, если условие выполнено, применить правило. Применение правила здесь означает пополнение множества признаков Р, причем разумеется, такими признаками, которые до этого в Р отсутствовали (это тебование содержательное, на самом деле, за этим можно не следить, т.к. «склеивание» совпадающих признаков будет выполняться автоматически). Перейти к Шагу 1.
Шаги 1 и 2 должны выполняться попеременно до стабилизации множеств Р и Н.
Выполнение этих шагов гарантирует, что ни один признак и ни одна из возможных гипотез, имеющих хотя бы отдалённое отношение к состоянию больного, не будут упущены.
Шаг 3. Выбрать очередное правило типа (в), проверить его выполнимость на множестве признаков Р и если его усовие выполнено, применить его.
Повторять Шаг 3 до стабилизации множества Н.
В результае выполнения цикла правил типа (в) из множества гипотез Н будут исключены все гипотезы, для которых известны и выполнены исключающие признаки.
Шаг 4. Выбрать очередное правило П1 типа (д) . Если среди правил типа (д) для него найдется правило П2, такое что <УСЛОВИЕ>(П1) <УСЛОВИЕ>(П2), то из Н удаляются все гипотезы h1, содержащиеся в списке добавляемых фактов правила П1 . Шаг 4 повторяется до стабилизации множества Н.
На этом шаге стратегия завершает свою работы. Полученное множество Н и будет результатом дифференциальной диагностики.
Подчеркнем, стратегия
D ни в коем случае не является алгоритмом дифференциальной диагностики, т.к. не содержит знаний о конкретных нозологиях, их признаках, симптомах, симптомокомплексах и синдромах. Вся такая информация должна содержаться в правилах, типы которых здесь описаны. Собственно диагностический алгоритм, т.е. , последовательность примененных правил, результатом которых является диагноз, возникает в результате взаимодействия описанной стратегии и множества правил.Преимущество описанной здесь архитектуры состоит в том, что стратегия
D применима к любому набору правил, а это означает. что построенную на её основе систему можно постоянно совершенствовать, редактируя как сами правила, так и их состав без перепрограммирования системы, сохраняя её работоспособность. Для этого нужен лишь достаточно удобный интерфейс. Кроме того , множество правил может пополняться благодаря применению методов машинного обучения или обучения по примерам и прецедентам без нарушения работоспособности системы. Ниже мы несколько продробнее обсудим применение прецедентов и машинного обучения в медицине.3. Применение индуктивных методов машинного обучения для автоматического порождения правил по примерам и прецедентам
Как мы видели, описанный выше подход к построению медицинских систем использует правила в качестве способа представления знаний. Таким образом, уместен вопрос: откуда же берутся требуемые правила? Иначе говоря, каковы источники знаний для построения экспертных систем?
В качестве таковых обычно выступают:
- специалисты предметных областей, обычно называемые экспертами;
- протоколы рассуждений (протоколы "мыслей вслух") экспертов;
- протоколы так называемых диагностических игр;
- книги, инструкции;
- примеры и прецеденты решения соответствующих задач (например, диагностики или выбора схемы лечения);
- базы медицинских данных (например, электронные истории болезней).
Приобретение экспертными системами знаний от экспертов и из текстов различного рода описано в [15-17]. Здесь же мы рассмотрим методы обучения экспертных систем по примерам, т.е. такие методы приобретения знаний медицинскими экспертными системами, в которых в качестве источников знаний выступают примеры и прецеденты решения различных медицинских задач и данные, содержащиеся в базах данных, точнее, в медицинских информационных системах.
Существуют различные типы методов такого рода, которые условно можно разбить на три класса: статистические, индуктивные и нейросетевые.
Здесь мы сосредоточим внимание на втором классе методов, особенность которых состоит в том, что они не требуют представительных или, как говорят, репрезентативных выборок данных и, кроме того, могут довольствоваться небольшим количеством примеров.
Среди индуктивных методов, в свою очередь, можно выделить методы ближайших соседей, методы построения деревьев решений, методы покрытий и другие. Здесь мы продемонстрируем возможности метода последовательных покрытий для автоматического построения правил.
Этот метод основан на идее постепенного покрытия обучающих данных с помощью последовательно порождаемых правил и используется целым семейством алгоритмов [18]. При поиске правил следует действовать таким образом, чтобы порождаемые правила покрывали все положительные примеры и ни одного отрицательного.
В привычной записи порождаемые алгоритмом правила будут иметь вид: если v2
v3 …, где атрибут может принимать одно из нескольких значений (связанных дизъюнкциями).
Опишем этот алгоритм в общем виде:
Шаг 1. Разделить все примеры на подмножества PE положительных примеров и NE отрицательных примеров.
Шаг 2. Выбрать из PE случайным образом или по каким-то соображениям один пример, который будет считаться опорным примером.
Шаг 3. Найти множество максимально общих правил, характеризующих опорный пример. Предел обобщения определяется множеством NE : обобщенное описание опорного примера не должно удовлетворять ни одному объекту из NE . Полученное таким образом множество правил называется опорным множеством.
Шаг 4. Используя некоторый критерий предпочтения, выбрать лучшее правило в опорном множестве.
Шаг 5. Если это правило, вместе с ранее порожденными таким образом правилами, покрывает все объекты из PE , то конец. Иначе — найти другой опорный пример среди неохваченных примеров в PE и перейти к 3.
Шаг 3 выполняется специальной процедурой порождения опорного множества правил. Критерий предпочтения для выбора правил на шаге 4 определяется характером решаемой задачи. В качестве такого критерия может выступать комбинация различных элементарных критериев, таких как требование максимального числа положительных примеров, описываемых правилом, минимального числа используемых атрибутов, максимальной оценки степени общности, т.е. отношения числа положительных примеров, покрываемых правилом, к числу всех примеров, минимальных затрат на измерение значений атрибутов и т.п. Кроме того, можно использовать критерии выбора атрибутов такие как энтропия, информационная функция полезности и т.д. Алгоритм позволяет также строить множество правил с различными отношениями между отдельными правилами.
Проиллюстрируем работу алгоритма на простом примере построения правил определения тяжести обострения протрузии межпозвонкового диска на уровне L5-S1 позвонков. Пациенту выполнено МРТ – исследование и назначено консервативное лечение. Разумеется, пример будет носить модельный характер и предназначен исключительно для иллюстрации п роцесса обнаружения правил - рассмотрение примеров реального уровня сложности требует больших объемов вычислений и возможно только с применением современных вычилительных средств.
В качестве обучающей выборки возьмем примеры тяжести обострения протрузии межпозвонкового диска на уровне L5-S1 позвонков: в таблице 3 примеры 1-3 соответствуют тяжёлому обострению, примеры 4-7 – не тяжелому обострению. Каждый пример задан набором признаков и их значений.
Для простоты возьмём семь признаков (хотя в реальности их должно быть не менее девяти): анталгический наклон туловища, интенсивность болевого синдрома по шкале болевого аудита (от 0-120), Ахиллов рефлекс, чувствительность в промежности, чувствительность по дерматому S1, сила в стопе (разгибание), мочеиспускание.
Каждая строка соответствует одному вектору значений признаков. Предположим, критерий предпочтения рекомендует выбирать правила, охватывающие максимально возможное число положительных примеров, а условия правил могут пересекаться друг с другом. Программа, ведущая к выявлению правил из приведенных примеров, будет состоять из следующих шагов:
Выбрать первый опорный пример:
П1 .Для построения опорного множества примера
П1 (т.е. множества максимально общих описаний П1), начать с построения множества всех описани й П1, которым не удовлетворяют отрицательные примеры.Для этого обобщим какой либо признак опорного примера, например, Ахиллов рефлекс. При <Ахиллов рефлекс> = отсутствует v норма, правило R1 таково:
ЕСЛИ: (Анталгический наклон туловища = есть) & (Интенсивность болевого синдрома по шкале болевого аудита = 41-120) & (Ахиллов рефлекс = (отсутствует v норма)) & (Чувствительность в промежности = изменена) & (Чувствительность по дерматому S1 = изменена) & (Сила в стопе (разгибание) = парез) & (Мочеиспускание = затруднительно), то обострение тяжелое.
Далее займёмся атрибутом Чувствительность в промежности и попытаемся его обобщить. Получим в результате правило R1 таково: ЕСЛИ: (Анталгический наклон туловища = есть) & (Интенсивность болевого синдрома по шкале болевого аудита = 41-120) & (Ахиллов рефлекс = (отсутствует v норма)) & (Чувствительность в промежности = (изменена v норма) & (Чувствительность по дерматому S1 = изменена) & (Сила в стопе (разгибание) = парез) & (Мочеиспускание = затруднительно) то обострение тяжелое.
Результатом обобщения атрибута Сила в стопе (разгибание) будет правило R1 таково: ЕСЛИ: (Анталгический наклон туловища = есть) & (Интенсивность болевого синдрома по шкале болевого аудита = 41-120) & (Ахиллов рефлекс = (отсутствует v норма)) & (Чувствительность в промежности = (изменена v норма) & (Чувствительность по дерматому S1 = изменена) & (Сила в стопе (разгибание) = (парез v норма)) & (Мочеиспускание = затруднительно) то обострение тяжелое.
Попытки дальнейшего обобщения этого описания приводят к тому, что ему начинают удовлетворять и отрицательные примеры. Например, обобщение атрибута Мочеиспускание приводит к правилу стопе (разгибание) = (парез v норма)) & (Мочеиспускание = затруднительно v норма), покрывающее пример 7, который не относится к тяжелому обострению протрузии меж позвонкового диска на уровне L5-S1 . Поэтому правило R1' мы вынуждены отбросить. Однако, оставшееся правило R1 покрывает примеры 1 и 2. Остался «неохваченным» пример 3.
R1 ': (Анталгический наклон туловища = есть) & (Интенсивность бо левого синдрома по шкале болевого аудита = 41-120) & (Ахиллов рефлекс = (отсутствует v норма)) & (Чувствительность в промежности = (изменена v норма) & (Чувствительность по дерматому S1 = изменена) & (Сила вВозьмем
П3 в качестве следующего опорного примера и попытаемся его обобщить.Процесс обобщения, начиная с признака Ахиллов рефлекс примера стопе (разгибание) = (парез v норма)) & (Мочеиспускание = затруднительно v норма) то обострение тяжелое.
П 3 , приводит к уже полученному правилу R1 , поэтому займемся обобщ ением с последнего атрибута, который не был обобщен ранее, и получим правило R2: ЕСЛИ (Анталгический наклон туловища = есть) & (Интенсивность болевого синдрома по шкале болевого аудита = 41-120) & (Ахиллов рефлекс = (отсутствует v норма)) & (Чувствительность в промежности = изменена) & (Чувствительность по дерматому S1 = изменена) & (Сила вИтак, поскольку неохваченных примеров больше не осталось, то два правила стопе (разгибание) = (парез v норма )) & (Мочеиспускание = затруднительно), то степень обострения = Тяжелое и R2: ЕСЛИ (Анталгический наклон туловища = есть) & (Интенсивность болевого син дрома по шкале болевого аудита = 41-120) & (Ахиллов рефлекс = (отсутствует v норма)) & (Чувствительность в промежности = изменена) & (Чувствительность по дерматому S1 = изменена) & (Сила в стопе (разгибание) = (парез v норма)) & (Мочеиспускание = затруднительно v норма), то степень обострения = Тяжелое дают полное и непротиворечивое описание представленой в таблице 3 ситуации.
R1 : ЕСЛИ: (Анталгический наклон туловища = есть) & (Интенсивность болевого синдрома по шкале болевого аудита = 41-120) & (Ахиллов рефлекс = (отсутствует v норма)) & (Чувствительность в промежности = (изменена v норма) & (Чувствительность по дерматому S1 = изменена) & (Сила в4. Особенности использования систем правил для диагностики и планирования лечения на основе прецедентов
В этом разделе рассмотрим синтез плана лечения или иначе - лечебно-диагностической последовательности правил - по прецедентам. Неформально, прецедент (например, хранящийся в базе данных), имеет вид: