О
с
т
а
в
и
т
ь
С
о
о
б
щ
е
н
и
е

Медицина / Диагностика / Диагностика (статья)

Доказательная диагностика

Доказательная диагностикаДоказательная диагностикаВ статье рассмотрены исторические аспекты методологии диагностики. Приведены понятия о диагностических методах, диагностические показания и диагностические тесты, их точность, разновидности, аналитические параметры – стабильные (чувствительность и специфичность) и вторичные (прогностическая ценность позитивных и негативных результатов). Обговаривается биологическая и методическая норма, понятия информативности теста, представления о золотом стандарте диагностики. Рассмотрены внедрения новых диагностических методов в клиническую практику на основах доказательной медицины. Представлены определения предтестовой и послетестовой вероятности диагноза, шансов развития и диагностических критериев заболевания. уделено внимание перекрестным исследованиям как первичным источникам доказательств параметров диагностических тестов.

История развития диагностики, как и история медицины в целом, отображает борьбу мировоззрений, научно-технический и социальный прогресс. У древних ассирийцев был обычай выводить больного человека на дорогу, и каждый, кто шел этим путем, мог его обследовать и дать ему совет; подобные традиции существовали во многих восточных странах, а также в Стародавней Руси. Тщательное наблюдение за больным и анализ фактов были присущи гиппократовской медицине (хотя его заслугой стала разработка системы определения прогноза, а не диагноза); благодаря Галену были заложены основы топической диагностики. Стоить отметить, что практический опыт лечения и профилактики заболеваний накапливался в мире раньше и быстрее, чем опыт диагностики. Например, канон Авесты обязывал врачей Древнего Ирана и Средней Азии быть максимально осторожными при определении диагноза и прогнозах, чтобы не навредить больным и не подорвать собственный авторитет. И хотя первая методическая медицинская школа возникла уже в Древнем Риме, на протяжении многих столетий продолжался эмпирический период ее развития.

Как в свое время писал профессор С.А. Гиляревский, «решающим фактором успешной работы врача в то время был опыт, диагноз ставили на основании жалоб больного, внешнего вида и того впечатления, которое он производил на врача». В XVIII веке нидерландский врач Г. Бургав, которому принадлежит высказывание «Кто хорошо диагностирует, тот хорошо лечит», предложил использовать для диагностики методы наблюдения и аналогии. Важность практики и опыта, учета влияния на развитие заболеваний «духовной жизни» и факторов окружающей среды отмечал выдающийся московский клиницист М.Я. Мудров (1776-1831 гг). Его заслугами в отрасли диагностики считают «разработка и внедрение в практику: 1) метода систематического и всестороннего обследования больного и 2) методического ведения истории болезни». С именем Г.А. Захарьина (1829-1897 гг) в методологии диагностики связано как разграничения «основного заболевания» (diagnosismorbi) и «второстепенных расстройств и всех особенностей больного» (diagnosisaegri), так и совершенная разработка метода опроса.

Требования к точности диагноза все больше возрастали, начиная со второй половины XIX века, что было связано с бурным развитием различных методов исследований. Выдающуюся теорию диагностического мышления на то время создал С.П. Боткин (1832-1889 гг), который «поставил методику клинического исследования на природно-научную физиологическую основу и, стремясь к индивидуализации каждого случая, …указал нам, как превратить … диагностику болезни в диагностику больного». Дальнейшее развитие было связано с именем М.П. Кончаловского (1875-1942 гг): он определил четыре аспекта диагноза (морфологический, функциональный, патогенетический и этиологический) и отметил важность определения «диагноз будущего» - прогноз. Работы Г.Ф. Ланга (1875-1948 гг) обогатили методологию диагноза синдромным подходом. Всемирно известным автором нескольких диагностических методик в клинике внутренних болезней является основатель киевской терапевтической школы В.П. Образцов (1849-1920). Заслугами в этой отрасли его ученика М.Д. Стражеска (1876-1952 гг) являются разработка патофизиологического направления и функциональной диагностики, организация проведения в Украине многочисленных клинико-экспериментальных исследований и широкое внедрение синтетического метода диагностики («…на долю интерниста приходится осуществление синтеза всех факторов, полученных разными специалистами при изучении любой проблемы»).

Много актуальных вопросов диагностики в разных отраслях клинической медицины было решено благодаря глубоким фундаментальным и клиническим исследованиям, которые проводились с того времени по сегодняшний день. Как писал академик М.В. Черноруцкий (1884-1957 гг), обязательными этапами распознавания заболеваний является «наблюдение, оценка явлений, которые наблюдаются, и умозаключения». Соответственно составляющими диагностики он называл методы исследования («врачебная техника, … или диагностика в узком смысле»), семиотику (семиологию) и методологию диагноза – «особенности мышления при построении диагностических выводов». Как известно, на протяжении последних десятилетий в медицинской практике внедрены принципы клинической эпидемиологии и доказательный подход. В аспекте клинической и нозологической диагностики это означает: 1) приоритетный выбор тех диагностических методов, точность которых доказана результатами систематических осмотров или контролированных клинических исследований; 2) понимание математической сущности результатов диагностических тестов, отличий между их клинической и статической значительностью; 3) понимание того, что тот или иной диагноз у каждого конкретного пациента следует выражать как вероятность (риск, шансы); 4) индивидуальный, ориентированный на пациента подход – учет его выбора, ожиданий, ценностей и возможностей во время назначения исследований и интерпретации их результатов. Что касается такого раздела диагностики, как семиология, то лучшее описание симптомов и клинической картины приведены в старых учебниках и монографиях. Доказательный подход предусматривает оценку выявленных во время обследования признаков как диагностических тестов, диагностических критериев, факторов риска (ФР) или прогностических маркеров.

Клиническая диагностика была, и будет сложным познавательным процессом, в котором врач всегда полагается на специальные знания, опыт, законы логики и интуицию. Его соображения должны быть определенными (ясными, точными), последовательными (непротиворечивыми) и обоснованными. Сложность диагностического процесса предопределяется множеством факторов, среди которых – особенности клинического течения заболевания у конкретного пациента, влияние сопутствующей патологии и лечения, компетентности врача, доступность необходимых методов диагностики, корректная интерпретация результатов диагностики. Значительное распространение новых диагностических методов в клинической практике является признаком настоящего времени. Правильной выбор того или иного из этих методов или их комбинации, а также трактовка полученных данных имеют решающее значение во многих клинических ситуациях и часто влияют на жизненный прогноз у пациентов. Именно использование методов клинической эпидемиологии и доказательного подхода дает врачам возможность делать справедливые выводы, контролируя влияние систематических ошибок.

Известно, что любой диагностический метод – клинический, физикальный, лабораторный, инструментальный или морфологический – описывает определенный биологический феномен в организме человека. Метод признают диагностическим тестом и используют в клинической практике при условии его воспроизводимости и изученности в стандартных клинических ситуациях у пациентов разных популяций. Диагностический показатель – это биологический феномен, который возникает или меняется при патологии и может быть выявленным при помощи стандартизированного диагностического метода. Как правило, один показатель можно определить при помощи нескольких методов, которые отличаются по аналитическим характеристикам; из-за этого разными являются «границы нормы» и диагностическое значение показателя. Диагностическим тестом является определение конкретного диагностического показателя при помощи конкретного метода, аналитические параметры которого остаются неизменными при условии контроля качества его выполнения.

Диагностические исследования проводят лицам, которые обратились к врачу с жалобами, для выяснения их причин и постановки диагноза. Тот же самый тест, назначенный человеку, которые не имеет жалоб или признаков конкретного заболевания и считает себя здоровым, принято называть скрининговым. Так, для пациента, который жалуется на боль в подложечной области, эзофагогастродуоденоскопия является диагностическим тестом, а для того, кто не имеет жалоб, - скрининговым. Электрокардиография (ЭКГ) с определением индексов Sokolow-Lyon и Cornell и эхокардиография с вычислением массы миокарда левого желудочка являются диагностическими тестами для выявления гипертрофии левого желудочка (ГЛЖ) у лиц с артериальной гипертензией (АГ) и скрининговым – у здоровых лиц. Вообще скрининг (англ. Screen – просеивать) подразумевает массовое обследование людей и является технологией первичной популяционной профилактики и «ранней диагностики скрытых заболеваний». Кроме этого, В.В. Власов разделяет диагностические тесты для выявления сопутствующих заболеваний (такие, что показаны в случае обращения к врачу по каким-либо причинам, например, общий осмотр, общий анализ крови, рентгенография грудной клетки, ЭКГ) и диагностические тесты для оценки эффективности лечения (термометрия пациентов, которые принимают антибиотики; терапия ex juvantibus).  Тесты также разделяют на скрининговые и «тесты, которые подтверждают диагноз».

Как видно в таблице 1, диагностические тесты могут быть качественными, порядковыми и колличественными. Во всех случаях клиницисты склонны к упрощенным данным. Примером является использование порядковых шкал – как например представленную на рис. 1 визуальной аналоговой шкалы (ВАШ) для оценки болевого синдрома (от 0 до 3 баллов) как врачами, так и собственно пациентами. Подобные шкалы все чаще используют и в контролируемых клинических исследованиях и в обыкновенной клинической практике.

 

Таблица 1. Физикальное исследование как диагностический тест для выявления вторичной артериальной гипертензии
  1. Типичная для синдрома Кушинга внешность.
  2. Характерные признаки нейрофиброматоза на коже (феохромоцитома).
  3. Пальпация увеличенных почек (поликистоз почек).
  4. Аускультация шума в области живота (вазоренальная артериальная гипертензия).
  5. Аускультация шума в предсердечной области и грудной клетке (коарктация аорти).
  6. Снижение или отсутствие пульсации на бедренной артерии и сниженное артериальное давление на бедре (коарктация аорты или болезни аорты и ее веток).

 

Визуальные аналоговые шкалы, по которым характеризуют силу боли

Рис. 1. Визуальные аналоговые шкалы, по которым характеризуют силу боли.

Бристольская шкала кишечных испражнений

Рис. 2. Бристольская шкала кишечных испражнений.

На рисунке 2 изображена другая визуальная аналоговая шкала – Бристольская шкала кишечных испражнений, или шкала Маерса, которая представляет современную медицинскую классификацию форм испражнений человека, топ которых зависит от времени их пребывания в толстой кишке. Типы 1 и 2 характерны при запорах, типы 3 и 4 считают «идеальными», типы 5-7 присущи поносам (особенно тип 7, который свидетельствует о высокой вероятности серьезного заболевания).

Еще чаще сложные данные упрощают до дихотомических: «наличие-отсутствие», «патология-норма», «больной-здоровый». Привычными являются такие заключения: «признаков перенесенной стрептококковой инфекции нет», «установлен обратный поток крови в митральном клапане сердца», «лабораторное исследование выявило анемию, лейкоцитоз и бактериоурию».

Лучшая клиническая практика предусматривает использование наиболее полезных и информативных диагностических тестов. Внедрение нового метода диагностики целесообразно в тех случаях, когда имеющиеся методы признаны недостаточно точными или неприемлемыми по другим причинам (инвазивность, высокая стоимость и др.). Наиболее точный, надежный среди имеющихся диагностических тестов называют золотым стандартом диагностики (или эталонным, референтным тестом). Иногда эталонным являются простые в исполнении и относительно дешевые тесты: целенаправленный опрос пациента (диагностика стенокардии при наличии приступов чувства загрудинного «сдавливания», гастроэзофагально рефлюксной болезни – при частых эпизодах изжоги), некоторые лабораторные (определение уровня гемоглобина, эритроцитов в крови и гематокрита при развитии кровотечения, оценка уровня С-реактивного протеина в крови как показателя активности воспаления), морфологические или бактериологические исследования (мазков-отпечатков со слизистой оболочки желудка – для диагностики инфекции H. pylori, мазков с зева – для определения возбудителя ангины). Но чаще всего эталонами являются инвазивные и дорогие тесты, нередко – данные биопсии или аутопсии. На практике врачи и пациенты как правило выбирают неэталонные методы диагностики, по крайней мере на начальном этапе. Например, возбудителя пневмонии предполагают на основании особенностей клинического течения болезни, данных рентгенографии грудной клетки и анализе мокрот, а золотой стандарт диагностики – исследование биоптатов легочной ткани – не является рутинной практикой. Другой пример. В клинических исследованиях доказано, что гипертрофия левого желудочка является независимым фактором риска коронарной болезни сердца, в том числе внезапной сердечной смерти, инфаркта миокарда и желудочковых аритмий, а также фибрилляции предсердий и сердечной недостаточности. Развитие гипертрофии левого желудочка у пациентов с коронарной болезнью сердца и артериальной гипертензией повышает риск развития инфаркта миокарда и инсульта в 5 раз; развитие гипертрофии левого желудочка у больных с первичной артериальной гипертензией приводит к повышению уровня сердечно-сосудистой смертности в 25 раз. Золотым стандартом диагностики гипертрофии левого желудочка является вычисление массы миокарда левого желудочка и индексация ее к площади поверхности тела или роста пациента: критерием является показатель свыше 125 г/м2 у мужчин и свыше 110 г/м2 у женщин. Увеличение индекса массы миокарда левого желудочка на 50 г/м2 повышает риск коронарной болезни сердца на 50%. Эталонным тестом для диагностики гипертрофии левого желудочка является метод магнитно-резонансной томографии (МРТ), который не всегда доступный, в том числе из-за высокой стоимости. Как известно, наиболее доступным диагностическим тестом является ЭКГ (критерии гипертрофии левого желудочка – индекс Sokolow-Lyon >38 мм, индекс Cornell >2440 мм/мс). Оптимальное соотношение информативности, стоимости и затрат времени имеет метод эхокардиографии, что именно и обусловило включение его в стандарты диагностики гипертрофии левого желудочка в клинической практике.

Доказательный подход предусматривает сравнение нового диагностического теста с имеющимся золотым стандартом в контролированных клинических исследованиях. Важно то, что золотой стандарт является не идеальным, а наилучшим среди имеющихся диагностических методов, и новый, более доскональный тест может его заменить.

Для оценки аналитических параметров диагностического теста его используют у лиц двух групп – у пациентов с определенным заболеванием и у лиц контрольной группы. Для этого проводят перекрестные (синоним – одномоментные) исследования, которые имеют преимущества во времени, позволяя изучать распространенность заболеваний и факторов риска. Недостатки клинических исследований этого типа приведены в таблице 3.

Таблица 2. Определение качества исследования, посвященного оценке диагностического или скринингового теста

Вопросы, на которые нужно последовательно дать ответ

Комментарии

1. Является ли тест полезным для нашей практики?

Позволит ли тест выявить потенциально излечимую болезнь лучше, чем существующие тесты? Повлияет ли его использование на план ведения пациента?

2. Сравнивали ли исследуемый тест с золотым стандартом?

Для многих заболеваний эталон диагностики так и не определен, и в таких случаях используют комбинацию критериев, с которой и сравнивают тест.

3. Насколько адекватную выборку исследовали?

Выборка, в которой проверяли тест, должна быть как можно меньше смещена и репрезентативна.

4. Удалось ли избежать смещения из-за неполного использования золотого стандарта?

У всех пациентов, которые приняли участие в исследовании и получили диагностический тест, должен был быть использованным также и золотой стандарт диагностики.

5. Удалось ли избежать систематической ошибки «из-за ожидания»?

Все оценки должны быть «слепыми»: на интерпретацию результатов теста не должно влиять знание результатов других тестов.

6. Является ли тест воспроизводимым как у того самого, так и у других исследователей?

При интерпретации результатов некоторых тестов (визуализационных, качественных) их воспроизводимость у двоих исследователей должна быть приемлемой.

7. Какими являются характеристики теста на основе результатов исследования?

Достоверность скринингового теста, в отличие от диагностического, не имеет абсолютно четких характеристик.

8. Указаны ли для этих характеристик доверительные интервалы?

Чем больше размер выборки, тем уже доверительные интервалы полученного результата. Следовательно, характеристики доверительного интервала являются особо важными в случае малых выборок.

9. Был ли определен на основании результатов диапазон нормальных значений?

При определении зон риска для непрерывных физиологических или патологических параметров следует оценивать вероятность событий, для предупреждения которых направлено лечение. Самую объективную их оценку обеспечивает расчет отношения правдоподобности.

10. Как интерпретируют тест в контексте других, которые используют в диагностическом поиске при данном состоянии?

Примером может быть многофакторный общий кардиоваскулярный риск или риск желудочно-кишечных кровотечений

 

Таблица 3. «Недостатки» одномоментных (перекресных) исследований
  1. Не отображают реального распространения заболеваний.
  2. Чем менее распространенным является заболевание, тем выборка должна быть больше, чтобы выявить достаточное количество больных на это заболевание.
  3. Не позволяют оценить вклад некоторых факторов риска в развитие заболевания и установить наличие связи между ними.
  4. Могут привести к ложному определению факторов риска из-за того, что в случае заболевания изменяются определенные показатели и нередко – привычки пациентов.
  5. Не позволяют оценить прогностическую силу отдельных признаков (маркеров).
  6. Не позволяют выучить характеристики умерших от конкретного заболевания.
  7. При обследовании профессиональных групп не позволяют изучить характеристики тех, которые оставили работу из-за состояния здоровья, достижения пенсионного возраста или других причин.

 

При получении результатов исследований традиционно строят четырехпольную таблицу, или «латинский квадрат» (табл. 4), на основе которого вычисляют аналитические параметры диагностического теста или его операционные характеристики – истинные или ложные результаты, точность, чувствительность и специфичность теста, прогностическую ценность позитивных и негативных результатов, а также отношение правдоподобности.

Таблица 4. Соотношение результатов диагностического теста и наличия заболевания

 

 

ЗАБОЛЕВАНИЕ

 

 

Имеющееся

Отсутствует

ТЕСТ

Позитивный

Истиннопозитивный

Ложнопозитивный

a

  b

Негативный

c

  d

Ложнонегативный

Истиннонегативный

Опыт доказывает, что как правило по результатам диагностического поиска мы можем только допускать правильность диагноза, нежели утверждать это категорически. В современной медицине принято выражать уверенность в диагнозах из-за вероятности (риски, шансы). Следовательно, врачи должны понимать математическую сущность диагностической ценности тестов в разных клинических ситуациях. В таблице 4 приведены соотношения результатов диагностического теста и правильного диагноза: заболевание имеющееся и отсутствующее, а результат теста – позитивный (патология) или негативный (норма). Существует два конкретных результатов теста – он является позитивным при наличии заболевания (истиннопозитивный результат) или негативным при отсутствии заболевания (истиннонегативный результат). Ложнопозитивным называют позитивный результат теста у здорового, ложнонегативным – негативный результат теста у человека, который имеет конкретное заболевание.

Точность теста (англ. Accuracy, A) отображает часть истинных (корректных) результатов теста в их общем количестве. Индекс точности рассчитывают по формуле: A=(a+b)/(a+b+c+d). Понятие точности, или аналитической точности, используют для сравнения разных диагностических тестов. Индекс точности позволяет сравнить разные методы определения конкретного показателя при обследовании пациентов этой же популяции.

Вероятность заболевания необходимо оценивать до назначения диагностических тестов. Однако интенсивность диагностических мероприятий должна отвечать каждой конкретной клинической ситуации.

Термин «априорная», или «предтестовая вероятность заболевания», в клинической эпидемиологии является синонимом его распространенности (англ. Prevalence, P). Ее расчитывают по формуле: P=(a+c)/(a+b+c+d). Однако перекрестные исследования, как видно в таблице 3, не отображают реального распространения заболевания, и источниками такой информации являются статистические отчеты и мировая медицинская литература. Направление пациентов на диагностическое исследование фактически является способом повышения априорной вероятности заболевания: умозаключения специалистов увеличивают шанс того, что пациент с конкретными жалобами действительно имеет определенное заболевание, и это оправдывает более активный подход к назначению ему диагностических тестов. Так, значительное распространение в популяции такого значительного фактора риска преждевременной смерти, как артериальная гипертензия, обуславливает широкое внедрение измерения артериального давления.

Стабильными характеристиками диагностического теста являются так называемые его первичные параметры – чувствительность и специфичность, ведь они зависят от распространения заболевания у выборки пациентов, которую исследуют.

Чувствительность теста (англ. Sensitivity, Se) – это часть истинных позитивных результатов в основной группе (т.е. у пациентов с конкретным заболеванием): Se=a/(a+c).

Специфичность (англ. Specificity, Sp) – это часть истинных негативных результатов в контрольной группе (т.е. у лиц без этого заболевания): Sp=d/(b+d).

Показатель чувствительности отображает вероятность позитивного результата диагностического теста при наличии заболевания. Чувствительный диагностический тест редко «пропускает» пациентов, которые являются больными. Так, повышение температуры тела и содержание С-реактивного белка (СРБ) в крови являются высокочувствительными тестами большого круга воспалительных заболеваний независимо от их природы – инфекционной, аутоиммунной, онкологической и др. Высокочувствительные тесты являются особенно полезными при наличии риска пропустить угрожающие, но излечимые заболевания, а также на ранних стадиях диагностического поиска для сужения его рамок (такие тесты позволяют исключить другие многочисленные заболевания, которые являются маловероятными).

Специфический тест позволяет не отнести здоровых людей к критерию больных. Высокоспецифические тесты являются бесценными в ситуациях, когда ложнопозитивные результаты могут нанести вред физическому или психическому здоровью пациента, например, в результате ошибочно назначенного лечения. К высокоспецифическим тестам относятся и патогномонические признаки конкретных заболеваний.

Особенно информативными для диагностики являются негативные результаты чувствительных тестов и позитивные – специфических. При предположении конкретного диагноза негативный результат высокочувствительного теста позволяет надежно исключить, а положительный результат высокоспецифического теста – подтвердить заболевание. В.В. Власов отмечает такую типовую ошибку врачей, как уверенность в необходимости проведения дифференцированной диагностики при положительных результатах именно чувствительных (а не специфических) тестов. Он также отмечает, что для диагностических тестов «не существует минимально необходимой величины» стабильных параметров: «Тест, который дает позитивный результат у больных чаще, чем у здоровых, может быть полезным». Р. Флетчер и соавт. отмечают, что на практике не используют тесты, чувствительность и специфичность которых не достигает 50%.

Стоит отметить, что стабильные параметры диагностического теста зависят от обратной границы нормы: чем она ниже, тем выше является чувствительность теста и число ложнопозитивных результатов. «Нормальные границы» диагностического теста стоит обговаривать в аспекте именно медицинской нормы». Если биологическую норму определяет биологическая вариация в популяции параметра, который изучают, то медицинскую – определяют те клинические задания, которые будут решены при помощи диагностического вмешательства. С позиции доказательной медицины результат какого-либо теста более конкретно нужно рассматривать не в связи с нормой, а в связи с доказанным в эпидемиологических исследованиях риском неблагоприятных событий в аналогичных популяциях. Медицинскую норму определяют современные представления медицинской науки. Например, верхняя граница нормы СРБ для диагностики воспалительных процессов установлена на уровне 10 мг/л, а при использовании новых высокочувствительных тестов определение СРБ для оценки кардиоваскулярного риска – 4 мг/л. Наличие нескольких границ нормы определяет информативность теста – условное понятие, которое указывает на объем диагностической информации, которую можно получить при его использовании.

Заполнить все поля «латинского квадрата» для оценки параметров диагностического теста бывает тяжело по этическим и практическим причинам. В медицинской литературе недостаточно информации о негативных результатах диагностических тестов (истинных и ложных), поскольку при нормальных результатах предыдущих тестов тяжело настаивать на дальнейших обследованиях, как правило дорогостоящих и часто связанных с риском для здоровья пациента. Так, при повышенном содержании простатспецифического антигена (ПСА) в крови мужчины чаще соглашаются на проведение биопсии предстательной железы, чем в случае нормальных показателей ПСА. Во-вторых, неверная оценка диагностического теста может быть последствием его исследования только или преимущественно у больных. Например, МРТ поперечного отдела позвоночника как правило назначают пациентам с синдромом боли в нижней части спины, и частой находкой являются грыжи межпозвоночных дисков. Контрольную группу (МРТ у пациентов, которые не имели жалоб) изучали только в сравнительном клиническом исследовании, и частота грыж в этой группе не отличалась от таковой в основной группе.

Клинические характеристики пациентов значительно влияют на оценку стабильных параметров диагностических тестов (табл. 5). Например, на протяжении первых 3 месяцев заболевания на ревматоидный артрит (РА) повышенные титры ревматоидного фактора (РФ) в крови выявляют меньше чем у половины пациентов, что свидетельствует о недостаточной чувствительности теста в ранней стадии заболевания. Рост титров в дальнейшем коррелируется с активностью, тяжестью течения и развитием системных проявлений, а их внезапное снижение происходит при возникновении такого угрожающего поражения почек, как амилоидоз. Недостаточную специфичность теста подтверждает обнаружение ревматоидного фактора в повышенных титрах у пациентов с другими заболеваниями, течение которых осложняется полиартритом, - паразитарные инвазии (90% пациентов), вирусные гепатиты В и С (75%), первичный билиарный цирроз печени (в 70%), острые вирусные инфекции (65%), инфекционный эндокардит и силикоз легких (50%), злокачественные новообразования (25%), а также у 25% здоровых лиц пожилого возраста. Подобная картина наблюдается во многих иммунологических тестах, диагностическое значение которых в современной клинической практике часто преувеличивается.

Таблица 5. Причины неправильной оценки чувствительности и специфичности диагностического теста

1. Сравнение с неверно выбранным «эталоном»

Если новый тест является более чувствительным, то обнаруженные при его помощи дополнительные случаи заболевания считаются ложнопозитивными результатами

2. Неучет важных характеристик пациентов, у которых оценивали результаты теста

Чувствительность теста часто коррелируется с тяжестью течения заболевания, иногда – с его длительностью и осложнениями, а пациенты отличаются между собой по этим параметрам, как и по активности, стадией и фазой заболевания.

3. Недостаточный размер выборки, отобранной для оценки теста

Чем меньшей является выборка, тем менее корректным является вывод. Сужение 95% доверительных интервалов при увеличении числа исследуемых означает повышение точности оценки теста.

4. Неучет того, что параметры теста, использованного как скрининговый, отличаются от его параметров как диагностического

При обследовании популяции, в которой нет признаков заболевания, тест на его наличие как правило является недостаточно чувствительным (так как больными является небольшое количество людей, и они имеют более ранние и легкие проявления) и в сравнении более специфическими. Оценка этого теста в выборке с большей вероятностью заболевания демонстрирует большую чувствительность и меньшую специфичность. Поэтому достоверность диагностического теста всегда является выше, чем скринингового.

 

Распространенным компромиссным решением проблемы повышения точности диагностики является одновременное или последовательное использование нескольких диагностических тестов. Например, учитывают комплекс тестов, которые называют критериями диагноза. Так, в 1987 году Американской коллегией ревматологов (ACR) было предложено 7 диагностических критериев ревматоидного артрита: 1) утренняя скованность; 2) артрит хотя бы трех суставов; 3) артрит суставов кисти; 4) симметрический характер артрита; 5) ревматоидные узлы; 6) ревматоидный фактор в сыворотке крови; 7) типичные рентгенологические изменения суставов. Название каждого теста дополнено детализированной характеристикой и указано, что «для постановки диагноза необходимо наличие каких-либо 4 критериев их 7. Критерии с 1-го по 4-й должны наблюдаться как минимум 6 недель. Чувствительность их комбинации составляет 91,2%, специфичность – 89,3%». Этот пример демонстрирует постановку нозологического диагноза на основании комбинации признаков заболевания, что имеет высокую чувствительность и специфичность. Также стоит отметить, что отсутствие или несовершенство критериев заболеваний ухудшает оценку точности новых диагностических тестов.

Получение результата диагностического теста позволяет оценить послетестовую вероятность наличия заболевания у конкретного пациента. Специальным параметром, наиболее адекватным для интерпретации известного результата теста в конкретной клинической ситуации, является прогностическая ценность теста (ПЦТ, англ. Predictive value, PV). Показатель отображает вероятность наличия или отсутствия заболевания при известном положительном или отрицательном результате теста (синоним – послетестовая вероятность, апостерирная вероятность).

Положительная ПЦТ(англ. Positive predictive value, +PV; синоним – прогностическая ценность позитивного результата, прогноз позитивного результата) – это вероятность того, что пациент является больным, если получен позитивный результат диагностического теста. Параметр рассчитывается с использованием данных «латинского квадрата» по формуле: +PV=a/(a+b).

Негативная ПЦТ (англ. Negative predictive value, - PV; синоним – прогностическая ценность негативного результата, прогноз негативного результата) – это вероятность отсутствия заболевания при негативном (т.е. нормальном) результате теста. Параметр рассчитывается по формуле: -PV=d/(c+d).

ПЦТ не является стабильным параметром диагностического теста. Позитивная ПЦТ зависит непосредственно от специфичности теста. На практике это означает, что высокие значения позитивной прогностической ценности высокоспецифического теста подтверждают предыдущий диагноз. Негативная ПЦТ связана с чувствительностью теста: негативные (нормальные) результаты высокочувствительного теста опровергают наличие заболевания.

ПЦТ также называю «вторичным» параметром теста, так как она существенно зависит от соотношения включенных в основную и контрольную группу участников исследования: чем больше было обследовано больных, чем здоровых, тем более прогностическая ценность позитивного результата будет выше, и наоборот – преобладание здоровых людей среди обследуемых увеличивает прогностическую ценность негативного результата.

В каждой клинической ситуации врач оценивает вероятность заболевания – до назначения диагностического теста (это этапа характерным является постановка предварительного диагноза). Существует две ситуации, при которых назначают тест, - вероятность болезни является высокой (например, имеющиеся характерные клинические симптомы или факторы риска) или она является низкой (например, существуют данные о низкой распространенности заболевания в данной популяции). Основой расчета послетестовой вероятности заболевания является статистическая теорема Баерса, которая объединяет его предтестовую вероятность, стабильные параметры диагностического теста и прогностическую ценность позитивного результата:

теорема Баерса

Практически значительным является вывод из этой теоремы: результаты использования диагностических тестов зависят от распространенности заболевания – в популяции с высокой вероятностью заболевания негативные результаты даже высокочувствительного теста являются преимущественно ложными, а в популяции с низкой вероятностью заболевания позитивные результаты даже высокоспецифического теста являются преимущественно ложными. Иначе говоря, если распространенность заболевания приближается к 100%, негативная ПЦТ стремиться к нулю; если распространенность заболевания приближается к нулю, стремится к нулю и позитивное ПЦТ, и тест является практически непригодным. Например, специализированная иммунологическая лаборатория, которая получает биологический материал преимущественно от пациентов с ревматическими заболеваниями, всегда имеет небольшое количество ложных результатов. Самые эффективные диагностические тесты есть в тех популяционных группах, в которых распространенность заболевания не является слишком высокой или слишком низкой.

В монографии Р. Флетчера и соавт. приведен пример исследования прогностической ценности теста на содержание ПСА в крови для диагностики рака предстательной железы. Первую группу составляли мужчины пожилого возраста без признаков заболевания, вероятность рака у которых оценивали в 6-12%. Во 2-й группе риск заболевания оценивали как высокий (из-за наличия клинических признаков) у 26% мужчин. Результаты исследования доказали, что при позитивном результате теста онкологический диагноз подтвердили в 15% пациентов 1-й группы и почти у 40% - 2-й. Следовательно, при использовании теста как скринингового на один случай корректного диагноза рака могло риходиться 5-6 случаев ложного, и такие пациенты подлежали бы дополнительным дорогостоящим инвазивным вмешательствам. Использование теста как диагностического оказалось оправданным.

Еще один вывод из теоремы Баерса заключается в том, что со снижением чувствительности и специфичности теста зависимость ПЦТ от распространенности заболевания увеличивается.

Повысить эффективность диагностики можно при помощи комбинации тестов. Несколько тестов назначают параллельно в случае необходимости быстрой оценки состояния пациента – для максимального повышения предтестовой вероятности диагноза перед назначением более специфических тестов. Для уменьшения количества ложнопозитивных результатов, избегания гипердиагностики целесообразно параллельно целесообразно назначать тесты с высокой специфичностью и низкой чувствительностью. Примером последовательного назначения нескольких тестов является комбинация «скрининговый тест – тест, который подтверждает диагноз». Первый тест является высокочувствительным, и поэтому имеет высокую негативную прогностическую ценность; для верификации диагноза выбирают более специфический тест. Особенно полезным такой подход в тех случаях, когда каждый из тестов не является высокоспецифическим. Параллельное тестирование как правило практикуют в специализированных центрах, последовательное – в амбулаториях. Последняя технология является менее затратной и более специфической. На практике каждый диагностический тест не используют изолированно.

Стоит обратить внимание, что все характеристики диагностического теста (чувствительность, специфичность, ПЦТ) мы выражали через вероятность – в процентах или частях. Для описания приведенных параметров используют также понятие шансов – отношение двух вероятностей:

 

Шансы события = (вероятность события) / (1 – вероятность события)

 

 

Вероятность события = (шансы события) / (1 + шансы события)

 

Например, если вероятность осложнений в случае отказа от лечения составляет 80%, то шансы их развития составляют (0,8 / (1 – 0,8)) = 0,8 : 0,2 = 4:1.

Дополнительным способом описания точности диагностического теста является расчет отношения правдоподобности (англ. Likelihoodratio, LR) – отношение вероятности данного результата теста у лиц с заболеванием к вероятности такого самого результата у лиц без заболевания. параметр отображает, насколько вероятность конкретного результата теста отличается в основной группе от результата теста в контрольной группе. Существует два варианта параметра: отношение правдоподобности позитивного результата (англ. Positive likeliood ratio, LR+) и отношение правдоподобности негативного результата (англ. Negative likelihood ratio, LR-). Их расчитывают по следующим формулам:

likeliood ratio

Преимуществами использования отношений правдоподобности является то, что они позволяют: 1) определить степень отклонения от нормы, а не только оценить вероятность наличия или отсутствия заболевания (что возможно при помощи показателей чувствительности и специфичнсти); 2) отобразить полученную информацию одним числом; 3) облегчить расчет послетестовых шансов на основании предтестовых:

Послетестовые шансы = предтестовые шансы * отношение правдоподобности

Приведем пример расчета параметров диагностического теста – определение сывороточного содержания IgM-РФ (ревматоидный фактор) для диагностики РА (ревматоидного артрита) у пациентов с хроническим полиартритом (табл. 6). По результатам дальнейших исследований у части пациентов был установлен диагноз ревматоидный артрит (по критериям ACR, представленных выше).

Таблица 6. Исследование сывороточного содержания IgM-РФ как диагностического теста на ревматоидный артрит у пациентов с хроническим полиартритом

 

 

ЗАБОЛЕВАНИЕ

 

 

Имеющееся

Отсутствует

ТЕСТ: сывороточный IgM-РФ

Позитивный

Истиннопозитивный
65

  Ложнопозитивный
  25

a

  b

Негативный

c

  d

12
Ложнонегативный

  127
  Истиннонегативный

 

P=(a+c)/(a+b+c+d)=(65+12)/(65+25+12+127)=77/179=34%

A=(a+d)/(a+b+c+d)=(65+127)/(65+25+12+127)=192/229=84%

Se=a/(a+c)=65/(65+12)=84%

Sp=d/(b+d)=127/(25+127)=83%

+PV=a/(a+b)=65/(65+25)=72%

-PV=c/(c+d)=12/(12+127)=9%

LR+=0.84/0.164=5.12

LR-=0.16/0.84=0.19

Расчеты свидетельствуют, что: 1) распространенность ревматоидного артрита среди лиц с хроническим полиартритом составила 34%; 2) точность сывороточного содержания IgM-РФ как диагностического теста на ревматоидный артрит составила 84%, чувствительность – 84%, специфичность – 83%; 3) прогностическая ценность позитивного результата теста является достаточно высокой (72%), а исключить диагноз ревматоидный артрит при негативном результате невозможно, так как его прогностическая ценность составила 9%; 4) у больных ревматоидным артритом позитивный результат теста в 5,12 раз более вероятен, чем у пациентов не страдающих РА; 5) отношение правдоподобности негативного результата теста составляет 0,19, следовательно, шансы нормального результата теста при наличии и при отсутствии ревматоидного артрита составляют 1:4,3.

Соответственно по содержанию параметры диагностического теста приведены в таблице 7.

Таблица 7. Соответствие характеристик диагностического теста

Показатель

Соответствуют содержанию других показателей

Предтестовые (априорные) шансы

Распространенность (предтестовая, априорная вероятность) заболевания

Отношение правдоподобности

Чувствительность и специфичность теста

Послетестовые шансы

Прогностическая ценность (послетестовая вероятность) позитивного результата теста

В современной медицинской литературе принято приводить указанные характеристики диагностических тестов. Врачи должны понимать их значение и использовать основные понятия доказательной диагностики на практике.

Внедрение доказательного подхода позволяет повысить качество нозологического и синдромного диагноза путем корректного, дифференцированного назначения наиболее точных диагностических тестов в конкретной клинической ситуации и на популяционном уровне. Доказательная практика предусматривает критическую оценку и использование новых и референтных диагностических тестов с учетом данных клинических исследований, врачебного опыта и выбора пациентов. Владение методологией доказательной медицины не заменяет семиологии, знания диагностических  методик и навыков их использования, а является составляющей эрудиции врача и инструментом, который преподносит искусство «диагностики больного» и уровень клинического диагноза. Как писал С.П. Боткин, «чем шире и многостороннее образование врача, тем вернее будет критика фактов и тем вернее, конечно же, будет гипотеза – результат критического разбора всего найденного. Эта гипотеза и составит… распознавание (diagnosis) болезни и индивидуума».

Похожие новости

Комменатрии к новости

Уважаемый посетитель, Вы зашли на сайт как незарегистрированный пользователь.
Мы рекомендуем Вам зарегистрироваться либо войти на сайт под своим именем.

Написать свой комментарий: