Гомеопатия и проклятие научного метода
Перевод статьи Overall KL, Dunham AE. Homeopathy and the curse of the scientific method. Vet J. 2009 May;180(2):141-8. doi: 10.1016/j.tvjl.2008.10.006. Epub 2008 Nov 28. PMID: 19046906. В недавней статье, опубликованной в The Veterinary Journal, Нина Крэкнелл и Дэниел Миллс из Департамента сельскохозяйственных наук Университета Линкольна проверили действие гомеопатического средства для лечения страха, связанного с шумом фейерверков (Кракнелл и Миллс, 2008). Они обнаружили, что группа плацебо реагировала так же, как группа гомеопатического/лечебного лечения, при статистическом сравнении изменений в количестве оставшихся поведенческих признаков. Гомеопатия переживает возрождение интереса и получает внимание в области ветеринарной поведенческой медицины в основном из-за того, что гомеопатическое лечение не имеет побочных эффектов, в то время как традиционное лечение часто воспринимается как имеющее неприемлемые побочные эффекты. 2008). Такое восприятие редко подвергается сомнению, но если мы хотим вывести ветеринарную поведенческую медицину из области наблюдения и медицины, основанной на доказательствах, в область проверки механизмов и гипотез, мы должны подвергнуть сомнению наш подход к таким вопросам. В этой статье дается комментарий к тому, что обзор гомеопатии может рассказать нам о мыслительном процессе, связанном с оценкой и лечением в ветеринарной поведенческой медицине. Вопросы, влияющие на экспериментальный план Есть две проблемы, связанные с разработкой плана любого лечения или группового сравнения, особенно в поведении, а именно концептуальные проблемы и методологические проблемы. В ветеринарном поведении и поведенческой медицине последняя часто включает в себя измерение вещей, которые вы не можете увидеть или сосчитать, особенно на механистическом уровне. Концептуальные вопросы Концептуальные вопросы касаются таких проблем, как эффект от простого проведения исследования (или участия в нем). Здесь мы должны рассмотреть версию эффекта Гейзенберга (где что-то изменяют, измеряя это) и вопросы населения, включая предвзятость. Способ отбора пациентов имеет решающее значение, особенно в исследованиях, в которых основное внимание уделяется реакции на предполагаемое поведенческое лечение (Brown, 2006). Мы редко оцениваем мнение пациентов (в случае исследований лечения на людях) или взглядов лиц, осуществляющих уход (в случае исследований лечения не на людях) об определенных классах лечения, но вполне вероятно, что никто добровольно не соглашается на что-то, во что он не верит и в этом случае существует высокая вероятность положительного эффекта. В то время как группы лечения могут быть «рандомизированы» в отношении пула тех, кто приглашен или привлечен к участию в исследовании, такая рандомизация вряд ли будет включать тех, кто не хочет использовать лекарства в фармакологических исследованиях, или тех, кто считает гомеопатию «мусором». , в случае изучения гомеопатического лечения. Та же логика применима и к восприятию побочных эффектов: если кто-то «верит», что конкретное лечение имеет больше побочных эффектов, чем другое, на его вероятность участия в исследовании будет влиять восприятие риска, который, как считается, имеет побочные эффекты. В этом случае именно восприятие риска, а не его измерение, оказывает влияние на участвующую популяцию. Поскольку ветеринарные исследователи не могут напрямую оценить мнение пациентов об их состоянии, вопрос рандомизации становится критическим фактором, когда мы оцениваем вопросы, относящиеся к оценке состояния пациентов. Это особенно верно, если клиенты (те же лица, которых мы пригласили для исследования) каким-либо образом и на любом уровне участвуют в оценке реакции, как это почти всегда бывает в ветеринарных поведенческих исследованиях (King et al., 2000). , 2004; Crowell-Davis et al., 2003; Cracknell and Mills, 2008), когда признаки неспецифичны и могут быть неочевидны для клиницистов, обследующих пациентов. Другими словами, в некоторых популяциях наших клиентов и их животных интерпретация проблемы и реакция на предполагаемое лечение могут зависеть от убеждений клиента, а не от объективной оценки реакции пациента на конкретное лечение (Bausell, 2007). Вот почему — с концептуальной точки зрения — рандомизированные плацебо-контролируемые испытания необходимы и могут быть наиболее вероятным объяснением того, почему исследование, о котором сообщили Cracknell and Mills (2008), дало совершенно отличные результаты от более раннего, открытого, нерандомизированного исследования, проведенного той же группой (E.D. Levine and D.S. Mills, неопубликованные данные, цит. по Cracknell and Mills, 2008). Методологические вопросы Методологические вопросы включают использование в исследованиях плацебо и, если да, то каким образом. Плацебо можно определить (OED online, 2008) как «лекарство, терапию и т. д., прописываемое больше для психологической пользы пациента от лечения, чем для какого-либо прямого физиологического эффекта, особенно такого, который не оказывает специфического терапевтического воздействия на организм». состояние пациента, но, по мнению пациента, является терапевтическим (и поэтому иногда эффективным)» новым лекарством и т. д.» (OED online, 2008), который затем функционирует как пустой образец в тесте. Эффект плацебо — это «благоприятное (а иногда и неблагоприятное) влияние плацебо на здоровье, которое нельзя отнести к свойствам плацебо» (OED online, 2008). Его часто определяют как измеримое, наблюдаемое или ощутимое улучшение здоровья или поведения, которое не связано с назначенным лечением. Контроль плацебо необходим, потому что пациент (в медицине человека) и владелец домашнего животного (в ветеринарии) знают, что они участвуют в эксперименте или исследовании лечения. Из-за правил, регулирующих информированное согласие в экспериментальной медицинской науке, нет возможности проверить эффективность предполагаемого лечения по сравнению с эффективностью плацебо без того, чтобы либо пациент, либо клиент, соответственно, были проинформированы о характере эксперимента и предоставили письменное согласие на участие в испытании. Соответственно, нас не должно удивлять, что плацебо очень эффективны при лечении боли и что для этого открытия существует постулируемый механизм. Поскольку восприятие боли зависит от ряда сложных нейрохимических взаимодействий, некоторые из которых могут модулироваться мыслительными процессами, боль можно модулировать верой в то, что лечение поможет. Однако механизмы, с помощью которых это происходит, различаются. Например, лекарства могут блокировать выработку простагландинов, участвующих в болевом каскаде, но вера в успех может высвобождать эндорфины, которые блокируют действие простагландинов (Park, 2000; Hribjartsson and Gotzche, 2001; Bausell, 2007). С точки зрения оценки клинического «фенотипа», то есть того, как себя чувствует пациент, результат может быть таким же (Park, 2000). Важно помнить, что исследование, предназначенное, например, для оценки фенотипической изменчивости, отличается от интервенционного исследования и может предоставить превосходную информацию, на которую могут совершенно не влиять «убеждения» клиентов. В интервенционном экспериментальном плане лечение плацебо включается для контроля чувства достижения или получения положительного результата, которое связано с верой пациента (или, в случае животных, владельца или опекуна) в то, что исследование, в котором они участвуют, будет иметь положительный эффект. Плацебо дается для контроля любого влияния на результат исследования или испытания либо участия, либо ожидания результата участия. Тем не менее, две вещи имеют решающее значение. Во-первых, используемое плацебо не должно иметь известного влияния на патологию, и не должно быть известного механизма, посредством которого плацебо могло бы иметь такой эффект. Во-вторых, следует признать, что поскольку обе группы лечения (т. е. группа, получающая плацебо, и группа, получающая предполагаемое лечение) подвержены эффекту плацебо, важным статистическим тестом является такой, который способен обнаружить разницу между измеренными или зарегистрированными эффектами между группой, получавшей плацебо, и группой, получавшей предполагаемое лечение. Что редко признается или формулируется, так это то, что при точном измерении эффект плацебо является достоверной мерой дисперсии эффекта испытания или самого исследования, независимо от направленности плацебо или предполагаемого механизма. Важность включения плацебо-терапии в эксперимент состоит в том, что наличие и величина статистически значимой разницы между реакцией экспериментальной группы и плацебо-группы (контрольной) в эксперименте свидетельствует об эффективности предполагаемого лечения. Короче говоря, у нас есть способ оценить наше вмешательство, но мы редко интерпретируем наши результаты в этом свете. Нам нужно начать это делать, потому что, когда признаки неспецифичны, неодинаково отмечены и могут быть затронуты интерпретацией клиентов, нам необходимо оценить влияние этих факторов на наши выводы. Применение правил планирования эксперимента в медицинской науке в целом и в гомеопатии в частности. В любом исследовании мы прежде всего хотели бы знать, существует ли «статистически значимая» разница между эффектами лечения и плацебо? В этом отношении испытания лекарств отличаются от других типов экспериментов случай-контроль, потому что они являются интервенционными исследованиями, в которых механизм изменения связан с механизмом, посредством которого предполагается, что вмешательство работает. Другими словами, вы можете оценивать воздействие на симптомы или признаки, а не на основную патологию. Нам также необходимо знать, подразумевается ли разница в направлении предполагаемым механизмом. При определении того, достаточно ли велика разница, чтобы иметь значение, мы должны признать, что статистической значимости самой по себе недостаточно, чтобы нам было удобно обнаруживать явление. Величина статистического эффекта говорит вам о вашем замысле, а не о важности биологического явления; план должен оцениваться с точки зрения вероятности обнаружения эффекта лечения заданной величины (статистической мощности) и вероятности того, что обнаружение зависит, например, от размера выборки. Мы редко видим сообщения о последнем, но мы часто видим некоторую атрибуцию достоверности, приписываемую определенному заданному уровню вероятности, без какого-либо понимания того, что вероятность 0,0002 не эквивалентна вероятности 0,05, которая не эквивалентна вероятности 0,1. Все это можно было бы считать «значимым», но оценка этой статистики должна учитывать взаимосвязь между планом эксперимента и лежащим в его основе распределением данных — характеристика, которая редко обсуждается в любом исследовании, сообщающем о «значимости». Однако часто значимость достаточна и правдоподобна, но тогда мы не задаемся вопросом, достаточна ли величина эффекта экспериментального лечения, чтобы быть биологически значимой. Просто наличие статистически значимого эффекта не гарантирует, что значимое открытие имеет какое-либо отношение к фактической направленности исследования. Редкая статистическая связь может не иметь никакого влияния на биологию системы, но может ввести неосторожных читателей в заблуждение и заставить поверить, что это не так. Если величина экспериментального эффекта достаточно велика, чтобы иметь биологический смысл, то для полноты требуется гипотеза о механизме, посредством которого возникает лечебный эффект. Поддающиеся проверке гипотезы о механизмах действия почти всегда отсутствуют в любых исследованиях комплементарной и альтернативной медицины (CAM), да и во многих ветеринарных поведенческих исследованиях. Такое обсуждение того, что мы на самом деле знаем, ограничено тем, что вы можете реально измерить при попытке оценить вмешательство. Это не так просто, как спросить, является ли что-то «таким же или другим», потому что в интервенционных исследованиях может иметь значение то, насколько это то же самое или другое (см. выше). Например, при оценке дифференциальных реакций на провокационный шум вы можете провести исследование случай-контроль и (1) спросить об общих различиях (наличие/отсутствие, частоты), (2) посмотреть на различные последовательности поведения (одно может повлиять на другое), и (3) использовать модель рандомизации, чтобы оценить, отличаются ли шаблоны на каждом из этих шагов и общий эффект от того, что можно было бы ожидать, если бы вмешательство не имело никакого эффекта. С помощью последнего вы можете посмотреть, куда падают фактические значения статистики теста по сравнению со значениями, полученными в результате повторной итерации модели рандомизации с точки зрения величины эффекта. Это очень полезный, но малоиспользуемый метод для оценки поведенческих изменений в популяциях с относительно небольшим размером выборки (Overall et al., 2001). Двумя основными вопросами, которые должны нас интересовать в статистическом плане, являются (1) распределение величины эффекта или величина эффекта и (2) распределение тестовых статистических значений. Мощность статистического теста (1 б) не является незначительной. Когда вы оцениваете мощность (вероятность совершения ошибки типа II или принятия гипотезы, когда она ложна), вы спрашиваете, какой размер выборки необходим для фактического обнаружения эффекта данной величины; мощность должна быть рассчитана при планировании эксперимента. Если ваш эксперимент не способен обнаружить эффект определенной величины с имеющимися у вас данными, любые реальные эффекты меньше этой величины, вероятно, будут упущены. В статье Cracknell and Mills (2008) был сделан апостериорный расчет мощности теста, который использовался для подтверждения отсутствия эффекта от гомеопатического лечения. Однако, если бы эффект был обнаружен, вероятность того, что кто-то проверил бы влияние размера выборки, была бы убывающе малой, что еще раз подчеркивает важность хорошего экспериментального плана в начале клинического испытания. Установление валидности гомеопатического метода требует (1) того, чтобы он соответствовал тем же стандартам валидности негомеопатических методов, (2) что кто-либо, кровно заинтересованный в результате, не должен участвовать в проведении испытаний (в отчасти из-за проблем, связанных с оценкой эффектов), и (3) что обсуждавшиеся выше методологические вопросы должны решаться в каждом испытании: испытание должно быть слепым, должно оцениваться эффект плацебо и должна оцениваться относительная величина любого эффекта. Бауселл, 2007). Если вы не можете записать предполагаемую гипотезу с механизмом, который можно проверить с научной точки зрения, нет смысла идти дальше. Возможно, именно этот момент отличает гомеопатические препараты с высоким разведением от многих других «травяных» или «натуральных» препаратов, которые часто ошибочно относят к гомеопатии. «Травяные» и «естественные» типы вмешательств более уместны в рамках CAM. Практически все коммерчески производимые фармацевтические препараты имеют своим источником и/или интеллектуальными корнями активные соединения, выделенные из растений. По иронии судьбы сами «растительные» источники часто считаются «безопасными», а коммерческие производные — соединения, которые вынуждены проходить испытания на токсичность — нет. Тот факт, что 1/5 аюрведических лекарств, купленных в Интернете, содержит поддающиеся обнаружению и часто токсичные уровни свинца, ртути и мышьяка (Saper et al., 2008), должен заставить серьезно задуматься тех, кто считает, что вмешательства CAM не могут причинить вреда. Гомеопатические препараты с высоким разведением, такие как тот, который тестировали в Cracknell and Mills (2008), предполагают разведение до такой степени, что очень маловероятно присутствие хотя бы одной молекулы основного соединения. Это означает, что в соответствии с принятыми в настоящее время научными стандартами, в том числе химическими и физическими, регулирующими серийные разведения, не существует мыслимого механизма действия. Конкретные вопросы, связанные с родственными исследованиями, поднятые Cracknell and Mills (2008). однако клиентов часто просят оценить изменения неспецифических признаков. Соответственно, не все поведенческие показатели точно проанализированы. Например, неспецифические признаки разрушения, побега и элиминации клиентам легче оценить (и они представляют большую проблему для клиента), чем неспецифические признаки замирания, слюноотделения и тяжелого дыхания. Поведенческие исследования, которые стремятся использовать оценки клиентов, нуждаются в оценке того, насколько легко люди могут анализировать поведение, имеющее значение. Другими словами, мы должны задаться вопросом не только о том, насколько мы можем доверять оценкам клиентов, но и о том, насколько сильно различаются оценки клиентами своих питомцев. Последняя проблема может быть решена с помощью повторных оценок и дизайна повторных измерений, которые позволяют оценивать домашних животных как индивидуумов, меняющихся во времени, но не в сравнительном исследовании вариаций признаков среди пациентов. Из 15 признаков заинтересованности в исследовании фейерверков, проведенном Cracknell and Mills (2008), только два или три («деструктивность», «устранение» и, возможно, «самоповреждение», в зависимости от социальной среды) могли быть распознаны клиентами. кто не был свидетелем событий. Если собака могла покинуть дом, также можно было оценить «бегство». Это означает, что для подавляющего большинства признаков, используемых для оценки тяжести состояния и его предполагаемой реакции на любое лечение, невозможна точная независимая оценка достоверности сообщений клиентов. Такое влияние на оценку признаков можно контролировать, обдумывая концептуальные вопросы, связанные с планом исследования. В исследовании влияния кломипрамина на поведение животных, страдающих тревогой разлуки, оцениваемые признаки ограничивались теми, которые каждый мог увидеть и оценить (King et al., 2000, 2004), хотя это не был полный сборник всех признаков. признаков, проявляемых собаками с тревогой разлуки. В статье King et al.. (2000), эффект информирования клиентов о том, что они участвовали в исследовании, включавшем лекарство и плацебо, модулировался набором инструкций, влияющих на их реакцию на своих питомцев, которые были очень похожи на те, которые использовали Cracknell and Mills (2008). Просто клиенты были осведомлены о том, что значит случайно или преднамеренно вознаграждать/подкреплять тревожное поведение, и их просили не делать этого. Чтобы помочь клиентам выполнить эту просьбу, их попросили заставить собаку подождать, пока она сядет и успокоится, прежде чем уделять ей какое-либо внимание, и научили, как это делать. Преимущество таких инструкций состоит в том, что они позволяют и поощряют, но не гарантируют сотрудничество со всеми клиентами. Как и в случае Cracknell and Mills (2008), в работе King et al. В исследовании (2000) «плацебо» на самом деле было формой пассивной модификации поведения, предназначенной для того, чтобы позволить людям, которые хотели (и собирались) сделать что-то, что все же позволило бы оценить эффект их вмешательства. В таких планах все еще есть два концептуальных недостатка, и они затрагивают все исследования плацебо. Во-первых, люди лгут. Во-вторых, даже если мы предположим, что все наши клиенты добродетельны, существует дополнительная, более коварная проблема, которая подчеркивает, насколько важен механизм понимания для наших пациентов. Мы не можем отделить эффект пассивных действий, которые могут изменить поведение собаки, от того, что она станет более бдительной, внимательной, информированной и т. д., что может повлиять на то, как вы интерпретируете поведение собаки. Изменение интерпретации может привести или не привести к изменению того, как клиент взаимодействует с собакой, но мы почти никогда не оцениваем такие эффекты. В группе плацебо в ветеринарной поведенческой медицине мы на самом деле стремимся контролировать поведение человека по отношению к животному. Это не решает вопрос о том, есть ли у нас различия в предвзятости населения в наших группах лечения, а вместо этого является попыткой нивелировать влияние некоторых потенциальных предубеждений. То, как и где мы оцениваем поведение, также является проблемой. Cracknell and Mills (2008) отметили, что одно исследование по использованию модификации поведения в сочетании с двумя препаратами, кломипрамином и алпразоламом, для лечения штормовой фобии сообщило об улучшении результатов при оценке поведения собак клиентами, но не показало эффекта при оценках поведения знаков из видеозаписей (Crowell-Davis et al., 2003). Одна из проблем многих поведенческих исследований связана с методологией, которая несопоставима между исследованиями или между группами изучаемых. В исследовании Crowell-Davis et al. (2003), часть оценочной документации доступна только у автора, и эти документы расширяют идею шкалированных эффектов, использованную Cracknell and Mills (2008), для включения поведенческих журналов и опросников, оценивающих конкретные аспекты частоты и интенсивности. в рамках глобальной оценки лиц, осуществляющих уход. В таких случаях мы на самом деле получаем более качественную информацию о фактическом поведении, отвлекая внимание от интерпретации клиентом такого поведения. Немаловажна и ситуация, в которой оценивается поведение. В исследовании Crowell-Davis et al. (2003) были сняты на видео реакции собак, боящихся шторма, при записи трех последовательно более интенсивных штормов. Все видеосъемки проводились в ветеринарной больнице, и, несмотря на оценки клиницистом и клиентом улучшения лечения, не было отмечено различий в переменных событий, связанных с тревогой (облизывание губ, зевота) или переменных состояния (нытье, прятание, тяжелое дыхание и дрожь). . К сожалению, видеосъемка собак, не страдающих боязнью штормов, не проводилась ни в клинике, ни дома до и после лечения. Это проблема только потому, что в этом исследовании нельзя было оценить влияние пребывания в университетской ветеринарной клинической больнице. Cracknell and Mills (2008) отметили, что «поведенческие оценки не изменились по сравнению с видеозаписью» (стр. 86). Этот вывод следует оценивать в контексте вышеупомянутого ограничения потенциального влияния места, в котором проводится оценка. В одном исследовании вокализации собак, которые ничем не примечательны, и собак, страдающих сепарационной тревогой, видеозаписи обеих групп как в домашних, так и в больничных условиях показали, что существует значительный эффект лечения на вокализацию дома, но та же величина эффекта не была обнаружена в ветеринарной больнице, где после лечения больные собаки издавали звуки в той же степени, что и обычные собаки (Overall et al., 1999a, 1999b). Все собаки лаяли или издавали звуки в стрессовой обстановке ветеринарной больницы, что усложняло интерпретацию. Эти примеры показывают важность прозрачности в дизайне и подчеркивают, что чем объективнее оценка поведения, тем меньше приходится полагаться на впечатления клиентов. В таких случаях не только данные более надежны, но и дизайн может быть использован и/или воспроизведен другими исследователями. Если мы заинтересованы в том, чтобы начать выяснять и понимать основные механизмы поведенческих проблем, это важный шаг. Обзор результатов Cracknell and Mills (2008) для этого исследования и других типов нетрадиционных методов лечения Как отмечают Cracknell and Mills (2008), было проведено мало рецензируемых исследований по гомеопатии, и еще меньше исследований с использованием плацебо-контроля. . Здесь уместно сказать несколько слов о рецензировании и методе, обычно используемом для сравнения многих гомеопатических исследований в медицине человека, мета-анализах. Экспертная оценка Рецензирование гарантирует, что до публикации (и в качестве предварительного условия) статья будет прочитана и оценена кем-то, кто предположительно хорошо разбирается в данной области, но успешная публикация не означает, что статья «хорошая»'. Все журналы публикуют статьи разного качества. Хотелось бы надеяться, что никогда не придется утверждать, что какой-либо журнал опубликовал другие статьи столь же плохие, как и ваша собственная. Вопиющие ошибки и ложь обычно выявляются — или, возможно, — в процессе рецензирования, но не всегда (DeAngelis and Fontanarosa, 2008; Ross et al., 2008). Но рецензенты на самом деле не повторяют эксперименты для проверки результатов, поэтому мы не можем ожидать, что публикация гарантирует «правдивость». Есть одно заметное исключение из этого комментария о воспроизведении, и оно касается гомеопатического исследования. В 1988 г. в журнале Nature была опубликована статья, посвященная изучению гомеопатического подхода с использованием анти-IgE соединения в высоких разведениях, что подтверждало эффект этого соединения, измеряемый дегрануляцией базофилов (Davenas et al., 1988). Из-за шумихи, вызванной этой статьей, которая была воспринята как одно из первых и лучших доказательств принципов гомеопатии, трое исследователей попытались с помощью первоначальных исследователей воспроизвести исследование. Результаты их воспроизведения также были опубликованы в журнале Nature (Maddox et al., 1988) и могут служить руководством к тому, чего не хватало даже в «лучших» исследованиях гомеопатических вмешательств. Авторы не нашли подтверждения какого-либо эффекта анти-IgE в высоких разведениях и резюмировали свои выводы по пяти основным пунктам: (1) осторожность, с которой проводились эксперименты, не соответствовала экстраординарному характеру утверждений авторов; (2) описанные явления не были воспроизведены, и лаборатория-инициатор не проводила расследование причин; (3) в данных фактически отсутствовали ошибки, которые можно было бы ожидать в любом наборе измерений (например, случайные ошибки) — по сути, данные были слишком чистыми и слишком «хорошими»; (4) не было предпринято никаких реальных попыток устранить систематические ошибки (в отличие от случайных ошибок, упомянутых в пункте 3); и (5) климат лаборатории не способствовал объективной оценке исключительных данных (Maddox et al, 1988). Речь идет о том, что эти авторы назвали «исключительными данными». В гомеопатических растворах с высоким разведением первоначально присутствующее соединение разбавлено до такой степени, что весьма вероятно, что ни одна молекула не существует. Если можно показать, что такое разведение имеет какой-либо эффект, то этот эффект должен быть свободен от известных и обычно используемых и упоминаемых стандартов и механизмов. Другими словами, в отсутствие предполагаемого механизма, который можно исследовать и проверить, любые данные должны быть исключительно тщательно собраны и оценены, чтобы быть правдоподобными. Мы упоминаем об этом, потому что гомеопатические вмешательства — не единственные виды предполагаемого лечения, которые не соответствуют этим стандартам «исключительных данных». Bausell (2007) заявил, что все вмешательства CAM не соответствуют таким стандартам. В ветеринарии мы не должны смотреть дальше, чем многие широко используемые поведенческие «лечения», включая некоторые травяные добавки и продукты с феромонами. На самом деле Cracknell and Mills (2008) ссылаются на неконтролируемое плацебо исследование, проведенное в их собственной лаборатории по лечению боязни фейерверков с помощью феромонального продукта DAP или феромона, успокаивающего собаку (Sheppard and Mills, 2003), в котором было обнаружено улучшение в признаках, сходных с теми, которые они сообщают для неконтролируемой плацебо версии этого исследования (E.D. Levine and D.S. Mills, неопубликованные данные; цитируется по Cracknell and Mills, 2008). Возникает вопрос, исчез бы ли и этот «эффект», если бы вмешательство было подвергнуто строгому повторному плацебо-контролируемому двойному слепому исследованию. Если бы кто-нибудь загуглил феромональные вмешательства для животных, то нашел бы десятки тысяч «попаданий», однако было опубликовано лишь несколько тщательно проведенных исследований, и большинство из них не плацебо-контролируемые. Перед лицом экстраординарных заявлений на этикетках многих продуктов, включая феромоны, мы должны понимать коварное и проникающее влияние «фольклора» (Maddox et al., 1988) на любую истинную оценку или оценку любых эффектов, или возможность получения таких оценок . Эта проблема является свойством неясных и неопределенных механизмов действия, которые позволяют сторонникам оправдывать любые результаты как набор частных случаев. Если кому-то еще интересно, это не наука. Мета-анализ Появился ряд обзоров, в которых представлены результаты гомеопатических исследований (Linde et al., 1999; Linde и Melchart, 1999; Ernst, 2002; другие исследования см. в Bausell, 2007). Такие таблицы информативны, но простого подхода поднятием рук для оценки эффективности подхода недостаточно. Неважно, сколько плохо спланированных (и, следовательно, ненадежных) исследований показывают положительные эффекты гомеопатического лечения. Однако, если ряд хорошо спланированных, плацебо-контролируемых, двойных слепых экспериментов показал положительные результаты, можно с уверенностью сказать, что эффект надежен. Даже в этих случаях простому методу поднятия рук не хватает статистической силы и точности. Существует устоявшаяся статистическая методология (метаанализ) объединения результатов нескольких исследований в единый анализ. Метаанализ широко используется в эпидемиологии и доказательной медицине, а также во многих других немедицинских дисциплинах, и по его использованию имеется обширная литература (Whitehead, 2002). Это может быть мощным инструментом, но, как отмечает Bausell (2007), то, что было сделано с помощью исследований CAM, в том числе исследований по гомеопатии, не является ни истинным мета-анализом, ни «синтезом» — это резюме, более известное как поднятие рук. Наука, сделанная хорошо и тщательно, устраняет необходимость голосовать за то, считаете ли вы, что метод или лечение работают. Итак, что мы на самом деле знаем о гомеопатии и других формах CAM? В отличие от сочувственных формулировок, встречающихся во многих статьях, посвященных оценке гомеопатии, здесь нет причин для сочувствия. Наиболее четкое заявление об анализе имеющихся данных, повторном анализе и обзоре исследований, предназначенных для изучения других исследований, можно найти в Bausell (2007): ни одна CAM-терапия, включая гомеопатию, не имеет научно правдоподобного биохимического механизма действия, помимо этого. эффекта плацебо. Рекомендации о том, как лучше всего измерять поведенческие данные и почему важен выбор подходящего измерения. Так куда же мы пойдем отсюда? Сбор данных для исследований в области поведенческой медицины и поведенческой медицины не является тривиальной задачей. Следующие методы оценки поведенческих данных предназначены для того, чтобы показать, что необходимо для перехода к достаточно тщательному сбору данных, который позволит сформулировать и проверить механистическую гипотезу и позволит нам поверить в результат этого процесса. Способ 1. Спросите о впечатлениях людей от поведения Это не оптимальная методика, но качество получаемых данных очень сильно зависит от качества задаваемых вопросов. Анкеты абсолютно должны быть избавлены от необходимости выносить суждения и делать выводы тем, кто их заполняет (Serpell and Hsu, 2001), включая тех, кто занимается диагностикой, и людям должна быть предоставлена возможность заявить, когда они чего-то не знают (см. Общий и др., 2006 для одного примера). В исследовании Cracknell and Mills (2008) формулировка нарушает этот принцип: «владельцы заявили, что чувствуют страх своей собаки. . .’. Было бы предпочтительнее спросить о реальных событиях (например, «неизвестная собака на поводке приближается к вашей собаке на поводке») и какой-либо объективной оценке их (например, «отступает ли ваша собака или отступает, рычит ли она, поджимает ли она свой хвост?» ') (Overall et al., 2006). Тот же стандарт должен применяться для оценки результатов. В исследовании Cracknell and Mills (2008) клиентов спрашивали об их уровне «удовлетворенности», но не об их точке зрения, например, на гомеопатию, которая могла бы предоставить столь необходимую информацию о предубеждениях. Метод 2. Задавайте вопросы о конкретном поведении и его интенсивности/частоте Это должно быть сделано таким образом, чтобы гарантировать, что каждый наблюдатель имеет в виду одно и то же (например, «рычит ли собака в обстоятельствах x, как часто она сталкивается с обстоятельствами x и в какой части времени она реагирует рычанием?» «мы имеем в виду следующее...») (Overall et al., 2006). Это улучшение по сравнению с первым подходом, но он работает лучше всего, только если результаты могут быть подтверждены (например, видео, журнал и т. д.) и когда определения поведения ясны и могут быть подвергнуты сомнению, если они неясны. Последнее может сопровождаться просмотром анкеты с клиентами с использованием стандартного набора определений. Метод 3. Люди должны вести журнал Метода 2? Журналы или дневники предоставляют более объективные данные, если люди обучены тому типу данных, которые они должны собирать (например, время начала и окончания поведения, демонстрируемое поведение, погодные условия и т. д.). Метод 4. Наблюдайте за поведением, записывайте и проводите этологический анализ Этот метод лучше, и его можно усовершенствовать, используя галочки с объективными категориями и определениями этих категорий (Martin and Bateson, 1986), но его эффективность ограничена возможностями записи человеком. Метод 5. Запишите поведение на видео и проведите полный этологический анализ Этот метод лучше всего подходит, если важно знать, какие типы поведения используются, в каких сочетаниях, как долго и с какими конкретными проявлениями, а также для тех, кто желает в последующем иметь возможность формулировать гипотезы о поведении. Метод 6. Посмотрите на сопутствующие модели поведения и физиологии. Поведение не возникает в вакууме, и одновременное появление физиологических изменений может позволить более полное понимание моделей поведения и предполагаемых лежащих в их основе механизмов (Overall, 2005). Эта расширенная возможность улучшает методы 2–5. Метод 7. Подвергнуть каждую собаку одному и тому же провокационному тесту. Сравнение реакций или результатов можно провести, подвергая каждую собаку одному и тому же провокационному событию (например, оценка ручности в смысле Брэнсона и Роджерса, 2006; физиологический тест в смысле Оверла и др., 1999a, 1999b). связано ли это с нарушением их сенсорной среды (Crowell-Davis et al., 2003) или с предполагаемым тестом, который спрашивает об использовании или решении проблем (Branson and Rogers, 2006; Batt et al., 2007). Этот метод обеспечивает непредвзятую оценку каждого животного, потому что все они лечатся одинаково, и является улучшенным по сравнению с методами 2–6. Выбранный провокационный тест должен относиться к вопросам, которые задают авторы, и без другой информации выводы о механизме следует делать осторожно. Способ 8. Комбинация вышеперечисленных Это лучший подход к обеспечению того, чтобы поведение оценивалось как можно более беспристрастно и таким образом, чтобы обеспечить сбор данных, которые могут помочь определить «поверхность реакции» (Overall, 2005). Комбинация методов 4–7, вероятно, даст наиболее информативные данные и позволит вам задать вопрос о согласованности данных, полученных с использованием различных методов. Выводы Когда подход заявляет о себе вне принятых методологий науки, он не должен и не может восприниматься учеными всерьез. Проверка гипотез и фальсификация лежат в основе научного подхода. Если ученые хотят, чтобы гомеопатия и другие CAM рассматривались, их эффективность должна быть доказана с использованием методов, которые наука использует для оценки всех методов лечения. Если эти области не соответствуют этим правилам, они не могут считаться научными и не могут использоваться ни в одном наборе передовых научных и медицинских практик. Проще говоря, ответственность за проведение и подтверждение чужих экспериментов лежит не на остальной части научного сообщества, а на сторонниках CAM. Если для проверки приходится ссылаться на другой, неспецифический способ мышления или авторитет, отличный от того, который используется в науке, не следует удивляться, когда в результате таких обращений результаты считаются ненаучными, а утверждения сторонников считаются недействительными при использовании методов, которыми проверяется вся наука. Мы предлагаем переформулировать окончательные выводы Cracknell and Mills (2008) следующим образом: Нет никаких доказательств какого-либо эффекта гомеопатического «лечения»; Не было никакого эффекта от лечения с использованием гомеопатического «лечения»; Собаки, страдающие от страха, связанного с шумом фейерверков, не получат пользы от «лечения» гомеопатическим препаратом; Гомеопатический препарат не поможет боязливым собакам, которых беспокоит шум фейерверков. В ходе написания этой редакционной статьи один из нас (KLO) получил два увещевания по электронной почте (13 августа 2008 г. и 12 сентября 2008 г.) от HomeoPet 1.что их продукт, известный как Storm Stress, показал эффективность на 98%, а рейтинг удовлетворенности клиентов составил 94% в плацебо-контролируемых, двойных слепых исследованиях. Их неопубликованное и, по-видимому, непроверенное плацебо-контролируемое двойное слепое исследование доступно в Интернете, и оно не соответствует действительности. Учитывая, что он цитирует Total et al. (2001), подразумевая поддержку некоторых утверждений, это нехорошо. На самом деле, онлайн-ссылка может быть образцом, на котором можно научить каждому пункту, изложенному в этой статье. (вообще не понятно, к чему ссылка на этот препарат, так как в состав егоявно другой https://www.homeopet.com/product/storm-stress/, чем тот, что использовался в обсуждаемой статье. прим переводчика) Используя статус, подразумеваемый фразой «плацебо-контролируемые, двойные слепые исследования», Homeopet заявляет о непредпринятых усилиях и не обнаруженных эффектах, чтобы получить признание, которого у них нет в глазах общественности, которая не может этого знать. Ветеринарное сообщество просто не должно допустить, чтобы их интеллектуальное и профессиональное доверие было так нагло украдено. Подтверждение Доктор Сорайя В. Хуарбе-Диаз любезно прокомментировала более раннюю версию этой рукописи. Batt, L., Batt, M., McGreevy, P., 2007. Two tests for motor laterality in dogs. Journal of Veterinary Behavior: Clinical Applications and Research 2, 47–51. Bausell, R.B., 2007. Snake Oil Science. The Truth about Complementary and Alternative Medicine. Oxford University Press, New York, 324 pp. Branson, N.J., Rogers, L.J., 2006. Relationship between paw preference strength and noise phobia in Canis familiaris. Journal of Comparative Psychology 120, 176–183. Brown, D.C., 2006. Control of selection bias in parallel-group controlled clinical trials in dogs and cats: 87 trials (2000–2005). Journal of the American Veterinary Medical Association 229, 990–993. Cracknell, N.R., Mills, D.S., 2008. A double-blind placebo-controlled study into the efficacy of a homeopathic remedy for fear of firework noises in the dog (Canis familiaris). The Veterinary Journal 177, 80–88. Crowell-Davis, S.L., Seibert, L.M., Sung, W., Parthasarathy, V., Curtis, T.M., 2003. Use of clomipramine, alprazolam, and behavior modifica- tion for treatment of storm phobia in dogs. Journal of the American Veterinary Medical Association 222, 744–748. Davenas, E., Beauvais, F., Amara, J., Oberbaum, M., Robinzon, B., Miadonnai, A., Tedeschi, A., Pomeranz, B., Fortner, P., Belon, P., Sainte-Laudy, J., Potevin, B., Benveniste, J., 1988. Human basophil degranulation triggered by very dilute antiserum against IgE. Nature 333, 816–818. DeAngelis, C.D., Fontanarosa, P.B., 2008. Impugning the integrity of medical science. The adverse effects of industry influence. Journal of the American Medical Association 299, 1833–1835. Ernst, E., 2002. A systematic review of systematic reviews of homeopathy. British Journal of Clinical Pharmacology 54, 577–582. Hribjartsson, A., Gotzche, P.C., 2001. Is the placebo powerless? – An analysis of clinical trials comparing placebos with no treatment. New England Journal of Medicine 344, 1594–1602. King, J.N., Overall, K.L., Appleby, D., Simpson, B.S., Beata, C., Chaurand, C.J.P., Heath, S.E., Ross, C., Weiss, A.B., Muller, G., Bataille, B.G., Paris, T., Pageat, P., Brovedani, F., Garden, C., Petit, S., 2004. Results of a follow-up investigation to a clinical trial testing the efficacy of clomipramine in the treatment of separation anxiety in dogs. Applied Animal Behaviour Science 89, 233–242. King, J., Simpson, B., Overall, K.L., Appleby, D., Pageat, P., Ross, C., Chaurand, J.P., Heath, S., Beata, C., Weiss, A.B., Muller, G., Paris, T., Bataille, B.G., Parker, J., Petit, S., Wren, J., . Treatment of separation anxiety in dogs with clomipramine. Results from a prospective, randomized, double-blinded, placebo-controlled clinical trial. Applied Animal Behaviour Science 67, 255–275. Linde, K., Scholtz, M., Ramirez, G., Clausius, N., Melchart, D., Jonas, W.B., 1999. Impact of study quality on outcome in placebo controlled trials of homeopathy. Journal of Clinical Epidemiology 52, 631–636. Linde, K., Melchart, D., 1999. Randomized controlled trials of individualized homeopathy: a state-of-the-art review. Journal of Alternative and Complementary Medicine 4, 388. Maddox, J., Randi, J., Stewart, W.W., 1988. ‘High-dilution’ experiments a delusion. Nature 334, 287–290. Martin, P., Bateson, P., 1986. Measuring Behaviour: An Introductory Guide. Cambridge University Press, NY, 200 pp. OED online. Overall, K.L., 2005. Veterinary behavioural medicine: a roadmap for the 21st century. The Veterinary Journal 169, 130–143. Overall, K.L., Agulnick, L., Kapes, M., Dunham, A.E., 1999. Sono- graphic analysis of dog vocalization: a pilot study involving distressed and unaffected dogs (poster/abstract). American Veterinary Society of Animal Behavior (AVSAB) Meeting, New Orleans, LA, July 1999. Overall, K.L., Dunham, A.E., Acland, G., 1999b. Responses of genetically fearful dogs to the lactate test: assessment of the test as a provocative index and application in mechanistic diagnoses (poster/abstract), World Congress on Psychiatric Genetics, Monterey, CA. Molecular Psychiatry 4, S125. Overall, K.L., Dunham, A.E., Frank, D., 2001. Frequency of nonspecific clinical signs in dogs with separation anxiety, thunderstorm phobia, and noise phobia, alone or in combination. Journal of the American Veterinary Medical Association 219, 467–473. Overall, K.L., Hamilton, S.P., Chang, M.L., 2006. In Brief: understanding the genetic basis of canine anxiety: phenotyping dogs for behavioral, neurochemical, and genetic assessment. Journal of Veterinary Beha- vior: Clinical Applications and Research 1, 124–141. Park, R., 2000. Voodoo Science. The Road from Foolishness to Fraud. Oxford University Press, New York, 230 pp. Ross, J.S., Hill, K.P., Egilman, D.S., Krumholz, H.M., 2008. Guest authorship and ghostwriting in publication related to rofecoxib: a case study of industry documents from rofecoxib litigation. Journal of the American Medical Association 299, 1800–1812. Saper, R.B., Phillips, R.S., Sehgal, A., Khouri, N., Davis, R.B., Paquin, J., Thuppil, V., Kales, S.N., 2008. Lead, mercury, and arsenic in US- and Indian-manufactured Ayurvedic medicines sold on the internet. Journal of the American Medical Association 300, 915–923. Serpell, J.A., Hsu, Y., 2001. Development and validation of a novel method for evaluating behavior and temperament in guide dogs. Applied Animal Behaviour Science 72, 347–364. Sheppard, G., Mills, D.S., 2003. Evaluation of dog-appeasing pheromone as a potential treatment for dogs fearful of fireworks. Veterinary Record 152, 432–436. Whitehead, Anne, 2002. Meta-Analysis of Controlled Clinical Trials. John Wiley and Sons Ltd., London, 336 pp. 148 Источник: https://www.sciencedirect.com/science/article/abs/pii/S1090023308003651?via%3Dihub | |
Просмотров: 183 | |