Þekktustu rannsóknir á muninum á virkni þunglyndislyfja og lyfleysu eru rannsóknir Irving Kirsch. Hann hefur rannsakað lyfleysuáhrif alla sína starfsævi og er virtur fræðimaður (sálfræðingur að mennt). Af því ég hef áður bloggað um rannsóknir og umfjöllun Kirsch (sjá færslurnar Máttur lyfleysunnar og Nýju lyfin keisarans) eyði ég ekki löngu máli í að fjalla um þær. Í hnotskurn sýna rannsóknir hans á virkni þunglyndislyfja umfram lyfleysu, að munurinn milli verkunar lyfleysu og þunglyndislyfja mælist ákaflega lítill. Fyrstu niðurstöður voru birtar 1998.
Í rannsóknarniðurstöðum í grein Kirsch o.fl. frá 2002, sem fólst í yfirferð yfir öll gögn sem skilað var inn til Bandaríska matvæla- og lyfjaeftirlitsins (FDA) varðandi tvíblindar rannsóknir á sex algengum þunglyndislyfjum, kemur fram að þeim sjúklingahópi sem tók virkt þunglyndislyf reyndist batna að vegnu meðaltali um 10,13 stig mælt á Hamilton-geðlægðarkvarðanum en þeim hópi sjúklinga sem tók lyfleysu batnaði um 8,24 stig á sama kvarða að vegnu meðaltali. Af þessum (örlitla) mun dró Kirsch þá ályktun að 82% af mældum bata hópsins sem tók virk þunglyndislyf mætti skýra með lyfleysuáhrifum eingöngu. Svörun við lyfleysu er raunar óvenju mikil í þunglyndislyfjarannsóknum miðað við í lyfjarannsóknum almennt segir Kirsch í bók sinni The Emperor’s New Drugs.
Munurinn mældist mestur hópi þeirra sem voru allra mest þunglyndir (skoruðu 27 stig eða hærra á Hamilton geðlægðarkvarðanum þegar rannsókn hófst) en hann fólst ekki í því að þeim batnaði betur af þunglyndislyfjunum heldur í því að lyfleysan ein og sér hafði minni bataáhrif á þennan hóp sjúklinga. Það var einungis í hópi þessara allra veikustu sjúklinga sem munurinn á bata þeirra sem tóku lyfleysu og þeirra sem tóku virkt lyf náði yfir 3 stig á Hamiltonkvarðanum, sem eru lágmarksskilyrðin sem NICE setur fyrir því að bati teljist klínískt marktækur (nánar tiltekið mældist munurinn 4,28 stig á Hamilton-geðlægðarkvarðanum að vegnu meðaltali). [National Institute of Health and Clinical Excellence er opinber stofnun í Brelandi, með faglegt og fjárhagslegt sjálfstæði, en er líklega oft kölluð „Bresk heilbrigðisyfirvöld“ á íslensku. Klínískar leiðbeiningar Landspítala um þunglyndi og kvíða eru sniðnar eftir leiðbeiningum NICE.] Vísbendingar eru um að í sjúklingahópi í raunheimum (clinical practice) sé þessi hópur ekki stór, í fyrirlestri Kirsch í maí 2012 vitnar hann í rannsókn sem sýni að um 11% þunglyndissjúklinga sem leita lækninga mælist svo veikur.
Aðrir hafa endurtekið rannsóknir á borð við rannsóknir Kirsch og niðurstaðan er sú sama, þ.e. munur á virkni þunglyndislyfja og virkni lyfleysu er einungis klínískt marktækur meðal lítils hóps mjög þunglyndra. Í vægu eða meðalþungu þunglyndi mælist lækningarmáttur lyfleysu og þunglyndislyfja nánast sá sami. Má hér nefna:
*Rannsókn Turner o.fl. frá 2008 (sem voru raunar að rannsaka annað, þ.e.a.s. að hve miklu leyti birtar niðurstöður um þunglyndislyfjarannsóknir væru sérvalið jákvætt úrtak úr niðurstöðum allra rannsókna og birtu þannig skekkta mynd af raunveruleikanum);
*Yfirferð Fountoulakis og Müller 2011 yfir rannsókn og niðurstöður Kirsch sem birtust 2008 (þessir eru svarnir andstæðingar Kirsch, fengu út nánast sömu tölur í vegnu meðaltali og Kirsch en hlakka svolítið yfir að finna út að munur milli lyfleysu og virks lyfs rétt slefar yfir 3 stig á Hamilton-geðlægðarkvarðanum þegar niðurstöður rannsókna á venlafaxine [Efexor] og paroxetine [Seroxat] eru skoðaðar sérstaklega);
*Rannsókn Fournier o.fl. 2011 sýndi enn minni mun á lyfleysu og virku lyfi en Kirsch hafði fundið út. Þeir settu strangari skilyrði en Kirsch, tóku t.d. einungis til greina tvíblindar rannsóknir sem grisjuðu ekki úr sjúklinga sem svöruðu lyfleysu í fyrstu eða annarri viku rannsóknar („washout period“ er þetta kallað, þ.e. oft er öllum þátttakendum í svona lyfjarannsóknum gefin lyfleysa í fyrstu vikunni/fyrstu tvær vikurnar og þeir sem sýna strax jákvæða svörun eru reknir úr rannsókninni) og þeir fengu öll frumgögn um einstaka þátttakendur afhent. Að uppfylltum þessum ströngu skilyrðum stóðu eftir 6 rannsóknir með 718 þátttakendum. Fournier og félagar lýsa því yfir að af því „washout“aðferðin var notuð í öllum rannsóknunum sem Kirsch skoðaði sýni niðurstöður hans minna vægi lyfleysu en það raunverulega er. Niðurstaða þeirra er nokkuð afdráttarlaus: „[Mælanlegur bati af þunglyndislyfjum] … er líklega hverfandi eða enginn hjá sjúklingum með vægt eða meðalþungt þunglyndi. Fyrir mjög veika þunglyndisjúklinga er ávinningur af lyfjum umfram lyfleysu talsverður.“
Víða hefur komið fram að lyfjafyrirtæki hafa valið vandlega úr rannsóknum/rannsóknarniðustöður og birta einungis jákvæðar niðurstöður. Þunglyndislyfjarannsóknir þar sem bati af lyfleysu mælist jafnmikill og af lyfinu sem verið er að prófa eru ekki birtar opinberlega. Hinar sérvöldu rannsóknir sem birtar eru hafa svo orðið uppspretta fjölda greina geðlækna og fræðimanna sem byggja á þeim, grunlausir um aðrar rannsóknarniðurstöður í sömu lyfjaprófunum. Raunar hefur líka verið sýnt fram á að ótrúlega margir byggja umfjöllun sína á ótrúlega fáum rannsóknum. Sú mynd sem fæst af gagnsemi þunglyndislyfja með lestri fræðirita er því verulega skekkt. (Benda má á niðurstöður Turner o.fl. 2008 og grein Ioannidis 2008 sem dæmi um þennan málflutning en raunar vekja nánast allir sem skrifa gagnrýnið um þunglyndislyfjarannsóknir og lyfjafyrirtæki athygli á þessu.)
Gagnrýni eða andsvör við rannsóknarniðurstöðum sem sýna að virkni þunglyndislyfja mælist mjög lítið meiri en virkni lyfleysu
Kirsch hefur sætt óvæginni gagnrýni fyrir rannsóknarniðurstöður sínar, sem og sporgöngumenn hans. Í fyrri tveimur færslum mínum um rannsóknir Kirsch, Máttur lyfleysunnar og Nýju lyfin keisarans, gerði ég grein fyrir hluta gagnrýninnar og endurtek ekki hér. Yfirlit yfir helstu atriði sem hafa verið gagnrýnd má sjá í grein Fountoulakis og Müller 2011 en þeir telja upp (og vísa í heimildir):
* Aðstæður og sjúklingahópar í slembdri klínískri prófun (randomized clinical trial) endurspegla ekki aðstæður í raunheimi;
* Í raunverulegum aðstæðum tíðkast að efla virkni þunglyndislyfja með annarri meðferð samhliða (t.d. öðrum lyfjum);
* Ýmislegt má að Hamilton-kvarðanum finna og þáttakendur í slembdum klínískum prófunum taka oft önnur lyf sem hafa mikil áhrif á sum atriði kvarðans, t.d. bensódrínlyf;
* Það er rangt að túlka lækningarmátt þunglyndislyfja eingöngu með því að skoða muninn á bata af lyfjatöku og bata af lyfleysu.
Hvað varðar síðasttöldu rökin er rökstuðningur þeirra Fountoulakis og Müller eitthvað á þessa leið:
Af því lyfleysuáhrif mælast minni hjá veikustu þunglyndissjúklingunum en áhrif þunglyndislyfja mælast jafnmikil [öllu heldur jafnlítil] hjá öllum hópum má draga þá ályktun að vænting um svörun (response expectancy) stýri lyfleysuáhrifum en ekki áhrifum þunglyndislyfja. Áhrif/verkun lyfjanna séu því sannanleg og ekki háð því hve illa haldnir þáttakendur í tilraununum eru því áhrif lyfleysunnar stafa af öðrum orsökum. Þeir bæta því svo við að gildi slembdra klínískra prófana kunni að vera vafasamt út af þessu.
Þeir sem leggja áherslu á að rannsóknarumhverfi í klínískum þunglyndislyfjarannsóknum endurspegli ekki raunveruleikann hafa til skamms tíma hampað mjög niðurstöðum úr STAR*D rannsókninni til sönnunar þess að langtímameðferð með þunglyndislyfjum, einkum með annarri lyfjagjöf, sýni góðan árangur. Þetta var risastór amerísk langtímarannsókn á raunverulegum þunglyndissjúklingum í raunumhverfi. Ef eitt þunglyndislyf virkaði ekki var bætt við fleiri meðferðarkostum, aðallega lyfjum en einnig gafst kostur á sálfræðimeðferð (aðallega hugrænni atferlismeðferð). Rannsóknin var þrepaskipt, þ.e. skoðuð voru fjögur þrep mismunandi meðferða. Lyfleysa var hvergi notuð til samanburðar. Pigott o.fl. birtu grein árið 2010 þar sem sýnt er fram á að birtum rannsóknarniðurstöðum úr STAR*D var talsvert hagrætt: Því hafði t.d. verið flaggað mjög að 67% sjúklinga hafi batnað væri árangur á öllum meðferðarþrepum lagður saman (37% batnaði af fyrsta lyfi, 19% á næsta meðferðarþrepi, 6% á því þriðja og 5% á fjórða þrepi). Þess var hins vegar ekki getið að 93% þeirra sem náðu bata af einhverri þessara fjögurra þrepaskiptu meðferð veiktust aftur innan árs eða hættu í rannsókninni.
Í svari við grein Ioannidis sem birtist í 2011, eftir Davis o.fl. er tekið undir að slembdar klínískar prófanir endurspegli ekki raunveruleikann, þekking læknis á sjúklingi og sjúkrasögu hans vegi svo þungt að hann geti valið þunglyndislyf sem gagnist þótt tilraunirnar hafi ekki sýnt fram á mælanlegan árangur af þeim; að tilraunirnar nú til dags séu gerðar á fólki sem svari auglýsingum og þiggi laun fyrir, það fólk kunni að hirða bara launin sín og sleppa því að taka lyfin sem skekki niðurstöðurnar; aðrar viðurkenndar læknisaðferðir s.s. skurðlækningar eru ekki studdar tvíblindum rannsóknum og mætti allt eins beina spjótum sínum að þeim; að það hafi þrátt fyrir allt verið sýnt fram á mælanlegan mun á bata ákveðins sjúklingahóps af þunglyndislyfjum samanborið við lyfleysu sem sýni að þunglyndislyf virki.
Hvað varðar meintan óheiðarleika sumra sem taka þátt í þunglyndislyfjarannsóknum tekur Peter D. Kramer í sama streng í grein sem birtist í New York Times sumarið 2011. Hann bætir ennfremur við að einhverjum þátttakendum í svona rannsókn gæti hreinlega hafa batnað af sjálfu sér sem hafi ekkert með lyfleysuáhrif að gera en skekki niðurstöður. (Kramer náði heimsfrægð með bókinni Listening to Prozac sem kom út 1993. Hann er prófessor í geðlæknisfræðum við Háskólann í Brown.)
Í yfirlýsingu Evrópsku geðlæknasamtakanna um gagnsemi þunglyndislyfja sem birt var í ár, 2012, er talsverðu púðri eytt á gagnrýni á rannsóknir Kirsch og sporgöngumanna. (Þetta plagg er raunar svo merkilegt að ég splæsi sérstakri færslu um það síðar.) Þar segir m.a. að:
* Þótt munur á lækningarmætti þunglyndislyfja og lyfleysu nái ekki að vera klínískt marktækur sé hann tölfræðilega marktækur því Kirsch hafi byggt á svo fjölmennu gagnasafni. [Kirsch útskýrir ákaflega vel hver munurinn á þessum tveimur hugtökum er í fyrirlestri sem krækt er í úr heimildalista neðst í færslunni];
* NICE skilyrðin um að klínískt marktækur munur þurfi að vera að lágmarki 3 batastig á Hamilton-geðlægðarkvarðanum eru valin af handahófi en ekki studd vísindalegum gögnum. Úr því Bandaríska matvæla- og lyfjaeftirlitsstofnunin og Evrópska lyfjaeftirlitsstofnunin hefur veitt leyfi fyrir þeim lyfjum sem ekki ná þessum lágmarksskilyrðum ætti að lækka lágmarksskilyrðin. [Í þessu sambandi má geta að Kirsch og margir fleiri hafa bent á að leyfi þessara stofnana hafa verið veitt á grundvelli sérstaks úrvals jákvæðra niðurstaðna úr fjölda rannsókna, þ.e. að þær rannsóknir sem sýndu lítinn eða engan mun á áhrifum lyfleysu og þunglyndislyfja voru ekki taldar fram – engin takmörk eru á hve margar rannsóknir lyfjafyrirtæki megi láta framkvæma og einungis þarf að sýna fram á klínískt marktækan mun í tveimur rannsóknum];
* Af ofansögðu megi draga þá ályktun að að bati sem mælist um 2 stig á Hamilton-geðlægðarkvarðanum sé raunverulega klínískt marktækur;
* Þótt vegið meðaltal sýni lítinn lækningamátt þunglyndislyfja segi slíkt ekkert um lækningarmátt fyrir vissa sjúklingahópa eða einstaklinga;
* Í raunverulegum aðstæðum er venjulega beitt samsettri meðferð við þunglyndi (í yfirlýsingunni er annars staðar eindregið mælt með samsettri lyfjagjöf fremur en annarri meðferð) og rannsóknir sem mæla virkni eins lyfs á þunglyndissjúklinga gefi því skekkta mynd af lækningarmætti þess (í yfirlýsingunni kemur annars staðar fram að einungis um 30% þunglyndra sjúklinga í raunverulegum aðstæðum hljóti einhvern bata af einu þunglyndislyfi);
* Rannsóknirnar sem Kirsch greindi voru allar skammtímarannsóknir, stóðu í hæsta lagi í 8 vikur. Aðrar rannsóknir á langtímalyfjagjöf sýna meiri mun á bata af lyfleysu og þunglyndislyfjum. Vísað er í niðurstöður einnar safnrannsóknar, framkvæmd af Geddes o.fl., sem birtust árið 2003 þessu til stuðnings. Í henni voru skoðaðar rannsóknir á fólki sem hafði sýnt svörun við þunglyndislyfjagjöf í stuttri rannsókn og skoðað hversu mikill munur væri á því hvort þeir sem héldu áfram að taka lyfin í lengri tíma og þeir sem voru látnir hætta á lyfinu og settir á lyfleysu í staðinn veiktust aftur. Að meðaltali veiktust 41% þeirra sem teknir voru af þunglyndislyfinu og gefin lyfleysa í staðinn, 18% þeirra sem héldu áfram að taka þunglyndislyf í lengri tíma veiktust.;
* Það er hvort sem er siðferðilega rangt að gefa sjúklingi lyfleysu án þess að hann viti það og gagnslaust að ávísa sjúklingi lyfleysu sem hann veit að er lyfleysa. [Kirsch hefur reyndar gert slíka tilraun sem skilaði mælanlegum bata, sjá fyrirlestur hans í heimildaskrá.] Þ.a.l. sé ekki annar kostur en treysta á lyf en ekki lyfleysu í raunverulegum aðstæðum.
Niðurstaðan er sú að það er óumdeilt að í þunglyndislyfjatilraunum mælist sáralítill munur á lækningarmætti lyfleysu og lyfja. Helst mælist munur hjá fárveikum þunglyndissjúklingum vegna þess að lyfleysa virkar síður á þann sjúklingahóp. Menn greinir hins vegar á um hvernig beri að túlka þessar niðurstöður og af hverju þær kunni að stafa.
Næsta færsla fjallar um aukaverkanir og möguleg skaðleg áhrif sem þunglyndislyf geta haft. Svo helga ég yfirlýsingu Evrópsku geðlæknasamtanna um þunglyndislyf eina færslu.
Efri myndin í þessari færslu er af forsíðu Newsweek 8. febrúar 2010. Neðri myndin er af forsíðu sama tímarits 26. mars 1990.
Heimildir
Davis o.fl. 2011. Should We Treat Depression with drugs or psychological interventions? A Reply to Ioannidis. Philosophy, Ethics, and Humanities in Medicine 2011, 6:8.
Fountoulakis og Möller. 2011. Efficacy of antidepressants: a re-analysis and re-interpretation of the Kirsch data. The International Journal of Neuropsychopharmacology 14:3 s. 405-12.
Mjög svipaða grein eftir þá tvo má finna undir heitinu Antidepressant drugs and the response in the placebo group: the real problem lies in our understanding of the issue í Journal of Psychopharmacology 2012 26:744.
Fournier o.fl.2010. Antidepressant Drug Effects and Depression Severity. A Patient-Level Meta-analysis. The Journal of American Medical Association (JAMA) 2010;303(1).
Geddes o.fl. Relapse prevention with antidepressant drug treatment in depressive disorders: a systematic review. The Lancet 22. febrúar 2003.
Ioannidis. 2008. Effectiveness of antidepressants: an evidence myth constructed from a thousand randomized trials? Philosophy, Ethics, and Humanities in Medicine 2008, 3:14.
Kirsch. 2012. Placebo Therapy as an Ethical Alternative, fyrirlestur með glærum fluttur á þingi The Consortium of Academic Health Centers for Integrative Medicine þann 16. maí 2012.
Kirsch. 2011. Antidepressants and the Placebo Response í De-Medicalizing Misery. Psychiatry, Psychology and the Human Condition, s. 187-196. Palgrave Macmillan.
Kirsch. 2010. The Emeror’s New Drugs. Basic Books New York. [Kom fyrst út 2009.]
Kirsch o.fl. 2008. Initial Severity and Antidepressant Benefits: A Meta-Analysis of Data Submitted to the Food and Drug Administration. Febrúarhefti PLOS Medicine 2008.
Kirsch o.fl. 2002. The Emperor’s New Drugs: An Analysis of Antidepressant Medication Data Submitted to the US Food and Drug Administration. Prevention & Treatment, 5. árg. 2002 s. 1522-1534.
Kramer, Peter D. 2011. In Defense of Antidepressants. New York Times 9. júlí 2011.
Möller o.fl. 2012. Position statement of the European Psychiatric Association (EPA) on the value of antidepressants in the treatment of unipolar depression. European Psychiatry 27:2 s, 114–128
Pigott o.fl. 2010. Efficacy and Effectiveness of Antidepressants: Current Status of Research. Psychotherapy and Psychosomatics 2010;79 s. 267–279.
Turner o.fl. 2008. Selective Publication of Antidepressant Trials and Its Influence on Apparent Efficacy. The New England Journal of Medicine 2008; 358:252-260.
Fylgiskjal greinarinnar með tölfræðilegum upplýsingum er hér.