1.
Wissenschaftliche Studien â oder:
Eine kurze Interpretationshilfe im Dschungel der Daten
ES GIBT VERSCHIEDENE ARTEN von Studien, die man unterscheiden lernen muss, denn dies ist die Grundlage fĂŒr eine informierte Entscheidung. Die Fehlinterpretation eines bestimmten Studientyps, nĂ€mlich der Beobachtungsstudie, ist die Hauptursache der Verwirrung und der Fehlaussagen zum Thema Lebensstil.
Die meisten Studien sind Beobachtungsstudien, dazu zĂ€hlen auch die Querschnittstudien. Sie verfolgen die untersuchten Menschen nicht ĂŒber einen bestimmten Zeitraum, sondern erheben die Daten nur zum Zeitpunkt der Beobachtung und treffen dann Aussagen wie: âDiejenigen, die sich wohlfĂŒhlen, treiben mehr Sport als diejenigen, die mit ihrem Leben unzufrieden sind.â Querschnittstudien messen und schauen, welche mathematischen BezĂŒge sich zwischen bestimmten Lebensstil-Formen und MessgröĂen wie Sport und Zufriedenheit errechnen lassen. Aber sie können nie klĂ€renâ egal wie mathematisch prĂ€zise sie rechnen â, ob diejenigen, die glĂŒcklich sind, nur wegen des Sports glĂŒcklich sind, oder ob es eine nicht eingerechnete EinflussgröĂe gibt, die diesen Effekt erklĂ€rt. Diese Form von Studien liefert daher gute Hypothesen fĂŒr zukĂŒnftige prospektive Beobachtungsstudien. Das ist wichtig, aber leider ĂŒberbewertet, weil es keine Richtschnur fĂŒr therapeutisches Handeln, sondern nur AnstoĂ zur weiteren Forschung mittels einer Interventionsstudie sein kann.
Die nĂ€chste Form von Studien, die hier besprochen werden soll, ist die prospektive, also in die Zukunft angelegte, den Patienten ĂŒber eine bestimmte Zeit beobachtende Studie. Sie kann beispielsweise untersuchen, ob sich Menschen mit unterschiedlichem Körpergewicht in den nĂ€chsten 20 Jahren auch im Auftreten von TodesfĂ€llen unterscheiden. Aufgrund ihrer lĂ€ngeren Dauer ist sie meist schon etwas belastbarer als eine Querschnittstudie und liefert gute Hypothesen. Aber da solche Hypothesen bildenden prospektiven Beobachtungsstudien nur einen mathematischen Bezug ĂŒber die Zeit aufzeigen, also eine Korrelation, aber keine Ursache-Wirkungs-Beziehung, berechtigen sie allein nicht zum therapeutischen Eingreifen. Sie berechtigen nur zur Planung einer Interventionsstudie.
Darauf basierend können dann die fĂŒr die Therapie relevanten Interventionsstudien geplant werden. Da eine Interventionsstudie â beispielsweise mediterrane Kost bei Hochrisikopatienten â ein Eingriff am Menschen ist, darf sie nur durchgefĂŒhrt werden, wenn zuvor eine Hypothesen generierende Beobachtungsstudie es denkbar gemacht hat, dass die Intervention den therapierten Menschen etwas nutzen könnte. Den therapeutischen Eingriff untersucht die prospektive, doppelblinde, randomisierte und Placebo-kontrollierte Interventionsstudie. Etwas viele Fremdwörter? Hier die ErklĂ€rung:
âProspektivâ bedeutet: Ein Patient wird in die Studie aufgenommen und ĂŒber den gesamten Studienzeitraum wiederholt untersucht. Eine solche Studie dauert etliche Jahre und ergibt ganz andere DatenqualitĂ€ten als Querschnittstudien, die Patienten nur zu einem bestimmten Zeitpunkt analysieren und dann zu errechnen versuchen, welche Parameter mit der Erkrankung korrelieren.
âRandomisiertâ bedeutet: Es gibt eine zufĂ€llig gebildete Kontrollgruppe und eine genauso zufĂ€llige, zum Ausgangszeitpunkt der Kontrollgruppe exakt vergleichbare Interventionsgruppe.
âDoppelblindâ bedeutet: Weder der Arzt noch der Patient weiĂ, in welchen Arm der Studie der Proband eingeteilt ist â in die Gruppe derer, die die echte Therapie erhalten, oder in die Kontrollgruppe derer, die nur Placebo oder konventionelle Therapie erhalten.
âPlacebo-kontrolliertâ bedeutet, dass weder Arzt noch Patient erkennen können, ob der Patient z. B. ein richtiges Vitamin erhĂ€lt, also den zu untersuchenden Wirkstoff, oder das Placebo, also eine Tablette, die genauso aussieht, aber nicht die zu untersuchende Wirksubstanz enthĂ€lt.
Die Intervention versucht also genau das zu imitieren, was zwischen Arzt und Patient passiert: Der Arzt stellt eine Diagnose und bietet dem Patienten eine Therapie an, er interveniert. Jede Therapie, jeder âgute Ratâ, ist eine Intervention. Daher kann die Wirksamkeit einer Therapie nur in Interventionsstudien untersucht werden, nur Interventionsstudien erlauben eine Aussage, ob eine DiĂ€t vorteilhaft ist oder nicht. Nach der vorher festgelegten Dauer der Intervention wird dann untersucht, welche Unterschiede es zwischen den beiden Gruppen gibt â der Kontrollgruppe einerseits und der Gruppe, in der die neue Therapie erprobt wird, andererseits.
Die nĂ€chsten Seiten sollen zumindest einen groben Eindruck geben, was diese Studientypen bedeuten, wie ihre Aussagen interpretiert gehören und inwieweit sie berechtigen, einer bestimmten Person, die um Rat fragt, eine Empfehlung zu geben. Vorweg: Da so viele Parameter das Leben eines Menschen bestimmen, gibt es nie eine perfekte Studie, die genau das abbildet, was bei einem bestimmten Menschen das Problem ist. Aber so viel sei schon gesagt: Da jede Therapie â und sei es der Rat, einen bestimmten Lebensstil zu wĂ€hlen â eine Intervention, ein therapeutischer Eingriff ist, ist vor jeder Therapie zu fragen, ob eine Interventionsstudie vorliegt. Also: Vorsicht bei Therapeuten, die behaupten, eine solche Studie könne man bei der von ihnen vorgeschlagenen Therapieform nicht machen!
Diese Interpretationshilfe ist notwendig, denn ein Ziel des Buches ist es ja, Ihnen zu vermitteln, wo Grenzen naturwissenschaftlich-medizinischer Forschung existieren. Und Wissenschaft zu Selbstbegrenzung und ZurĂŒckhaltung aufzufordern. Denn nicht alles, was wissenschaftlich korrekt ist, muss als neue Erkenntnis gleich wie ein Regen ĂŒber alle Menschen ausgegossen werden â so verlockend es in der medialen Gesellschaft auch sein mag, aus kleinen Studienergebnissen sofort groĂe Schlagzeilen zu machen. So verlockend es sein mag, Hinweise zu haben, was möglicherweise helfen könnte, so unseriös ist es, diese Hinweise als sichere Therapie zu verkaufen. Das gilt insbesondere fĂŒr Beobachtungsstudien, aber auch fĂŒr doppelblind angelegte, prospektiv randomisierte, Placebo-kontrollierte Interventionsstudien, denn auch sie mĂŒssen interpretiert und richtig gelesen werden.
Beispiel: Wenn eine Ănderung des Gesundheitsverhaltens beim Einzelnen nur 30 Tage eines sonst 80-jĂ€hrigen Lebens ausmacht, ist diese LebensverlĂ€ngerung fĂŒr den Einzelnen nur marginal. Sie kann fĂŒr ihn irrelevant sein, auch wenn sie statistisch nachweisbar ist. Zudem gibt es zwei Möglichkeiten:
Die eine Möglichkeit wĂ€re, dass eine solche Intervention das Leben bei jedem Menschen um 30 Tage verlĂ€ngert, dann wĂ€re die sogenannte ânumber needed to treatâ â also die Zahl derjenigen, die ihr Leben Ă€ndern mĂŒssten, um 30 Tage lĂ€nger zu leben â eins. Das ist der Idealfall, denn jeder profitiert und weiĂ, was es ihm bringt. Dann weiĂ jeder, dass er mit Sicherheit 30 Tage lĂ€nger lebt, wenn er den Ratschlag befolgt. Dann kann der Patient, dem diese Therapie empfohlen wird, nach AufklĂ€rung fĂŒr sich selber bestimmen, ob er sie durchfĂŒhren möchte oder nicht. Also: ob der Aufwand es ihm wert ist oder ob er die 30 zusĂ€tzlichen Lebenstage nicht in Anspruch nehmen möchte, weil die Ănderung seines Lebensstils ihm die anderen 80 Jahre vermiest.
Der Patient kann selbst entscheiden und sagen: âDie vorgeschlagene Intervention, beispielsweise jeden Tag einen Löffel Linsen zu essen, wird bei mir das Leben um 30 Tage verlĂ€ngern. Da das Essen eines Löffels Linsen mir sogar schmeckt, werde ich das machen.â
Oder er denkt sich: âDa mir Linsen gar nicht schmecken und ich danach unter schrecklichem Durchfall leide, werde ich die Linsen nicht tĂ€glich essen. Dieser Eingriff in mein Leben mit dem daraus folgenden Durchfall ist mir diese minimale VerlĂ€ngerung meines Lebens, um nur 30 Tage, angesichts der erwarteten 80 Jahre nicht wert.â
Also: Eine Empfehlung kann richtig sein â fĂŒr den einen jedoch mit ganz anderer Auswirkung auf sein Leben, da ihm Linsen schmecken, als fĂŒr den anderen, dem Linsen nicht schmecken und bei dem sie Durchfall erzeugen. Trotz gleicher Auswirkung auf die Lebensdauer werden die beiden Patienten unterschiedlich entscheiden.
An dieser Stelle muss ich Ihnen gleich den Zahn der Hoffnung ziehen, denn solch eine niedrige ânumber needed to treatâ wie 1, eine solche Effizienz einer Therapie, gibt es beim Thema Lebensstil nicht. Beim Thema Lebensstil betrĂ€gt die Anzahl der Menschen, die behandelt werden mĂŒssen, meist mehrere Hundert, wenn nicht gar viele Tausend, und der Zeitraum geht ĂŒber mehrere Jahre, wenn nicht gar Jahrzehnte.
Um bei dem oben gewĂ€hlten Beispiel zu bleiben: Bei der Fantasiestudie, in der Linsen essen das Leben um 30 Tage verlĂ€ngert, kann durchaus etwas ganz anderes herauskommen, sobald die ânumber needed to treatâ gröĂer als 1 ist:
Es stimmt zwar, dass das Leben im Durchschnitt durch Linsen verlĂ€ngert wird. Aber bei einigen wird es um 20 Jahre verlĂ€ngert, bei anderen hingegen verkĂŒrzt! Also profitiert nicht jeder davon, sondern einige haben einen groĂen Nutzen, andere nur einen kleinen, und eine dritte Gruppe kann sogar Schaden nehmen. Dann sollte man zwei KenngröĂen errechnen: nicht nur die ânumber needed to treatâ, sondern auch die ânumber needed to harmâ. Dann ist die AufklĂ€rung des um Rat fragenden Menschen noch komplizierter, denn ich kann ihm ja nur einen Mittelwert bieten, keinesfalls jedoch die Sicherheit, dass er derjenige ist, dem es nutzt oder schadet, oder ob er derjenige ist â falls es ihm nutzt â, der nur zehn Tage oder ganze 20 Jahre lĂ€nger lebt. Und wie seine ganz individuelle LebensqualitĂ€t sein wird, wenn er denn so alt wird, weiĂ der Arzt nie! An diesem Beispiel wird deutlich, wie wichtig der Arzt-Patienten-Kontakt und die von jeder Gesundheitsideologie befreite gemeinsame Wegfindung sind. Deutlich wird auch, dass eine solche Studie nie die letzte sein kann â die Studie, die die endgĂŒltige Antwort findet. Denn da einige Patienten profitieren, andere nicht, muss in einer Folgestudie untersucht werden, wie man diejenigen erkennt, denen die Linsen durch VerlĂ€ngerung des Lebens um mehr als zehn Jahre sehr viel nutzen, und von denen unterscheidet, denen sie sogar schaden könnten.
Nicht nur im obigen Beispiel, sondern bei allen Formen des âgesunden Lebensstilsâ trifft eine ganz andere Zahl als die ânumber needed to treatâ von 1 zu: Die gemessenen Effekte sind beim Einzelnen nicht nachweisbar, man braucht nicht zehn, nicht 100, sondern zumeist Tausende Menschen, um einen kleinen Effekt zu messen, der dann mit der Gesamtzahl der Bevölkerung hochgerechnet die berĂŒhmten Zahlen der groĂartigen Verbesserung der Gesundheit ergibt â wenn man den angeblich richtigen RatschlĂ€gen nur folgen wĂŒrde. Dies dem Leser konkret aufzuzeigen, an den Beispielen Sport, Gewicht, Diabetes und DiabetesprĂ€vention sowie mediterrane DiĂ€t â das ist Aufgabe und Ziel des vorliegenden Buches.
Doch Achtung: Diese Effekte sind aus Beobachtungsstudien errechnet, nicht aus Interventionsstudien! Wir kennen sie alle, die Millionen Menschenleben, die gerettet werden könnten, wenn man mehr Sport triebe, mehr GemĂŒse zu sich nĂ€hme, weniger wöge. Aber stimmt das und ist es so einfach, wie die Gesundheitsprediger immer sagen? Ein Gesunder, dem etwas geraten wird, hat doch nur ganz einfache Fragen:
âWisst ihr wirklich, dass das stimmt, was ihr ratet, und wie hoch ist die Wahrscheinlichkeit, dass es mir etwas nutzt, wenn ich einen Teil meines ganz persönlichen Lebensstils danach ausrichte?
Habt ihr nur geschaut, was miteinander korreliert, und dann angenommen, ihr wĂŒsstet genau, welche Variablen â die nicht immer alle bekannt sind â dann herausgerechnet wurden, oder habt ihr eine Interventionsstudie durchgefĂŒhrt, in der Personen meines Alters, meines Lebensstils, meines genetischen Risikos eingeschlossen wurden? Wobei die eine Gruppe ein Placebo erhielt und die andere Gruppe die empfohlene Korrektur des Lebensstils?
Und habt ihr dann nur einen sogenannten Surrogatparameter gemessen, also einen Wert, der keine Krankheit anzeigt, sondern nur deren Risiko, oder habt ihr echte Endpunkte wie Krebs, Schlaganfall etc. gemessen?
Habt ihr diese Empfehlung in einer prospektiv angelegten randomisierten Interventionsstudie untersucht?â Da die Antwort fast immer âneinâ lautet, veranlasste mich das, dieses Buch zu schreiben.
Am Anfang möchte ich Ihnen daher anhand ganz konkreter wissenschaftlicher Studien fĂŒr das, was tatsĂ€chlich hinter den Aussagen steckt, nicht nur ein GefĂŒhl geben. Sie sollten auch möglichst in die Lage versetzt werden, die originalen Studiendaten selber zu interpretieren. Es geht um die Aussagen, mit denen uns eingeredet wird, man wisse, was fĂŒr jeden der richtige Lebensstil sei. Ihnen soll anhand konkreter Abbildungen ein GefĂŒhl fĂŒr das VerhĂ€ltnis einer meistens leider nur geringen EffektstĂ€rke zum nur individuell abzuwĂ€genden Eingriff in die eigene LebensfĂŒhrung gegeben werden. Es geht also in dem Buch auch darum, bei Ihnen, dem Leser, Interesse zu wecken, sich mit Freude auch einmal selber zu informieren im Dschungel der RatschlĂ€ge, die alle gut gemeint, aber vielleicht nicht zielfĂŒhrend und oft einfach nur falsch sind. Die gezeigten Daten sind unverĂ€ndert aus den Originalpublikationen entnommen, die die Wissenschaftler selber lesen und mit deren Hilfe sie einander die Forschungsergebnisse auf Kongressen vorstellen. Nur manchmal wurden die Abbildungen etwas grafisch verbessert, der VerstĂ€ndlichkeit halber. Es wird daher im Buch strikt getrennt zwischen sachlicher Darstellung der Daten und der darauf folgenden ganz persönlichen Interpretation des Autors.
Also geht es in dem Buch darum, Ihnen dabei zu helfen, Studien und verschiedene Arten von Studien richtig einzuordnen, zu verstehen, fĂŒr sich selber so zu lesen, dass Sie sagen können: âBasierend auf diesen Studienergebnissen bin ich der Auffassung, dass ein bestimmter Lebensstil fĂŒr mich richtig ist. Ich bin beispielsweise bereit, pro Woche fĂŒnf Stunden Sport zu treiben.â Deutlich wird herausgestellt, dass die meisten Erkenntnisse ĂŒber das Thema Essen und Lebensstil bei Gesunden nur auf Beobachtungsstudien beruhen. Diese sind durchaus interessant und wir Ărzte brauchen sie, denn ohne sie könnten wir keine Hypothesen darĂŒber bilden, welcher Eingriff bei welchem Menschen sinnvoll ist. Und nur mit solchen Hypothesen sind Interventionsstudien ethisch begrĂŒndbar. Die Beobachtungsstudie liefert eine Hypothese, zum Beispiel âFĂŒnfmal pro Woche einen Apfel essen reduziert das Krebsrisikoâ. Das kann aber sehr wohl falsch sein, wenn eine wesentliche Variable bei der Berechnung mathematischer ZusammenhĂ€nge eines klinischen Ereignisses â der Krebsdiagnose â mit einer Lebensstilform â also Ăpfel essen â vergessen wurde. Das wĂ€re der Fall, wenn man vergĂ€Ăe zu berĂŒcksichtigen, dass beispielsweise Apfelesser weniger rauchen. Dann wĂ€re nicht das Apfelessen per se, nicht die bekannten Inhaltsstoffe des Apfels fĂŒr die geringere Krebsrate verantwortlich, sondern ausschlieĂlich ein zufĂ€lliges Zusammentreffen des Nichtrauchens, als dem wichtigsten Faktor, mit dem Apfelessen, einem dann eben nicht so wichtigen Faktor.
Ein anderes Beispiel: Wenn die Herzinfarkt-HĂ€ufigkeit bei Vegetariern mit der von Fleischessern verglichen wird, aber nicht andere Unterschiede wie Gewicht, Sport, Bildung oder Rauchen berĂŒcksichtigt werden, ergibt sich zwangslĂ€ufig ein falsches Ergebnis. Es entsteht eine Legende, beispielsweise dass Vegetarier vor Herzinfarkt geschĂŒtzt seien. Was möchte dieses Beispiel dem Leser aufzeigen? Ganz einfach: Ohne eine exakt vergleichbare Kontrollgruppe ist jede Aussage wertlos!
An einem humorvollen Beispiel soll dies nun besprochen werden: Da Schokolade nicht nur gut schmeckt, sondern auch einerseits kalorienreich ist und andererseits wirksame pflanzliche Bestandteile enthĂ€lt, die angeblich positive und gesundheitsfördernde Effekte auf GefĂ€Ăe besitzen, soll der Unterschied zwischen Beobachtung mit mathematischer Korrelation und einer therapeutischen Interventionsstudie am Beispiel der Schokolade aufgezeigt werden.
Man liest ja immer wieder tolle Dinge ĂŒber die Schokolade, nicht nur wie schnell man sich mit kalorienreichen SĂŒĂigkeiten dick essen kann, sondern auch wie viele die Gesundheit fördernde Bestandteile Schokolade enthĂ€lt. Schokolade â der Inbegriff des menschlichen Traums vom Schlaraffenland. Man kann sie vielfĂ€ltig genieĂen, als heiĂes GetrĂ€nk, als kaltes Eis, in Pralinen oder zum Rotwein. Sie scheint alles auf den Kopf zu stellen, was uns die Freude am Essen nimmt, denn sie ist einfach gesund und gut. Meist ist es ja so, dass richtig gute Speisen als ungesund gelten. Doch nicht das Hinterfragen dieser wunderbaren Wirksamkeit soll jetzt das Thema sein, sondern eine â zugegeben als Glosse â publizierte Wirkung. Der Autor der Abbildung 1 auf Seite 26, die dem New England Journal of Medicine entnommen wurde, einer der besten medizinischen Zeitschriften der Welt, zeigt eine ungeheuer starke mathematisch als signifikant errechnete Beziehung zwischen der Anzahl der Nobelpreise und dem jĂ€hrlichen Schokoladenkonsum der BĂŒrger eines Landes.
Deutlich ist in Abbildung 1 erkennbar: Die Korrelation der Anzahl Nobelpreise zum steigenden Schokoladenkonsum ist sehr stark. Sie ist mathematisch gesehen viel stĂ€rker als der Bezug von Ăbergewicht zu Herzinfarkt und frĂŒhem Tod. Ist die Aussage deswegen korrekter, nur weil die statistische Korrelation stĂ€rker ist? Sie werden sich nun denken: âNa ja â nur eine Glosse, es ist doch klar, dass das nicht stimmen kann. Da muss es eine nicht beachtete Variable geben, die alles erklĂ€rt und mal wieder beweist, dass eine Statistik nur so weit richtig ist, wie man sie selber gefĂ€lscht hat.â Korrekter gesagt: Eine Statistik ist nur so viel wert wie meine FĂ€higkeit, sie zu âlesenâ, sie zu interpretieren.
Die Basis von Abbildung 1 sind exakt erhobene Daten, auch wenn sie eine Glosse ist. Hintergrund sind Untersuchungen, wonach sogenannte Flavonoide, die in Schokolade, grĂŒnem Tee, Rotwein und manchen FrĂŒchten vorkommen, in Tierversuchen die Denkfunktion verbessert haben. Es gibt Daten, dass sie die GefĂ€Ăfunktion verbessern und den Blutdruck senken können, sodass der Autor der Studie auf die Idee kam zu fragen, ob es einen Zusammenhang zwischen der Anzahl der Nobelpreise pro zehn Millionen Einwohner eines Landes und dem Schokoladenkonsum geben könnte.
Abbildung 1: Schokoladenkonsum und NobelpreistrÀger nach LÀndern.
Modifiziert nach Messerli FH, The New England Journal of Medicine 367:1562-1564, 2012.
Die einzelnen Nationen sind mit den LÀnderkennzeichen dargestellt, der Schokoladenkonsum in kg/Einwohner zeigt aus dem Internet recherchierte Daten. Es ergibt sich eine höchst signifikante lineare Korrelation zwischen dem Schokoladenkonsum pro Kopf und der Anzahl der NobelpreistrÀger pro zehn Millionen Einwohner in insgesa...