Wissen was wirkt

Subscribe to Wissen was wirkt feed Wissen was wirkt
Cochrane bloggt auf deutsch
Updated: 8 hours 11 min ago

3.1 Sind die gemessenen Endpunkte für Sie bedeutsam?

Thu, 07/30/2020 - 10:17

Wie wir mittlerweile wissen, sollten wir beim Lesen einer klinischen Studie eine Reihe von Aspekten beachten. Zu diesen gehört auch die genaue Betrachtung der in der Studie verwendeten Endpunkte. Genau davon handelt dieser Beitrag.

Dies ist der 31. Beitrag aus einer Blogserie zu „Schlüsselkonzepten zur besseren Bewertung von Aussagen zu Behandlungen“, die im Rahmen des Projektes Informed Health Choices erarbeitet wurden. Jeder der insgesamt 36 Blogbeiträge befasst sich mit einem Schlüsselkonzept, das dabei hilft, Aussagen zu Wirkungen von Behandlungen besser verstehen und einordnen zu können.

Wir wissen, dass wir beim Lesen einer klinischen Studie den Einleitungs- und den Hintergrundteil genau betrachten und die Hauptziele sowie die angewandte Methodik im Blick haben sollen. Wenn wir ganz „unternehmenslustig“ sind, können wir sogar so weit gehen, die statistischen Methoden, die die Autoren angewandt haben, laut auszusprechen. Was wir damit erreichen ist jedoch oft nicht das, was wir eigentlich wollen: Es ist nur ein Aufschieben unseres instinktiven Verlangens, die Antwort, die wir suchen, direkt zu finden. Natürlich verlangt die gute Praxis einen Blick auf die Studiendetails, aber tief im Inneren wollen wir wirklich nur die Antwort auf unsere Fragen, wie zum Beispiel diese:

Willkommen in der spannenden Welt der „Endpunkte“ (Ergebniskriterien)

Ein Endpunkt ist das Ziel oder Ergebniskriterium einer klinischen Studie. Manchmal ist ein Endpunkt sehr offensichtlich. Führen wir uns zum Beispiel eine fiktive Behandlung zur Gewichtsreduktion vor Augen: Sie würden das Gewicht der Teilnehmer in der Interventionsgruppe im Vergleich zu dem der Teilnehmer in der Vergleichsgruppe nach der Behandlung vergleichen wollen. Der Endpunkt, an dem Sie sich interessieren, ist der Unterschied in der Gewichtsänderung der beiden Gruppen.

In bestimmten Bereichen in der Forschung gibt es Endpunkte, die weit akzeptiert und immer wieder verwendet werden. Das ist natürlich sehr hilfreich, wenn man die Ergebnisse aller Studien in einem Bereich zusammenfassen möchte (so lange ihre Methoden ausreichend ähnlich sind).

Wie können wir also herausfinden, was ein wichtiger Endpunkt ist?

Nun, das kommt darauf an, wen Sie fragen. Egal wie einfach ein Endpunkt erscheinen mag, er ist es wert, ernsthaft bedacht zu werden. Verschiedene Endpunkte sind für verschiedene Personen wichtig. Ein Arzt denkt vielleicht, dass der wichtigste Endpunkt die Sterberate ist – wenn eine Intervention verhindert, dass Menschen sterben, ist dies das Wichtigste.

Ein Krankenhausleiter ist vielleicht anderer Ansicht: das Wichtigste für ihn könnte sein, die Anzahl von Krankenhauseinweisungen zu verringern. Eine Kommunalverwaltung könnte daran interessiert sein, wie kosteneffektiv die Behandlung ist. Natürlich gilt: wenn etwas für Patienten wichtig ist, ist es wichtig. Was wäre also, wenn Sie ihr Leben verlängern kann, wenn sie die ganze Zeit unter schrecklichen Schmerzen leiden? Wären sie bereit, 30 Jahre lang ein Medikament einzunehmen, wenn dieses ihr Risiko für einen Herzinfarkt womöglich nur um einige Prozente senkt?

Und letztlich unterscheiden sich die Sichtweisen auch je nach Fachgebiet: so ist das Sterben in der Palliativmedizin nicht zwangsläufig ein so schrecklicher Endpunkt wie er es in der Kinderheilkunde sein kann.

Es ist offensichtlich, dass wir hier manchmal Kompromisse eingehen müssen. Stellen Sie sich vor, Sie würden eine Studie durchführen, in der ein Diabetes-Medikament mit einem anderen verglichen wird. Der Grund, weshalb Diabetes behandelt wird, ist, dass die Krankheit mit einigen wirklich schwerwiegenden Komplikationen einhergeht, darunter Augenprobleme, Nierenprobleme und Probleme mit den Blutgefäßen (denken Sie an Herzinfarkte und venöse Geschwüre).

Im Idealfall würden wir zwei große Personengruppen bilden, jeder der Gruppen ein anderes Medikament geben und sie über ihre Lebensspanne nachbeobachten, indem wir Daten über die Endpunkte erheben, die bedeutsam sind: Wie lange haben sie gelebt? Haben sie unter Nebenwirkungen der Medikamente gelitten? Hatten sie Augenprobleme, die mit dem Diabetes in Zusammenhang standen? Hatten sie Nierenprobleme? Haben sie Herzinfarkte erlitten? Wir würden diese Daten nehmen und die Gruppen miteinander vergleichen, um zu ermitteln, welches Arzneimittel besser darin war, diesen Endpunkt vorzubeugen. Leider wäre diese Studie sehr teuer, und schwierig durchzuführen, und wenn wir die Antworten vorliegen hätten, hätten wir womöglich schon ein neues Diabetesmedikament erfunden, dass die gesamte Arbeit überflüssig machen würde!

Also verwenden wir stattdessen Surrogatendpunkte…

„Surrogat“ bedeutet wörtlich „Ersatz“, etwas, das die Stelle von etwas anderem einnimmt. Surrogatendpunkte sind häufig Labortests, bildgebende Verfahren oder sehr eng definierte Aktivitäten, die wir verwenden können, wenn der ideale Endpunkt zu teuer, zu selten oder zu schwer zu messen ist. Die wesentliche Annahme, die wir hier zugrunde legen, ist, dass wir die biologischen Prozesse verstehen und uns sicher sind, dass sich der ideale Endpunkt, wenn sich der Surrogatendpunkt ändert, auch ändern würde. Die nachstehende Tabelle setzt dies in einen Kontext:

Tabelle zu Endpunkten und Surrogatendpunkten

Das Hauptproblem, dass wir im Zusammenhang mit Surrogatendpunkten beobachten, ist, dass sie die idealen oder wichtigen Endpunkte nicht immer gut repräsentieren. Manchmal stellen wir fest, dass, auch wenn ein Medikament für den Surrogatendpunkt eine Wirkung aufweist, wie wir sie uns wünschen, bei Verwendung des Medikamentes bei „realen Patienten“ keine Verbesserung in wichtigen Endpunkten bewirkt.

Es gibt eine ganze Reihe von Gründen, weshalb dies der Fall sein kann, in der Regel liegt dies jedoch entweder daran, dass wir die diesen Prozessen zugrundeliegende Biologie nicht vollständig verstehen, oder dass das Medikament andere Wirkungen hat, die wir nicht berücksichtigt haben.

Um diesen Punkt noch einmal zu betonen: Surrogatendpunkte sind mit großer Vorsicht zu betrachten. Nicht nur, weil sie in Bezug auf die Informationen, an denen wir wirklich interessiert sind, ein bisschen „unsinnig“ sind, sondern weil sie manchmal auch irreführend sein können.

Fassen wir noch einmal zusammen:

Endpunkte sind normalerweise intuitiv und offensichtlich. Seien Sie im Umgang mit Surrogatendpunkten vorsichtig. Verwerfen Sie eine Studie jedoch nicht gleich, nur weil sie Surrogatendpunkte verwendet hat – versuchen Sie zu ergründen, weshalb die Wissenschaftler sich für diese entschieden haben. Versetzen Sie sich stets in andere hinein: Wäre dieser Endpunkt für Sie bedeutsam, wenn Sie der Patient wären? Und schließlich: Gibt es etwas, über das diese Endpunkte nichts aussagen, welches Sie aber gerne wüssten – zum Beispiel Nebenwirkungen oder langfristige Wirkungen?

Und nun, um die Fragen zu beantworten, die zu Beginn dieses Blogbeitrags gestellt wurden…

Ich möchte wissen, ob ich nach der Operation eines eingewachsenen Zehnagels einen Verband mit Honig verwenden soll: Wahrscheinlich nicht: N=100, die Heilungszeit nach einer partiellen Avulsions-OP (partielle Entfernung eines Nagels) betrug bei Honigverbänden 31,67 Tage (SA 18,8) im Vergleich zum „normalen“ Paraffin-Gazeverband mit 19,62 Tagen (SA 9,31). Bei einer totalen Avulsion (d.h. Ablösung des gesamten Nagels), lagen die Ergebnisse jedoch enger beieinander, und das letzte Wort ist hier noch nicht gesprochen. (http://www.ncbi.nlm.nih.gov/pubmed/16550669)

Ich möchte wissen, ob ich Orangensaft trinken kann, während ich gegen Gicht behandelt werde: Ich wäre vorsichtig: In einer Phase-I-Studie (mit gesunden Freiwilligen), bei der die Pharmakokinetik (wie sich das Arzneimittel durch den Körper transportiert wird) von Colchicin zur Behandlung von Gicht bei gleichzeitigem täglichen Trinken von zwei Tassen Grapefruitsaft oder Bitterorangensaft verglichen wurde, minderte der Orangensaft die Aufnahme des Medikaments und verlängerte die Zeit, die es benötigte, um seine maximale Serumkonzentration zu erreichen. Es wurden jedoch keine signifikanten Nebenwirkungen berichtet, und die Autoren betonten, dass das Ergebnis möglicherweise nicht klinisch signifikant ist. Interessanterweise hatte der Grapefruitsaft keinen Einfluss auf die Pharmakokinetik des Colchicin, obwohl die Hersteller dringend vor seiner Einnahme während der Behandlung warnen. (http://www.ncbi.nlm.nih.gov/pubmed/22940371)

Text: John Cafferkey

Übersetzt von: Brita Fiess

Anmerkung: Aus Gründen der besseren Lesbarkeit wird auf die gleichzeitige Verwendung männlicher und weiblicher Sprachformen verzichtet. Sämtliche Personenbezeichnungen gelten gleichermaßen für alle Geschlechter.

Über 2.000 Zusammenfassungen von Cochrane Reviews sind übersetzt

Thu, 07/23/2020 - 07:45

Seit 2014 liefert „Cochrane Kompakt“ deutsche Übersetzungen der „Plain Language Summaries“ von Cochrane Reviews, die zuvor nur auf Englisch verfügbar waren. Im Frühjahr des Jahres 2020 erreichte unser Übersetzungsprojekt den Meilenstein von 2.000 Übersetzungen – Anlass für ein kurzes Portrait des Projekts.

Als eine kleine Gruppe um den britischen Gesundheitswissenschaftler Iain Chalmers 1993 die „Cochrane Collaboration“ gründete, um die Medizin auf ein festeres Evidenz-Fundament zu stellen, war Englisch die „Lingua franca“ aller Beteiligten. Doch schon bald wurde deutlich, dass die wissenschaftliche Evidenz aus Cochrane Reviews Menschen in aller Welt dann am besten erreicht, wenn sie auch deren Sprache spricht. Denn gerade mal sechs Prozent der Menschheit sind englische Muttersprachler, drei Viertel dagegen sprechen überhaupt kein Englisch. 1998 begann Cochrane deshalb, seine Review-Ergebnisse zunächst ins Spanische zu übersetzen. Über die Jahre kamen immer mehr Sprachen hinzu, inzwischen „spricht“ Cochrane 15 Sprachen.

Cochrane-Evidenz auf Deutsch gibt es seit 2014. Damals taten sich die deutschsprachigen Cochrane-Zentren Schweiz, Österreich und Deutschland zusammen und gründeten das gemeinsame Projekt Cochrane Kompakt. Die Grundidee von Cochrane Kompakt ist es, aktuelles, unabhängiges, frei zugängliches und leicht auffindbares Forschungswissen für den Gesundheitsbereich bereitzustellen – und das auf Deutsch.

Cochrane Kompakt – Ein Beispiel

Stellen wir uns eine Kinderärztin vor, mit einem kleinen Patienten, der wegen Ohrenschmerzen und Hörproblemen zu ihr kommt. Nach einer kurzen Untersuchung ist die Diagnose klar: Mittelohrentzündung mit Paukenerguss. Dabei handelt es sich um eine Ansammlung von Flüssigkeit in der Paukenhöhle, dem Hohlraum des Mittelohrs gleich hinter dem Trommelfell – ein recht häufiges Problem bei jüngeren Kindern.

Die Ärztin weiß aus ihrem Studium, dass man bakterielle Mittelohrentzündungen mit Antibiotika behandeln kann. Doch sie weiß auch, dass dies mit dem Risiko von Nebenwirkungen verbunden ist. Damit haben die Eltern bei einer früheren Behandlung ihres Kindes schon Erfahrungen gemacht, als ein Antibiotikum bei ihrem Kind Durchfall auslöste. Zudem wissen Eltern und Ärztin, dass der übermäßige Gebrauch dieser Medikamente für die immer weiter verbreiteten Resistenzen von Erregern verantwortlich sind, ein Problem, das weltweit als eines der größten Bedrohungen für die Gesundheitsversorgung gilt. Sie sind deswegen eher zurückhaltend, was den unnötigen Einsatz eines Antibiotikums angeht.

Die Ärztin fragt sich daher, wie die wissenschaftliche Evidenz für den Einsatz von Antibiotika bei Mittelohrentzündungen mit Paukenerguss aussieht. Um dies zu beantworten, benötigt sie Zugang zu verlässlichen Informationen zum aktuellen Stand der Wissenschaft zu dieser Frage.

Genau dies ist Aufgabe der systematischen Übersichtsarbeiten von Cochrane. Cochrane Reviews fassen sämtliche verfügbaren Ergebnisse aus klinischen Studien zu einer bestimmten Fragestellung zusammen und bewerten dabei auch die Vertrauenswürdigkeit der vorliegenden Evidenz. Sie sind international als Qualitätsstandard in der evidenzbasierten Gesundheitsversorgung anerkannt und sind sowohl für medizinisches Fachpersonal als auch für medizinische Laien eine wichtige Informationsquelle. Denn auch Patienten – oder in diesem Fall die Eltern des Kindes – möchten sich unter Umständen nicht nur auf die Empfehlungen ihrer Ärztin verlassen, sondern sich vor ihrer Entscheidung selbst ein Bild von der wissenschaftlichen Evidenz machen.

Doch nicht immer können oder wollen sich Laien wie Fachleute durch einen langen Review mit all seinen Tabellen, Quellen und Teilergebnissen arbeiten. Was sie sich wünschen, sind frei zugängliche Informationen, die nicht im Fachjargon und nach Möglichkeit auf Deutsch geschrieben sind.

Eben dies bietet Cochrane Kompakt an. Wenn die Ärztin oder die Eltern dort nach den Schlagworten „Paukenerguss“ und „Antibiotika“ suchen, finden sie schnell die kurz zusammengefassten Ergebnisse des Cochrane Reviews „Antibiotika bei Mittelohrentzündung mit Erguss (Paukenerguss) bei Kindern“, die bereits ins Deutsche übersetzt sind.

Aus den Ergebnissen dieses Reviews können Ärztin und Eltern ablesen, dass es durchaus brauchbare Evidenz („moderate Vertrauenswürdigkeit“) dafür gibt, dass mit Antibiotika behandelte Paukenergüsse in den folgenden Wochen im Durchschnitt wahrscheinlicher abklingen. Allerdings stellen sie offenbar auch keine „Sofortlösung“ für das Problem dar. Zudem gibt es Hinweise von niedriger Vertrauenswürdigkeit für ein erhöhtes Risiko von Nebenwirkungen wie Durchfall. Insgesamt ist das Bild der Evidenz also nicht eindeutig, zumal sich aus den vorliegenden Studien nicht beurteilen lässt, ob Antibiotika einen positiven Einfluss auf einige wichtige „Endpunkte“ haben, etwa auf die Sprachentwicklung von Kindern, die durch ein dauerhaft schlechtes Hören wegen eines Paukenergusses leiden kann.

Für die konkrete Entscheidung von Ärztin und Eltern ist der Cochrane Review trotzdem eine wichtige Informationsquelle. Da der kleine Patient nicht besonders unter dem Paukenerguss zu leiden scheint, entschließen sie sich auf dieser Basis, erst einmal einige Wochen abzuwarten, um zu sehen, ob der Erguss von alleine abklingt. Dies deckt sich auch gut mit der entsprechenden Leitlinie der Deutschen Gesellschaft für Hals-Nasen-Ohrenheilkunde, Kopf- und Hals-Chirurgie zum Paukenerguss bei Kindern. Auch der erwähnte Cochrane Review ist Bestandteil dieser Leitlinie, ebenso wie eine Reihe weiterer Cochrane Reviews – eine Suche in der Cochrane Library ergibt mehr als 50 Reviews zu einer Vielzahl von Fragen rund um das Stichwort „Mittelohrentzündung“ (Otitis media), für rund ein Viertel davon bietet Cochrane Kompakt kurze und einfach verständliche Zusammenfassungen auf Deutsch an.

Diese Reviews und auch gute, evidenzbasierte medizinische Leitlinien und Gesundheitsinformationen können Ärzte und Patienten als Grundlage für ihre Entscheidung nutzen. Wie diese am Ende ausfällt, hängt aber ebenso von den Erfahrungen der Ärztin und den Präferenzen der Eltern ab, sowie natürlich von der Frage, wie sehr das Kind unter der Krankheit leidet und wie seine klinischen Begleitumstände aussehen.

Darauf sind wir besonders stolz

In diesem Entscheidungsprozess will Cochrane Kompakt helfen. Um einen schnellen und leicht verständlichen Überblick über die Ergebnisse aus Wissenschaft und Forschung zu einer bestimmten Fragestellung zu geben, bietet Cochrane Kompakt vor allem die in vereinfachter Sprache erstellten Zusammenfassungen von neuen und aktualisierten Cochrane Reviews (sogenannte “plain language summaries”, PLS) an. Im Frühjahr 2020 haben wir mit unserer Arbeit den Meilenstein von mehr als 2.000 verfügbaren PLS auf Cochrane Kompakterreicht. Damit können wir jetzt für rund ein Viertel der momentan 8.000 verfügbaren Cochrane-Reviews deutschsprachige PLS anbieten.

Unsere Zugriffszahlen belegen ein wachsendes Interesse an dem Angebot von Cochrane Kompakt. Die Seitenaufrufe haben sich seit Anfang 2017 mit ca. 68.000 Zugriffen pro Quartal bis Ende 2019 mit ca. 666.000 Zugriffen im Quartal beinahe verzehnfacht.


Für die deutschen Übersetzungen steht die Qualitätssicherung an erster Stelle. So arbeiten wir intern in einem erfahrenen Team und jede Übersetzung wir durch zwei Mitarbeiter geprüft, bevor sie veröffentlicht wird. Eine Besonderheit der deutschsprachigen Übersetzungen ist die Zusammenarbeit mit externen Partnern. Dazu gehören verschiedene Fachzeitschriften aus dem Gesundheitswesen, Fachgesellschaften und Fachgruppen von Fachhochschulen und Universitäten. Diese fachlich kompetente Unterstützung bei den Übersetzungen macht es möglich, dass wir Übersetzungen mit einem sehr breiten Themenspektrum anbieten können, von Public Health über Hebammen- und Pflegewissenschaften und Urologie bis hin zu Physiotherapie.

Fazit

Cochrane Kompakt bietet Laien und Profis die Möglichkeit, sich einen schnellen Überblick über aktuelle und relevante Forschungsergebnisse zu verschaffen, was zu einer informierten Entscheidung beitragen kann. Wir arbeiten weiter daran, uns zu vernetzen und unser Projekt im deutschen Sprachraum noch bekannter zu machen. Die Arbeit wird uns jedenfalls nicht so schnell ausgehen, denn die Cochrane Library füllt sich stetig weiter mit neuen Reviews. Inzwischen enthält sie mehr als 8.000 englischsprachige Einträge.

Text: Katharina Kohler, Projektleiterin für Cochrane Kompakt bei Cochrane Deutschland

Anmerkung: Aus Gründen der besseren Lesbarkeit wird auf die gleichzeitige Verwendung männlicher und weiblicher Sprachformen verzichtet. Sämtliche Personenbezeichnungen gelten gleichermaßen für alle Geschlechter.

2.18 Verwechseln Sie nicht „keine Evidenz für einen Unterschied“ mit „Evidenz für keinen Unterschied“

Wed, 07/15/2020 - 09:38

Ein systematischer Review zu Behandlungen zielt normalerweise darauf ab, die folgende Frage zu beantworten: Was ist die Wirkung von Behandlung A im Vergleich zu Behandlung B? Doch auch ein systematischer Review kann diese Frage nicht immer beantworten.

Dies ist der 30. Beitrag aus einer Blogserie zu „Schlüsselkonzepten zur besseren Bewertung von Aussagen zu Behandlungen“, die im Rahmen des Projektes Informed Health Choices erarbeitet wurden. Jeder der insgesamt 36 Blogbeiträge befasst sich mit einem Schlüsselkonzept, das dabei hilft, Aussagen zu Wirkungen von Behandlungen besser verstehen und einordnen zu können.

Evidenz versus Wirksamkeit

Ein systematischer Review – also eine analytische Synthese aller vorhandener Evidenz zu einer medizinischen Fragestellung – kann die Frage, welche von zwei Behandlungen – A oder B – besser ist, oft nicht klar beantworten. Die Studien, auf denen die Evidenz eines Reviews basiert, liefern natürlich Informationen zu den Wirkungen der beiden im Review untersuchten Behandlungen oder Interventionen, und ziehen einen Vergleich. Wenn jedoch keine ausreichende Evidenz zur Verfügung steht, können wir nicht beurteilen, ob die Behandlungen sich unterscheiden.

Bei der Interpretation der Ergebnisse von systematischen Reviews (und von anderen Studien) ist deshalb immer wichtig, dass wir „keine Evidenz für einen Unterschied“ nicht mit „Evidenz für keinen Unterschied“ verwechseln.

Wo liegt das Problem?

Das Problem: Wenn es keinen statistisch signifikanten Unterschied zwischen Behandlung A und Behandlung B gibt, nimmt man mitunter fälschlicherweise an, dass dies zwangsläufig bedeutet, dass die beiden Interventionen gleichwertig sind. Selbst wenn kein statistisch signifikanter Unterschied besteht, ist es dennoch möglich, dass es einen klinisch relevanten Unterschied gibt. Es könnte sein, dass die eine Behandlung in Wirklichkeit besser als die andere ist, der Unterschied sich jedoch nicht statistisch signifikant belegen lässt, da die Anzahl der Ergebniswerte zu gering ist, um eine „statistische Signifikanz“ zu ermitteln.

Wie kann ich dieses Problem umgehen?

Die beste Methode, dieses Problem zu vermeiden, ist, das Konfidenzintervall zu betrachten (Mehr zur Thematik „Konfidenzintervall in diesem Artikel. Wenn das 95 %- Konfidenzintervall sowohl eine klinisch relevante Wirkung als auch keine Wirkung umfasst, legt dies nahe, dass wir nicht wissen, ob die Behandlung wirksam ist oder nicht, da keine ausreichende Evidenz vorliegt.

Wann liegt „keine Evidenz für einen Unterschied“ vor? Durchschnittlicher Unterschied, 95 %-Konfidenzintervall

In diesem Forest Plot ist das Gesamtergebnis (durch die Raute dargestellt) ein durchschnittlicher Unterschied von 4,02 (95 %-Konfidenzintervall: -1,06 bis 9,11). Dieser Unterschied ist statistisch nicht signifikant (das Konfidenzintervall überschreitet die 0). Dies bedeutet jedoch nicht, dass es in Wirklichkeit keine Wirkung gibt. Nehmen wir einmal an, die Grenze für einen klinisch bedeutsamen Unterschied bei diesem Ergebnis würde bei 8 Punkten liegen. Das 95 %-Konfidenzintervall schließt die 8 ein, sodass das Ergebnis nahelegt, dass wir nicht sicher sein können, dass es nicht doch einen klinisch relevanten Unterschied gibt. Der Grund hierfür ist in aller Regel, dass zu wenige Ergebniswerte für die Behandlungen vorliegen, d. h. die Studie keine ausreichende „Power“ hat (d. h. underpowered ist).

Wann liegt „Evidenz für keine Differenz“ vor?

Wenn das Ergebnis jedoch nahe 0 (bzw. nahe dem Wert für keinen Unterschied) ist und das Konfidenzintervall eng ist, legt dies nahe, dass es tatsächlich keine oder zumindest keine relevante Wirkung gibt. Im nachstehenden Forest Plot ist das Gesamtergebnis ein durchschnittlicher Unterschied von 1,81 (95 %-Konfidenzintervall: -2,95 bis 6,57). Dieses schließt die 8 (unsere angenommene Schwelle für eine relevante Wirkung) nicht ein und legt daher nahe, dass es keinen klinisch bedeutsamen Unterschied gibt.

Durchschnittlicher Unterschied, 95 %-Konfidenzintervall

Um weitere Evidenz dafür zu bekommen, dass zwei Behandlungen gleichermaßen wirksam sind, könnten wir uns dafür entscheiden, eine Nicht-Unterlegenheitsstudie oder Äquivalenzstudie zu verwenden, um zu ermitteln, ob eine nützliche Behandlungswirkung sicher ausgeschlossen werden kann.

Wieso liegt keine Evidenz vor?

„Keine Evidenz“ bedeutet nicht immer, dass keine Studien zur Behandlung vorliegen. Manchmal bedeutet es einfach nur, dass zu wenig Daten vorliegen, oder nicht ausreichend viele Studien, um aussagekräftige Schlussfolgerungen zur Behandlungswirkung zu rechtfertigen. Entsprechend ist es möglich, dass es eine Reihe von Studien gibt, dass aber, wenn diese ziemlich klein sind, immer noch nicht ausreichend viele Ergebniswerte vorliegen, um abzuschätzen, ob eine Wirkung besteht. Wenn die Studie also einen binären Endpunkt hat (z. B. ist die Person gestürzt oder nicht?), liegt möglicherweise nur wenig Evidenz vor, da nicht ausreichend Ergebnisereignisse vorliegen (z. B. wenn nur sehr wenige Personen gestürzt sind).

Selbst wenn einige der eingeschlossenen Studien größere Stichprobengrößen haben, können andere Gründe dafür vorliegen, weshalb ein Review zu dem Schluss kommt, dass nicht ausreichend Evidenz vorliegt. Ein Review kann zum Beispiel zu dem Schluss kommen, dass „unzureichende Evidenz“ vorliegt, wenn die Evidenz von niedriger Vertrauenswürdigkeit ist – weil:

  • die eingeschlossenen Studien von niedriger Vertrauenswürdigkeit waren, denn wenn es keine Studien von hoher Vertrauenswürdigkeit gab, können wir von ihren Ergebnissen nicht ausreichend überzeugt sein.
  • es nur indirekte Evidenz gibt – z. B. wenn in einen Review über die Wirkung eines Blutdruck-Medikaments nur Raucher eingeschlossen werden, könnte man davon ausgehen, dass dies keine ausreichende Evidenz für die Beantwortung der Frage ist, ob das Medikament bei Nichtrauchern wirksam ist.
  • eine große statistische Heterogenität vorhanden ist – die Ergebnisse der Studien stimmen nicht überein (z. B. wenn es in einigen Studien große Wirkungen gibt, in anderen jedoch nur geringere Wirkungen)

    Zusammengefasst heißt das:
  • Wenn ein Ergebnis statistisch nicht signifikant ist, bedeutet das nicht automatisch, dass die Behandlung wirkungslos ist
  • Betrachten Sie das Konfidenzintervall, um festzustellen, ob es eine klinisch bedeutsame Wirkung einschließt
  • Betrachten Sie die Qualität der Evidenz ebenso wie das zusammengefasste Ergebnis.

Text: Bethan Copsey

Übersetzt von: Brita Fiess

Video zum Schlüsselkonzept 2.18


Für weitere Informationen lesen Sie: Altman, D. G., & Bland, J. M. (1995). Statistics notes: Absence of evidence is not evidence of absence. Bmj, 311(7003), 485.

Anmerkung: Aus Gründen der besseren Lesbarkeit wird auf die gleichzeitige Verwendung männlicher und weiblicher Sprachformen verzichtet. Sämtliche Personenbezeichnungen gelten gleichermaßen für alle Geschlechter.

Kurzvideos über Grundlagen der Evidenzbasierten Medizin-Teil 4 ‚Effektmaße‘

Wed, 07/08/2020 - 13:42

Um Ergebnisse von klinischen Studien rundum zu verstehen, ist es wichtig, Effektmaße wie das „Relative Risiko“ oder die „Number Needed to Treat“ zu kennen und interpretieren zu können. In unserem vierten Video aus der Reihe „Grundlagen der Evidenzbasierten Medizin“ erklären wir einige wichtige Effektmaße, die in Studien häufig verwendet werden.

„Effektmaße“ messen welchen Effekt Interventionen auf verschiedene Endpunkte (Ergebniskriterien) haben. Grundsätzlich gibt es zwei Arten von Endpunkten, für die man Effekte berechnen kann. „Dichotome“ Endpunkte können nur zwei Ausprägungen annehmen. Mortalität wäre so ein Beispiel. Dieser Endpunkt kann nur eine der zwei Ausprägungen, „tot“ oder „lebendig“ annehmen. Die zweite Art von Endpunkten sind „kontinuierlich“. Das heißt, sie können eine Reihe von Ausprägungen annehmen. Lebensqualität gemessen auf einer Skala von 0-10 wäre so ein Beispiel. Die Werte können dann auf dieser Skala alle möglichen Ausprägungen annehmen.

Der Fokus in dieser Video-Serie liegt auf Effektmaßen für dichotome Endpunkte. Speziell erklären wir das Relative Risiko, die Odds Ratio, das absolute Risiko und die Number needed to treat bzw. die Number needed to harm (mehr dazu auch in diesem Artikel: Angaben zu relativen Risiken können irreführend sein. Diese Effektmaße begegnen einem sehr häufig in medizinischen Studien.

Das Relative Risiko und die Odds Ratio sind relative Effektmaße. Sie vergleichen das Risiko oder die Chance für einen Endpunkt in zwei Gruppen. Stellen wir uns folgendes Szenario vor:

Der Direktor einer Schule ist mit Vorwürfen konfrontiert, dass sich die Kinder, die ihren Klassenraum im ungeheizten Keller haben, häufiger erkälten als jene, die ihr Klassenzimmer im geheizten Erdgeschoss haben. Er möchte untersuchen, wie viele Kinder sich im Winter in einem ungeheizten Klassenzimmer erkälten – im Vergleich zu jenen, in einem beheizten Klassenraum. Der Endpunkt ist in diesem Fall dichotom: „Erkältung“ vs. „keine Erkältung“. Wir vergleichen den Effekt eines geheizten Klassenraums mit dem eines ungeheizten Klassenraums.

Es zeigt sich, dass das Risiko sich zu erkälten im ungeheizten Klassenraum doppelt so hoch ist wie im geheizten (das Relative Risiko ist 2). Das klingt sehr hoch. Wichtig ist hierbei aber zu beachten, dass relative Effektmaße nur beschreiben, wie stark sich das Risiko in einer Gruppe vom Risiko in der anderen Gruppe unterscheidet. Um das Relative Risiko besser einordnen zu können, ist es wichtig, sich das absolute Risiko anzusehen. Wie groß war denn im geheizten Klassenzimmer generell das Risiko sich zu erkälten? Angenommen das Risiko sich zu erkälten war im Erdgeschoss 2%. Dann bedeutet ein Relatives Risiko von 2 (also eine Verdoppelung des Risikos), dass im Keller 4% eine Erkältung entwickelten. Wirft man also ein Auge auf das absolute Risiko der Kinder in der kalten Klasse sich zu erkälten, zeigt sich, dass dieses wesentlich niedriger ausfällt, als die relativen Zahlen vermuten lassen. Das relative Risiko alleine ist meist zu wenig, um Effekt gut interpretieren zu können. Man braucht immer auch die Information was denn das Ausgangsrisiko war. Seriöse Gesundheitsinformationsseiten stellen aus diesem Grund Effekte häufig auch in absoluten Zahlen mit einer sinnvollen Bezugsgröße (zum Beispiel 1 zu 1.000) dar.

Die Number needed to treat (NNT) oder die Number needed to harm (NNH) sind absolute Effektmaße, die helfen, den individuellen Nutzen für den einzelnen Patienten besser abschätzen zu können. Die NNT wird in der Regel dazu verwendet, den Nutzen einer medizinischen Intervention zu messen. Sie gibt an, wie viele Personen behandelt werden müssen, damit bei einer Person die erwünschte Wirkung eintritt. Je niedriger dieser Wert ist, desto effektiver ist die Behandlung.

Bei der Number needed to harm (NNH) wird dagegen auf die gleiche Art und Weise das Risiko für unerwünschte Effekte einer Behandlung betrachtet. Sie gibt an, wie viele Personen eine medizinische Behandlung erhalten können, bis bei einer Person ein unerwünschter Effekt auftritt. Hier gilt: je höher dieser Wert ist, umso besser verträglich ist eine Intervention und umso seltener treten unerwünschte Effekte auf.

Das Kurzvideo erklärt anhand von Beispielen wie diese Effektmaße berechnet und interpretiert werden.

Text: Claudia Christof, Barbara Nußbaumer-Streit

Videoanrufe gegen Einsamkeit und soziale Isolation

Mon, 06/29/2020 - 06:34

Viele ältere Menschen haben die letzten Monate zum Schutz vor COVID-19 isoliert von ihren Liebsten zu Hause oder in Alters- und Pflegeheimen verbracht. Grosseltern durften plötzlich ihre Enkel nicht mehr sehen, Familien ihre Angehörigen nicht mehr in Altersheimen besuchen. Für die Betroffenen bedeutete diese erzwungene Isolation oft eine erhebliche psychische Belastung. Viele Heime und Angehörige wurden daraufhin kreativ und versuchten der Vereinsamung entgegenzuwirken, etwa durch den Einsatz digitaler Angebote. Ob Skype, Facetime, Zoom & Co älteren Menschen wirklich dabei helfen können, sich weniger einsam zu fühlen, und ob diese digitalen Kommunikationsmittel insgesamt die Lebensqualität verbessern, untersuchte ein neuer Cochrane Rapid Review.

Eigentlich wollte ich meine Eltern in Deutschland im März besuchen. Aber dann kam der Lockdown. Die Grenzen wurden geschlossen, der Besuch viel ins Wasser. Schnell merkte ich, wie sehr ich sie vermisse. Ich wollte meine Eltern nicht nur hören, sondern auch sehen – denn Blicke sagen ja bekanntlich mehr als 1000 Worte. Da wir bei Cochrane sowieso häufig Besprechungen online durchführen, lud ich meine Eltern auf eine Videokonferenz ein. Nach anfänglichen technischen Hürden, die wir schnell per Telefon lösten, konnten wir uns per Computer unterhalten und uns dabei auch sehen. Bald schon war das wöchentliche «Meeting» fest in unseren Terminkalendern vorgemerkt.

So wie uns erging es vielen Familien. Viele benutzten Videoanrufe, um Freunde und Familie zu sehen und wenigstens so die sozialen Kontakte ein wenig aufrecht zu erhalten. Und um nicht in den eigenen vier Wänden zu vereinsamen.

Videoanrufe als Maßnahmen gegen soziale Isolation

Videoanrufe stellen nur eine der vielen Möglichkeiten dar, um aus der Ferne mit älteren Menschen in Kontakt zu treten. Diese wurden auch in vielen Alters- und Pflegeheimen genutzt, indem man den Bewohnern bei der Anwendung der oft unvertrauten Technik half. So wurde in Einrichtungen, die aufgrund des Lockdowns für Besucher geschlossen wurden, Personal aus anderen Bereichen auf die Stationen zu den Bewohnern geschickt. Diese unterstützen die Heimbewohner* mit der Handhabung von elektronischen Geräten, um den Kontakt zu den Angehörigen zu ermöglichen. „Bei einigen hat das sehr gut geklappt. Bei anderen – vor allem bei denjenigen, die kognitiv eingeschränkt sind – überhaupt nicht. Sie verstanden nicht, wie sie oder ihre Angehörigen auf einmal ‚im Gerät drin sein können‘. Da hat es sehr schwierige Situationen gegeben“, so Markus Leser, Leiter Fachbereich ‘Menschen im Alter’ von Curaviva, dem Branchenverband der Institutionen für Menschen mit Unterstützungsbedarf.

Aber nicht nur in Heimen wurden Videoanrufe eingesetzt. Auch ältere Menschen, die zu Hause leben, nutzten diese Technik während der Corona Krise vermehrt. „Durch Covid-19 und den damit verbunden Lockdown habe ein Digitalisierungsschub in der Anwendung stattgefunden“, bilanziert Peter Burri Follath, Leiter Kommunikation von Pro Senectute Schweiz, die größte Anlaufstelle für Altersfragen der Schweiz. Dies, aus anwendungstechnischen Gründen: „In ‘normalen Zeiten’, eignen sich Seniorinnen und Senioren technische Fertigkeiten selbst an, erhalten dabei Unterstützung aus dem Umfeld oder besuchen entsprechende Kurse“, so Peter Burri Follath. Während der Corona-Zeit hatten Angehörige oft mehr Zeit, die älteren Menschen bei der Nutzung von digitalen Geräten anzuleiten. „Um den Kontakt trotz Social Distancing aufrechterhalten zu können, wurden digitale Kanäle wie Facetime oder Skype enorm wichtig und eingeübt“, berichtet Peter Burri Follath.

Weitere Maßnahmen gegen soziale Isolation

Neben der Videotelefonie setzten manche Alters- und Pflegeheime aber auch kreative Lösungen ein, wie beispielsweise die sogenannten „Besuchsboxen“ . Hierbei sitzen Bewohner und Besucher nur durch ein Plexiglas getrennt vis-à-vis voneinander in einer Kabine und telefonieren miteinander. Auch die Gärten wurden für Besuche auf Distanz genutzt. „Einige Häuser haben sogenannte ‘öffentliche Besuchsorte’ eingerichtet – also Stühle im Garten mit entsprechendem Abstand. In der Anfangsphase als es so warm war, standen die Angehörigen oft unten im Garten und die Bewohner oben auf ihrem Balkon“ so Markus Leser von Curaviva. „Auch habe ich Beispiele gesehen, bei denen sich Bewohner mit ihrem Essen statt im Zimmer auf den Gang setzten. Vier bis fünf Bewohner assen so gemeinsam, konnten sich dabei sehen und miteinander reden. All das waren Möglichkeiten, Kontakte innerhalb des Hauses zu schaffen, so gut das halt eben ging“ berichtet er weiter.

Bei zu hause lebenden älteren Menschen in der Schweiz wurde „Amigos“ – ein Einkaufs- und kostenlose Lieferdienst – sehr gefragt und geschätzt. Dieses Projekt wurde von Pro Senectute und dem Migros Genossenschaftsbund für die Zeit der Corona-Pandemie ins Leben gerufen, da die bestehenden Onlineshops extrem überlasten waren. Die älteren Menschen oder ihre Angehörigen konnten so mittels einer App sämtliche Migros-Produkte online bestellen. Registrierte Freiwillige kauften die Lebensmittel und andere Artikel ein und brachten sie unter Einhaltung der Hygienemassnahmen zu ihnen nach Hause. Somit hatten viele ältere Menschen einen sicheren Kontakt zu anderen Menschen. „Dies war sehr innovativ und extrem unkompliziert organisiert. Wir haben gemerkt, dass allein schon ein Einkaufsdienst für einsame Menschen extrem wertvoll und hilfreich war. Wir würden sogar die These wagen, dass so wahrscheinlich gar mehr Begegnungen zwischen den Generationen stattgefunden haben, als in Normalzeiten“, so Peter Burri Follath von Pro Senectute Schweiz. „Das Engagement und die Solidarität von gesunden Menschen, die sich nicht besonders vor einer Ansteckung schützen mussten, war sehr gross in dieser Zeit.“

Lebensqualität von älteren Menschen in der Isolation

Die plötzlichen Einschränkungen wurde von den Bewohnern der Alters- und Pflegeheime sehr unterschiedlich empfunden. „So gab es beispielsweise diejenigen, die relativ gelassen reagiert haben, wie zum Beispiel eine 100-jährige Frau aus Schaffhausen, die uns einfach sagte ’das ist schon gut, wie es ist und ich fürchte mich sowieso nicht vor dem Tod’ “, berichtet Markus Leser. Diesen Eindruck bestätigen auch andere Altersheime. Durch die internen Aktivitäten, den Zugang zum hausinternen Garten und durch regelmässigen Austausch mit den Betreuern hätten sich die Bewohner nie eingesperrt oder alleine gefühlt. „Aber zum Teil waren sie natürlich auch traurig. Das hat man schon gemerkt, vor allem wenn es um die Isolation ging“ berichtet Markus Leser von Curaviva von seinen Erfahrungen. „Wir wissen, dass den Seniorinnen und Senioren und deren Angehörigen die Besuche sehr gefehlt haben. So wie uns ja auch“, meint auch Peter Burri Follath von Pro Senectute Schweiz.

Cochrane-Evidenz

Es gibt also eine ganze Reihe von Möglichkeiten, die Einsamkeit alter Menschen in Zeiten von COVID-19 und darüber hinaus anzugehen. Doch lässt sich auch anhand wissenschaftlicher Evidenz bewerten, wie wirksam diese Massnahmen wirklich sind? Diese Frage stellten sich die Autoren eines neuen Cochrane Rapid Reviews. Sie konzentrierten sich dabei auf die Frage, ob Videoanrufe die soziale Isolation und Einsamkeit älterer Menschen über 65 Jahren verringern können. Die Autoren fanden bei ihrer Literatursuche drei Studien mit insgesamt 201 Teilnehmenden, alle in Pflegeeinrichtungen in Taiwan und aus der Zeit vor der COVID-19-Pandemie. In diesen Studien wurden ältere Menschen zufällig einer Gruppe zugeteilt, in denen Videoanrufe, anderen Methoden der Kontaktpflege, oder als Kontrollgruppe keine bestimmte Methode miteinander verglichen wurden. Die Videoanrufe konnten wahlweise mittels Computer, Tablet oder Handy per Internet durchgeführt werden; die Geräte wurden den Bewohnern der Interventionsgruppe zur Verfügung gestellt.

Drei, sechs und zwölf Monate nach der Einführung der Massnahmen wurde die Einsamkeit mit Hilfe eines validierten Messinstruments der University of California, Los Angeles (UCLA) gemessen. Die Gesamtpunktzahl auf dieser Einsamkeitsskala reicht von 20 (am wenigsten einsam) bis 80 (am meisten einsam). Die Ergebnisse deuteten darauf hin, dass die Videoanrufe wahrscheinlich nur eine geringe oder gar keine Wirkung auf die Einsamkeit ältere Menschen hatten, zumindest kurz- und mittelfristig. Die durchschnittliche Punktzahl für Einsamkeit in den Kontrollgruppen betrug 48,45. Unter der Intervention betrug die Mittelwertdifferenz nach 3 Monaten −0.44 (95% KI −3.28 bis 2.41) in 3 Studien (201 Teilnehmende), nach 6 Monaten −0.34 (95% KI −3.41 bis 2.72) in 2 Studien (152 Teilnehmende) und nach 12 Monaten −2.40 (95% KI −7.20 bis 2.40) in einer Studie (90 Teilnehmenden).

Auch bei der Verringerung von Symptomen einer Depression waren die Unterschiede klein bis nicht vorhanden. Diese wurden mit Hilfe der Geriatrischen Depressionsskala gemessen. Die Gesamtpunktzahl reicht von 0 bis 30 (je höher je schlechter). Der Mittelwert der Depressionssymptome in den Kontrollgruppen betrug 12,16. Unter Einsatz der Videoanrufe betrug die Mittelwertdifferenz nach drei Monaten Nachbeobachtung 0,41 (95% KI -0,90 bis 1,72; 3 Studien; 201 Teilnehmende) und nach sechs Monaten – 0,83 (95% KI -2,43 bis 0,76; 2 Studien, 152 Teilnehmende).

In einer der Studien hatten Videoanrufe im Vergleich zur üblichen Versorgung auch nur einen kleinen bis keinen Einfluss auf die Lebensqualität. Keine der drei Studien berichtete über die Wirksamkeit bezüglich sozialer Isolation. Die Vertrauenswürdigkeit der Evidenz war aufgrund der geringen Teilnehmeranzahl und den unzuverlässigen oder unvollständig beschriebenen Methoden eingeschränkt.

Langfristige Änderungen?

Auch wenn die vorhandene Evidenz aus kontrollierten Studien den Nutzen von Videoanrufen nicht eindeutig belegen konnte, so kann der Einsatz dieser Technologie im Einzelfall dennoch eine von vielen Möglichkeit darstellen, gegen die Einsamkeit und soziale Isolation älterer Menschen vorzugehen. Jedoch ist dies nicht für alle älteren Menschen umsetzbar, da manche mit solchen Videoanrufen überfordert sind.

Zudem sind die Ergebnisse des Cochrane Rapid Reviews mit Studien aus Heimen nicht unbedingt auf zuhause lebende ältere Menschen übertragbar. Dies sieht auch Markus Leser kritisch: „Mir fiel in der ganzen Corona-Zeit auf, dass sich Medien und Öffentlichkeit stark auf ältere Leute im Heim fokussieren. Aber ich habe keine einzige Frage bekommen, wie sich beispielsweise Witwen und Witwer alleine zu Hause fühlen. Dabei haben sie ein noch viel grösseres Einsamkeitsrisiko, wenn sie kein funktionierendes soziales Netzwerk haben oder keine Angehörigen, die sich um sie kümmern“. Auch ist es schwierig, die Resultate von Taiwan auf europäische Alters- und Pflegeheime zu übertragen.

Eines zeigte sich allerdings zumindest in der Schweiz: „Der Generationenzusammenhalt war in der Lockdown-Phase sehr gut. Im Ausnahmezustand rückten die Generationen eher zusammen und die Nachbarschaftshilfe – beispielsweise in Form von Einkaufsdiensten – erlebte eine Renaissance“, so Peter Burri Follath von Pro Senectute Schweiz.

Schön wäre es, wenn wir uns auch über die Corona-Zeit hinaus mehr Zeit für ältere Menschen nähmen und einige der neuen Gewohnheiten, wie etwa die Lebensmitteleinkäufe, weiterführen könnten. Denn Einsamkeit im Alter ist und bleibt eine grosse gesellschaftliche Herausforderung – ganz unabhängig von Corona.

Text: Anne Borchard

Anmerkung: Aus Gründen der besseren Lesbarkeit wird auf die gleichzeitige Verwendung männlicher und weiblicher Sprachformen verzichtet. Sämtliche Personenbezeichnungen gelten gleichermaßen für alle Geschlechter.

Masern, Mumps, Röteln und Windpocken – Alles nur ein paar Flecken?

Fri, 06/26/2020 - 19:02

„Zählt eure Kinder, wenn die Masern vorüber sind“, besagt ein altes arabisches Sprichwort. Noch heute sind Masern alles andere als eine harmlose Kinderkrankheit. In seltenen Fällen können sie sogar sehr gefährlich werden. Eine kombinierte Impfung gegen Masern, Mumps, Röteln und Windpocken (MMRV) kann uns und unsere Kinder davor bewahren. Was sind das für Krankheiten, vor denen diese Impfung schützt? Wie funktioniert die Impfung? Welche Risiken birgt sie? Ein kürzlich aktualisierter Cochrane Review liefert evidenzbasierte Antworten.

Das hochansteckende Masernvirus löst vor allem bei Kindern die Masernerkrankung aus. Sie zeigt sich üblicherweise zunächst mit Husten, Schnupfen und leichtem Fieber und später mit den für die Krankheit typischen rötlichen Flecken am ganzen Körper und hohem Fieber. Bei knapp einem Drittel der Erkrankten kommt es zu Komplikationen wie Durchfall, Entzündung der Lunge, des Mittelohrs oder seltener auch des Gehirns [1]. Diese Komplikationen können einen sehr gefährlichen Verlauf mit bleibenden Schäden nehmen, bei etwa einem von 1000 Erkrankten führen sie zum Tod [2].

Mumpsviren lösen eine Entzündung der Ohrspeicheldrüsen aus, die sich gelegentlich auch in andere Organe ausbreitet. Bei bis zu einem von 10 Erkrankten kann es zu einer gefährlichen Hirnhautentzündung kommen [3]. Am häufigsten erkranken Kinder und junge Menschen.
Bei einer Erkrankung mit Rötelnviren fühlt sich das betroffene Kind üblicherweise krank und hat die typischen rötlichen Flecken auf der Haut, die der Krankheit ihren Namen geben. Komplikationen sind aber zum Glück sehr selten. Trifft die Erkrankung jedoch Schwangere, so besteht die Gefahr, dass das ungeborene Kind sich fehlentwickelt oder an der Infektion verstirbt (15%) [4].

Das Varizella-Zoster-Virus ruft die als Windpocken (Varizellen) bekannten Hautveränderungen hervor. Wie das Rötelnvirus ist dieser Erreger besonders gefährlich für ungeborene Kinder. Typisch für das Windpocken-Virus ist, dass es sich in Teile des Nervensystems zurückzieht, wo es sich gewissermaßen vor dem eigenen Immunsystem „verstecken“ und ein Leben lang erhalten bleiben kann. Manchmal kommt es dann viel später zu einer Reaktivierung in Form einer Gürtelrose (Herpes Zoster), die sich in Form schmerzhafter Hautausschläge bemerkbar macht.

Vor all diesen Krankheiten können wir uns heute schützen, denn es gibt Impfstoffe.

Wie funktioniert eine Impfung?

Impfstoffe enthalten entweder nicht-infektiöse Bruchstücke des Erregers (Totimpfstoff) oder eine abgeschwächte Version des Erregers, die sich im Körper zwar noch vermehren kann, jedoch nicht die volle Erkrankung auslöst (Lebendimpfstoff). In diese zweite Kategorie fallen auch die Impfungen für Masern, Mumps, Röteln und Windpocken. Beide Impfstofftypen dienen dem gleichen Zweck: Das Immunsystem lernt, den Erreger zu erkennen und kann sich auf den möglichen Ernstfall einer Infektion vorbereiten. Dieses Kennenlernen kann sich mit Fieber oder Abgeschlagenheit als sogenannte Impfreaktion äußern, die tatsächliche Krankheit bleibt uns aber erspart. Unser Immunsystem merkt sich, wie der Erreger aussieht, sodass es bei einem Kontakt mit dem echten Erreger direkt auf sein „Gedächtnis“ zurückgreifen und ihn abwehren kann, ohne dass wir erkranken. Gegen diese Erreger ist unser Körper nun immun: Er kann uns nichts mehr anhaben, weil wir auf ihn vorbereitet sind. Immunität kann man auch durch das Durchmachen der Erkrankung erreichen, allerdings muss man dann die damit einhergehenden Risiken in Kauf nehmen.

Allerdings gilt auch für alle Impfungen die Grundregel der Medizin: Keine Wirkung ohne Nebenwirkungen. Für die MMRV-Impfung beschränken sich diese unerwünschten Wirkungen meist auf harmlose Impfreaktionen an der Injektionsstelle, in sehr seltenen Fällen können sie aber auch schwerwiegender ausfallen. Letztlich gilt es, die Risiken der Impfung mit den Risiken eines natürlichen Krankheitsverlaufs abzuwägen.

Cochrane Review belegt Wirksamkeit der MMRV-Impfung

Ein aktueller Cochrane Review hat bei zehn Millionen Kindern untersucht, wie gut der kombinierte Impfstoff gegen Masern, Mumps, Röteln und Varizellen (MMRV oder MMR+V) vor diesen Krankheiten schützt und mit welchen Risiken dabei zu rechnen ist. Die im Review zusammengefassten Studien zeigen, dass die Impfstoffe nach den empfohlenen zwei Impfungen im Abstand von einigen Monaten 96 Prozent der Geimpften vor einer Masernerkrankung, 86 Prozent vor einer Mumpsinfektion, 89 Prozent vor einer Rötelninfektion und 95 Prozent vor einer Windpockenerkrankung schützen. Die Autoren bewerteten die Vertrauenswürdigkeit der Evidenz für die Wirksamkeit des MMR-Impfstoffs mit Hilfe des in allen Cochrane Reviews verwendeten GRADE-Schemas (sehr niedrig, niedrig, moderat und hoch) als „moderat“.

Welche Risiken sind mit der Impfung verbunden?

Der Cochrane Review untersuchte auch die aufgetretenen Nebenwirkungen. „In diesem Bericht wollten wir uns speziell mit der Evidenz für spezifische Schäden befassen, die in der öffentlichen Debatte mit diesen Impfstoffen in Verbindung gebracht werden – oft ohne streng wissenschaftliche Grundlage“, sagt der Erstautor des Reviews, Carlo Di Pietrantonj vom italienischen Regionalen Referenzdienst für Epidemiologie (SeREMI). In Studien mit insgesamt mehr als 13 Millionen Kindern zeigte sich kein Zusammenhang zwischen der Impfung und einer Reihe von Krankheiten und Symptomen wie Autismus, Hirnentzündungen, Darmerkrankungen, verzögerter kognitiven Entwicklung, Diabetes, Asthma, Hautentzündungen, Heuschnupfen, Leukämie, multipler Sklerose, Gangstörungen, Darmerkrankungen oder Infektionen.

Auch schwere Impfreaktionen wie beispielsweise ein Fieberkrampf gibt es, sie sind aber sehr selten: Die Basis-Wahrscheinlichkeit für ein Kind, bis zum 5. Lebensjahr einen oder mehrere Fieberkrämpfe zu erleben, beträgt ohne Impfung 2-4 %. Durch die MMRV-Impfung kommt ein Risiko von ca. 0,1 % hinzu.
Für Carlo Di Pietrantonj sind die Ergebnisse dieses Reviews eine weitere Bestätigung, „dass die Risiken, die von diesen Krankheiten ausgehen, bei weitem die Risiken der zur Vorbeugung verabreichten Impfstoffe überwiegen“.

Referenz: Di Pietrantonj C, Rivetti A, Marchione P, Debalini MG, Demicheli V. Vaccines for measles, mumps, rubella, and varicella in children. Cochrane Database of Systematic Reviews 2020, Issue 4. Art. No.: CD004407. DOI: 10.1002/14651858.CD004407.pub4.

Eine kurze Geschichte der Impfung am Beispiel von Pocken und Masern

Die folgende Liste gibt einen Einblick in die Geschichte des Impfens. Sie beginnt mit den durch das Pockenvirus ausgelösten Pocken, die schon seit sehr langer Zeit die Menschheit beherrschten. Sie beinhaltet die erste Impfung mit dem Sekret von Kühen und führt über eine skandalöse Studie über angebliche Impfschäden bis in die Gegenwart.

  • Bereits in 3000 Jahre alten Pharaonen-Mumien aus Ägypten finden sich Spuren der Pocken [5].
  • Vor etwa 1000 Jahren benutzt man in Asien, viel später auch in Europa, das Sekret von Erkrankten, um damit kontrolliert andere Menschen anzustecken (Variolation). Mit dieser Art der Ansteckung geht häufig ein vergleichsweise milder Krankheitsverlauf einher [5].
  • 1796: Der englische Landarzt Edward Jenner zeigt, dass er einen Jungen durch die Impfung mit Kuhpockensekret (Vakzination) lebenslang vor der Pockenerkrankung schützen kann [5]. Das Kuhpockensekret enthält einen ähnlichen, jedoch nicht die Pockenkrankheit auslösenden Erreger. Die Bezeichnung Vakzination entstammt von dem lateinischen Wort „vacca“ für Kuh [6].
  • Ab dem 19. Jahrhundert wird in Europa in manchen Regionen aufgrund der weit verbreiteten Pocken zum ersten Mal eine Impfpflicht eingeführt [6]. Zeitweise sind die Pocken für ein Drittel aller Erblindungen und jedes zehnte tote Kind in Europa verantwortlich [7].
  • 1980: Die Weltgesundheitsorganisation WHO erklärt die Welt dank der flächendeckenden Impfung offiziell für pockenfrei [5].
  • 1960: Zurück zu den Masern: Seit den 1960er Jahren gibt es in der BRD einen Impfstoff für Masern [2]. Daraus entsteht der heute verwendete MMRV-Impfstoff.
  • 1998: Aufregung um die MMR-Impfung gegen Masern, Mumps und Röteln. Eine Forschungsgruppe um den britischen Arzt Andrew Wakefield veröffentlicht einen Fachartikel, in dem sie bei 12 untersuchten Patienten einen Zusammenhang zwischen der MMR-Impfung und Autismus vermuten [8]. Später kommen Manipulationen der Ergebnisse und erhebliche finanzielle Verflechtungen und Interessenkonflikte Wakefields ans Licht [9], die Fachzeitschrift zieht den Artikel später zurück. Wakefields Ergebnisse konnten nie reproduziert werden, für einen Zusammenhang zwischen MMR-Impfung und Autismus gibt es bis heute keine wissenschaftlichen Belege. Auch die aktuelle Version des Cochrane Reviews zur MMR-, bzw. MMRV-Impfung enthält keinerlei Hinweis auf einen solchen Zusammenhang.

Text: Johanna Gerhards

Quellen:

[1] CDC, „Measles,“ [Online]. Available: https://www.cdc.gov/vaccines/pubs/pinkbook/meas.html. [Zugriff am 03 06 2020].
[2] RKI, „RKI-Ratgeber Masern,“ [Online]. Available: https://www.rki.de/DE/Content/Infekt/EpidBull/Merkblaetter/Ratgeber_Masern.html. [Zugriff am 03 06 2020].
[3] RKI, „RKI-Ratgeber Mumps,“ [Online]. Available: https://www.rki.de/DE/Content/Infekt/EpidBull/Merkblaetter/Ratgeber_Mumps.html. [Zugriff am 03 06 2020].
[4] RKI, „RKI-Ratgeber Röteln,“ [Online]. Available: https://www.rki.de/DE/Content/Infekt/EpidBull/Merkblaetter/Ratgeber_Roeteln.html. [Zugriff am 03 06 2020].
[5] CDC, „History of Smallpox,“ [Online]. Available: https://www.cdc.gov/smallpox/history/history.html. [Zugriff am 03 06 2020].
[6] RKI, „Impfgegner und Impfskeptiker,“ Bundesgesundheitsblatt – Gesundheitsforschung – Gesundheitsschutz, 12 2004.
[7] „WHO Factsheet Smallpox,“ [Online]. Available: https://web.archive.org/web/20070921235036/http://www.who.int/mediacentre/factsheets/smallpox/en/. [Zugriff am 03 06 2020].
[8] A. Wakefield, „Ileal-lymphoid-nodular Hyperplasia, Non-Specific Colitis, and Pervasive Developmental Disorder in Children,“ The Lancet, 1998.
[9] GMC, „FITNESS TO PRACTISE PANEL HEARING 28 JANUARY 2010,“ 2010.
[10] RKI, „RKI-Ratgeber Windpocken,“ [Online]. Available: https://www.rki.de/DE/Content/Infekt/EpidBull/Merkblaetter/Ratgeber_Varizellen.html. [Zugriff am 03 06 2020].

Anmerkung: Aus Gründen der besseren Lesbarkeit wird auf die gleichzeitige Verwendung männlicher und weiblicher Sprachformen verzichtet. Sämtliche Personenbezeichnungen gelten gleichermaßen für alle Geschlechter.

2.17 „Statistische Signifikanz“ sollte nicht mit „Bedeutsamkeit“ verwechselt werden

Wed, 06/10/2020 - 08:44

Wenn wir das Wort „signifikant“ lesen, läuten bei uns in Gedanken die Alarmglocken. Aussagen wie „Hier ist etwas bedeutsames passiert“ oder Synonyme wie „wesentlich“, „bemerkenswert“ und „wichtig“ kommen uns in den Sinn. Leider hat dieses ansonsten unschuldig aussehende Wort in wissenschaftlichen Kreisen zu einer signifikanten Menge an Problemen geführt, da sein Gebrauch (und Missbrauch) in Zusammenhang mit der Interpretation von Ergebnissen das Wort für immer an das Konzept der statistischen Hypothesenprüfung gekoppelt hat.

Dies ist der 29. Beitrag aus einer Blogserie zu „Schlüsselkonzepten zur besseren Bewertung von Aussagen zu Behandlungen“, die im Rahmen des Projektes Informed Health Choices erarbeitet wurden. Jeder der insgesamt 36 Blogbeiträge befasst sich mit einem Schlüsselkonzept, das dabei hilft, Aussagen zu Wirkungen von Behandlungen besser verstehen und einordnen zu können.

Wie im vorausgegangenen Key Concept-Beitrag diskutiert, legen Wissenschaftler beliebige Grenzwerte oder „Signifikanzniveaus“, idealerweise vor Beginn ihrer Arbeit, fest, um später zu ermitteln, ob ihre Ergebnisse „statistisch signifikant“ sind. Der in der Forschung am häufigsten verwendete Grenzwert ist 5 % oder p < 0,05 (wenn der p-Wert unter 0,05 liegt, wird das Ergebnis als „statistisch signifikant“ bezeichnet). Die Interpretation von Ergebnissen anhand dieses Grenzwertes ist sehr einfach (siehe auch den Artikel Konfidenzintervalle sollten angegeben werden).

Ein Beispiel

Wenn der p-Wert für den Unterschied im durchschnittlichen Gewicht zwischen zwei Gruppen von Teilnehmern unterhalb dieser Grenze (z. B. p = 0,03) liegt, können wir die Nullhypothese, d. h. dass es keinen Gewichtsunterschied zwischen den beiden Gruppen gibt, verwerfen. Das Ergebnis wird als „statistisch signifikant“ betrachtet. Liegt der p-Wert über dem Grenzwert (z. B. p = 0,10), können wir die Nullhypothese nicht verwerfen, und das Ergebnis ist „statistisch nicht signifikant“. Dieser Vorgang wird als statistische Hypothesenprüfung bezeichnet.

Es ist wichtig zu betonen, dass diese Grenze von p < 0,05 völlig beliebig ist und grundsätzlich keine besondere Bedeutung hat. Es ist klar, dass p = 0,04999 und p = 0,05001 im Grunde dasselbe sind, und doch dürfen wir im ersten Fall das Ergebnis mit den magischen Worten „statistisch signifikant“ beschreiben, im zweiten nicht. Manchmal werden Ergebnisse, die diesen Grenzwert nicht erfüllen (nicht unterschreiten), nie veröffentlicht, weil sie als „uninteressant“ oder „unwichtig“ betrachtet werden. Dies wiederum hat zu verzerrten Ergebnisdarstellungen (Publikations-Bias) und „p-Hacking“ geführt [1,2].

Aber was ist der tatsächliche Unterschied im durchschnittlichen Gewicht zwischen den beiden Teilnehmergruppen? Weder der p-Wert noch die zweigeteilten (ja/nein) Aussagen zur „statistischen Signifikanz“ vermitteln uns Informationen über die Ergebniswerte bzw. die Größe des Unterschieds. Und hier genau liegt das Problem: p-Werte sagen nur etwas darüber aus, wie wahrscheinlich es ist, dass wir dieselben Studienergebnisse rein zufällig erhalten würden. Wir wissen nichts über den tatsächlichen Wert, hier den Unterschied im durchschnittlichen Gewicht, an dem wir eigentlich interessiert sind.

Nehmen wir einmal an, der Unterschied im durchschnittlichen Gewicht zwischen den beiden Gruppen beträgt 0,1 kg, und wir ermitteln, dass dieser Unterschied „statistisch signifikant“ (p = 0,03) ist. Dies bedeutet, dass sich das durchschnittliche Gewicht in Gruppe 1 vom durchschnittlichen Gewicht in Gruppe 2 unterscheidet, und dass dieser kleine Unterschied (auf Grundlage des p-Wertes) wahrscheinlich nicht durch Zufall bedingt ist.

Auch wenn dieses Ergebnis statistisch signifikant ist: ist es wirklich bedeutsam? In der Wissenschaft wird hierfür auch verbreitet der Begriff „klinisch relevant“ verwendet.

Die Antwort auf diese Frage hängt allein vom Kontext ab und ist eine Frage der Interpretation. Wenn wir eine randomisierte, kontrollierte Studie mit erwachsenen Teilnehmern durchführen, ist ein Unterschied von 0,1 kg im durchschnittlichen Gewicht zwischen den beiden Gruppen wahrscheinlich nicht bedeutsam, selbst wenn er „statistisch signifikant“ ist. Wir wären jedoch sicherlich anderer Ansicht, wenn wir eine andere Teilnehmergruppe betrachten würden – ein Unterschied von 0,1 kg wäre zum Beispiel bei Neugeborenen weitaus bedeutsamer.

Wenn wir die Anzahl der Ergebniswerte erhöhen, wird unsere Schätzung des wahren Unterschieds präziser. In anderen Worten, steigt unser Vertrauen, dass die Ergebnisse nicht rein zufällig entstanden sind. Theoretisch können selbst die winzigsten, unbedeutendsten Unterschiede statistisch signifikant werden, wenn es ausreichend viele Ergebniswerte gibt. Auf der anderen Seite kann das übermäßige Vertrauen in die statistische Signifikanz dazu führen, dass wir wesentliche Unterschiede übersehen oder unsichere Ergebnisse fälschlicherweise als negative Ergebnisse einstufen. Aufgrund des Zusammenhangs zwischen dem p-Wert und der Stichprobengröße (Teilnehmerzahl) tritt dieses Problem vor allem in Studien mit einer geringeren Anzahl von Ergebniswerten auf. Aus diesem Grund ist es sehr wichtig, statistische Signifikanz nicht mit Bedeutsamkeit zu verwechseln.

Manchmal werden Ergebnisse, die nicht „statistisch signifikant“ sind, niemals veröffentlicht, da sie für „uninteressant“ oder „unbedeutend“ gehalten werden. Dies wiederum hat zu Verzerrungen in der Darstellung der Ergebnisse geführt.

Ein weiteres Beispiel

Wir möchten herausfinden, ob eine neue chirurgische Intervention bei einem Hirntumor besser wirkt als die derzeitige Standard-Chemotherapie. Dazu betrachten wir die folgenden hypothetischen Ergebnisse:

Hypothetisches Ergebnis 1: „Die neue chirurgische Intervention hat die Anzahl der Todesfälle im Vergleich zur Standard-Chemotherapie statistisch signifikant (p = 0,04) verringert.“

Was bedeutet signifikant hier? Meinen die Autoren damit wesentlich weniger Todesfälle oder nur eine statistisch signifikant geringere Anzahl von Todesfällen? Dies ist nicht klar, aber wahrscheinlich ist letzteres gemeint, weil der p-Wert angegeben ist. Wir haben in diesem Fall keine Informationen darüber, wie genau die neue chirurgische Intervention der Chemotherapie überlegen ist.

Hypothetisches Ergebnis 2: „Die neue chirurgische Intervention hat die Anzahl der Todesfälle im Vergleich zur Standard-Chemotherapie statistisch signifikant (p = 0,04) verringert. Nach fünf Jahren gab es in der chirurgischen Interventionsgruppe zwei Todesfälle weniger.“

Diesmal ist der exakte Unterschied in der Anzahl der Todesfälle angegeben. Es ist zudem klar, dass sich das Wort „signifikant“ in diesem Fall auf die statistische Signifikanz bezieht, da ein Unterschied von zwei kein großer Unterschied ist.

Als Leser ist es nun wichtig, diese Ergebnisse zu kontextualisieren. Bei einer explorativen Studie, in der jede Gruppe nur 10 Teilnehmer umfasste, wäre eine Anzahl von zwei Todesfällen weniger in der Interventionsgruppe bedeutsam und würden weitergehende Untersuchungen erforderlich machen. In einer großen klinischen Studie mit 1.000 Teilnehmern in jeder Gruppe sind zwei Todesfälle weniger beeindruckend, auch wenn das Ergebnis statistisch signifikant ist. In diesem Fall würden wir die beiden Interventionen als in etwa gleichwertig betrachten und unsere Entscheidung bezüglich der Behandlung auf Grundlage anderer Faktoren treffen.

Hypothetisches Ergebnis 3: „Die neue chirurgische Intervention hat die Anzahl der Todesfälle im Vergleich zur Standardchemotherapie nicht statistisch signifikant (p = 0,07) verringert. Nach fünf Jahren gab es einen Todesfall in der chirurgischen Interventionsgruppe und neun Todesfälle in der Standard-Chemotherapiegruppe.“

Dieses Mal haben wir ein statistisch nicht signifikantes Ergebnis, das mit einem großen Unterschied in der Anzahl der Todesfälle (8 weniger) einhergeht. In diesem Fall scheint die Behandlung einen bedeutsamen Effekt zu haben, jedoch fehlt es der Studie vielleicht an „Power“ (ist sie nicht ausreichend groß) für einen statistisch signifikanten Unterschied. Auch hier benötigen wir mehr Informationen zur Größe der Studie, um die Ergebnisse kontextualisieren zu können. Allein auf Grundlage einer statistischen Signifikanzprüfung den Schluss zu ziehen, dass diese Studie keinen Unterschied zwischen den Gruppen zeigt, wäre unangemessen.

Zusammengefasst…

…ist anhand dieser Beispiele hoffentlich deutlich geworden, dass das Wort „signifikant“ im wissenschaftlichen Kontext eher irreführend sein kann. Zum Glück gibt es noch eine Vielzahl anderer Wörter, wie „wichtig“, „bedeutsam“, „klinisch relevant“, „interessant“ und so weiter, die Sie stattdessen verwenden können, um auf die Bedeutung von Ergebnissen hinzuweisen, ohne sich auf diesen beliebig gesetzten Grenzwert zu beziehen. Achten Sie zudem bei der Präsentation von Ergebnissen darauf, absolute Ergebniswerte („die Punktschätzer“) und die zugehörigen Konfidenzintervalle anstelle des irreführenden p-Werts und des zweigeteilten Konzepts der Hypothesenprüfung zu verwenden.

Text: Jessica Rohmann

Übersetzt von: Brita Fiess

Zum Originaltext

Literaturhinweise:

[1] Masicampo EJ, Lalande DR. A peculiar prevalence of p values just below .05. The Quarterly Journal of Experimental Psychology. 2012;65(11):22719.
[2] Head ML, Holman L, Lanfear R, Kahn AT, Jennions MD. The Extent and Consequences of P-Hacking in Science. PLoS Biol. 2015;13(3):e1002106.

Anmerkung

Aus Gründen der besseren Lesbarkeit wird auf die gleichzeitige Verwendung männlicher und weiblicher Sprachformen verzichtet. Sämtliche Personenbezeichnungen gelten gleichermaßen für alle Geschlechter.

Kurzvideos über Grundlagen der Evidenzbasierten Medizin – Teil 3 Randomisierte kontrollierte Studien

Thu, 06/04/2020 - 06:09

Um die Wirksamkeit von einem Medikament oder einer Therapie nachzuweisen, gelten randomisierte kontrollierte Studien – sogenannte RCTs (randomized controlled trials) – als das beste Studiendesign. In unserem dritten Video aus der Reihe „Grundlagen der Evidenzbasierten Medizin“ erklären wir, was RCTs sind, warum sie am besten dazu geeignet sind, um eine Ursache-Wirkungsbeziehung nachzuweisen. Wir stellen auch unterschiedlichen RCT-Designs vor.

Randomisierte kontrollierte Studien, kurz RCTs, haben eine wichtige Besonderheit – die Randomisierung. Randomisierung bedeutet so viel wie zufällige Zuordnung (random = zufällig). Werden also TeilnehemerInnen in eine Studie eingeschlossen, dann erfolgt die Zuordnung zur Studiengruppe rein nach dem Zufallsprinzip.

Stellen wir uns eine Studie vor, die ein Schmerzmittel mit einem Scheinmedikament (Placebo) vergleicht mit dem Ziel chronische Kopfschmerzen zu lindern. Jede Person, die in die Studie aufgenommen wird, hat die gleiche Chance entweder der Medikamentengruppe oder der Placebogruppe zugeteilt zu werden. Man geht davon aus, dass sich durch die zufällige Zuteilung alle möglichen Einflussfaktoren wie beispielsweise Alter, Geschlecht, beruflicher und privater Hintergrund, gleichmäßig auf die Gruppen verteilen.

Wenn dann am Ende der Studie ein Unterschied in der Schmerzwahrnehmung zwischen den Personen in der Medikamentengruppe und in der Placebogruppe zu beobachten ist, kann man davon ausgehen, dass dieser durch das Medikament verursacht wurde und nicht durch andere Einflussfaktoren.

Welches Design eines RCTs zum Einsatz kommt, hängt von der Studienpopulation und der Art der Fragestellung ab. Die häufigste Form von RCTs sind Parallelgruppen RCTs. Hier werden zwei Gruppen (Interventions- und Kontrollgruppe) zeitlich parallel beobachtet. Im Idealfall handelt es sich um eine verblindete Studie, weder TeilnehmerInnen noch das Studienpersonal wissen, welcher Gruppe die einzelnen Personen zugeteilt wurden. In unserem Video stellen wir dieses und noch fünf weitere RCT-Designs vor: Cross-over RCT, N of 1 RCT, RCT mit faktoriellem Design, Cluster RCT und RCT mit adaptivem Design. Beim kritischen Lesen und Beurteilen von Studien ist es wichtig, darauf zu achten, ob das gewählte Design auch für die Fragestellung sinnvoll ist.

Text: Barbara Nußbaumer-Streit, Claudia Christof



COVID-19: JETZT den Rauchstopp wagen!

Sun, 05/31/2020 - 08:30

Tabak in jeglicher Form ist schädlich und trägt ursächlich dazu bei, dass jedes Jahr über 8 Millionen Menschen sterben. „Die Jugend schützen!“ lautet das Motto des diesjährigen Weltnichtrauchertages der WHO am 31. Mai. Ziel der Aktion: Kinder und Jugendliche sollen erst gar nicht mit dem Rauchen beginnen und besser vor Passivrauch bewahrt bleiben. Nicht zu rauchen ist gerade in Pandemiezeiten umso wichtiger, da noch unklar ist, inwiefern das Rauchen als Risikofaktor für eine COVID-19-Erkrankung gelten kann. Eine „Special Collection“ der Cochrane Library stellt Behandlungen und Ansätze vor, die den Rauchstopp unterstützen können.

Am 31. Mai ist Weltnichtrauchertag – ein Tag, an dem Organisationen wie die Weltgesundheitsorganisation (WHO) weltweit auf die Gefahren des Rauchens hinweisen und versuchen, Raucher zum Rauchstopp anzuregen und Menschen vor dem Rauchbeginn zu schützen. Denn die Gefahren des Tabakrauchens und des Passivrauchens sind mittlerweile unumstritten und sogar auf der Zigarettenverpackung unübersehbar: Rauchen tötet! Rauchen erhöht nicht nur das Risiko für Atemwegserkrankungen wie COPD und Lungenkrebs, sondern gilt auch als Risikofaktor für Diabetes Typ-2 und Herz-Kreislauf-Erkrankungen.

Weniger schwere COVID-19 Krankheitsverläufe bei Rauchern?

Seit Beginn der Corona-Krise hat das Thema „Rauchen“ und „Nikotinaufnahme“ besonders Fahrt aufgenommen und bereits für einige Diskussionen gesorgt. Denn über den Zusammenhang zwischen Rauchen und COVID-19 gibt es gemischte Nachrichten.

So veröffentlichten französische Forscher am 21. April eine Querschnittsstudie, mit dem Befund, dass unter den Corona-Patienten erstaunlich wenige Raucher sind: „Unsere Studie sowohl bei ambulanten als auch bei stationären COVID-19-Patienten deutet stark darauf hin, dass Menschen, die täglich Rauchen im Vergleich zur Allgemeinbevölkerung eine sehr viel geringere Wahrscheinlichkeit haben, eine symptomatische oder schwere SARS-CoV-2-Infektion zu entwickeln,“ schlussfolgerten die Autoren.

Diese Studie – für sich allein und aus dem Kontext genommen – könnte sogar zum Rauchen oder zumindest zum Konsum von Nikotinersatzprodukten wie Pflaster oder Kaugummis, anregen. Tatsächlich sahen sich französische Behörden nach der Veröffentlichung der Studie gezwungen, gegen Hamsterkäufe von Nikotinersatzprodukten vorzugehen. Dabei ist die Vermutung, dass Nikotin möglicherweise das Coronavirus daran hindern könnte, in „Körperzellen einzufallen“, voreilig und wissenschaftlich nicht fundiert. Wie in diesem Artikel des „Spiegel“ hervorgehoben, basiert die französische Studie „letztlich auf den Angaben von 22 Rauchern unter den befragten Pariser Corona-Patienten. Bei einer so kleinen Testgruppe können zufällige Abweichungen in der Statistik entstehen, die das Gesamtbild verzerren.“

Ein Ende April erstmals veröffentlichter Living Systematic Rapid Review von Beobachtungsstudien stellt fest, dass die Evidenz bezüglich eines Zusammenhangs zwischen Rauchen und COVID-19 nicht eindeutig ist: „Über alle 41 Beobachtungsstudien hinweg besteht bei der Erfassung des Raucherstatus eine erhebliche Unsicherheit darüber, ob das aktuelle oder ehemalige Rauchen mit einer SARS-CoV-2-Infektion […] in Zusammenhang gebracht werden kann.“, schlussfolgern die Autoren (Stand: 18.05.2020).

COVID-19 Risikogruppe: Raucher?

Egal von welcher Seite man die Situation also betrachtet, sie bleibt – zumindest momentan –ungewiss. Verbleiben wir deshalb bei den wenigen Faktoren, die wir Fakten nennen können:

  1. Aktives und passives Tabakrauchen sind als Risikofaktoren für akute Atemwegsinfektionen und weitere Krankheiten bekannt.
  2. Covid-19 ist für Menschen mit bestimmten Vorerkrankungen gefährlicher als für Gesunde.

Auch nach Einschätzung des Robert-Koch-Instituts haben Raucher nach bisherigen Erkenntnissen ein höheres Risiko für einen schweren Krankheitsverlauf: „Auch verschiedene Grunderkrankungen wie z. B. Herzkreislauferkrankungen, Diabetes, Erkrankungen des Atmungssystems, der Leber, der Niere, Krebserkrankungen oder Faktoren wie Adipositas und Rauchen scheinen das Risiko für einen schweren Krankheitsverlauf zu erhöhen“ (Stand 08.05.2020). Eine ausführliche Diskussion der noch wenig aussagekräftigen Evidenz zum Thema „Rauchen und COVID-19“ liefern zwei auch Autoren der Cochrane Tobacco Addiction Group (auf Englisch).

COVID-19: Rauchstopp jetzt erst recht

Die außergewöhnliche Zeit, die wir alle während der aktuellen COVID-19-Pandemie, erleben, ist für viele Raucher eine besondere Herausforderung. Manch einer greift nun vielleicht erst recht zur Zigarette -- sei es aus Langeweile, Angst oder Unsicherheit. Dabei kann man gerade diese Zeit des Physical Distancings auch dazu nutzen, mit dem Rauchen aufzuhören. Das ist auf jeden Fall eine sehr gute Idee. Selbst wenn sich ein Zusammenhang zwischen Rauchen und COVID-19 nicht bestätigen sollte: Die anderen Gesundheitsrisiken für Raucher und ihre Mitmenschen sind seit langer Zeit bestens belegt und auch ohne Pandemie ein nicht kleinzuredender Grund, dem Tabak zu entsagen.

Eben darum fordert die WHO nun dringend dazu auf, mit dem Rauchen aufzuhören. Denn nur so können die damit verbundenen Risiken sowohl für die Raucher selbst als auch die Passivraucher minimiert werden.

Schluss mit dem Rauchen – aber wie?

Die Sonderkollektion der Cochrane Library „Coronavirus (SARS-CoV-2) -- Rauchentwöhnung während der COVID-19-Pandemie“ führt Cochrane-Evidenz zum Thema Rauchstopp zusammen.

Die Sammlung enthält bisher sieben Reviews und fasst die vorhandene Evidenz in folgende drei Untergruppen zusammen:

  1. Medikamentöse Behandlungen und Unterstützung, u. a. auch durch Nikotinersatzprodukte für Schwangere
  2. Unterstützung zur Verhaltensänderung
  3. Interventionen zum schrittweisen Aufhören

Interventionen, die den Vorgang des Rauchens imitieren, insbesondere E-Zigaretten, wurden von dieser Sonderkollektion ausgeschlossen, da die Risiken ihrer Verwendung vor dem Hintergrund der aktuellen Pandemie -- wie oben angedeutet -- unklar sind. Die Sammlung wurde von der Cochrane Tobacco Addiction Group erstellt und wird regelmäßig aktualisiert. Alle Zusammenfassungen der Cochrane Reviews dieser Special Collection wurden ins Deutsche übersetzt und die Volltexte sind weltweit frei zugänglich.

Mit dieser Sammlung von Reviews will auch Cochrane dazu beitragen, die seit langem bestehende „Tabak-Epidemie“ weiter zurückzudrängen – denn ganz unabhängig von COVID-19 gilt: Zum Aufhören ist „jetzt“ immer die beste Zeit.

Text: Anne Borchard, Andrea Puhl, Georg Rüschemeyer

Weitere nationale Informationen und Hilfestellungen zum Thema Rauchstopp mit bzw. ohne Bezug zu COVID-19 finden sich auch auf folgenden Websites:

Deutschland:Rauchfrei: https://www.rauchfrei-info.de/informieren/rauchen-gesundheit/corona/
Gesundheitsinformationen.de: https://www.gesundheitsinformation.de/rauchen.2080.de.html
Aktionsbündnis Nichtrauchen zum 31. Mai: https://www.abnr.de/weltnichtrauchertag/2020-lass-dich-nicht-manipulieren/Österreich:Medizin Transparent: https://www.medizin-transparent.at/corona-nikotin/
Gesundheit.gv.at: https://www.gesundheit.gv.at/service/beratungsstellen/nikotinsucht-beratungSchweiz:Stopsmoking.ch: https://www.stopsmoking.ch/de/ich-informiere-mich/corona/
Bundesamt für Gesundheit BAG: https://www.bag.admin.ch/bag/de/home/gesund-leben/sucht-und-gesundheit/tabak/gesundheitliche-folgen-rauchen/nikotinabhaengigkeit-tabakentwoehnung.html
Lungenliga: https://www.lungenliga.ch/de/die-lungen-schuetzen/tabak-und-nikotin/rauchstopp.html Lungenliga


Aktiv gegen akute Atemwegsinfektionen – kann körperliche Betätigung schützend wirken?

Wed, 05/20/2020 - 12:47

Wer sich regelmäßig sportlich betätigt, hält sich körperlich fit. Aber schützt Bewegung auch vor Schnupfen, Halsschmerzen oder Husten? Ein aktualisierter Cochrane Review hat sich dieser Frage angenommen und untersucht, ob regelmäßige Bewegung das Auftreten, die Dauer und den Schweregrad von akuten Atemwegsinfektionen reduzieren kann.

Gestern war noch alles in Ordnung. Den ganzen Tag über fühlte ich mich fit und war abends noch joggen. Heute Morgen wache ich jedoch mit Halsschmerzen und verstopfter Nase auf. Der erste Gedanke, der mir durch den Kopf schießt: Oh nein, hat´s mich jetzt mit COVID-19 erwischt? Nervös messe ich meine Temperatur. 37,0°C, okay. Habe ich mich gestern Abend vielleicht einfach ‘verkühlt‘? Mir ist bewusst, dass es durch die momentan stark schwankenden Temperaturen und unpassender Kleidung schnell dazu kommen kann, dass man sich erkältet. Doch warum habe ich heute Halsschmerzen, obwohl ich gestern Sport gemacht habe? Schützt regelmäßige Bewegung doch nicht gegen Infektionen?

Ein aktualisierter Cochrane Review ging dieser Frage nach und untersuchte, ob regelmäßige Bewegung das Auftreten, die Dauer und den Schweregrad von akuten Atemwegsinfektionen reduzieren kann.

Akute Atemwegsinfektionen

Unter dem Ausdruck „akute Atemwegsinfektionen (ARE)“ wird ein Spektrum ansteckender Krankheiten zusammengefasst, die die oberen (Rachen/Stimmbänder) oder unteren (Bronchien) Atemwege betreffen. Demnach zählen eine unkomplizierte Erkältung, eine Bronchitis oder auch Lungenentzündung dazu. Alle akuten Atemwegsinfektionen haben gemeinsam, dass sie durch Mikroorgansimen (z. B. Viren, Bakterien, Pilze) verursacht werden – also ansteckend sind – und nicht länger als 30 Tage andauern.

Akute Atemwegserkrankungen sind die am häufigsten auftretenden akuten Erkrankungen weltweit [1]. So stehen diese beispielsweise in Deutschland mit ca. 17.000 Todesfällen pro Jahr in Zusammenhang, wobei jedoch jährliche und saisonale Schwankungen zu berücksichtigen sind [2].

Hilft mir Bewegung dabei, gesund zu bleiben?

Ja, regelmäßige Bewegung ist gesund und wirkt nachweislich schützend gegen eine Reihe von Erkrankungen, wie z.B. kardiovaskuläre Erkrankungen und einige Krebsarten. Die Bewegungsempfehlungen der World Health Organisation (WHO) gibt es hier.

Mit Blick auf das Immunsystem, welches uns vor Krankheitserregern schützt, kann Bewegung (mäßige bis kräftige Intensität, weniger als 60 Minuten) eine positive Wirkung haben. Durch die Anregung des Körperkreislaufs wird der kontinuierliche Austausch verschiedener Immunzellen zwischen Körperkreislauf und Gewebe beschleunigt, was langfristig die Immunabwehraktivität verbessern kann. Übermäßige körperliche Beanspruchung (Leistungssport) führt hingegen zum gegenteiligen Effekt und schwächt die Immunabwehr eher [3].

Bei der Behandlung von akuten Atemwegsinfekten gab es Hinweise darauf, dass Bewegung die Gesundheit im Allgemeinen verbessert und das Auftreten, den Schweregrad und die Dauer von akuten Atemwegsinfektionen reduzieren kann [4].

Cochrane Evidenz zur Wirkung von Bewegung auf das Auftreten, den Schweregrad und die Dauer akuter Atemwegsinfektionen

In diesem aktualisierten Cochrane Review schlossen die Autoren insgesamt 14 Studien (1.377 Teilnehmer) ein, die zwischen 1990 und 2018 veröffentlicht wurden. Neun Studien stammten aus den USA und jeweils eine aus Brasilien, Kanada, Portugal, Spanien und der Türkei. Die Stichprobengröße der einzelnen Studien variierte zwischen 16 und 419 Teilnehmern im Alter von 18 bis 85 Jahren. Ebenso unterschied sich der Anteil an weiblichen Teilnehmern und lag je nach Studie zwischen 52 % und 100 %. Bereits diagnostizierte chronische Atemwegserkrankungen der Teilnehmer spielten bei Ein – oder Ausschluss keine Rolle.

Bei der Gruppe, die die zu untersuchende Behandlung (Intervention) erhielt, wurden mindestens dreimal pro Woche Bewegungseinheiten verschrieben und überwacht. Bei den meisten Studien dauerte eine Einheit (Gehen, Radfahren, Laufband oder eine Kombination) 30 bis 45 Minuten und wies eine mittlere Intensität auf. Die Studiendauer reichte von sieben Tagen bis zu zwölf Monaten. Bei dreizehn Studien wurde der Interventionsgruppe Gruppentraining verschrieben. Dieses wurde überwacht und angeleitet durchgeführt. Bei einer Studie fanden die Einheiten bei den Teilnehmern ohne Überprüfung zuhause statt. Die Kontrollgruppe erhielt keine Bewegungseinheiten oder nur eine medikamentöse Basisbehandlung.

Um die Wirksamkeit der Bewegungseinheiten messen zu können, wurden die Interventions- und Kontrollgruppen unter anderem hinsichtlich folgender Ergebniskriterien (Endpunkte) vor und nach dem Interventionszeitraum untersucht.

  • Primäre Endpunkte: Anzahl von akuten Atemwegsinfektionen pro Person pro Jahr, Anteil von Teilnehmern, die über den Studienzeitraum hinweg eine akute Atemwegsinfektion erlitten, Schweregrad der Symptome, Anzahl der Symptomtage innerhalb des Interventionszeitraums (12 Wochen), Anzahl der Symptomtage pro erlebte Krankheitsepisode.
  • Sekundäre Endpunkte: Immunparameter, Lebensqualität, Kosten für den Patienten, belastungsbedingte Verletzungen, Einhaltung der Gruppenintervention
Ergebnisse

Die Anzahl akuter Atemwegsinfektionen pro Person und Jahr unterschied sich nicht zwischen der Interventions- und Kontrollgruppe. Auch gab es weder Unterschiede zwischen den Gruppen bezüglich des Anteils von Teilnehmern, die während des Studienzeitraums eine akute Atemwegsinfektion erlitten noch hinsichtlich der Anzahl an Symptomtagen pro Krankheitsepisode. Eine signifikant positive Wirkung hatten die Bewegungseinheiten in Bezug auf die Schwere der Symptome einer akuten Atemwegsinfektion (Mittelwertdifferenz (MD) −103.57 Punkte 95% KI −198,28 bis −8,87) sowie hinsichtlich der Gesamtanzahl der Symptomtage während des Untersuchungszeitraums (MD –2,24 Tage, 95% KI –3,50 bis –0,98). Bezüglich der sekundären Endpunkte gab es keine Unterschiede zwischen den Gruppen.

Fazit

Die Ergebnisse des Cochrane Reviews weisen darauf hin, dass körperliche Bewegung die Schwere der Symptome von akuten Atemwegsinfektionen (zwei Studien) sowie die Dauer (vier Studien) der Symptome positiv beeinflussen kann. Da die Vertrauenswürdigkeit der Studien (Evidenz) als niedrig bewertet wurde, ist die Aussagekraft der Ergebnisse jedoch eingeschränkt.

Text: Maren Fendt

Quellen:

  1. Shi T, Arnott A, Semogas I, et al. The Etiological Role of Common Respiratory Viruses in Acute Respiratory Infections in Older Adults: A Systematic Review and Meta-analysis. The Journal of Infectious Diseases 2019.
  2. Steppuhn H, Buda S, Wienecke A. Zeitliche Trends in der Inzidenz und Sterblichkeit respiratorischer Krankheiten von hoher Public-Health-Relevanz in Deutschland. Journal of Health Monitoring: Robert Koch-Institut, Berlin, 2017.
  3. Nieman DC, Wentz LM. The compelling link between physical activity and the body’s defense system. Journal of Sport and Health Science 2019; 8(3): 201-17.
  4. Barrett B, Hayney M, Muller D, Rakel D, Brown R, Zgierska A. Meditation or exercise for preventing acute respiratory infection (MEPARI-2): A randomized controlled trial. PLoS ONE 2018; 13.

Anmerkung: Aus Gründen der besseren Lesbarkeit wird auf die gleichzeitige Verwendung männlicher und weiblicher Sprachformen verzichtet. Sämtliche Personenbezeichnungen gelten gleichermaßen für alle Geschlechter.

2.16 Konfidenzintervalle sollten angegeben werden

Thu, 05/14/2020 - 09:47

Dies ist der 28. Beitrag einer Blogserie zu „Schlüsselkonzepten zur besseren Bewertung von Aussagen zu Behandlungen“, die im Rahmen des Projektes Informed Health Choices erarbeitet wurden. Jeder der insgesamt 36 Blogbeiträge befasst sich mit einem Schlüsselkonzept, das dabei hilft, Aussagen zu Wirkungen von Behandlungen besser verstehen und einordnen zu können.

Sicherlich sind auch Sie bei der Auswertung von wissenschaftlicher Literatur oder im Rahmen Ihrer eigenen Forschungsarbeiten schon einmal auf das unschuldig aussehende „p“ gestoßen. Meiner Erfahrung nach sind die meisten Menschen zwar mit p-Werten vertraut. Nur wenige können jedoch erklären, was sie bedeuten.

Dieses Wirrwarr sowie ein grassierender Fehlgebrauch haben dazu geführt, dass das „p“ zu einem umstrittenen Thema geworden und sogar aus einigen Fachzeitschriften völlig verbannt worden ist. In diesem Beitrag wird diskutiert, weshalb die Verwendung von p-Werten zur Darstellung von Ergebnissen problematisch sein kann. Es werden Alternativen erkundet, die eventuell besser dazu geeignet sind, Informationen über das Vertrauen in die Studienergebnisse zu vermitteln.

Bei der Beschreibung von Forschungsergebnissen ist die wichtigste Zahl, die angegeben wird, der Punktschätzer (z. B. ein Unterschied im Risiko zwischen zwei Gruppen, Risikodifferenz genannt). Dieser Wert ist die „beste Schätzung“ des wahren Unterschieds. Da Studien jedoch nur an einer Stichprobe aus der größeren interessierenden Grundgesamtheit durchgeführt werden, weicht die Punktschätzung für die Stichprobe unweigerlich vom unbekannten wahren Unterschied zwischen den Gruppen ab. Das heißt, der wahre Unterschied kann größer oder kleiner als der geschätzte Wert sein. Dies kann entweder durch Bias, Zufallsfehlern auf Basis der Stichprobenauwahl („Zufall“) oder eine Kombination aus beidem bedingt sein.

In der Forschung werden statistische Untersuchungen dazu verwendet, Daten darüber zu erhalten, wie wahrscheinlich es ist, dass der beobachtete Unterschied lediglich zufallsbedingt zustande gekommen ist. Üblicherweise wird ein p-Wert berechnet. Das „P“ steht für ‘Probabilität‘, und bezieht sich auf die Wahrscheinlichkeit, Unterschiede zu beobachten, die genauso groß wie die in der Studie beobachteten oder größer sind, wobei davon ausgegangen wird, dass in Wirklichkeit kein wahrer Unterschied besteht (d. h. es wird davon ausgegangen, dass die Nullhypothese wahr ist).

Eine hypothetische Studie

In einer Präventionsstudie untersuchen wir den Unterschied zwischen zwei Gruppen (einer Behandlungs- und einer Placebogruppe) im Risiko, die Krankheit X zu entwickeln. Wir stellen fest, dass das Risiko in der Behandlungsgruppe geringer ist als das Risiko in der Placebogruppe. Unser statistischer Test ergibt für die Risikodifferenz einen niedrigen p-Wert von p = 0,001.


Dies bedeutet, dass es sehr unwahrscheinlich ist, dass derselbe Unterschied beobachtet worden wäre, wenn kein wahrer Unterschied zwischen den Vergleichsgruppen bestünde (Nullhypothese). In anderen Worten: wir können uns ziemlich sicher sein, dass dieser Unterschied im Risiko wirklich besteht, und dass unsere Behandlung das Risiko, Krankheit X zu entwickeln, verringert. In Wahrheit werden wir es nie sicher wissen. Selbst bei einem niedrigen p-Wert besteht weiterhin die Möglichkeit, dass die Nullhypothese fälschlicherweise verworfen wird, obwohl sie tatsächlich wahr ist (ein „falsch-positiver“ Wert). Dies wird als Fehler 1. Art bezeichnet.

Statistische Hypothesenprüfung

Wie groß darf der Fehler 1. Art sein, um noch akzeptabel zu sein? Genau an dieser Stelle kommt das Konzept der statistischen Hypothesentestung ins Spiel. Bei einem Hypothesentest wird der p-Wert im Vergleich zu einem vorab festgelegten Grenzwert (Signifikanzniveau) ermittelt, der angibt, wie groß der Fehler 1. Art sein darf, der noch toleriert werden kann (häufig 0,05 oder 5 %). Das Konzept ist ziemlich einfach: wenn p < 0,05, werden die Ergebnisse als „statistisch signifikant“ betrachtet. Wenn nicht, sind die Ergebnisse „statistisch nicht signifikant“. Aber weshalb genau 0,05? Dieser Grenzwert ist völlig willkürlich gewählt. Wie Rosendaal sagt: „Es steckt keine Logik dahinter. Es gibt keine mathematische oder biologische Begründung, die einen Grenzwert von 5 % stützt [3]. Leider herrscht in der heutigen Forschung ein großer Druck, „statistisch signifikante“ Ergebnisse auf Basis eines auf diesem willkürlich festgelegten Grenzwert basierenden Hypothesentests zu erhalten.

Beachten Sie, dass bis jetzt noch nichts über die tatsächliche Punktschätzung/Effektgröße für unsere Beispielstudie gesagt worden ist! Genau das ist das Problem mit p-Werten und der Signifikanztestung: Wir haben unser Augenmerk darauf gerichtet, dass wir uns relativ sicher sind, dass unser Ergebnis nicht rein zufällig zustande gekommen ist, aber wir haben tatsächlich keine Vorstellung davon, ob das Ergebnis in irgendeiner Form nützlich oder klinisch relevant ist!

Ein „statistisch signifikantes Ergebnis“ weist daher nicht notwendigerweise auf ein wichtiges Ergebnis hin. Selbst ein trivial kleiner Effekt (ohne klinische Relevanz) kann aufgrund eines niedrigen p-Werts als „signifikant“ erachtet werden. Dies ist nicht unüblich in großen Studien oder Studien, in denen viele Hypothesen getestet werden (1/20 sind bei einem Signifikanzniveau von 0,05 rein zufällig signifikant).

Am anderen Ende des Spektrums ist es auch möglich, einen großen Punktschätzer für einen Effekt mit einem nicht signifikanten p-Wert (z.B. p = 0,10) zu erhalten. Dies kommt insbesondere bei kleinen Stichprobengrößen oder großen Studien vor, die kleine geschichtete (stratifizierte) Untergruppen untersuchen. Leider werden nicht signifikante p-Werte häufig mit „keine Wirkung“ verwechselt und werden potenziell bedeutsame Ergebnisse von zu kleinen („underpowered“) Studien einfach unberücksichtigt gelassen.

Wenn Ergebnisse nur mit p-Werten und/oder einer Aussage über die „statistische Signifikanz“ dargestellt werden, wird die wichtigste Information außer acht gelassen: die Punktschätzung. Mittlerweile denken Sie bestimmt, wie gut es wäre, eine alternative Methode für die Darstellung der Unsicherheit in Zusammenhang mit der tatsächlichen Größe und Richtung des Effekts zu haben? Glücklicherweise gibt es hier eine andere Option!

Konfidenzintervalle

Wenn wir die Unsicherheit bezüglich eines Ergebnisses kommunizieren möchten, ist es viel besser, ein Konfidenzintervall (KI; Konfidenz = Vertrauen) zu verwenden. Ein KI ist ein symmetrischer Wertebereich, in dem die Ergebniswerte wiederholter Experimente wahrscheinlich liegen. Unser Punktschätzer liegt in der Mitte dieses Bereichs. Die Breite des KIs stellt den Fehlerbereich dar und wird mittels der Verteilung der Daten, der Stichprobengröße und einer Stichprobenverteilung berechnet, die auch zur Berechnung von p-Werten verwendet werden. Der wichtige Unterschied hier ist, dass das KI einen besseren Bezugsrahmen als der p-Wert vermittelt, weil es die Richtung des Effekts zeigt (d. h. zum Beispiel ob eine Behandlung das Sterberisiko erhöht oder senkt), und weil es in denselben Einheiten wie die Punktschätzung angegeben wird, während es gleichzeitig auch die Unsicherheit der Schätzung angibt.

Das Konfidenzniveau (90 %, 95 %, 99 %, usw.), das für das KI gewählt wird, ist völlig willkürlich. Üblicherweise wird in der medizinischen Forschung ein Niveau von 95 % verwendet, da diese Zahl dem uns vertrauten Signifikanzniveau von 0,05 entspricht. Was bedeutet dieser Prozentsatz? Eine häufige Fehlinterpretation ist, dass der wahre Wert 95 % der Fälle in diesem Bereich liegt. Stattdessen bedeutet ein 95 % KI jedoch nur, dass, wenn dasselbe Experiment wieder und wieder mit verschiedenen Stichproben der interessierenden Grundgesamtheit durchgeführt wird, der wahre Wert in 95 % dieser Studien innerhalb des KIs liegt (ausgehend von der Annahme, dass alle Voraussetzungen zur richtigen Berechnung des KIs erfüllt sind).

Die Breite des KI zeigt die Präzision des Punktschätzers an. Bspw. kann ein Punktschätzer eines Unterschieds von 5,5 ein 95 % KI von 3,5 bis 7,5 aufweisen (Breite von 4 Einheiten). Ein schmaleres Intervall, das einen Bereich von zwei Einheiten (z. B. 95 % KI, 4,5 bis 6,5) umfasst, ergibt eine präzisere Schätzung derselben Effektgröße als ein breiteres KI mit derselben Effektgröße (z. B. 95 % KI, 3,5 bis 7,5).

Nehmen wir beispielsweise an, eine bestimmte Behandlung reduziere das Sterberisiko im Vergleich zu einer Placebobehandlung mit einem Odds Ratio (Chancenverhältnis) von 0,5 und einem 95 % KI von 0,2 bis 0,8. Dies bedeutet, dass die Behandlung in unserer Stichprobe das Sterberisiko im Vergleich zu der Placebobehandlung um 50 % verringert hat, und dass die wahre Verringerung des Risikos irgendwo zwischen 20 % und 80 % liegt.

Es ist wichtig zu beachten, dass ein Konfidenzintervall keine einheitliche Wahrscheinlichkeitsverteilung darstellt, dass die Werte, die am dichtesten am Punktschätzer liegen, wahrscheinlich eher wahr sind als die Werte an den äußeren Enden des Intervalls.

Für diejenigen, die auf statistischen Hypothesentests bestehen – Konfidenzintervalle liefern Ihnen sogar auch diese Information. Wenn Ihr KI den Nullhypothesenwert nicht umfasst (z. B. für eine Risikodifferenz: Nullhypothese = 0, für ein relatives Risiko: Nullhypothese = 1), dann ist Ihr Ergebnis „statistisch signifikant“ (auf dem dem Signifikanzniveau des KIs entsprechenden Niveau). Wenn der Nullhypothesenwert innerhalb des Intervalls liegt, ist das Ergebnis „nicht statistisch signifikant“. Es ist jedoch wichtig sich daran zu erinnern, dass diese „zweigeteilte“ Denkweise aus den bereits erwähnten Gründen problematisch sein kann.

Eine großartige Ressource, die Sie sich anschauen können, ist eine von Steven Woloshin erstellte animierte Folienpräsentation, in der dargestellt ist, wie das Cochrane-Logo entwickelt wurde und was es aussagt.

Schlussfolgerung

Zusammengefasst lässt sich feststellen, dass p-Werte sehr irreführend sein können, insbesondere, wenn sie in Verbindung mit statistischen Hypothesentests ohne entsprechende Punktschätzer und Konfidenzintervalle dargestellt werden. Ihre Verwendung lenkt von möglicherweise interessanten Ergebnissen ab, die den Signifikanzschwellenwert aufgrund von Faktoren wie beispielsweise einer geringen Zahl von Ergebnisereignissen erreichen. Wenn Ergebnisse nicht veröffentlicht werden, weil sie „nicht statistisch signifikant“ sind (was nicht dasselbe wie das Ergebnis „keine Assoziation“ ist), führt dies zu schädlichem Publikations-Bias.

Anstatt sich auf wenig aussagekräftige p-Werte zu berufen, möchte ich Sie dazu ermuntern, Ergebnisse unter Verwendung von Punktschätzern und ihren aussagekräftigeren Konfidenzintervallen darzustellen und skeptisch zu sein bei Forschungsergebnissen und Behauptungen, die diese Informationen nicht vermitteln.

Text: Jessica Rohmann

Übersetzt von: Brita Fiess

Zum Originaltext

Literaturhinweise im Originaltext

Anmerkung

Aus Gründen der besseren Lesbarkeit wird auf die gleichzeitige Verwendung männlicher und weiblicher Sprachformen verzichtet. Sämtliche Personenbezeichnungen gelten gleichermaßen für alle Geschlechter.

Helfen positive Erwartungen bei Rückenschmerzen?

Thu, 05/07/2020 - 07:55

In unserer Themenserie „Wenn der Rücken schmerzt“ haben wir Ihnen Cochrane Evidenz zu verschiedenen Behandlungsmaßnahmen bei Kreuzschmerzen vorgestellt. Dabei ging es in erster Linie um die Wirksamkeit der Maßnahmen. Nun ist ein neuer Cochrane Review der Frage nachgegangen, ob persönliche Erwartungen an den Verlauf von Kreuzschmerzen oder eine Behandlungsstrategie das Ergebnis beeinflussen können.

Hilft Bewegung bei Kreuzschmerzen?

Auch Physiotherapeuten können Kreuzschmerzen bekommen…! Und ja, so haben auch wir, die beiden Autorinnen dieses Beitrags – beide Physiotherapeutinnen – unsere eigenen Erfahrungen mit Kreuzschmerzen, die uns von Zeit zu Zeit mal ärgern. Gut zu wissen, dass Kreuzschmerzen in den meisten Fällen (80-90%) auf keine bestimmte („spezifische“) behandelbare Ursache zurückzuführen sind und daher als „nicht-spezifisch“ bezeichnet werden. Wir beide sind uns dabei einig, was wir gegen unsere Kreuzschmerzen tun: wir versuchen uns mehr zu bewegen, gehen regelmäßiger zum Sport und vermeiden langes Sitzen bzw. das „Sich-nicht-Bewegen“. Und erwarten, dass wir hierüber unsere Schmerzen schnell und wirksam in den Griff bekommen. Was bei uns auch tatsächlich der Fall ist. Die Wissenschaft gibt uns übrigens recht, wie Sie auch in unserer Themenserie nachlesen können: Bewegung hilft bei Kreuzschmerzen!

Dennoch gibt es Menschen, die anders darüber denken, was die beste Vorgehensweise bei Kreuzschmerzen ist. In der physiotherapeutischen Praxis erleben wir immer wieder Patienten mit Kreuzschmerzen, die mit der Erwartung kommen, dass Schonung oder passive Behandlungsmaßnahmen, zum Beispiel Massagen und Fango oder Elektrotherapie, die besseren Maßnahmen sind, und dass aktive Behandlungsmaßnahmen, das heißt Bewegungsübungen bzw. Training, nicht bzw. weniger helfen. Nicht immer ist es für uns einfach, unsere Patienten von den Vorteilen einer aktiven Strategie zu überzeugen. Gelingt es jedoch nicht, die Erwartungshaltung des Patienten gegenüber einer aktiven Strategie zum positiven zu beeinflussen, kann das Ergebnis einer solchen Behandlung allein aus diesem Grund ein negatives sein – so unsere Beobachtung aus der Praxis.
Dies führt zu der Frage, ob persönliche Erwartungen an den Verlauf von Kreuzschmerzen oder an eine bestimmte Behandlungsstrategie den tatsächlichen Verlauf bzw. die tatsächliche Wirksamkeit einer Behandlung beeinflussen können:

Kann es sein, dass eine positive Erwartung zu einem besseren Ergebnis führt, zum Beispiel zu einer schnelleren Schmerzfreiheit?

Welche Rolle spielt unsere Erwartung an eine Behandlungsstrategie?

Niemand ist gänzlich frei von Vorstellungen und Erwartungen an die Wirksamkeit einer bestimmten Behandlungsstrategie (darunter verstehen wir in diesem Beitrag auch Vorgehensweisen wie „abwarten und nichts tun“) für ein bestimmtes Beschwerde- oder Krankheitsbild.

Unsere Vorstellungen und Erwartungen können dabei von verschiedenen Faktoren geprägt werden, darunter

  • unsere persönlichen Erfahrungen mit Beschwerden und Behandlungsmaßnahmen,
  • was uns ein Arzt über die Behandlung erzählt,
  • was wir über sie in den Medien hören oder lesen,
  • welche Erfahrungen Verwandte, Freunde oder Nachbarn berichten,
  • welche grundsätzlichen Ansichten wir über sie haben.

Abhängig davon, was wir hören, lesen oder denken, können wir eine positive Erwartung an eine Behandlung bzw. Vorgehensweise haben, das heißt zuversichtlich sein, dass sie uns helfen wird. Andererseits können wir aber auch eine negative Erwartung haben, das heißt der Ansicht sein, dass sie entweder keine Besserung bringt oder uns möglicherweise sogar schaden wird. Kommt Ihnen vielleicht das ein oder andere eigene Beispiel in den Sinn…?

Ein wichtiger Punkt dabei: Erwartungen sind keine feste, unveränderbare Größe, sondern sie sind beeinflussbar. So kann z. B. eine negative Erwartung bezüglich einer Behandlungsmaßnahme durch Information oder Aufklärung in eine positive übergehen – was bedeutsam ist, wenn dies zu einem besseren Ergebnis führt, wie z. B. zu einer größeren Schmerzlinderung.

Die Frage, ob persönliche Erwartungen einen Einfluss auf den Verlauf von Beschwerden oder ein Behandlungsergebnis haben, ist seit langem Gegenstand wissenschaftlicher Forschung. Nun hat ein kürzlich veröffentlichter Cochrane Review die verfügbare Evidenz zum Einfluss persönlicher Erwartungen auf den Verlauf bzw. das Ergebnis unterschiedlicher Behandlungsmaßnahmen bei Kreuzschmerzen zusammengefasst.

Cochrane Evidenz zu Genesungserwartungen bei Kreuzschmerzen

In dem im November 2019 veröffentlichten Review wurden Studien zusammengefasst, in denen untersucht wurde, ob es bei Menschen mit nicht-spezifischen Kreuzschmerzen Zusammenhänge zwischen „individuellen Genesungserwartungen“ und verschiedenen kreuzschmerzbezogenen Ergebnissen gibt. Studien, deren Ziel es ist zu ermitteln, ob bestimmte Faktoren (Prognosefaktoren) ein zukünftiges Ergebnis vorhersagen (prognostizieren) können, werden auch „Prognosestudien“ genannt. Der vorliegende Review ist einer der ersten Cochrane Reviews, die zu einer Prognose-Fragestellung erstellt worden sind.

Die in den Studien erhobenen „Genesungserwartungen“ konnten dabei unterschiedliche Arten von Erwartungen sein, wie die allgemeine Erwartung an die Genesung von den Kreuzschmerzen oder die Erwartung an ein konkretes Behandlungsergebnis. Die wichtigsten interessierenden Ergebnisse waren solche zur Teilhabe am Arbeitsleben (Rückkehr an den Arbeitsplatz, Abwesenheitszeiten, Dauer des Bezugs von Lohnersatzzahlungen) sowie die für den einzelnen Patienten bedeutsame Beschwerdeverbesserung, das Ausmaß funktioneller Einschränkungen sowie die Schmerzstärke.

Studien, die Zusammenhänge wie diese untersuchen, sind in der Regel so gestaltet, dass zu Beginn der Studie die Erwartung jedes einzelnen Studienteilnehmers erhoben wird. Danach folgt eine Phase, in der eine Behandlung oder andere Vorgehensweise stattfindet. Am Ende, ggf. auch zu einem späteren Zeitpunkt, wird das Ergebnis erhoben. Anschließend wird anhand statistischer Berechnungen ermittelt, ob es einen Zusammenhang zwischen der Erwartung und dem Ergebnis gibt. Ein möglicher Zusammenhang kann sein, dass diejenigen Teilnehmer, die beim Studienbeginn zuversichtlich waren, nach einer bestimmten Zeit wieder an den Arbeitsplatz zurückkehren zu können, am Ende auch eher tatsächlich wieder arbeitsfähig waren.

In Box 1 finden sich einige allgemeine Informationen zu dem Review und den 60 in ihn eingeschlossenen Studien. Weitere Informationen finden sich auch in der laienverständlichen Zusammenfassung.

Ergebnisse: Genesungserwartungen können einen Einfluss haben!

Der Review zeigt: Genesungserwartungen können sehr unterschiedlich definiert werden: in den 60 Studien wurden sie auf sehr unterschiedliche Art erhoben. Häufig wurde erhoben, für wie wahrscheinlich es die Teilnehmer hielten, innerhalb von sechs Monaten an den Arbeitsplatz zurückzukehren. Weitere Fragen warten zum Beispiel „Wie groß ist, Ihrer Ansicht nach, das Risiko, dass Ihre Beschwerden länger anhalten werden?“ oder „Was denken Sie, wie hilfreich wird Behandlung X sein?“

Die Auswertung der Studien ergab einen starken Zusammenhang zwischen positiven Genesungserwartungen und einer besseren Teilhabe am Arbeitsleben. Die Vertrauenswürdigkeit der Evidenz für dieses Ergebnis wurde als moderat eingestuft. Dies bedeutet, dass weitere Forschung wahrscheinlich einen bedeutsamen Einfluss auf das Vertrauen in die Ergebnisse haben und diese möglicherweise verändern wird. Zudem gab es Hinweise auf einen Zusammenhang zwischen positiven Ergebniserwartungen und einer klinisch bedeutsamen Besserung der Beschwerden. Die Vertrauenswürdigkeit der Evidenz für dieses Ergebnis wurde jedoch als niedrig eingestuft. Dies bedeutet, dass weitere Forschung sehr wahrscheinlich einen bedeutsamen Einfluss auf das Vertrauen in die Ergebnisse haben und diese wahrscheinlich verändern wird. Die dargestellten Ergebnisse bezogen sich auf eine Nachuntersuchung nach ungefähr 12 Monaten. Der Zusammenhang von Genesungserwartungen mit anderen Ergebnissen wie dem Ausmaß funktioneller Einschränkungen oder der Schmerzstärke war weniger klar. Die Vertrauenswürdigkeit der Evidenz für diese Ergebnisse wurde als sehr niedrig bzw. niedrig eingestuft. Eine sehr niedrige Vertrauenswürdigkeit bedeutet, dass die Ergebnisse sehr unsicher sind.

Keine der Studien erbrachte einen Hinweis darauf, dass positive Genesungserwartungen mit einer Verschlechterung der Kreuzschmerzen zusammenhängen können.

Was bedeuten die Ergebnisse?

Die Autoren folgern aus den Ergebnissen, dass es wahrscheinlich einen starken Zusammenhang zwischen positiven Genesungserwartungen und einer besseren Teilhabe an der Arbeitstätigkeit (Arbeitsfähigkeit) sowie möglicherweise einen Zusammenhang zwischen positiven Ergebniserwartungen und einer klinisch bedeutsamen Beschwerdeverbesserung gibt. Die Autoren weisen darauf hin, dass die Ergebnisse aufgrund der begrenzten Qualität der eingeschlossenen Studien sowie ihrer großen Unterschiedlichkeit insgesamt zurückhaltend betrachtet werden sollten. In diesem Bereich ist weitere Forschung erforderlich.

Trotz der zurückhaltenden Schlussfolgerungen liegt die praktische Bedeutung der Ergebnisse auf der Hand. Die Ergebnisse deuten darauf hin, dass es Sinn machen kann, sich über die „Genesungserwartungen“ frühzeitig Gedanken zu machen. Wo eine Erwartung dem wissenschaftlichen Kenntnisstand entgegensteht – wie zum Beispiel bei unserem Beispiel einer passiven statt einer aktiven Vorgehensweise bei Kreuzschmerzen – können Ärzte oder Therapeuten möglicherweise durch Informationen oder Beratung dazu beitragen, beides zusammenzubringen und hierüber das Ergebnis zu verbessern. Und wenn Patienten Ihre eigenen Erwartungen von sich aus offen äußern, kann dies die gemeinsame Entscheidungsfindung für das bestmögliche Vorgehen erleichtern. Denn: wer will schon nicht möglichst schnell wieder beschwerdefrei sein…!

Weitere Informationen zu Kreuzschmerzen

Alle Beiträge unserer Themenserie zum nicht-spezifischen Kreuzschmerz finden Sie hier. Diese enthalten auch Links zu weiterführenden Informationsquellen, darunter die Nationale Versorgungsleitlinie „Nicht-spezifischer Kreuzschmerz“, die es auch in einer Patientenversion gibt.

Autorinnen: Cordula Braun, Katja Ehrenbrusthoff

Aktualität
(Datum der letzten Suche nach Studien)März 2019Anzahl der Studien (Teilnehmer)60 Studien (30.530 Teilnehmer),
davon 52 Studien (28885 Teilnehmer) mit für die Auswertung nutzbaren DatenStudienorte (Anzahl)Europa (35), Nordamerika (21), Australien (4)Studienteilnehmer
(wesentliche Merkmale)Frauen/Männer: Anteile vergleichbar
Alter: durchschnittlich zw. 34 und 74 Jahren
Beschwerdedauer: Studiengruppen größtenteils Patienten mit chronischen Kreuzschmerzen (37%) oder mit Kreuzschmerzen von unterschiedlicher Dauer (31%)Kritische Bewertung der StudienMit QUIPS Tool und GRADE (modifiziert)Einstufung der Vertrauenswürdigkeit der EvidenzModerat bis sehr niedrigBox 1: Informationen zu dem Review

Kurzvideos über Grundlagen der Evidenzbasierten Medizin – Teil 2: Confounding, Zufallsfehler und Bias

Thu, 04/30/2020 - 07:42

Was ist beim Interpretieren von Studien zu beachten und wie können Fehlerquellen, die zu verzerrten Ergebnissen führen, möglichst vermieden werden? Das ist das Thema unseres zweiten Kurzvideos aus der Serie zu Grundlagen der Evidenzbasierten Medizin.

Studien haben immer das Ziel, so gut als möglich den wahren Effekt einer Intervention abzubilden. Sogenannte Störfaktoren können genau das aber manchmal verhindern und zu verzerrten Ergebnissen führen. In unserem zweiten Video stellen wir drei Fehlerquellen vor, die diese Gefahr mit sich bringen: Confounding, Zufallsfehler und Bias.

Confounding kommt aus dem Englischen und bedeutet so viel wie „verwirren“ oder „durcheinanderbringen“. Genau das tun Confounder auch – sie verwirren uns bei der Interpretation und führen dazu, dass wir falsche Schlüsse über Ursachen und Wirkungszusammenhänge ziehen. Ein Beispiel: Wir beobachten, dass ein hoher Kaffeekonsum mit schlechter Herzgesundheit zusammenhängt. Bei genauerem Hinsehen stellen allerdings fest, dass speziell Personen, die viel rauchen ein erhöhtes Risiko für Herzerkrankungen haben. Raucherinnen und Raucher trinken auch häufig Kaffee. Würde man den Faktor „Rauchen“ nicht in die Analyse miteinbeziehen, könnte man den falschen Schluss ziehen, dass Kaffeetrinken für die Herzgesundheit schädlich ist.

Es gibt Confounder, die man im Vorfeld einer Studie kennt und die man berücksichtigen kann (z.B. Einteilung der Gruppen in Raucher und Nichtraucher). Es gibt aber auch Confounder, die unbekannt sind. Die einzige Möglichkeit mit diesen umzugehen ist eine Randomisierung – also ein zufälliges Zuteilen der StudienteilnehmerInnen auf die Studienarme.

Zufallsfehler treten auf, wenn das Ergebnis der Studie zufällig vom echten Effekt in der Population abweicht. Wichtig hierbei ist, dass diese Abweichung keine bestimmte Richtung hat. Der Zufallsfehler schlägt vor allem bei kleinen Studien zu. Bei einer Studie mit 40 Personen könnte es leicht passieren, dass Einflussfaktoren wie Alter, Geschlecht, privater und beruflicher Hintergrund sich trotz zufälliger Gruppenzuteilung ungleichmäßig auf die Studienarme aufteilen. Nehmen wir an, dass sich in einer Gruppe mehr ältere Personen befinden als in der anderen. Wenn dann diese Personen am Ende der Studie einen schlechteren Gesundheitszustand haben, kann das mit der Intervention zusammenhängen, es kann aber auch daher kommen, dass diese Personen älter waren. Zufallsfehler können durch umfangreiche Stichprobengrößen eingedämmt werden.

Bias sind systematische Fehler, die beim Design, der Durchführung, oder der Auswertung der Studie entstehen können. Beispielsweise kann das Wissen darüber, wer zur Interventions- und wer zur Vergleichsgruppe gehört, zu Verzerrungen führen. Um das zu vermeiden, werden StudienteilnehmerInnen und Studienpersonal häufig „verblindet“ – das heißt sie werden nicht informiert, wer in der Interventions- oder Kontrollgruppe ist.

Es gibt eine Vielzahl von Bias-Arten, Selektions-Bias, Performance-Bias, Mess-Bias und Attrition-Bias werden in unserem Video näher erklärt, weil sie zum kritischen Bewerten von Studien sehr wichtig sind. Generell gilt, dass Bias bei der kritischen Beurteilung von Studien nicht direkt gemessen werden kann, sondern nur indirekt über die Beurteilung des Studiendesigns und der Ausführung der Studie. Bias kann also durch gutes Studiendesign, gute Durchführung der Studie und angemessene Auswertung der Daten minimiert werden.



Text: Barbara Nußbaumer-Streit, Claudia Christof

2.15 Statistische Vergleiche mit kleinen Stichproben oder wenigen Endpunktereignissen können irreführend sein

Thu, 04/23/2020 - 09:24

Dies ist der 27. Beitrag einer Blogserie zu „Schlüsselkonzepten zur besseren Bewertung von Aussagen zu Behandlungen“, die im Rahmen des Projektes Informed Health Choices erarbeitet wurden. Jeder der insgesamt 36 Blogbeiträge befasst sich mit einem Schlüsselkonzept, das dabei hilft, Aussagen zu Wirkungen von Behandlungen besser verstehen und einordnen zu können.

Immer mehr neue Medikamente, die besser als ihre Vorgänger sein sollen, sättigen unseren pharmazeutischen Markt. Deshalb ist es umso wichtiger, zu prüfen, ob die in Studien vorgenommenen Aussagen und Interpretationen valide sind.

Auch bewährte statistische Methoden zur Bewertung der Wirkung einer Intervention (etwa die eines Arzneimittels) können irreführend sein, wenn das Studiendesign nicht angemessen ist. Das kann zum Beispiel vorkommen, wenn für die Studie zu wenige Personen (also eine zu kleine Stichprobe) rekrutiert wurden, um eine ausreichende Anzahl von Endpunktereignissen zu liefern.

Endpunkte bezeichnen das Ziel einer klinischen Studie. Nehmen wir als hypothetisches Beispiel eine randomisierte kontrollierte Studie, die die Wirkung eines Arzneimittels auf das Risiko eines Herzinfarkts untersuchen soll. Das untersuchte Endpunktereignis wäre also sie Anzahl an Studienteilnehmern, die nach Einnahme des Arzneimittels einen Herzinfarkt erleiden.

Das Problem mit zu kleinen Probandengruppen liegt in einem Mangel an statistischer Trennschärfe oder Power. Diesen Begriff wollen wir hier genauer betrachten. Dazu aber zuerst einmal eine kurze Wiederholung von der Bedeutung statistischer Signifikanz, denn sie geht mit dem der Statistischen Power Hand in Hand:

Die statistische Signifikanz gibt an, ob sich die statistischen Ergebnisse einer Vergleichsstudie über die erhobenen Stichproben hinaus auf eine Grundgesamtheit generalisieren lassen. In anderen Worten, ob der Unterschied, der beim Vergleich zweier oder mehrerer Interventionen in einer Stichprobe von Studienteilnehmern festgestellt wurde, nicht nur auf Zufall beruht, sondern dass man auf Basis dieses Unterschiedes auch eine allgemeingültige Aussage treffen kann.

Signifikanz wird mithilfe des p-Werts – der Irrtumswahrscheinlichkeit – ausgedrückt. Für Werte von 0,05 (5%) und darunter geht man davon aus, dass der beobachtete Unterschied einen tatsächlichen Unterschied zwischen den beiden Studienpopulationen repräsentiert; man spricht von einem „statistisch signifikanten“ Unterschied. Werte über 0,05 dagegen legen nahe, dass der Unterschied sehr wohl auch auf reinem Zufall beruhen könnte – also je größer p-Wert, desto wahrscheinlicher handelt es sich um ein Zufallsergebnis. Statistiker sprechen in diesem Fall vom Risiko eines Fehlers der 1. Art. Eine Grundsatzerklärung der American Statistical Association zu p-Werten und statistischer Signifikanz kann man hier auf Englisch lesen; zu einem erweiterten Verständnis auf Deutsch hilft Wikipedia)

Die statistische Trennschärfe oder Power einer Studie dagegen ist die Wahrscheinlichkeit, dass ein real existierender Effekt auch in der Studie entdeckt wird. Je größer die statistische Power einer Studie, desto geringer ist also die Gefahr, dass sie eine (allgemeine) Wirkung nicht erkennt, obwohl diese in Wirklichkeit vorhanden ist. Statistiker sprechen hier vom Risiko eines Fehlers 2. Art, Mediziner kennen diesen Fehler beispielsweise als falsch-negatives Ergebnis eines diagnostischen Tests.

Wir haben instinktiv mehr Vertrauen in Studien mit großen Stichprobengrößen. Dafür gibt es einen guten Grund: Große Studienpopulationen minimieren den Einfluss von zufälligen Schwankungen in der Zusammensetzung der Vergleichsgruppen und erhöhen dadurch die statistische Power. Studien auf Basis kleiner Populationen liefern oft keine ausreichende Anzahl an Endpunktergebnissen . Dies schwächt die Aussagekraft der Evidenz für oder gegen das Vorhandensein eines Effekts, weil der reine Zufall größeren Einfluss auf die Ergebnisse bekommt.

Man stelle sich beispielweise eine randomisierte kontrollierte Studie (RCT) zur Wirkung eines Herzmittels mit zehn Patienten in einem Studienarm (oder in einer Vergleichsgruppe) und zehn Patienten im anderen Vergleichsarm vor, wobei der primäre Endpunkt die Anzahl von Herzinfarkten in jeder Gruppe ist. Am Ende der Studie gibt es in der Placebogruppe sechs Infarkte und in der Interventionsgruppe drei. Rein rechnerisch scheint die Intervention das relative Risiko für einen Herzinfarkt um 50% reduziert zu haben. Aber kann man sich auf dieses Ergebnis wirklich verlassen? Und wenn nicht: Weshalb?

Man muss nicht Statistiker sein um zu erkennen, dass die Anzahl der Endpunktereignisse womöglich zu klein ist, um sicher sagen zu können, dass die Differenz einen tatsächlichen Unterschied zwischen den Behandlungen und nicht die Auswirkungen des Zufalls widerspiegelt. Selbst wenn jeder Studienarm 1.000 Teilnehmer hätte, die Gesamtzahl an Herzinfarkten in jeder Gruppe jedoch dieselbe bliebe, wäre die Anzahl an Endpunktereignissen immer noch zu gering, um daraus zu folgern, dass die Wirkung der Behandlung wirklich unterschiedlich ist. Genauer gesagt, sechs von 1.000 im Vergleich zu drei von 1.000 ist immer noch zu wenig, um den Zufall mit ausreichender Verlässlichkeit auszuschließen. Die statistische Power hängt also sowohl von der Stichprobengröße, als auch von der Häufigkeit von Endpunktereignissen ab.

Eine Zusammenfassung der wichtigsten Punkte:

  • Geringe Stichprobengrößen tragen normalerweise zu einer geringen statistischen Trennschärfe bei, was wiederum sowohl die Wahrscheinlichkeit für einen Fehler 2. Art (Nichterkennen einer Wirkung der Intervention), als auch für einen Fehler 1. Art (also das Erkennen einer Wirkung, die in Wirklichkeit nicht existiert) erhöht.
  • Bei Studien mit einer geringen Anzahl an Endpunktereignissen ist die Wahrscheinlichkeit größer, dass ihre Ergebnisse rein auf Zufall basieren, selbst wenn die Studien sehr viele Teilnehmer beinhalten.
  • Eine kleine Anzahl an Endpunktereignissen kann die vermeintliche Wirkung von Interventionen aufbauschen (siehe die Halbierung von Herzinfarkten im Beispiel).

Selbstverständlich ist nichts für immer und ewig in Stein gemeißelt, besonders in der Medizin. Studien mit sehr vielen Teilnehmern mögen zwar wünschenswert sein, sind aber oft aus praktischen Gründen kaum machbar. In manchen Situationen wiederum können auch kleine Studien eine ausreichende statistische Power bieten.

Text: Lewis Saunders

Übersetzt von: Brita Fiess

Zum Originaltext

Anmerkungen:

Dieser Blog-Artikel soll in erster Linie für das Problem kleiner Stichproben und seltener Endpunktereignisse sensibilisieren und zum Nachdenken anregen. Ziel des Beitrags ist es also, zum Nachdenken anzuregen und nicht, präzise Antworten zu liefern.

Aus Gründen der besseren Lesbarkeit wird auf die gleichzeitige Verwendung männlicher und weiblicher Sprachformen verzichtet. Sämtliche Personenbezeichnungen gelten gleichermaßen für alle Geschlechter.

Literaturhinweise:

  • Haas, J. P. Sample size and power. American journal of infection control. 2012,Oct;40(8):766-767
  • Dechartres A, Trinquart L, Boutron I, Ravaud P. Influence of trial sample size on treatment effect estimates: meta-epidemiological study. BMJ. 2013 Apr;346:f2304

Was bringen Quarantänemaßnahmen gegen COVID-19? Ein neuer Cochrane Rapid Review sucht nach Antworten.

Wed, 04/08/2020 - 13:25

Ein eben in der Cochrane Library erschienener Rapid Review legt nahe, dass Quarantäne von Personen mit einem erhöhten Infektionsrisiko eine wichtige Maßnahme zur Eindämmung der COVID-19-Pandemie ist. Doch er zeigt auch die Grenzen des evidenzbasierten Ansatzes in einer akuten Bedrohungslage durch ein Virus, das die Menschheit erst seit wenigen Monaten kennt.

Normalerweise dauert es viele Monate, bis ein Cochrane Review reif für die Veröffentlichung ist. Denn jeder Schritt seiner Entstehung, von der Suche nach relevanten Studien bis hin zur abschließenden Begutachtung durch nicht am Review beteiligte Experten (Peer Review), erfordert Sorgfalt – und damit Zeit.

Doch manchmal ist Zeit genau das, was man nicht hat. Das traf selten so deutlich zu, wie in der gegenwärtigen Krise durch die Lungenkrankheit COVID-19. Sie wird durch ein Coronavirus vom Typ SARS-CoV-2 ausgelöst, das bis Ende des vergangenen Jahres noch völlig unbekannt war, inzwischen aber die ganze Welt in seinen Bann zieht. Seit den Anfängen der Pandemie sind Wissenschaftler ausgesprochen fleißig: Die Zahl wissenschaftlicher Publikationen zu COVID-19 geht längst in die Tausende. Aber wer sichtet und bewertet diese Flut wissenschaftlicher Evidenz, wer fasst ihre Ergebnisse zusammen? Wie wichtig es gerade in Krisenzeiten ist, Informationen mit kühlem Kopf kritisch zu bewerten und einzuordnen, zeigen schon die zahlreichen Fake News, die zu COVID-19 durchs Internet schwirren.

Verlässliche, evidenzbasierte Informationen – das ist, wofür Cochrane mit seinen systematischen Übersichtsarbeiten steht. Doch in Zeiten wie diesen steht Cochrane vor der Herausforderung, den bestmöglichen Kompromiss finden zu müssen zwischen dem „Need for Speed“ und dem Anspruch, nur sorgfältig erstellte und geprüfte Übersichtsarbeiten zu veröffentlichen.

Für eben solche dringenden Fälle hat Cochrane Ende 2015 eine eigene Methodengruppe gegründet, deren Mitglieder aus Österreich, Kanada und den USA eine Methodik für sogenannte „Rapid Reviews“ erarbeiten. Das sind Übersichtsarbeiten, die ebenso systematisch wie ein regulärer Cochrane Review, aber mit gewissen methodischen „Abkürzungen“, erstellt werden – mit dem Ziel, die Evidenz binnen weniger Wochen zusammenzufassen. Die Methodengruppe hat kürzlich eine Anleitung veröffentlicht, welche dieser methodischen Abkürzungen bei der Erstellung eines Cochrane Rapid Reviews empfehlenswert sind. Diese Empfehlungen beruhen auf Ergebnissen von Methodenstudien und Experteneinschätzungen.

Im Auftrag der Weltgesundheitsorganisation (WHO) hat ein Team des Departments für Evidenzbasierte Medizin und Evaluation an der Donau-Universität Krems, wo auch Cochrane Österreich angesiedelt ist, in den letzten Wochen einen Rapid Review erstellt, der nun in der Cochrane Library veröffentlicht wurde. Er versammelt Evidenz zu einer der drängendsten Fragen zu COVID-19: Helfen Quarantänemaßnahmen wirklich dabei, die Ausbreitung des neuen Coronavirus einzudämmen?

Helfen Quarantänemaßnahmen wirklich dabei, die Ausbreitung des neuen Coronavirus einzudämmen?

Zum Hintergrund: In vielen Ländern, darunter auch Deutschland, Österreich und der Schweiz, müssen sich all jene in häusliche Quarantäne begeben, die engen Kontakt mit einer infizierten Person hatten. Quarantäne kann aber auch auf Ebene ganzer Städte oder Regionen angewendet werden, so wie es seit Februar in Norditalien der Fall ist. Ziel von Quarantäne ist es, Infektionsketten zu unterbrechen und dadurch den Ausbruch unter Kontrolle zu bekommen. Der aktuelle Rapid Review suchte nun nach Evidenz für die Wirksamkeit solcher Maßnahmen. Weitere Fragestellungen waren, inwiefern eine solche Quarantäne mit anderen Maßnahmen wie räumlicher Distanzierung, Schulschließungen oder einer verbesserten Handhygiene zusammenwirkt und ob Quarantäneregeln auch für Menschen sinnvoll sind, die von einer Reise aus einem Risikogebiet zurückkommen.

Für ihren Rapid Review zu diesen Fragen sichtete das Autorenteam mehr als 2000 Studien, von denen sie am Ende 29 als relevant einstuften und für den Review auswerteten. Zehn dieser Arbeiten sind mathematische Modellierungen, die in den letzten Monaten direkt zu COVID-19 publiziert wurden. 15 weitere Modeling-Studien und vier Kohortenstudien lieferten Evidenz zur Quarantäne bei den Lungenkrankheiten SARS und MERS, die von nahe verwandten Coronaviren ausgelöst werden. Diese Studien sind also nur indirekt relevant.

Die Ergebnisse all dieser Studien sind weitgehend konsistent und legen nahe, dass Quarantäne eine wichtige Maßnahme zur Eindämmung der Pandemie ist. Allerdings reicht Quarantäne alleine wahrscheinlich nicht aus, um den Ausbruch von COVID-19 zu kontrollieren. Sie sollte daher zusammen mit anderen Maßnahmen erfolgen. Denn bei COVID-19 können Ansteckungen bereits vor Auftreten von Symptomen geschehen. Das erschwert es, Fälle rechtzeitig zu erkennen und deren Kontaktpersonen zu finden und unter Quarantäne zu stellen.

Nur vergleichsweise geringe Effekte fand der Review für eine individuelle Quarantäne allein auf Basis eines vorhergehenden Aufenthalts in einem Risikogebiet – das legen zumindest Studien aus der Zeit des SARS-Ausbruchs der Jahre 2002 und 2003 nahe.

Die Autoren machen allerdings deutlich, dass die Evidenzbasis für diese Schussfolgerungen alles andere als optimal ist: Alle zehn Studien, die sich direkt auf COVID-19 beziehen, sind mathematische Modellierungen des Pandemieverlaufs. In diese Modelle gehen zahlreiche Annahmen ein, etwa zu Übertragungsraten, Inkubationszeiten oder Krankheitsverläufen. Diese Annahmen beruhen auf dem aktuell noch sehr lückenhaften Wissen über SARS-CoV-2, beziehungsweise COVID-19, welches sich aber laufend erweitert – sie sind deshalb mit einem hohen Maß von Unsicherheit verbunden. Die übrigen 19 Studien (15 davon ebenfalls Modelierungen) liefern indirekte Evidenz zu SARS und MERS. Es ist zwar plausibel, dass zwischen diesen von nahe verwandten Viren ausgelösten Krankheiten Parallelen bestehen, doch genauso gibt es offensichtlich erhebliche Unterschiede, etwa in der Infektiosität oder der Schwere des Krankheitsverlaufs. Insofern sind solche Rückschlüsse von einer Krankheit auf eine andere stets mit großer Vorsicht zu behandeln.

Die Aussagekraft dieser Studien, und damit auch die des Rapid Reviews, ist aufgrund dieser Limitationen begrenzt. Doch der Anspruch evidenzbasierter Medizin ist es, die beste verfügbare Evidenz zu einer Fragestellung zu berücksichtigen. In einer beispiellosen Situation wie der momentanen Krise durch COVID-19 bedeutet dies, auch mathematische Modellierungen zu berücksichtigen, solange keine bessere Evidenz vorhanden ist.

Cochrane Reviews berücksichtigen diese variable Vertrauenswürdigkeit unterschiedlicher Studien. Für die Gewichtung und Bewertung des Vertrauens in die Ergebnisse gibt es eine eigene Methodik (GRADE), die die Evidenz aus Studien in eine von vier Stufen der Vertrauenswürdigkeit einstuft (sehr niedrig, niedrig, moderat oder hoch). Im Fall des aktuellen Rapid Reviews stufen die Autoren die Vertrauenswürdigkeit der Evidenz aufgrund der zahlreichen Limitationen als niedrig bis sehr niedrig ein. Dies bedeutet, dass sich die berechneten Effekte mit großer Wahrscheinlichkeit noch substantiell von den wahren Effekten im echten Leben unterscheiden – sie könnten in Wirklichkeit sowohl deutlich stärker oder schwächer ausfallen. Der einzige Weg, diese Unsicherheit zu reduzieren, ist es, jetzt während der Krise weltweit Daten zu sammeln und Studien durchzuführen, die den Effekt von Quarantäne im Kontext von COVID-19 untersuchen.

Was bedeuten diese Ergebnisse nun für unseren Alltag, der sich in Zeiten von COVID-19 so dramatisch verändert hat? „Die aktuelle Evidenz zu Quarantänemaßnahmen hat sicher nicht die Aussagekraft, die wir uns wünschen würden. Doch es gibt zwei Argumente, warum die momentan geltenden Quarantänemaßnahmen trotzdem sinnvoll erscheinen“, sagt die Erstautorin des Rapid Reviews, Barbara Nussbaumer-Streit. „Zum einen sind die Ergebnisse aller Studien in unserem Review konsistent und weisen auf einen günstigen Effekt von Quarantäne im Verbund mit anderen Maßnahmen hin. Zum anderen ist die Rationale hinter diesen Maßnahmen wissenschaftlich plausibel: Es ist logisch nachvollziehbar, dass Menschen, die sich mit recht hoher Wahrscheinlichkeit infiziert haben, den Kontakt mit nicht infizierten Menschen meiden sollten, um die Virus-Ausbreitung somit einzudämmen.“

Jetzt sei es entscheidend, so Nussbaumer-Streit, die Krankheitsdynamik von COVID-19 so schnell wie möglich genauer zu erforschen, um beispielsweise eine genauere Vorstellung zu bekommen von der tatsächlichen Verbreitung des Virus in der Bevölkerung oder des wahren Risikos für Infizierte, an COVID-19 zu sterben. Solche grundlegenden Kennzahlen können kurzfristig helfen, die Modelrechnungen zu aktualisieren und die Auswirkungen von Maßnahmen besser abschätzen zu können. Langfristig brauche es gut durchgeführte Beobachtungsstudien, die die Wirksamkeit von Quarantäne und anderen Maßnahmen zur Eindämmung von COVID-19 bewerten. „Verschiedene Länder auf der ganzen Welt haben Kombinationen von Prävention- und Kontrollmaßnahmen mit unterschiedlicher Intensität und Geschwindigkeit eingeführt. Diese sollten laufend evaluiert werden. Ein Vergleich der Wirksamkeit dieser Strategien wird uns helfen, uns mit besserer Evidenz auf künftige Pandemien vorzubereiten.“

Text: Barbara Nußbaumer-Streit und Georg Rüschemeyer

Cochrane Crowd in Zeiten von COVID-19: jetzt mitmachen

Thu, 04/02/2020 - 10:40

Quarantäne, Ausgangssperren, Kontaktverbote – aufgrund der COVID-19-Krise gilt für Menschen, die nicht in sogenannten kritischen Berufen arbeiten, im Augenblick weltweit das Gleiche: Abstand halten und, wenn es irgendwie geht, zuhause bleiben. Wir haben einen Tipp, wie Sie sich von zuhause aus einer interessanten und sinnvollen Aufgabe widmen und dabei die Arbeit von Cochrane unterstützen können.

Weltweit ist zurzeit räumliche Distanzierung von unseren Mitmenschen angesagt. Sie soll ein weiteres Ausbreiten des Coronavirus verhindern. Um Abstand voneinander zu halten, bleiben viele Menschen zuhause, entweder weil sie die Möglichkeit haben Heimarbeit zu leisten, oder weil sie ihre Arbeit in Zeiten der weltweiten COVID-19-Pandemie nicht ausüben können. Diese Situation ist verständlicherweise für viele Menschen beunruhigend. Viele möchten gerne mehr tun als Abstand halten und Hände waschen, am liebsten irgendwie persönlich etwas zur Bekämpfung des Virus beitragen. Aber wie?

Cochrane Crowd ist eine Plattform, auf der Menschen aus aller Welt Cochrane bei seiner Kernaufgabe unterstützen können, die bestmögliche Evidenz zu Fragen der Gesundheitsversorgung in Cochrane Reviews zusammenzuführen. Als Bürgerwissenschaftler („Citizen Scientist“) hilft man in der Cochrane Crowd bei der Identifizierung von Studien, die für künftige Cochrane Reviews relevant sein könnten – und hat dabei noch einen spannenden Zeitvertreib.

Um Menschen aus aller Welt – auch gerade jetzt in Pandemiezeiten – auf diese Möglichkeit aufmerksam zu machen, hat Cochrane eine Serie von sogenannten „Cochrane Crowd Challenges“, initiiert. Das Ziel dieser Challenges ist es, dass alle Interessierten in einer vorgegebenen Zeit zusammen Studien auf bestimmte Kriterien hin untersuchen.

Was ist die Cochrane Crowd?

Im März 2014 gründete Cochrane eine Online-Plattform, auf der Laien Cochranes wissenschaftliche Arbeit tatkräftig dadurch unterstützen können, dass sie randomisierte, kontrollierte Studien (kurz: RCTs) von anderen Studien-Typen unterscheiden lernen und identifizieren können.

RCTs sind die wichtigste Datenquelle für Cochrane Reviews. Das Problem dabei: Jahr für Jahr erscheinen große Mengen an Studien! Beim Durchsuchen dieser enormen Menge auf der Suche nach denjenigen Studien, die für Cochrane Reviews relevant sein könnten, helfen sowohl computerbasierte Algorithmen als auch Menschen, die die Studien „von Hand“ als RCTs identifizieren. Hier kommt das sogenannte „Screening in der Cochrane Crowd“ ins Spiel: Jede Studie wird unabhängig voneinander von vier Mitgliedern der Cochrane Crowd begutachtet. Sind sich alle vier einig, dass es sich bei der Arbeit um einen RCT handelt, landet diese im Cochrane Central Register of Controlled Trials (kurz: CENTRAL), der zentralen Studien-Datenbank von Cochrane. Die dort enthaltenen RCTs sind für zukünftige systematische Reviews von besonderer Wichtigkeit.

In der Cochrane Crowd kann jeder zum „Bürgerwissenschaftler“ werden und in der Wissenschaft einen wichtigen Beitrag leisten. Einzige Voraussetzung ist ein gutes Leseverständnis auf Englisch. Mehr über Cochrane Crowd erfahren Sie in unserem Artikel Cochrane Crowd: Mitmachen erwünscht.

Die “COVID-19 Cochrane Crowd Challenge”

Gerade jetzt braucht Cochrane Ihre Hilfe. Es müssen Studien identifiziert werden, bei denen es sich um RCTs handelt oder die von RCTs berichten, – oder, um das Ganze in Jargon von Cochrane auszudrücken: Wir – d. h. Cochrane – brauchen Ihre Hilfe dabei, RCTs zu „screenen“.

Deshalb haben wir über die nächsten Wochen eine Reihe von „Mini Challenges“ organisiert – d. h. bestimmte Zeitfenster festgelegt, in denen Citizen Scientists aus aller Welt zeitgleich und somit GEMEINSAM – wenn auch räumlich distanziert im Internet – nach RCTs screenen. Diese Screenings könnten von großer Bedeutung für Wissenschaftler in dieser Zeit sein. Während der ersten Screening-Runden geht es darum, RCTs aus CINAHL, einer der größten Datenbanken für Krankenpflege und verwandte Gesundheitsbereiche, zu identifizieren. Danach werden sich die Aufgaben spezifischer auf die Identifizierung und Beschreibung der neuesten Studien zu COVID-19 oder zu Interventionen im Zusammenhang mit ähnlichen Infektionskrankheiten konzentrieren.

Wie läuft das gemeinsame Screening ab?

Es wird jede Woche ein dreistündiges Screening-Zeitfenster geben. Die Zeitfenster werden sich wöchentlich ändern, um sicherzustellen, dass Menschen aus jeder Zeitzone eine Chance haben, am Screening teilzunehmen.

Die erste Runde fand am Montag, dem 30. März, um 10:00 Uhr GMT (d. h. 11:00 Uhr deutscher Zeit bzw. MEZ) statt. Die nächste ist am Dienstag, 7. April, um 12:00 Uhr GMT (13:00 MEZ). Weitere Termine (MEZ):

  • Dienstag, 7. April: 13:00
  • Dienstag, 14. April: 11:00
  • Montag, 20. April: 9:00
  • Mittwoch, 29 April: 7:00
  • Donnerstag, 7. Mai: 14:00
Was brauche ich, um teilzunehmen?

Um an den Cochrane Crowd Challenges teilzunehmen wird absolut kein Fachwissen gefordert! Jedoch ist ein solides Leseverständnis in Englisch gefragt und die Bereitschaft zu lernen, wie Sie wesentliche Studientypen unterscheiden können. Alles, was Sie dazu wissen müssen, erfahren Sie, wenn Sie sich auf der Cochrane Crowd Plattform angemeldet und eingeloggt haben.

Wie kann ich mich registrieren?

Auf der Hompage der Cochrane Crowd Plattform wählen Sie entweder Login (wenn Sie sich schon einmal bei der Cochrane Crowd angemeldet haben) oder Signup, falls Sie sich zum ersten Mal registrieren. Nach einer kurzen Einführung mit direktem Feedback können sie dann direkt am Challenge teilnehmen!

Wir wünschen Ihnen viel Freude beim Screenen, und danken Ihnen, dass Sie Cochrane und die Wissenschaft mit ihrer Zeit unterstützen!

Bis bald in der Cochrane Crowd!

Text: Anne Borchard, Andrea Puhl, Georg Rüschemeyer

Kurzvideos über Grundlagen der Evidenzbasierten Medizin: Die Literatursuche

Thu, 03/26/2020 - 08:44

Wie macht man eine systematische Literatursuche? Wie interpretiert man das „Relative Risiko“? Was sind häufige Fehlerquellen in Studien? Das sind wichtige Fragen, die auftauchen, wenn man evidenzbasiert arbeiten will. Wir versuchen Grundlagen der Evidenzbasierten Medizin in einer Serie von Kurzvideos zu erklären.

Auch wenn der Schwerpunkt unseres Blogs meist auf Erkenntnissen aus Cochrane Reviews liegt, setzten wir gerne immer wieder mal einen Methodenschwerpunkt. In den nächsten Wochen stellen wir hier eine Serie von Kurzvideos vor, die Grundlagen der evidenzbasierten Medizin erklären. Wir haben uns bemüht dies möglichst leicht verständlich umzusetzen.

Die Videos wurden von Cochrane Österreich in Kooperation mit dem Department für Evidenzbasierte Medizin und Evaluation erstellt. Aktuell besteht die Serie aus 6 Videos.

Grundlagen der systematischen Literatursuche

Der erste Teil der Serie bietet eine kurze Einführung in die Welt der systematischen Literaturrecherche – einem Eckpfeiler gut durchgeführter systematischer Übersichtsarbeiten.

Das erste Video fasst die Grundlagen einer systematischen Literatursuche zusammen. Dabei werden die vier wichtigsten Schritte, die einen transparenten und nachvollziehbaren Suchprozess gewährleisten sollen, erläutert (Vorbereitung, Datenbank-Suche, zusätzliche Informationsquellen, Dokumentation). Um möglichst alle relevanten Studien zu finden ist, neben einer gut durchdachten, klaren Fragestellung, das Durchsuchen von zumindest zwei bibliographischen Datenbanken obligatorisch. Zu einer guten systematischen Literatursuche gehören daneben auch die Suche nach zusätzlichen Informationsquellen, wie das Sichten von Referenzlisten, das Durchforsten von Studienregistern oder das Kontaktieren von Expertinnen und Experten sowie die sorgfältige Dokumentation aller Suchschritte.



Im Zweiten Video wird erklärt wie man sogenannte Boolesche Operatoren (AND; OR; NOT) zum Verknüpfen von Suchbegriffen richtig und effizient verwendet. Das dritte Video geht auf den richtigen Einsatz von Schlagwörtern, häufig als MESH-Terms bekannt, ein.





Text: Barbara Nußbaumer-Streit, Claudia Christof

COVID-19: Seife und weitere Hygienemaßnahmen – Evidenz aus Cochrane Reviews

Fri, 03/20/2020 - 12:49

Seit Anfang des Jahres breitet sich weltweit ein neues Coronavirus (SARS-CoV-2) aus, das die Erkrankung COVID-19 (Corona virus disease 2019) auslösen kann. Diese verläuft in der Mehrzahl der Fälle mild, kann jedoch auch zu lebensbedrohlichen Komplikationen wie einer schweren Lungenentzündung führen. Inzwischen nehmen die Infektionsfälle mit SARS-CoV-2 weltweit rasant zu – so auch in den deutschsprachigen Ländern. Ziel der mehr und mehr ins öffentliche Leben einschneidenden Gegenmaßnahmen ist es, den zeitlichen Verlauf der Ausbreitung so zu verlangsamen, dass die Gesundheitssysteme mit der Versorgung von PatientInnen mit schweren Krankheitsverläufen nicht überlastet werden. Dafür gilt es, Infektionsketten wo irgend möglich zu unterbrechen.

Wie kann jeder Einzelne dazu beitragen? Die generellen Empfehlungen von Fachleuten sind weitgehend einheitlich (siehe Linksammlung am Ende dieses Blogbeitrags). Da ist zum einen das Social Distancing. Gemeint ist die rein räumliche Distanzierung von unseren Mitmenschen, um ein Überspringen der Infektion zu verhindern, also: Ansammlungen meiden und einen individuellen Mindestabstand von anderthalb Metern einhalten.

Der andere wichtige Punkt ist die individuelle Hygiene. SARS-CoV-2 verbreitet sich wie auch Grippe- oder Erkältungsviren vor allem durch Tröpfcheninfektionen, also durch das Einatmen infektiöser Tröpfchen, wie sie beim Husten oder Niesen entstehen. Der andere wichtige Infektionsweg sind vermutlich sogenannte Schmierinfektionen. Sie nehmen den Umweg durch den Kontakt mit durch Viruspartikel verunreinigten Oberflächen. Wenn die Viren dann auf die Hand, von dort in Mund oder Augen und schließlich in die Atemwege gelangen, können sie dort zur Infektion führen.

Gegen eine direkte Tröpfcheninfektion hilft vor allem räumlicher Abstand. Schmierinfektionen lassen sich darüber hinaus durch das Befolgen einfacher Hygienetipps vermeiden (Quelle: www.infektionschutz.de ):

• Vermeiden Sie Berührungen (z. B. Händeschütteln oder Umarmungen), wenn Sie andere Menschen begrüßen oder verabschieden.
• Halten Sie die Hände vom Gesicht fern – vermeiden Sie es, mit den Händen Mund, Augen oder Nase zu berühren.
• Waschen Sie regelmäßig und ausreichend lange (mindestens 20 Sekunden) Ihre Hände mit Wasser und Seife – insbesondere nach dem Naseputzen, Niesen oder Husten.
• Niesen oder husten Sie in die Armbeuge oder in ein Taschentuch – und entsorgen Sie das Taschentuch anschließend in einem Mülleimer mit Deckel.
• Halten Sie ausreichend Abstand zu Menschen, die Husten, Schnupfen oder Fieber haben – auch aufgrund der andauernden Grippe- und Erkältungswelle

Die in den Medien und Informationsseiten seit Wochen allgegenwärtige Aufforderung zum Händewaschen entspricht dem, was Infektionsmediziner predigen, seit Ignaz Semmelweis Mitte des 19. Jahrhunderts erstmals die Bedeutung guter Handhygiene für den Infektionsschutz nachwies.

Was genau geschieht beim Händewaschen? Seife besteht aus langkettigen Molekülen, deren bipolarer Charakter ihre Waschwirkung begründet. Während sich das eine Ende des Moleküls bevorzugt an Fett ansetzt, zieht sein anderes Ende Wasser an. Die Seifenmoleküle spielen so den Vermittler zwischen fettigem Schmutz und Wasser, die umhüllen die Schmutzpartikel und bringen sie in Lösung. Das gilt auch für Viren und Bakterien mit ihren aus Fettsäuren aufgebauten Hüllen: Seife zerstört diese Hülle und macht es leichter, die Reste von der Haut zu waschen.

Einem Holzhammer gleicht die Wirkung von hochprozentigem Alkohol auf Viren und Bakterien. Das Lösungsmittel denaturiert deren Proteine, die Erreger lösen sich unter Alkoholeinfluss schlich in ihre Bestandteile auf. Weil Seife und Alkohol derart rabiat wirken, können Erreger keine Resistenzen dagegen ausbilden. Das ist bei einigen antimikrobiellen Zusätzen, mit denen Seifenhersteller gerne werben, vermutlich anders. Daher gilt: Reine Seife ist auch ohne Zusatz antimikrobiell genug. Wichtiger ist, dass man sich die Hände oft genug, zum richtigen Zeitpunkt und wirklich gründlich wäscht. Informationen hierzu fasst die Bundeszentrale für gesundheitliche Aufklärung hier zusammen: https://www.infektionsschutz.de/haendewaschen

Dass eine gute Handhygiene mit Seife oder ergänzend auch mit alkoholbasierten Desinfektionsmitteln wirklich hilft, Krankheitserreger aufzuhalten, ist nicht nur plausibel, sondern durch zahlreiche Studien auch gut belegt. So führte die Anweisung, sich mindestens fünfmal am Tag die Hände zu waschen, in einer großen Studie (ca. 20.000 Personen-Jahre) mit amerikanischen Rekruten zu einem Rückgang von Arztbesuchen wegen Atemwegsbeschwerden um 45 Prozent.
Auf eine ähnlich hohe Wirksamkeit gründlicher Handhygiene zum Schutz vor viralen Atemwegsinfektionen kommt auch ein Cochrane Review aus dem Jahr 2011, in den insgesamt (also auch zu andern Hygienemaßnahmen) 67 Studien eingingen.

Dieser Review wird von Autoren gegenwärtig auf den neuesten Stand gebracht. Er ist Teil einer vor kurzem in der Cochrane Library veröffentlichten Sonderkollektion (Special Collection) von Cochrane Reviews, die Evidenz zu den Bereichen Prävention und Infektionskontrolle in Alltag und im Krankenhaus zusammenstellen.
Die momentan neun Reviews dieser Sonderkollektion wollen wir im zweiten Teil dieses Blogbeitrags kurz vorstellen.

Titel und Kurzzusammenfassungen sind in der Cochrane Library auch auf Deutsch verfügbar. Sie werden automatisch angezeigt, wenn man die Sprachauswahl oben rechts auf der Webseite auf „deutsch“ stellt. Angaben zur Vertrauenswürdigkeit der Evidenz zu individuellen Maßnahmen folgen wo möglich dem vierstufigem GRADE-Schema, in dem die Vertrauenswürdigkeit sehr niedrig, niedrig, moderat oder hoch bewertet werden kann (vgl. https://bestpractice.bmj.com/info/toolkit/learn-ebm/what-is-grade/).

Sonderkollektion der Cochrane Library zu Prävention und Infektionskontrolle Physikalische Interventionen zur Unterbrechung oder Verringerung der Ausbreitung von Atemwegsviren

Worum es ging:
Dieser Review prüft die die Wirksamkeit physischer (also nicht-medikamentöser) Maßnahmen zur Unterbrechung oder Verringerung der Ausbreitung von Atemwegsviren. Zu den untersuchten Interventionen gehören Handhygiene, Isolation und Quarantäne, körperliche Distanz und Screenings an Grenzübergängen und Flughäfen. Letzte Aktualisierung: 2011, Aktualisierung in den nächsten Tagen.

Vertrauenswürdigkeit der Evidenz:
Variabel und noch nicht nach GRADE eingeteilt, siehe Diskussion

Fazit der Autoren:
„Einfache und kostengünstige Interventionen sind nützlich, um die Übertragung von epidemischen Atemwegsviren zu reduzieren. Doch die routinemäßige und langfristige Durchführung einiger der untersuchten Interventionen könnte ohne eine akute Bedrohung durch eine Epidemie schwierig sein.“ Konkret fanden die Autoren Evidenz für folgende Maßnahmen, die am besten kombiniert werden sollten:

  • Häufiges, gründliches Händewaschen.
  • Barrieremaßnahmen wie Handschuhe, Schutzkleidung und Atemmasken im Umgang mit vermutlich oder bestätigt Infizierten
  • Isolierung von Verdachtsfällen

Die Autoren kommen auf Basis von Daten zu Influenza und der SARS-Epidemie von 2002/2003 zu dem Schluss, dass man dabei insbesondere auf gute Hygiene bei Kindern achten sollte, da diese Infektionen vermutlich besonders stark weitergeben. Insgesamt stellen die Autoren für einige der Maßnahmen (zum Beispiel Massenscreenings der Körpertemperatur an Flughäfen) aber einen Mangel an aussagekräftigen Studienergebnissen fest.

Interventionen zur Verbesserung der Umsetzung der Handhygiene bei der Patientenversorgung

Worum es ging:
Handhygiene ist eine effektive Maßnahme, um Mitarbeiter der Gesundheitsberufe vor Infektionen zu schützen.
Welche Strategien dazu führen, dass Mitarbeiter der Gesundheitsberufe die Empfehlungen für Handhygiene (Händewaschen mit Wasser und Seife oder das Benutzen von alkoholischen Hand-Desinfektionsmitteln oder beides) verstärkt umsetzen, war die Fragestellung dieses aktualisierten Reviews. Beispiele für untersuchte Strategien sind ein besseres Angebot an Wasch- oder Desinfektionsmöglichkeiten oder Schulungen des Personals. Letzte Aktualisierung: 2017.

Vertrauenswürdigkeit der Evidenz nach GRADE:
Sehr niedrig bis moderat

Fazit der Autoren:
Da die Vertrauenswürdigkeit der Ergebnisse, die Interventionen und auch die Forschungsmethoden sehr variierten, besteht nach wie vor ein dringender Bedarf an methodisch robuster Forschung, um die Wirksamkeit solcher Interventionen genau zu ermitteln. Außerdem wird mehr Forschung benötigt, um herauszufinden, welche Komponenten oder Kombinationen von Strategien in einem bestimmten Kontext am wirksamsten sind.

Verbesserung der Einhaltung von Maßnahmen der Standardhygiene zur Vermeidung von Infektionen im Rahmen der Gesundheitsversorgung

Worum es ging:
Der Review geht der Frage nach, welche Strategien bei Mitarbeitern der Gesundheitsberufe die Umsetzung von Maßnahmen der Standardhygiene fördern können, um Infektionen in Pflegebereichen zu verringern. Standardhygiene schließt zum Beispiel das Tragen von persönlicher Schutzausrüstung (Gesichtsmasken, Handschuhe) oder der sicheren Handhabung von Nadeln ein. Letzte Aktualisierung: 2018.

Vertrauenswürdigkeit der Evidenz nach GRADE:
Niedrig bis moderat, aber nur wenige Studien

Fazit der Autoren:
Die untersuchten Interventionen, die betrachteten Endpunkte, sowie die Vertrauenswürdigkeit der Evidenz variieren stark. Außerdem haben viele Studien ein hohes Risiko für Bias. All das macht es schwierig, Schlussfolgerungen über die Wirksamkeit der Interventionen zu ziehen. Mehr und methodisch robustere Forschung ist vonnöten.

Persönliche Schutzausrüstung zur Vorbeugung hochinfektiöser Erkrankungen durch Exposition gegenüber kontaminierten Körperflüssigkeiten bei Gesundheitspersonal

Worum es ging:
Bei hochinfektiösen Epidemien wie die des Ebola-Virus oder dem schweren akuten Atemwegssyndrom (SARS) sind Mitarbeiter der Gesundheitsberufe aufgrund ihres Kontakts mit kontaminierten Körperflüssigkeiten der Patienten einem wesentlich höheren Infektionsrisiko ausgesetzt als die allgemeine Bevölkerung. Kontaktvorkehrungen durch persönliche Schutzausrüstung (PSA) können das Risiko verringern. Dieser Review prüfte, welche Art von Ganzkörper-PSA und welche Methode des An- und Ablegens von PSA das geringste Kontaminationsrisiko für Beschäftigte im Gesundheitswesen birgt, sowie Schulungsmethoden, um die Einhaltung der PSA-Protokolle zu verbessern. Letzte Aktualisierung: 2019

Vertrauenswürdigkeit der Evidenz nach GRADE:
Sehr niedrig

Fazit der Autoren:
Die Autoren fanden Evidenz von zumeist geringer Vertrauenswürdigkeit für den Nutzen einer Reihe von Maßnahmen wie spezieller Schulungen und Anleitungen zum An- und Ablegen von PSA, sowie für bestimmte Varianten von PSA. Zudem fanden sie Hinweise darauf, dass atmungsaktivere, angenehmer zu tragende Schutzkleidung vermutlich ähnlich gut vor Kontamination schützt, wie vollkommen dichtes Material.
Allerdings stehe alle diese Ergebnisse unter dem Vorbehalt, dass sie auf Evidenz von geringer oder sehr geringer Vertrauenswürdigkeit basieren. Die Autoren fordern daher mehr randomisierte, kontrollierte Studien.

Verhaltensinterventionen, um den Gebrauch von Atemschutzgeräten bei Arbeitnehmern zu fördern

Worum es ging:
An zahlreichen Arbeitsplätzen enthält die Luft gesundheitschädliche Substanzen. Diese Substanzen könnten Bakterien und Viren sein, oder verschiedene Abgase ,Rauch, Staub oder Partikel wie z.B. Asbest oder Getreideabrieb. Je nachdem, was und wie viel davon eingeatmet wird, können die gesundheitlichen Folgen gering bis lebensbedrohlich sein. Die Folgen reichen von Reizgefühlen bis hin zu Kurz‐ und Langzeiterkrankungen wie Krebs. An zahlreichen Arbeitsplätzen werden deshalb Atemschutzausrüstungen (ASA) verwendet.. Unterschiedliche Methoden wurden eingeführt, um Arbeitnehmer in der wirksamen Anwendung einer ASA zu schulen. Jedoch ist es unklar, wie gut diese funktionieren. Dieser Review untersuchte Interventionen, die Arbeitnehmer ermutigen, eine ASA richtig oder öfter zu gebrauchen. Letzte Aktualisierung: 2016

Vertrauenswürdigkeit der Evidenz nach GRADE:
Sehr niedrig bis niedrig

Fazit der Autoren:
Die Autoren fanden Evidenz von niedriger bis sehr niedriger Vertrauenswürdigkeit, dass Verhaltensinterventionen die Arbeitnehmer nicht ermutigen, ASA richtig oder öfter anzuwenden. Wahrscheinlich werden sich die Schlussfolgerung ändern, wenn neue Studien veröffentlicht werden. Wir benötigen bessere Studien, die sich auf die Wirksamkeit der verschiedenen Interventionen konzentrieren.

Chlorhexidin‐Bäder bei schwerkranken Patienten zur Vorbeugung von im Krankenhaus erworbenen Infektionen

Worum es ging:
Eine im Krankenhaus erworbene Infektion ist ein häufiges und potentiell gefährliches Ereignis in der Patientenversorgung. Patienten auf der Intensivstation, die mechanisch beatmet werden, sind einem besonders hohem Infektionsrisiko ausgesetzt. Chlorhexidin ist ein kostengünstiges, weit verbreitetes Desinfektionsmittel. Es kann zum Baden von schwerkranken Patienten eingesetzt werden, um Bakterien abzutöten und die Verbreitung von im Krankenhaus erworbenen Infektionen zu reduzieren. Ob dies einen Nutzen hat war Fragestellung des Reviews. Letzte Aktualisierung: 2019

Vertrauenswürdigkeit der Evidenz nach GRADE:
Sehr niedrig

Fazit der Autoren:
Aufgrund der verfügbaren Evidenz von sehr niedriger Vertrauenswürdigkeit ist nicht klar, ob das Baden mit Chlorhexidin im Krankenhaus erworbene Infektionen, die Sterblichkeit oder die Aufenthaltsdauer auf der Intensivstation vermindert oder ob die Anwendung von Chlorhexidin zu mehr Hautreaktionen führt.

Infektionskontrollstrategien zur Verhinderung der Übertragung von Methicillin-resistenten Staphylococcus aureus (MRSA) in Pflegeheimen für ältere Menschen

Worum es ging:
Ältere Menschen in Pflegeheimen sind einem erhöhten Infektionsrisiko durch Meticillin-resistente Staphylococcus aureus (MRSA) ausgesetzt. Strategien zur Prävention und Kontrolle von Infektionen sind wichtig, um die Übertragung von MRSA zu verhindern. Ziel dieses Reviews war es, die Auswirkungen von Präventions- und Kontrollstrategien zur Verhinderung der Übertragung von MRSA in Altenheimen zu ermitteln. Letzte Aktualisierung: 2013

Vertrauenswürdigkeit der Evidenz nach GRADE:
Nicht anwendbar, es wurde nur eine Studie gefunden

Fazit der Autoren:
Es besteht ein Mangel an Studien, um die Auswirkungen von Strategien zur Prävention und Kontrolle MRSA-Infektionen in Pflegeheimen zu ermitteln. Es sollten in Pflegeheimen Studien durchgeführt werden, an denen Bewohner und Personal beteiligt sind, um diejenigen Interventionen zu testen, die speziell für diese Umgebung entwickelt wurden.

Weiterführende Informationen für die breite Öffentlichkeit zur aktuellen Pandemie von SARS-CoV-2 und zu allgemeinen Verhaltensempfehlungen Aktuelle Forschungsergebnisse zu SARS-CoV-2/COVID-19

Mehrere führende Wissenschaftsjournale haben eigene Portale zu SARS-CoV-2/COVID-19 eingerichtet, in denen sie aktuelle Studien zur Verfügung stellen (in der Regel free access).

Text: Andrea Puhl und Georg Rüschemeyer

Anmerkung: Aus Gründen der besseren Lesbarkeit wird auf die gleichzeitige Verwendung männlicher und weiblicher Sprachformen verzichtet. Sämtliche Personenbezeichnungen gelten gleichermaßen für alle Geschlechter.

Nützliche patientenrelevante Forschung

Thu, 03/12/2020 - 09:00

Forscherinnen und Forscher kämpfen um begrenzte Fördermittel, um ihre Arbeit zu finanzieren. Ein Nebenprodukt dieses Wettkampfs sind Studien, die kaum zum Erkenntnisgewinn beitragen oder sogar unnötig sind. Solche Studien werden unter dem Begriff „research waste“ zusammengefasst. Ein spannendes Thema von dem ich beim EBM-Kongress in Basel erstmals gehört habe. In diesem Blog-Beitrag möchte ich einen Überblick über dieses wichtige Thema geben.

Patientenorientierte Forschung

Grundsätzlich ist Forschung etwas Tolles. Neue Erkenntnisse werden gewonnen und Lösungen für Probleme gefunden. Die Welt der Forschung kämpft aber auch mit einigen Herausforderungen. Wissenschaftlerinnen und Wissenschaftler nutzen zur Finanzierung ihrer Arbeit teilweise Mittel der Industrie. Obwohl die Absichten solcher Forschungsförderung gut sein mögen, kann dies dazu führen, dass Ergebnisse nicht transparent berichtet werden. Als wichtiges Beispiel muss hier die Lebensmittelindustrie genannt werden, in der industrielle Fördergeber die Erkenntnisse der Ernährungswissenschaft manipuliert haben. So versuchte die Zuckerindustrie, den Zusammenhang zwischen Zucker und koronare Herzkrankheit (KHK) in den 1950er Jahren zu verharmlosen und den Fokus auf Fette zu setzen, wie die Publikation „Sugar Industry and Coronary Heart Disease Research“ von Cristin E Kearns et al. aus dem Jahre 2016 beschreibt.

Die Absichten der medizinischen Forschung sind unser Verständnis zu erweitern und die Gesundheit von Menschen zu fördern, jedoch nicht für eine Gewinnmaximierung der Unternehmen zu sorgen.

Aber was genau ist nützliche Forschung? Und wie setzt man sie um? Die Definition von nützlicher Forschung variiert je nach Forschungsfeld, Förderprogrammen, Organisationen und Unternehmen der Branche. Für Pharmakonzerne kann nützliche Forschung bedeuten, dass in der letzten Phase der pharmazeutischen Entwicklung Versuche an Menschen durchgeführt werden. Für Krankenhäuser wiederum, kann nützliche Forschung sein, die unterschiedlichen Methoden der Patientenbehandlung zu untersuchen. Für Patientinnen und Patienten, kann nützliche Forschung eine wegweisende klinische Studie für eine mögliche Heilung ihrer Krankheit darstellen. Die subjektive Natur des Begriffes „nützliche Forschung“, gemischt mit dem breiten Umfang des persönlichen Interesses macht es zu einem schwer definierbaren Begriff. Wie entsteht ein subjektiv, wichtiges Forschungsprojekt, das von einem Individuum definiert wird und später auch tatsächlich für die Patientinnen und Patienten nützlich ist? Zur Beantwortung von Fragen wie dieser und vielen ähnlichen, wurde der Begriff „patientenorientierte Forschung“ entwickelt. Diese Form der Forschung stellt sicher, dass jeder Schritt eines Forschungsvorhabens das beste Ergebnis für die Patientinnen und Patienten im Blick hat. Hervorgehoben wurde dies auf dem EBM-Kongress in Basel. Patientenorientierte Forschung bezieht patientenrelevante Endpunkte ein – schaut also auf die Ergebnisse, die für Patientinnen und Patienten spürbar und wichtig sind. Ziel patientenorientierter Forschung ist es die Patientenversorgung zu verbessern und gleichzeitig die Belastung für das Gesundheitssystem klein zu halten. Patientinnen und Patienten sollten bereits ab der Planung einer Studie einbezogen werden, damit sichergestellt ist, dass die Studie patientenrelevante Aspekte untersucht und für Patientinnen und Patienten nützlich bleibt.

Wie können wir „research waste“ reduzieren?

Der erste Schritt, um die Gesamteffizienz des Forschungsprozesses zu verbessern, ist es “research waste“ zu reduzieren. Von sogenanntem Forschungsabfall spricht man, wenn Studienergebnisse keine wesentliche Anwendung auf dem Gebiet haben, also quasi nutzlos sind. In seiner Keynote während des jüngsten 2020 EbM-Kongresses in Basel, hat Dr. Treweek von der Universität Aberdeen in einer Skizze beschrieben, wie man die Produktion von „research waste“ minimieren kann. Er rief dazu au:

Wissen was bereits geforscht wurde: Betreiben Sie Forschung vor Ihrer Forschung. Die Sammlung von bereits veröffentlichten Studien und systematischen Übersichten können unbeabsichtigte Datenduplizierung verhindern und so werden keine Ressourcen vergeudet.

  1. Wissen was bereits geforscht wurde: Betreiben Sie Forschung vor Ihrer Forschung. Die Sammlung von bereits veröffentlichten Studien und systematischen Übersichten können unbeabsichtigte Datenduplizierung verhindern und so werden keine Ressourcen vergeudet.
  2. Design für die Nutzerinnen und Nutzer: Fragen Sie sich, wer und was bin ich, dass ich diese Forschung verfolge. Stellen Sie sicher, was Sie erreichen wollen, und wen Ihre Forschung erreichen soll. Gibt es eine Notwendigkeit? Wird es jemandem helfen? Im Vergleich zu vorherigen systematischen Übersichten für die die klinische Relevanz bereits gewährleistet ist, ist Ihre Arbeit ebenfalls klinisch relevant für Ihre Zielgruppe?
  3. Denken Sie über den Prozess nach: Sind Sie sich sicher, dass das beabsichtigte Forschungsvorhaben die effizienteste und beste Herangehensweise ist um die Forschungsfrage zu beantworten? Holen Sie sich Rat von Forscherinnen und Forschern, die ähnliche Studien bereits erstellt haben und fragen Sie nach einer zweiten Meinung bevor Sie Ihren Forschungsantrag stellen.
  4. Forschung ist Team Arbeit: Nur wenige sind Expertinnen bzw. Experten auf einem breiten Gebiet. Wissen, wann ein Thema über Ihr Spezialgebiet hinausgeht und ein anderes erreicht, ist wichtig.

Die Anwendung dieses Modells in der Forschungsplanung hilft zu verhindern, unnütze Forschung zu betreiben. Es soll uns ermutigen, unseren Vorschlag zu reflektieren und ermöglicht es uns, Patientinnen und Patienten bereits in den frühen Schritten der Planung zu integrieren. Dies schafft nicht nur relevante Forschung, sondern insbesondere patientenrelevante Forschung. Dadurch wird sichergestellt, dass die Forscherinnen und Forscher die Forschung nicht nur in einen patientenrelevanten Kontext setzten, sondern auch in einer patientenrelevanten Art und Weise planen.

Relevante Forschung in die Praxis bringen

Durchführung von patientenorientierter Forschung ist das verbindende Puzzlestück zwischen einer Forschungspublikation und deren Umsetzung im klinischen Kontext. Wenn die wissenschaftliche Gemeinschaft das patientenorientierte Forschungsmodell etabliert, wird nicht nur die Menge an nützlicher Forschung drastisch erhöht, sondern wahrscheinlich auch Verbesserungen der Patientenversorgung erreicht. Wenn dieses Forschungsmodell das Leben von nur einer Person verbessert, hat es bereits klinische Relevanz erreicht. Durch die Reduzierung von „research waste“ werden gleichzeitig auch Ressourcen frei, die für andere wichtige Forschungsinitiativen genutzt werden können.

Persönliches Fazit

Für mich als Medizinstudentin im zweiten Jahr war es spannend zu sehen mit welchen Herausforderungen und Hürden, sich Forscherinnen und Forscher beschäftigen müssen. Die Teilnahme am EBM-Kongress gab mir einen guten Einblick in die Welt der EBM. Vor dem Kongress nahm ich auch am Studierendentag teil. Dort trafen sich Studierende aus Deutschland, Schweiz und Österreich, um über Methoden der EBM zu lernen – auch hier lag der Fokus auf patientenrelevanter Forschung. Der Studierendentag war eine tolle Gelegenheit, um sich mit anderen Studierenden auszutauschen und zu vernetzen. Gleichzeitig bereitete er mich gut auf die Konferenz vor. Ich hoffe eines Tages nach meinem Studium meinen Beitrag zu leisten, dass Forschung relevant ist und die Praxis verbessert.

Text: Arianna Gadinger

Arianna Gadinger und Stina Øvstetun sind Medizinstudentinnen und erhielten von Cochrane Österreich und der Karl-Landsteiner-Privatuniversität ein Stipendium zur Teilnahme am Studierendentag und am EBM-Kongress in Basel

Es bleibt dabei: Nahrungsergänzung mit Omega-3-Fettsäuren schützt das Herz kaum

Wed, 03/04/2020 - 13:16

Der tägliche Löffel von widerlich schmeckendem Lebertran ist schon lange passé. Heute kommen Omega-3-Fettsäuren zumeist in Form kleiner Kapseln mit Fischöl, die man für ein paar Euro rezeptfrei im Drogeriemarkt kaufen kann. Doch wie viel Mehrwert hat es, zusätzliches Omega-3 in Kapselform einzunehmen? Das eben veröffentlichte Update des Cochrane-Reviews „Omega-3-Fettsäuren zur Primär- und Sekundärprävention von kardiovaskulären Erkrankungen“ sieht dafür nach wie vor wenig Evidenz. Ko-Autorin Lee Hooper von der englischen University of East Anglia erklärt die Ergebnisse in unserem Interview.

Dr. Hooper, erzählen Sie uns von diesem Cochrane-Review.

In der Öffentlichkeit ist der Glaube an die kardiovaskulären Vorteile von Omega-3-Fetten sehr groß. Die Aufnahme von langkettigen Omega-3-Fettsäuren in den USA durch Nahrungsergänzungsmittel ist höher als durch Lebensmittel. Aber die Ratschläge zur öffentlichen Gesundheit unterscheiden sich von Land zu Land. Das National Institute for Health and Clinical Excellence in Großbritannien ermuntert die Menschen, öligen Fisch zu essen (die natürliche Hauptquelle für langkettige Omega-3-Fettsäuren), rät aber von einer Supplementierung ab. Die American Heart Association in den USA empfiehlt ebenfalls den Verzehr von öligem Fisch und deutet darauf hin, dass auch eine Ergänzung erforderlich sein könnte. Wir waren an der Evidenz interessiert – sind Omega-3-Fette schützend und wenn ja, wie sehr schützen sie? Wir untersuchten die Auswirkungen von langkettigen Omega-3-Fettsäuren, die als fetter Fisch und als Nahrungsergänzungsmittel verabreicht werden. Zudem untersuchten wir die Auswirkungen von Alpha-Linolensäure (ALA, eine kurzkettige Omega-3-Fettsäure, die in Pflanzenölen enthalten ist), die als Nahrungsmittel oder Nahrungsergänzungsmittel verabreicht wird.

Es handelt sich hier um ein Update – was hat sich im Vergleich zum letzten Update von 2018 geändert?

Wir haben dieses Update durchgeführt, weil Ende 2018 und Anfang 2019 drei sehr große, über mehrere Jahre laufende Studien veröffentlicht wurden, die die Auswirkungen von Supplementen mit langkettigen Omega-3-Fettsäuren auf die Ergebnisse des Herz-Kreislauf-Systems untersucht haben. Diese erhöhten die Anzahl der Personen, die randomisiert für mindestens 12 Monate an relevanten Studien teilnahmen, um über 30 Prozent, mit dem Potential, die Ergebnisse zu verändern. Dieses Update umfasst nun 86 RCTs (randomisierte kontrollierte Studien) mit insgesamt 162.796 Teilnehmern, die für mindestens ein Jahr entweder langkettige Omega-3-Fettsäuren oder ALA einnahmen. Die Studien bewerteten die Mortalität oder eine Form von kardiovaskulären Erkrankungen. Die Einbeziehung weiterer Teilnehmer, von denen einige kardiovaskuläre Ereignisse erlebten, hat uns bessere Möglichkeiten gegeben, die Auswirkungen von Omega-3-Fettsäuren auf die kardiovaskuläre Gesundheit zu erkennen.

Von den 86 eingeschlossenen Studien hatten 28 ein geringes summarisches Risiko von Bias (hohe Vertrauenswürdigkeit der Evidenz). Die meisten Studien gaben Nahrungsergänzungsmittel; 19 Studien gaben Nahrungsergänzungsmittel mit mindestens drei Gramm pro Tag langkettigen Omega-3-Fettsäuren.

Der Review aus dem Jahr 2018 lieferte gute Evidenz dafür, dass die Einnahme von langkettigen Omega-3-Fettsäuren weder der Herzgesundheit noch dem Schlaganfall- oder Sterberisiko zugute kommt. Ist dies immer noch der Fall?

Wie in der vorherigen Version dieses Reviews deutet die Meta-Analyse darauf hin, dass eine Erhöhung der Zufuhr von langkettigen Omega-3-Fettsäuren wenig oder gar keinen Einfluss auf die Gesamtmortalität, die kardiovaskuläre Mortalität, kardiovaskuläre Ereignisse, Schlaganfall oder Arrhythmie hat.

Das aktuelle Update deutet jedoch darauf hin, dass eine erhöhte Einnahme langkettiger Omega-3-Fettsäuren die Sterblichkeit bei koronaren Herzerkrankungen und koronaren Ereignissen leicht verringern könnte. Diese Effekte waren sehr gering. 334 Personen müssten über mehrere Jahre hinweg vermehrt langkettige Omega-3-Fettsäuren einnehmen, damit eine Person nicht an einer koronaren Herzkrankheit stirbt. 167 Personen müssten mehr einnehmen, damit eine Person nicht ein Ereignis einer koronaren Herzkrankheit, zum Beispiel einen Herzinfarkt, erleidet.

Wir fragten uns, ob die Auswirkungen von langkettigen Omega-3-Fetten in längeren Studien oder in Studien mit höheren Dosen größer wären. Die Wirkungen unterschieden sich jedoch nicht nach Studiendauer oder Dosis in einer vorher geplanten Untergruppenbildung oder Meta-Regression.

Eine Erhöhung der langkettigen Omega-3-Fettsäuren hatte keine oder nur geringe Auswirkungen auf schwerwiegende unerwünschte Ereignisse, Fettleibigkeit, Lipide oder Blutdruck. Allerdings reduzierte sie Triglyceride um ca. 15% in einer dosisabhängigen Weise.

Wie sieht diese Effektgröße einer Number Needed to Benefit (NNTB) von 167 beziehungsweise 334 im Vergleich zu anderen Medikamenten aus, die in der Prävention von Herz-Kreislauf-Erkrankungen eingesetzt werden?

Simvastatin (ein lipidsenkendes Medikament aus der Gruppe der Statine) in der Sekundärprävention: In der 4S-Studie, an der Personen teilnahmen, die vor kurzem einen Herzinfarkt erlitten hatten, starben 8% der Teilnehmer, die Simvastatin einnahmen, aber 12% der Teilnehmer, die das Placebo einnahmen. Das bedeutet einen Unterschied von 4%, so dass der NNTB bei 25 lag. Fünfundzwanzig Personen mussten also etwa fünf Jahre lang Simvastatin einnehmen, um den Tod einer Person zu verhindern. Die meisten von uns entscheiden sich für die Einnahme von Statinen nach einem Herzinfarkt.

Statine in der Primärprävention: Die Zehnjahres-NNTBs für Statine in der Primärprävention liegen bei entsprechender Anwendung bei etwa 30. Dreißig Personen müssen etwa 10 Jahre lang ein Statin einnehmen, damit bei einer Person keine atherosklerotische Herz-Kreislauf-Erkrankung auftritt.

Ezetimibe (ein Cholesterinabsorptionshemmer) in der Sekundärprävention: Wenn 50 Personen mit akutem Koronarsyndrom zusätzlich zu einem Statin sieben Jahre lang Ezetimibe einnehmen, wird eine Person ein kardiovaskuläres Ereignis vermeiden.

Dies sind die Zahlen, die wir mit wirksamen Medikamenten in Verbindung bringen – NNTBs von 25 bis 50. Sehr viel mehr Menschen müssen eine langkettige Omega-3-Ergänzung einnehmen, um ein einzelnes koronares Herzkrankheitsereignis oder den Tod zu verhindern. Langkettige Omega-3-Fettsäuren (mit NNTBs von 167 beziehungsweise 334), sind viel weniger wirksam als diese Medikamente und fast alle Menschen, die diese Nahrungsergänzungsmittel einnehmen, werden nicht davon profitieren.

Haben sich die Schlussfolgerungen in Bezug auf fettem Fisch geändert? Schützt er unsere Herzen?

Leider haben wir keine zusätzlichen Studien gefunden, die die Menge an ölhaltigem Fisch, die die Teilnehmer gegessen haben, erhöht hätten. Das bedeutet, dass wir die Auswirkungen des vermehrten Verzehrs von öligem Fisch auf die Gesundheit des Herz-Kreislauf-Systems noch immer nicht vollständig verstehen. Fisch und Meeresfrüchte sind nährstoffreich und reich an einer Vielzahl anderer Nährstoffe (wie z.B. Vitamin D, Kalzium, Jod, Selen, Eiweiß), so dass sie auch ohne kardiovaskuläre Vorteile nützlich sind.

Welche Auswirkungen hat die vegetarische/vegane Version von Omega-3, ALA?

Eine Erhöhung der ALA-Aufnahme macht wahrscheinlich wenig oder keinen Unterschied in Bezug auf die Gesamtmortalität, die kardiovaskuläre Mortalität, die Mortalität bei koronaren Herzkrankheiten und die Ereignisse bei koronaren Herzkrankheiten. Eine erhöhte ALA-Zufuhr kann jedoch das Risiko von kardiovaskulären Krankheitsergebnissen und Herzrhythmusstörungen leicht verringern. Auch hier sind diese Auswirkungen gering: 500 Personen müssten ihre ALA-Zufuhr über mehrere Jahre hinweg erhöhen, um zu verhindern, dass eine Person ein CVD-Ereignis erleidet, und 91 Personen müssten die ALA-Zufuhr erhöhen, um zu verhindern, dass eine Person eine Arrhythmie erleidet.

Gibt es Pläne, diese Übersicht bald wieder zu aktualisieren?

Der Review muss aktualisiert werden, sobald weitere große und qualitativ hochwertige Studien über den Verzehr von ölhaltigem Fisch und/oder die Erhöhung der ALA-Aufnahme vorliegen. Wir hoffen, dass dies bald geschieht. Es laufen keine weiteren sehr großen Studien über langkettige Omega-3-Nahrungsergänzungsmittel, die eine automatische Aktualisierung auslösen werden, obwohl einige große Studien weitere Ergebnisdaten zur Verfügung stellen könnten.

Zum Original-Interview mit Dr. Lee Hooper auf Englisch. Text Adaptiert und übersetzt von Cochrane Deutschland.

Zum Review: Abdelhamid AS, Brown TJ, Brainard JS, Biswas P, Thorpe GC, Moore HJ, et al. Omega-3 fatty acids for the primary and secondary prevention of cardiovascular disease. Cochrane Database Syst Rev. 2020;Issue 2:CD003177. DOI: 10.1002/14651858.CD003177.pub5

Mehr über Cochrane Heart.

Anmerkung: Aus Gründen der besseren Lesbarkeit wird auf die gleichzeitige Verwendung männlicher und weiblicher Sprachformen verzichtet. Sämtliche Personenbezeichnungen gelten gleichermaßen für alle Geschlechter.

Pages