Evidenz in der Kieferorthopädie

RCT-Studien sind ein Standard ohne Gold

Der Vorwurf mangelnder Evidenz in der Kieferorthopädie gründet sich nicht zuletzt darauf, dass heute bei Nutzenbewertungen nur randomisiert-kontrollierte Studiendesigns (RCT) als ausreichend beweiskräftig für den Erfolg einer Behandlung gelten. RCT sind in der Kieferorthopädie aber oft nicht sinnvoll einsetzbar. Es gibt aber Alternativen.

Abbildung 1: Ergebnisse eines RCT zum Einfluss der informierten Einwilligung von Patienten auf die Wirkung von Analgetika Nach: Bergmann et al. [1994]: A randomised clinical trial of the effect of informed consent on the analgesic activity of placebo and naproxen in cancer pain. Clinical Trials and Metaanalysis, 29, 41–47.

Die Vorstellung ist faszinierend und die Welt der Forschung wäre gleichsam aufgeräumt und geordnet, wenn es zutreffen würde, was uns die Verfechter der Evidenzpyramide nun seit einigen Dekaden bereits versprechen: Es gibt den einen und besten Weg, um die unbestechliche Wahrheit zu jeder beliebigen Forschungsfrage herauszufinden. Eine Art Universalwerkzeug, mit dem die Wirkung oder Nichtwirkung einer medizinischen Intervention zweifelsfrei nachgewiesen werden kann. Der Glaube daran nimmt zeitweise recht fundamentalistische Züge an: So empfahlen Sackett et al. Mitte der Neunzigerjahre „Wenn Sie auf eine nichtrandomisierte Studie stoßen, sollten Sie besser gar nicht weiterlesen, sondern gleich zum nächsten Artikel weiterblättern“ [Sackett et al., 1996].

Debatte um kieferorthopädische Versorgung

Der Bundesrechnungshof sieht keinen nachgewiesenen Nutzen der kieferorthopädischen Versorgung. "Böse Abzocke mit unnützen Zahnspangen" titelte die Bild-Zeitung. Die Zahnärzteschaft hält dagegen.

mehr

Diese Aussage beruhte noch auf der Annahme, eine RCT könnte systematische Fehler nicht nur begrenzen, sondern total beseitigen. Seither haben jedoch Wissenschaftler in allen medizinischen und zahnmedizinischen Disziplinen erkannt, dass dies nicht zutrifft. Nach der „neuen Lehre“ der evidenzbasierten Medizin können „RCTs systematische Fehler minimieren, aber nicht eliminieren“ [Sami/Sedwick, 2011]. Zudem können sie, wie Kaptchuk betont, „ihre eigenen Abweichungen von der Wahrheit einbringen“ [Kaptchuk, 2001]. Die Diskussionen der letzten 20 Jahre haben gezeigt, dass das RCT-Design zahlreiche Schwächen aufweist und nicht unerheblichen Limitierungen unterliegt – von ethischen Grenzen über praktisch undurchführbare Verblindungen bis hin zu spezifischen Verzerrungsrisiken. Würdigt man diese Tatsachen, wird aus dem Universalwerkzeug RCT ein ganz normales Instrument der Wissenschaft, das in einigen Bereichen seine Stärken ausspielen kann, in anderen aber schlicht unbrauchbar für die Forschung ist.

RCTs in der KFO

Um es gleich vorauszuschicken: Mir erscheinen RCTs nicht immer sinnvoll, jedenfalls nicht für zentrale klinische Fragen in der Kieferorthopädie. Meikle [Meikle, 2005] etwa resümierte, den Aussagegehalt von RCTs zur Behandlung von Klasse-II-Anomalien betreffend: „Wenn man fragt, ob RCTs ihr angestrebtes Ziel erreicht haben oder ob sie Erkenntnisse geliefert haben, die nicht bereits aus retrospektiven Studien oder Tierversuchen vorlagen, müsste die Antwort Nein lauten.“ Diese Aussage wiegt umso schwerer, wenn man bedenkt, dass zu keinem Thema der Kieferorthopädie mehr RCTs verfügbar sind als zu Klasse-II-Anomalien.

Zur Beantwortung der Frage, warum RCTs häufig an wesentlichen klinischen Fragestellungen der Kieferorthopädie scheitern, müssen wir uns ihren eigentlichen Zweck vor Augen führen: nämlich zu prüfen, ob eine Behandlung funktioniert, und zwar im Vergleich zu einem Kontrollzustand. Dieser kann in keiner, in einer alternativen oder in einer Placebo-Behandlung bestehen. Und da die Kieferorthopädie von Apparaturen bestimmt wird, liegt genau hier das Problem! Denn „kieferorthopädische Behandlungen gestalten sich nicht als sequenzielle Pilleneinnahme, die man randomisiert durchführen und verblindet auswerten könnte“ [Johnston, 2002]. Im Gegenteil: Selbst „unsichtbare“ Apparaturen sind für den Patienten sichtbar, jedenfalls aber wahrnehmbar. Also scheiden, wenigstens für die meisten Fragestellungen, Placebo-Behandlungen schon einmal aus.

Natürlich besteht immer die Alternative einer RCT mit einer unbehandelten Kontrollgruppe. Selbst wenn wir jedoch ethische Bedenken einmal ausklammern, wollen mir nur wenige klassische Fragestellungen der klinischen Kieferorthopädie einfallen, die ein solches Studienkonzept rechtfertigen würden. Dies umso mehr, wenn wir realistisch bleiben und nicht die jahrzehntelangen klinischen Erfahrungen ignorieren, über die wir in der Kieferorthopädie verfügen. Hierzu gehört, dass wir unbehandelte Kontrollgruppen nicht bedingungslos auch in lächerlichen Szenarien fordern, in denen eine klinisch relevante, stichhaltige Wahrheitsfindung auch ohne Kontrollgruppe gut möglich ist. Ein Beispiel dafür wäre die Aussage, dass sich starke Bissanomalien wie etwa eine Frontzahnstufe > 9 mm nicht von selbst korrigieren, dazu braucht es schlicht keine Beweisführung auf Evidenzstufe I.

Systematische Fehler von RCTs

Zusammenfassend sind also Vergleiche zwischen unterschiedlichen Behandlungsformen die einzige Forschungsmethode auf RCT-Niveau, die uns in der Kieferorthopädie bleibt. Solche RCTs sind zweifellos machbar, aber sind sie auch immer sinnvoll? 

Der Erfolg kieferorthopädischer Behandlungen hängt immer in gewissem Maße von der Kooperation der Patienten ab, weshalb Verzerrungseffekte wie die „aktive Forschungsbeteiligung“ hier sehr stark zum Tragen kommen. Schon die Tatsache, dass von jedem RCT-Teilnehmer eine Einwilligungserklärung nach erfolgter Aufklärung obligatorisch ist (also die Forderung nach informed consent oder informierter Einwilligung), kann das Ansprechen auf die Therapie in einem klinisch möglicherweise höchst relevanten Maß beeinflussen. Bergmann et al. [Bergmann et al., 1994] starteten 1994, kurz vor Inkrafttreten dieser Aufklärungspflicht in Frankreich, eine RCT zum Einfluss der informierten Einwilligung auf die Wirkung von Analgetika. 49 konsekutiv hospitalisierte Patienten mit leichten bis mittelstarken Tumorschmerzen wurden nach dem Zufallsprinzip über ihre Teilnahme an der RCT entweder informiert oder nicht informiert. Im zweiten Schritt erfolgte, wieder per Los, die Zuteilung aller Patienten zu den Behandlungsgruppen Analgetikum (Naproxen) oder Placebo. Die Resultate (Abbildung 1) zur Schmerzlinderung erbrachten in der nicht informierten Normalfallgruppe erwartungsgemäß eine Wirkung des Analgetikums, nicht aber des Placebo. Mit dem Umstand der Aufklärung veränderte sich dieses Bild massiv: Das Placebo wie auch das Analgetikum reduzierten die Tumorschmerzen unter den informierten Patienten signifikant stärker und nachhaltiger als unter den normalen klinischen Bedingungen. 

Auch kieferorthopädische Studien unterliegen der Aufklärungspflicht und lassen sich zudem, wie bereits erwähnt, meist weder einfach noch doppelt verblinden. Die daraus resultierenden Einstellungs- und Verhaltensanpassungen bei Patienten und Behandlern beeinflussen auch die Resultate in der Kieferorthopädie in klinisch signifikanter Weise. Ein sehr gutes Beispiel für diesen Zusammenhang ist die RCT von Sandler et al. [Sandler et al., 2008] unter Beteiligung von 51 randomisierten Patienten, die zur stärkeren Verankerung einer festsitzenden Apparatur entweder einen kooperationsabhängigen Headgear trugen oder mit einem kooperationsunabhängigen Gaumenimplantat zur Verankerung versorgt wurden. Die prätherapeutischen PAR-Werte (Schweregrad der Fehlstellungen) waren in beiden Gruppen vergleichbar, die PAR-Rückgänge im Behandlungsverlauf ebenfalls. Headgear und Implantat waren somit gleich wirksam. Auch bestand kein Gruppenunterschied bei der Behandlungsdauer, das heißt, beide Varianten waren auch gleich effizient. Aber ist dies tatsächlich die Wahrheit? Nun, es ist eine Wahrheit, allerdings nicht die klinische, sondern das Abbild einer von der Studie selbst beeinflussten Realität. Sandler et al. geben nämlich zu bedenken, dass „die Headgear-Patienten die Behandler mit der Geschwindigkeit und Effizienz der Methode überraschten […] die Kooperation übertraf das normal zu erwartende Maß […] vermutlich waren wir Zeuge des Hawthorne-Effekts!“ [Sandler et al., 2008].

Der Hawthorne-Effekt ist ein Phänomen, bei dem unter Beobachtung stehende Menschen im Wissen um diese Tatsache ihr Verhalten verbessern oder ändern [McCarney et al., 2007]. Wir müssen uns bewusst sein, dass kieferorthopädische RCTs extrem anfällig für Hawthorne-Effekte sind, da bei all diesen Behandlungen der Erfolg in einem gewissen Maß von der Kooperation des Patienten abhängt. Verändert das Bewusstsein um eine Studienteilnahme die Kooperation, lassen sich demnach alle kooperationsabhängigen Therapieformen durch ein RCT-Konzept nicht zuverlässig prüfen – jedenfalls nicht auf klinisch relevante Wahrheiten. Und dies erklärt vielleicht, wie Meikle 2005 festhielt, „warum RCTs in der Kieferorthopädie ihr beabsichtigtes Ziel verfehlt haben“ [Meikle, 2005].

Alternativen zu RCTs

Wir müssen also akzeptieren, dass für viele kieferorthopädische Fragestellungen keine, oder wenigstens keine vernünftige, Möglichkeit zur Durchführung einer RCT besteht, weil dies mit zu großen Schwierigkeiten verbunden wäre [Cunningham et al., 2011]:

  • hohe Kosten
  • ethische Probleme
  • Aufklärungspflicht, elterliche Einwilligung
  • Probleme durch systematische Fehler
  • Behandlungspräferenzen von Behandlern/Patienten

Rekrutieren ausreichend vieler Patienten (oft wird das Angebot teilnahmewilliger Patienten überschätzt)

Die genannten Argumente führen klarerweise zur Frage, wie es nun weitergehen soll vor dem Hintergrund, dass „der verbreitete Glaube, nur RCTs könnten vertrauenswürdige Resultate liefern und Beobachtungsstudien wären irreführend, der Patientenversorgung wie auch der klinischen Forschung und der Ausbildung von Gesundheitsdienstleistern einen schlechten Dienst“ erweist [Concato et al., 2000].

Gibt es Alternativen?

Wenn wir vor unserem geistigen Auge die Evidenzleiter hinuntersteigen, wären Kohortenstudien – also nichtrandomisierte prospektive Studien – die nächste Überlegung. Der einzige nennenswerte Unterschied zu RCTs besteht jedoch in der nicht zufälligen Gruppenzuteilung, so dass im Hinblick auf kieferorthopädische Fragestellungen die meisten bereits erörterten Nachteile von RCTs auch für Kohortenstudien gelten. Folglich müssen wir uns noch eine Stufe tiefer auf die Ebene der Fallkontrollstudien und retrospektiven Studien begeben. Ich persönlich bin voll und ganz der Meinung von Johnston [Johnston, 2002], dass uns „in der Kieferorthopädie nur der Blick zurück nach vorne führt“. Diese Aussage zielt nicht auf eine Rückkehr zu früheren Praktiken, sondern auf eine Verbesserung der Qualität von retrospektiven klinischen Studien: „Aus heutiger Sicht ist die drängendste klinische Frage das Erkennen und, im Rahmen des Möglichen, Eliminieren diverser systematischer Fehler im Gepäck der durchschnittlichen retrospektiven Studie“ [Johnston, 2002].

Abbildung 2: Kieferorthopädische RCTs pro Jahr zwischen 1990 und 2013 | Ruf

Ein Vergleich zwischen RCTs, Querschnitt-, Kohorten- und Fallkontrollstudien macht deutlich, dass die drei letzteren Beobachtungsstudien in puncto äußere Validität potenziell besser abschneiden als die RCTs. Anders formuliert lassen sich die gewonnenen Daten besser auf die Allgemeinbevölkerung übertragen, was natürlich wünschenswert ist. Andererseits haben sie den Nachteil einer schlechteren inneren Validität, da es sehr viel schwieriger ist, systematische Fehler und konfundierende Faktoren diverser Art zu beseitigen oder einzudämmen [Carlson/Morrison, 2009].

Wie also können wir retrospektive Studien verbessern? Statt Millionen von Euro ausschließlich für RCTs auszugeben, könnten wir alternativ oder ergänzend in eine Art internationales KFO-Register investieren, wo kieferorthopädische Fälle von Dysgnathien mit eindeutig definierten Merkmalen verpflichtend einzutragen wären. Natürlich sind auch solche Registerstudien nicht frei von systematischen Fehlern, sie bieten jedoch als Primärquelle für populationsbasierte Fallkontrollstudien eine Reihe von Vorteilen [Carlson/Morrison, 2009]:

  • große Stichproben
  • systematisch gesammelte Daten
  • eine wesentlich raschere Durchführung von Studien
  • relativ geringe Kosten
  • Studien zu seltenen Effekten und Erkrankungen
  • informierte Einwilligung nicht mehr erforderlich
  • eine wesentlich einfachere Auswertung von Langzeiteffekten

Resümierend lässt sich also festhalten, dass „individuelle wie kollektive Experimente, Beobachtungen und Berechnungen jeweils maßgeblich zur Evidenzbasis für eine moderne Therapeutik beitragen. Kontroversen zur relativen Bedeutung der einzelnen Studienkonzepte lenken nur unnötig ab. An die Stelle von Evidenzhierarchien sollte die Akzeptanz – ja das bereitwillige Aufgreifen – einer Vielfalt von Ansätzen treten“ [Rawlins, 2008]. Mit einer solchen Entwicklung verbunden wäre dann auch die Hoffnung auf ein Ende der nun schon viel zu lange geführten, ideologisch aufgeladenen Debatten über das Für und Wider evidenzbasierter Glaubensgegenstände. Mit den zweifellos vorhandenen Verdiensten der EbM, aber ohne den Bias des messianischen Eifers, wird die Wissenschaft besser vorankommen.

Prof. Dr. Sabine Ruf
Direktorin der Poliklinik für Kieferorthopädie
Zentrum für Zahn-, Mund- und Kieferheilkunde
Justus-Liebig-Universität Gießen
Schlangenzahl 14
35392 Gießen

Leicht gekürzter Nachdruck aus ZAHNMEDIZIN UND GESELLSCHAFT, Heft 2017–1, Hrsg. von der Interessengemeinschaft Zahnärztlicher Verbände in Deutschland e.V. (IGZ) Originalartikel frei zugänglich unter www.i-g-z.de 

Seite 1: RCT-Studien sind ein Standard ohne Gold
Seite 2: Literatur
alles auf einer Seite
19944271970765197076619707671987049 1994428 1970769
preload image 1preload image 2preload image 3preload image 4preload image 5preload image 6preload image 7preload image 8preload image 9preload image 10preload image 11preload image 12preload image 13preload image 14preload image 15preload image 16preload image 17preload image 18preload image 19preload image 20preload image 21preload image 22preload image 23preload image 24preload image 25preload image 26preload image 27preload image 28preload image 29preload image 30preload image 31preload image 32preload image 33preload image 34preload image 35preload image 36preload image 37preload image 38preload image 39preload image 40preload image 41preload image 42preload image 43preload image 44preload image 45preload image 46preload image 47preload image 48preload image 49preload image 50preload image 51preload image 52preload image 53preload image 54preload image 55preload image 56preload image 57preload image 58preload image 59preload image 60preload image 61preload image 62preload Themeimage 0preload Themeimage 1preload Themeimage 2preload Themeimage 3preload Themeimage 4preload Themeimage 5preload Themeimage 6preload Themeimage 7preload Themeimage 8preload Themeimage 9preload Themeimage 10preload Themeimage 11preload Themeimage 12preload Themeimage 13preload Themeimage 14preload Themeimage 15preload Themeimage 16preload Themeimage 17preload Themeimage 18preload Themeimage 19preload Themeimage 20preload Themeimage 21preload Themeimage 22preload Themeimage 23preload Themeimage 24preload Themeimage 25preload Themeimage 26preload Themeimage 27preload Themeimage 28
Bitte bestätigen Sie
Nein
Ja
Information
Ok
loginform
Kommentarvorschau
Kommentarvorschau schliessen
Antwort abbrechen
Ihr Kommentar ist eine Antwort auf den folgenden Kommentar

Keine Kommentare