Wirksamkeitsforschung

Aus Psycho
Wechseln zu: Navigation, Suche

Inhaltsverzeichnis

Wie kann man den Refolg vin PT Forschung wissenschaftlich untersuchen?

Interventions und Evaluationsstudie

Schritte empirischer Forschung

F 140225.1.png

  1. Ausgangspunkt
    • offene Fragestellung in der Gesellschaft
    • Welche verfahren sind wirksam?
  2. Wissenschaftliche Fragestellung
    • Wird so definiert das man Hypothesen erstellen kann
  3. Hypothesenbildung
  4. Operationalisierung
    1. Wir wollen x überprüfen, erzielen Patienten einen Therapieerfolg
    2. Was ist ein Therapieerfolg?

Wie misst man pPTeffekte

Was für eine Erwartung hat man

In welchen bereichen sollte die PT wirken, was sind die Outcome Bereiche

Wie Mess ich die Bereiche dann

Operationalisierung

Fallbesipiel (F10)

Frau W. in welchen Bereichen soll die Therapie wirken, wie kann ich die messen, kann ich den Therapiererfolg überhaupt allgemein bestimmen?

Symptomatik umfasst auch das emotionale.

Man hat ein Spektrum an Kritierien, die man abwägen muss, wie werde ich der Patientian, aber auch der Intervention gerecht.

Gliederungsversuch von Schulte

Auf welchen Ebenen müssen wir schauen wenn wir von Therapieerfolg sprechen.

  • Ursache, Defekt, ändert sich etwas daran.
    • Bsp. Angsttörungen: starkes Vermeidungsverhlten, um Therapieerfolg zu messen schauen ob sich das Vermeidungshalten minimiert.
    • Ebene ist stark theorie/schulenabhängig, Welche Variablen mit in die Outcomemessung mitkommen.
  • Symptomatik
    • Brngt die Behndlung besserung im Hinblick auf Krnakheitsbild
  • Krankheitsfolgen
    • Beeinträchtigung duch Symptomatik
    • Bei 2 Patienten mit gleicher ssymptomatik können Folgen ganz unterschiedlich sein
    • Auch die Behandlungskosten fallen in diesen Bereich (Bringt eine Behandlung etwas im Bezug auf Kostenreduktion)
  • Nebenwirkungen
    • Kommt es zu Verschlechterungen oder klassischen Nebenwirkungen (Beziehungsproblme wegen PT etc.) Schelchte Therapieerfahrungen, keine Motivaion Probleme zu behandeln.

Gute Liste auf Folie 13 ist aber relativ willkürlich und nicht fix, die Liste sind mehr die Zentralen (markiert)

Begründete Entscheidung welche Outcomeberiehce relevant sind.

Wie kann man den Outcomebereich oeprationalisieren?

Messbarmachung, wei messe ich eine Variable. Zwei Arten von Variablen

Manifest

Direkt beobachtbar

Latent

Indirekt messbar

Überwiegend latente Variablen, Man hat daher ein verstärktes Problem der Operationalisierung

Aus wessen Perspektive?

Folie19 Wie ist es am reliabelsten und am validesten. Um einzuschätzen was man nimmt muss man die Gütekriterein hinzuziehen. (objektivität, Reliabilitäät, Validität) Bereiche bei denen es sinnvoller ist wenn der Therapeut eine Einschätzung gibt sind solche, bei denen jemand aufgrund der symptomatik nicht in der Lage ist eine Einschätzung zu machen (schwer depresiv z.b)

Methoden der Datengewinnung

Beobachtung

Interview

Tests und Fragebögen

SCLR-90-R

Hohe Interkorrelation zwischen Subskalen, es ist nur Legitim die allgemeine Symptombelastung (GSI) interpretieren, es dürfen keine spezifischen Aussagen gemacht werden (viele depressive dinge angekreuzt > derpression darf nicht geschlossen werden)

Etwas lang, daher hat man eine Kürzere Variante erstellt:

SCL-14

Auch eine Grosse Korrelation und eine Gute Messung des GSI
Oft sinnvoller da ökonomischer.

Spezifische Symptomskala (ADS-K) Patientensicht

Folie 28 Auch hier lang und kurzversionen. Es werden Depressive Symptome erhoben Recht gut eingeführtes Instrument. Reagiert auch auf niedrige Symptomatik relativ gut. Eigentlich da Likert als Intervallskala, eigentlich sinnvoll nutzber aber als Ordinalskaliert. Die Abstände sind nciht so richtig gleich.

Hamilton Scale (Depression) HAMD

Folie 31 Der Behandler soll einschätzen wie sich der Patient verhält. Ganz andere Formulierung und ganz anderer Anspruch, man muss dafür geschult sein. Fremdratings hängen von der Qualität des Behandlers ab

Outcome: Erfüllen einer Diagnose

Kriterium des Erfüllen oder nichterfüllens der Diagnose.Binominalskaliert, Nominal) Wird über das klinische Interview gemacht. Relaibilität und validität steigt wenn das standartisiert vorgenommen wird. Es wird eine standartisierte Checkliste im Interview erfasst.

SKID

Sturukturierte klinisches Interview gemäss Diagnosesystem (DSM-V) Training und klinischer Hintergrund müssen von durchführer erfüllt sein.

Probleme

Probleme sind episodische Verhaltensformen (Depressive Phasen , Symptomfrei im Moment, aber bei gestaffelten messungen kann man die Episoden erwischen)

Mann weiss nicht was mit den Patienten ist, welche die Symptome zwar haben die Diagnose erfüllen, aber vielleicht auch in verminderter Form, es war also doch ein Therapieerfolg.

VorteiL: einfach kommunizierbar, aber ob aussage Adequat ist kann nciht gesagt werden.

Gesundheitsbezogene Lebensqualität

Ausmass, in dem medizinische Bedingungen bzw. deren Behandlung das übliche oder zu erwartende körperliche, emotionale und soziale Wohlbefinden beeinträchtigen. Einschränkung der Aktivität. Etwas anderes als was man umgangssprachlich als Lebenqualität anschaut. Besonder wichtig bei chronischen Krankheiten über lange sicht stärker eingeschränkt. Auch miteingerechnet sind Beschränkungen, welche durch die Behanlung selber entstehen.

Beispieltest Item SF-8 auf f37

SF-8

Kurzform des SF36 Test zur Erfassung der gesundheitsbezogenen Lebenqualität Einschränkunf duch psychische und einschränkung durch somatische Aspekte.

Interpersonale Prblematik / Beziehungen

Was ist eine Auffällige, was eine normale Interaktion?

IIP-D

Interpersonale Problleme Detsch. 8 Skalen man möchte ungünstige Interaktionsmuster verändern. Beispiele auf Folie 41 Es hgeht um ein Kontinuum von ungünstig bis ganz normal Man braucht Studien, welche helfen ein Cutoff zu definieren um eine grosszahl der Patienten, welche auch eine klinische Diagnose erfüllen auszusieben. Wobei bei diesem Test kein Cutoff genommen wird, sonder ein 2-Dimensionales Circumplexmodell welches als Spinnennetz ausgefüllt wird

F 140225.2.png

Wie kann man Intervention wissenschaftlich untersuchen

In welchen Bereichen soll intervention Wirken (outcomebereiche) Folie5 Selbstwirksamkeitserwartung: subjektive Auffassung neue oder schweirige Situationen selbst zu meistern. Hier ist es nciht die Frage ob das so ist (wirkluich besitzen der Fähigkeit) sodern ob die Person subjektiv davon ausgeht.

  • Boah ich kann das eh nicht**

SWE

Inteernationaler und etablierter Test. Man hat 10 items, welche man auf einer Skala beurteilen Soll (auf jeden fall Ordinal, evtl Intervall) Folie10 Man könnte bei Frau w eine verbesserung entdecken, da der test aber die Globale SWE misst, wird das gesamtresultat tiefer sein. Wie spezifisch soll mein instrument angelegt sein, je spezifischer desto eher sind in dem Bereich effekte zu erwarten, aber die allgemeine relevanz nimmt ab Bei Frau W. wäre ein Instrument oder Fragebogen zu sozialer SWE besser als der SWE zum globalen Test.

Ist das Kriterium für ein Therapieerfolg individuell oder übergreifend?

therapieziele versprechen einen Kompromiss zwischen Individualisiert und übergreifend anzubieten.

  • „ultimategoals“ = Ziele, die den Patienten dazu veranlassen, eine Behandlung zu beginnen (bei frau W abnahme der Angst)
  • instrumental goals“ = vom Therapeuten festgelegte Ziele Annahme, dass die Erreichung notwendig ist, um die ultimativen Ziele des Patienten zu erreichen (Bei frau W möglichkeit situationen aufzusuchen und somit reduktin des Vermeidungsverhalten) Mittel zum Zwck/Ultimativen Ziel

Therapieprozess profitiert davon wenn Therapieziele definiert werden.Weshalb sitzen wir zusammen, wasmcöhten sie erreichen, was möchte ich erreichen Wo konsensus zwischen Zielen Gegeben ist der Therapieerfolg höher. Therapieziele sind auch ein Mittel zu behandlng.

Therapiezele als Mittel zur Evaluation

Ergänzung zu generischen Outcomemassen Folie15

Zielorientierte Evaluationsstrategien

Keine Verwässerung Entweder komplett individuell oder ein Stückweit standartisiert (individuell ist extrem Aufwendig)

Individuelle Therapiezielsitzung

GAS Goal Attainment Scale

Man will Ziellereichung messen, ist unabhängig von den Inhalten und kann daher überall eingesetzt werden da individuell das Ziel Festgelegt wird. Man legt ein Zielbereich fest und für jedes Zeil werden Indikatoren festgelegt. Diese Indikatoren werden danach in eine 5-Stufige Skala pberführt in der Mitte (bei 0) steht das erwartet Ergebnis. Beispiel Folie19

SMART Prinzip

Gut bei der Definition von Zielen Wenn Ziele Angesetzt werden dann Spezifisch, Messbar (& Quantifizierbar) Akzeptiert, Realistisch (sonst werden nur Frustrationen erzeugt) und Terminierbar

Therapieziel können je nach SChweregrad unterschidlich sein, villeicht setzt jemand die 0 als ein Ziel das realtiv einfach zu erreichen ist, jemand anders definiert das eventluell unterschidlcih schwer. Kritikpunkt an GAS

Therapieziellisten

Listen von möglichen Therapiezielen Alles auflisten und nach Kategorien sortieren (Texonomie) Diese Auflistung kann dann in Instrumente (Checklisten) umgewandelt werden Beispiel auf Folie 27 & 29 Es gibt vorgegebene Ziele, das Individuelle ist das die Patienten ankreuzen was für sie relevant ist. danach sollten sie die 5 wichtigsten Ziele priorisieren (soonst sagt man: ja das ist eigentlich auch nicht schlecht) Nahc Abschluss der Behandlung werden dem Patienten diese 5 Ziele wieder vorgelegt. Ergebnisse der Anwendung solcher Zielliste auf Folie 32 Die ersten 3 Bereiche weden von fast allen Leuten genannt. Individualisietre Evaluation ist wichtig, aber den Zahlen ist u entnehmen das die meisten trotzdem übergreifende Ziele sind.

Probleme der TherapiezielerfassungFolie33

Manisfeste Variablen: Sozialmedizinische Parameter, Arbeitsfähigkeit

Beispiel Folie 35 Es sind nicht alle Berufstätig, die Arbeitsfähigkeit wird trotzdem schwieriger zu beurteilen.

F 140304.1.png

Inanspruchnahme von Gesundheitsleitungen lassen sich relativ einfach herausfinden, hier ist die schwierigkeit bei der Rekonstruktionsfähigkeit der Patienten

Hier geht es vorallem um kosten-nutzen analysen

Priorisierung von Outcomebereichen

Man muss eine Auswahl treffen, man kann auch für einen Outcomebrecih verschiedene Operationalisierungen herbeiziehen. (Messung eines Outcombereich mit verschiedenen Instrumenten)

Oft definiert man einen bestimmten Outcomeberiech (im Vorfeld und muss auch im Vorfeld publiziert werden) Danach definiert man die sekundären Outcomebreichen.

Was ist der Hintergrund für diese Priorisierung?

Selbst belastbare Patienten die 50 Instrumente durchabeiten führen dazu das man alleine durch zufall in bestimmten bereichen zufällig signifikante Ergebnisse erhält

Selbst wenn ein verfahren nicht wirksam ist, erhält man bei mehrfachtestung evtl per Zufall irgendwann ein Signifikantes ergebnis. die Priorisierung ist ein SChutzmechanismus der das versucht zu unterbinden.

Gütekriterien

Objektivität, Rleiabilität und Validität zusätzlih ist es wichitg das ein Obejkt Änderungsensitiv ist und gut Normiert ist (dmait Cu-off bereiche Festgelegt werden können Ab wo ist jemand auffällig, im klinisch relevanten Bereich

Weiter Entscheidungen

Erfassung von Veränderungsinformationen

Indirekte Veränderungsmessung

Wie kann ich Veränderungen abbilden. Man misst nicht direkt sondern macht zwei Sttuserhebungen. Eine bei t0 (vor intervention) und eine bei t1 (nach intervention) Wie geht es momentan, danach bildet man die Differenz. Die Merkmalsänderung wird indirekt durch die Differenzbildung erschlossen. (Beispiel hierfür z.B ADS-K) Nachteile:

  • Man hat 2 Messungen ungenauigkeit von 2 Messungen für ein Kennwert
  • Bedeuten die Differenzwerte immer dasselbe unabhängig von Ausgangswert
    • (Subjektivismus papipapa BSp: 130kg-auf 120kg und 80kg auf 70kg Differenzwert bei beiden Patienten ist gleich, therapierfaolg aber auch?)
    • Regression zu Mitte: Die Extremeren werte tendieren bei der zweiten Messung eher zur Mitte, könnte als Interventionseffekt interpretiert werden

Direkte Veränderungsmessung

Nur eine Messung (t1) man erfragt direkt die Veränderung Hat sich bei ihnen etwas im Vergleich zu vorher verändert? Der Patient schätzt ein wie gross die Veränderung ist. Problem: Betzugsniveau des Patienten kann sich während der Behandlung verändern am anfang: wär kuhl wenn ich manchmal angstefrei wäre am schluss zwar erreiht aber hat das geühl: ich hab ja immernohc ängste, Effekte sin immer grösser bei der direkten messung tönt lustig ist einfach so

Daher gibt es ein Mittelding bei dem man am schluss sagt: schätzen sie retrospektiv ein, wie es am Anfang war.

F 140304.2.png

Vergelich der Beiden auf Folie 49 Beispiel auf Folie48

Beurteilung des Status nach Therapieende

Statusbeurteilung (t0 muss nicht unbedingt sin) bei t1 wirrd erfasst: wie ist der Status des Patienten. Liegt der Patient nun unterhalb des Cut-offs Folie51 Die t0erhebung kann man sich ersparen, da man davon ausgeht das t0 im dysfunktionalen bereich ist, bei t0 also alle patienten dysfunktional sind.

Beurteilung der Therapiezielerreichung

Wurden die Indiviuduellen Therapieziele das Patienten erreicht und in welchem ausmass?

Auswahl der Messzeipunkte

Prä, Post und Followup Followup erfasst wie gut die Behandlung anhält. Es kommt eine weiter information dazu die die Stabilität des effekts anzeigt. Indirekte Messung ist am weitesten Verbreitet

Wirksamkeitsforschung

  1. Ausgangspunkt: Neues Psychotherapieverfahren X verspricht, Depressionen zu reduzieren. Die ersten Erfahrungen (= Fallberichte) sind sehr vielversprechend.
  2. Wissenschaftliche Fragestellung: Ist die Intervention (Psychotherapie-verfahren X) wirksam?
  3. Hypothese:
    • Patienten mit Behandlung durch X weisen eine höhere Reduktion der Symptomatik auf als Patienten ohne X.
  4. Operationalisierung/Untersuchungskriterien /Methoden der Datengewinnung: (Auswählen des Verfahrens)
    • z.B. Primäres Outcome: Reduktion der Depressionssymptomatik gemessen mittels Patienten-Selbstrating anhand von Fragebogen mit zufriedenstellenden Gütekriterien (z.B. ADS-K)
  5. Untersuchungsplanung

Untersuchungsplanung/Versuchsplanung

Designs (Evalustions/Interventionsstudien)

Ein-Punkt Studie / One-Shot Study

Within Subject bereich. Man macht eine Einmalmessung in der Interessierenden Stichprobe. Mit einer direkten Einmalmessung: "Hat sich X im vergelcih zu vorher verändert" Pragamtisches Design, sollte vermieden werden, da retrospektiv und non Experimentell.

Prä-Post Studie

Within Subject Design. Teilnehmer die bekommen intervention, es wird aber zuerst eine Baseline gemessen.

Zeiteffekte

Spontanremission

Spontane verläufe, keine Veränderung wegen Behandlung

Lösung um Faktiren zu Kontrollieren: Einführen einer Kontrollgruppe, welche die Intervention nicht bekommt. Wie entstehen diese Gruppen? Wenn die Gruppenbildung natürlich entsteht: Quasiexperimentelle Studie:

Kontrollierte klinische Studie/ Quasiexperimentelle Studie

Z.B Gruppenzuweisung durch Wohnort (irgendwo existiert die Behandlung, an einem anderen Ort nicht. Oder auch: inanspruchnahme der Behandlung (Patient entscheidet selber in welche Gruppe er gehen möchte. Problem: Störvariablen sind nicht kontrolliert! Man muss von systematischen Unterschieden ausgehen. Durch Randomisieren kann man Störvariablen kontrollieren.

Randomisierte kontrollierte Studie

Königsweg für intern valides Ergebnis. RCT

Arten der Randomisierung

Individualebene

Jede Person wird zufällig zugeteilt

Clusterrandomisierung

Gruppenrandomisierungen, er werden ganze einheiten Randomisiert (z.B Kliniken oder Hausarztpraxen) Problem dabei ist das man sich die Stichprobengrösse reduziert. Die anzahl der Randomisierungseinheiten nimmt ab, es kommt nicht mehr zu einer so starken Gleichverteilung.

Stratifizierung

Geshcichtete Stichprobenziehung Innerhalb der Schichten wird randomisiert. Wenn man weiss das es zentrale Störvariablen gibt, welche man sicher kontrollieren will. (z.B. in Kontrollgruppe genau soviele Frauen wie in Versuchsgruppe etc.)

Typen von Kontrollgruppen

inaktive Kontrollgruppe

Leute die Warten, Kontrollgruppen ohne Behandlungen.

Ohne Behandlung

Wir beantworten Frage ob intervention besser ist als keine Behandlung. Aber eventuell höherer Drop-out etc. Eine Menge an Problemen, (Methodishc aber auch bei durchführung)

Wartende Kontrollgruppe

Kontrollgruppe wartet, weiss das sie die Intervention später erhält, alle bekommen die Intervention nur die einen Zeitversetzt. Problem ist: Wartegruppe, ich kriege meine Behandlung in 6 Monaten, man hat also ein Warten und daher eventuell eine Verbesserung.

Probleme Inaktiver Kontrollgruppe

unspezifische Faktoren werden im Paket mituntersucht, die Leute verändern sich wenn sie wissen das sie behandelt werden.

Aktive Kontrollgruppe

Placebo

Leute mit Placebo, Placebokontrollgruppe heisst auch Aufmerksamkeits-Kontrollgruppe, Intervention die unspetzifische Elemente enthält, aber keine spezifische Elemente enthält. Gehen die Effekte der Intervention über die unspezifischen Effekte hinaus

Intervention mit nachgewiesener Wirksamkeit

Vergleichen mit einer Intervention welche bereits als wirksam nachgeprüft istz. ist die Neue intervention besser oder mindestens genau so gut? Man testet entweder nach Äquivalenz oder Überlegenheit (bei Äquivalenztestung brauht man eine deutlich höhere Stichprobe) (oft in der Literatur ein ungenügendes N) Es muss im vorfeld entschiedne werden ob uüberlegenheit oder äquivalenz getestet werden soll. Mehrere Kontrollgruppen um mehrere Fragen zu beantworten möglich, aber man braucht auch eine grössere Stichprobe

TAU

Treatment as usual, KG enthält die behandlung die momentan gängig ist. es wird die Neue intervention mit der gängigen Behandlung verglichen. TAU kann sehr heterogen sein. Patienten können andere sachen gemacht haben, was ist denn TAU abhängig wie aktiv die KG ist.

Designtypen

Folie 35

Parallelgruppendesign

Studienteilnehmer werden auf Untersuchungsbedingungen randomisiert und erhalten (zeitlich parallel) die Intervention oder die Kontrollbedingung.

Crossover Design

Studienteilnehmer erhalten im Wechsel die Interventions-und Kontrollbedingung (cave: «carry-over-Effekte») Werden gerne genommen (in der Wirksamkeitsforschung aber leider nicht) Eine gruppe intervention und die andere KG dann nach der hälfte der Studie wird gewechselt. Bei interventionen aber daher nicht. Schwierigkeit: Intervention beginnt für die zweite Bedingung bereits zu wirken - Carry Over

Faktorielles Design

Verschiedene aktive Interventionen (und deren Kombination) werden verglichen. Mehrere Ausprägungern (nicht nur 2) Beispiel auf Folie 36

Multicenterstudie

Studie wird an verschiedenen Untersuchungsstandorten (Studienzentren) durchgeführt.

Placebobedingung macht es möglich doppelblindstudien durchzuführen. Doppelblingd geht aber bei interventionsstudien nicht, da der Behandler behandeln muss.

Designs für Interventionsstudien

F 140318.1.png

Nach unten nimmt die interen Validität zu.

Phasen der Evaluation

Phase I Entwicklungsphase / Konzeptentwicklung

Einzelfallstudien zur Wirksamkeitsbeobachtung, versuchen herauszufinden woran es liegt, k

Phase II Exploration

z.B konfrontation mit Aversiven Reiz etc.

Phase III

Wirksamkeit des Verfahrens bei maximaler internen Validität testen

Phase IV Praxiskontrolle

Wenn es unter Idealbedingungen funktioniert muss es auch in natürlichen Setting funktionieren

F 140318.2.png

Phase III: Wirksamkeit im Sinne der efficacy, wirksamkeit unter Idealbedingungen, Phase IV Wirksamkeit im sinne der effectiveness, Wirksamkeit in realem Setting. Hier werden Immer die Englsichen Namen verwendet efficacy - interne Validität im Zentrum effectiveness - externe Validität im Zentrum, (wie lässt sich die Studie auf andere übertragen)

Effektstärke

Mass zur einschätzung der Grösse eines Effekts unabhängig von der Grösse der Stihprobe, Man kann effekte zwischen verschiedenen Studien vergleichen und aufsummieren.

Cohen's d

Mittelwertsdifferenz in Standardabweichungen. Cohen’sd gibt den Abstand zweier Verteilungen in Einheiten ihrer Standardabweichung an.

Fehler beim Erstellen des Vorschaubildes: Datei fehlt

F 140318.4.png

Folie13 & 14 In der regel sind Rpä-post effektsärken grösser, sie lassen sich nicht vergleichen. Konvention von ist nur eine art plan b, man soll in der Literatur früherer studien suchen um herauszufinden ab welchen werten etwas klinisch sinnvoll ist.

Kann die Stichprobenzusammensetzung Auswirkungen auf die Berechnung der Effektstärke haben?

Je nach zusammensettzung der Gruppe wird sich Kleiner Nenner (hohe varianz und Standardabweichung) bei einer sehr homogenen stichprobe, bei einer Heterogenen Srichprobe ein Hoher Nenner, also eine kleine Effektstörke. Es stellt sich also die Frage wie Homogen die Stichprobe sein soll. Effektstärke ist höger je homogener die Stichprobe.

Es müssen 2 Kriterien Zutreffen um Therapieerfolg beurteilen zu können:

Ist eine Statisteische Veränderung vorgekommen? (Entspricht dem Konzept der kritischen Differenz)

  1. Kann anhand einer Formel ermittelt werden, der RC wird dafür verwendet. (Folie21)
  2. Mittelwertsdifferent muss mit dem Standardmessfehler der Differenzen in Beziehung gesetzt werden.
  3. Vergelichen des Wertes (Normalverteilung, je nach Prozent) mit dem Berechneten RCI
  4. F 140318.5.png
  5. Bei gegebene Messverfahren und Population ist sdiff Konstant
  6. Nun kann man nach der Differenz auflösen und hat nun eine Formen für die kritische Mittelwertsdifferenz

Man muss mit seinen Kennwerten von Dysfunktionalen bereich in den funktionalen Bereich wechseln als Patient (klinische Signifikanz)

Bei einem Instrument mit Cut-off muss der Patient von einem Cut-offbreich in den anderen Wechseln.

Nun kann der Patient in 4 Gruppen eingeteilt werden:

  1. Statistisch reliableund klinisch signifikante Verbesserung («Remission») (Kriterium 1 & 2 erfüllt)
  2. Statistisch reliableVerbesserung («Response») (Kriterium 1 erfüllt)
  3. Keine reliable Veränderung («Nonresponse») (Kriterium 1 nicht erfüllt)
  4. Verschlechterung (Kriterium 1 negativ erfüllt; ggf. auch Kriterium 2)

Cutoff liebgt oft ca. 1 SA über dem Mittelwert der Bevölkerung

Umgang mit Drop-Outs

Eigentlich will man immer 100% vollständiger Datensatz, in der Realität hat man aber immer Drop-outs. Es gibt unterschiedliche Drop-outs:

  • Studienteilnehmer die man verliert (Verschwinden, die Studienteilnehmer sind nicht mehr erreichbar) (Teilnahme basiert auf Freiwilligkeit und TN kann ohne Gründe aufhören) (Studiendropout)
  • Studienteilnehmer, die Fragbogen falsch/unvollständig ausfüllen (Missing Values)
  • Studienteilnehmer die die Intervention abbrechen (Interventionsdropuots)

Oft kommt es zu einer Kombination zwischen Intervention und Studiendropout

Folie 4 Grafik

Probleme

  • Reduktion der Stichprobengrösse (Statistisch berechnet, evtl bei hohem drop-out zu knapp)
  • unsystematischer Droput nicht so schlimm, aber systematischer Dropout schlimm (bestimmte Merkmale verlassen Studie -> Verzerrung)

Gründe für systematischer Drop-out:

  • aus Unzufriedenheit
  • wegen Verschlechterung und stationärer Einweisung
  • fehlende Motivation
    • höher Motivierte erzeilen besseres Ergebnis -> Verzerrungxs
  • etc.

Gründe für unsystematischer Dropout:

  • Wegzug
  • Vergessen
  • etc.

Man darf aus ethischen Gründen die Gründe des Dropouts nicht erfassen.

Intention to treat analyse

Egal ob ein Patient ein Dropout ist oder nciht bleibt er drin, alle Leute die die Intention hatten teilzunehmen werden auch Ausgewertet, Stichprobenumfang reduziert sich nicth. iidr realitätsnähere Effektgrössen, aber ein Risiko der Übersch der Signifikanzätzung (da hoher Stichprobenumfang) Hängt davon ab welche Art von Dropout es ist und in welche Richtung der Dropout geht und auch wleche Strategie man verwendet die Fehlenden Werte zu ersetzten (davon hängt ab ob man eher über oder unterschätzt)

Completer-/Per Protocol Analyse

Nur die Teilnehmer werden eingeschätzt bei denen der Datensatz komplett ist. in der Regel auch überschätzung der Ergebnisse (Dropout der Patienten bei denen es nicht so gut läuft ist wahrscheinlicher)

Umgang mit Fehlenden Werten

Folie 8

  1. Fallweiser Ausschluss: Patienten werden gänzlich aus den Analysen ausgeschlossen.
  2. Paarweiser Ausschluss: Statistisches Verfahren zur Schätzung fehlenden Werte aufgrund von Korrelationsmatrizen.
  3. Ersetzung durch Lagemaße: Ersetzung der fehlenden Werte insb. durch Mittelwerte oder andere Lagemaßeder Interventionsgruppe oder der Gesamtstichprobe.
  4. Last Observation CarriedForward (LOCF): Fehlende Werte werden durch den letzten (zeitlich vorhergehenden) real erhobenen Wert ersetzt.
  5. Missing Values Relacement-Verfahren: Statistische regressionanalytischesVerfahren zur Schätzung fehlender Werte auf Basis derselben Variablen zu anderen Messzeitpunkten oder anderen Variablen zu demselben Messzeitpunkt, die mit dem Outcomein Beziehung stehen.
  6. Multiple-Implementations-Verfahren (MI): Iterative Schätzprozeduren mit Generierung verschiedener Datensätze für die Analysen durchgeführt werden.

Ergebnisbewertung

Wie belastbar sind Ergebnisse vor dem Hintergrund der angewandten Methodik? Man muss angemessen berichten was genau man gemacht hatten, damit andere Leute die die Studie lesen auch verstehen wie vorgenagen wurde, daher wurde eine Übereikunft zur Berichtung geschaffen, das CONSORT (Consolidated Standards of Reporting Trials) Statement.

CONSORT

F 140325.1.png

Checkliste Durcharbeiten zur Studie von Barlow zu Panikstörungen 5 Behandlungsbedingungen.

Einleitung

Wie wurde Fragestellung abgeleitet. Harlow hat erklärt was es mit Oanikstörungen auf sich hat, aktuelle Stand, etc. Im Hintergrundsteil wird hergeleitet wieso man ganu dieser Fragestellung nachgeht.

Methoden

Probanden

Klar definieren auf welche Population man sich Bezieht, klar definiert durch Einschlusskriterien. Bei Barlow Einschlusskriterien:

Einschlusskriterien:

  1. AnxietyDisordersInterview Schedule-Revised(ADIS-R)
  2. 1 Panikattacke während den 2Wochen vor Behandlung

Ausschlusskriterien:

  • Psychose, bipolare Erkrankungen
  • Schwerwiegende körperliche Erkrankungen
  • Begleitende andere Behandlungen
  • ...

Sehr wichtige Entscheidung wie gnau man die Ein und Ausschlusskriterien definiert (z.B Depression die sehr verbreitet ist wurde bei Barlow mit reingenommen, da PD und Depression häufig kgekoppelt ist.)

Auch angegeben (fehlt bei Barlow) Angabe des Settings der Patienten rekrutierung

Intervention/Behnadlung

Wie sieht das Konzept aus, welche Behanldungen werden vorgenommen. Immer beschreiben ob adequat umgesetzt wurde (treatmend fidelity)

Ziele

Abgeleitet aus Hintergrund und Stand der aktuellen wissenschaftlichen Forschung. Bei Barlow: Eine Komperative Zielsetzung, Verschiedene Verfahren werden miteinander verglcihen und gegeneinander verwendet, es gibt keine Korntrollgruppe.

Zielkriterien

Fremdrating, Primäres Outcome

Randomisierung

Wie wurde Randomisiert (bei früheren Studien oft sehr schlecht dokumentiert, und verzerrte Interpretation von Studienergebnissen)

Welche Technik wurde angewendet um Zufallsabfolge zu generieren (Barlow: Stratifizierung nach Studienzentrum und vorliegen einer Depression (über die Untersuchungsbedingungen Hinweg sollte begleitende Depression gelichmässig verteilt sein)

Wie ist es gelungen diese Zufallslisten geheim zu halten? Notwendig da wenn es zu vermischung über Patientenwissen und Randomisierung zu einer einteilung nach sympathie komen kann, ein systematischer Fehler. Sollte man eigentlich nach CONSORT berichten, wird aber in Studien sehr selten gemacht.

Wie ist überhaupt das durchführungsverfahren gewesen, wie wurde sichergestellt das es tatsächlich zufällig war. Welche Personen haben was gemacht.

Sehr wichtig, da starke Auswirkung auf interne Valisdität

Verblindung

Es sollte berichtet werden ob Probanden verblindet waren, die Durchführenden Verblindet und/oder die Leute verblindet welche die Ratings gamcht haben. Jemand ist verblindet wenn er nciht weiss in weche Bedingung der Patient fällt. Bei Barlow: Verblindung der Patienten und Untersuchenden bei Medikamenten. Bei Therapieen war keine Verblinfdun möglich. Auf Ebene C hingegen war wieder eine Verblindung möglich, beurteiler wussten nicht in welchem Untersuchungsarm der Patient war. Bei Selbstratings ist bei c immer auch verblindung wenn bei a verblindung war.

Statistische Verfahren

Bereits im Mehtodenteil muss beschrieben werden welche statistischen Verfahren man anwendet (im Vorfeld bereits definiert) Wird im Ergebnisteil wieder aufgegriffen.

Ergebnisse

Folie30 Man zeigt auf wann Leute über Dropout verloren etc. Wieviele Randomisiert wurden etc. Dafür wird mit folgendem Flussdiagramm vorgengen.

F 140325.2.png

Beispiel eines solchen Flowcharts auf Folie 31 In diesem Beispiel hat man 312 Patienten welche auf die Versuchsarme Randomisiert wurden. Auf die Completer-Analyse sind aber nur noch 213 weitergegangen (Stichwort: selektiver Dropout) Bei diesem Flowchart ein starker selektiver Aufall bei der Madikamentenbehandlung

Stichprobenbeschreibung

Man muss Patientencharakteristika der Patienten die die Studien anfangen mitgegeben werden, man zeigt bei Barlow anhand des p-wertes ob die Randomisierung funktioniert hat.

F 140325.3.png

Hier sieht man das sich die Gruppen zubeginn der Studie nicht systematisch unterscheiden und nicht signifikante unterschiede gibt.

Ergebnisse und Schätzmethoden

Tatsächliche Präsentation der Ergebnisse, auch Berichten der Effektgrössen Ergebnisse Bei Barlow Psychotherapie, Medikamente und Kombi alles besser als Placebo. Zwischen den Verfahrne: Completeranalyse: bei denen die das Verfahren Abgeschlossen haben ist Medikament besser. Wenn mann aber ITT schaut (intention to treat) ist die Verhaltenstherapie besser als die Medikamentmethode)

Untershciedliche Ergebnisse, da in der Medikamnetenbedingung ein Wesentlich höherer Drop-out vorhanden. Zurückzuführen auf selektiven Dropout in der Medikamentenbedingung. Beim Followup hat sich gezeigt das es bei Medikamenten häufiger zu Rückfällen kommt als Bei Psychotherapie.

Diskussion

Ergebnisse werden Interpretiert, methodische stärken und SChwächen werden berichtet, es wird gezeigt wie Genralisierbar (extern Valide) die Befunde eigentlich sind. Und eine Abschlissende allgemeine Bewertung der Evidenz und eine Einordnung in aktuellen Forschungsstand und einordnung in aktuelle Literatur.