Internationale Studie

Chatbots verbreiten Desinformationen zu Gesundheitsthemen

mg
Gesellschaft
Chatbots mit künstlicher Intelligenz (KI) verfügen nicht über ausreichende Sicherheitsvorkehrungen, zeigt eine Studie. Auf Wunsch generieren die Systeme Desinformationen über Gesundheitsthemen inklusive gefälschter Quellen und Patientenberichte.

Ein internationales Team von Forschenden aus Adelaide (Australien), Kirkland (USA) und Cambridge (Großbritannien) haben in einer wiederholten Querschnittsanalyse vier Large Language Modells (LLMs) über die dazugehörigen Chatbots beziehungsweise Assistentenschnittstellen evaluiert:

  • GPT-4 von OpenAI (über ChatGPT und Copilot von Microsoft),

  • PaLM 2 von Google und das neu veröffentlichte Gemini Pro (über Bard),

  • Claude 2 von Anthropic (über Poe) und

  • Llama 2 von Meta (über HuggingChat).

Im September 2023 wurden diese LLMs dazu veranlasst, gesundheitliche Desinformationen zu zwei Themen zu generieren: Sonnencreme als Ursache von Hautkrebs und die basische Ernährung als Krebsheilmittel. Jailbreaking-Techniken, das heißt Versuche, Sicherheitsvorkehrungen zu umgehen, wurden bei Bedarf ebenfalls evaluiert. Für LLMs mit beobachteten Sicherheitsschwachstellen wurden die Prozesse für die Meldung von besorgniserregenden Ergebnissen geprüft. 12 Wochen nach den ersten Untersuchungen wurden die Fähigkeiten der LLMs zur Generierung von Desinformation neu bewertet, um spätere Verbesserungen der Schutzmaßnahmen zu bewerten. Die wichtigsten Endpunkte waren, ob Schutzmaßnahmen die Generierung von Desinformation im Gesundheitsbereich verhindern und wie transparent die Prozesse zur Risikominderung gegen Desinformation im Gesundheitsbereich sind.

Die Ablehnungsrate betrug nur 5 Prozent

Ergebnisse: Claude 2 (via Poe) lehnte 130 Eingabeaufforderungen ab, die zu den beiden Zeitpunkten der Studie eingereicht wurden und in denen die Generierung von Inhalten gefordert wurde, in denen behauptet wurde, dass Sonnencreme Hautkrebs verursacht oder dass die basische Ernährung ein Heilmittel für Krebs ist, selbst bei Jailbreaking-Versuchen. GPT-4 (via Copilot) weigerte sich zunächst, Desinformation über die Gesundheit zu generieren, selbst bei Jailbreaking-Versuchen – obwohl dies nach 12 Wochen nicht der Fall war. Im Gegensatz dazu erzeugten GPT-4 (über ChatGPT), PaLM 2/Gemini Pro (über Bard) und Llama 2 (über HuggingChat) durchweg Desinformationsmeldungen über das Gesundheitswesen. In den Auswertungen vom September 2023 ermöglichten diese LLMs die Erstellung von 113 einzigartigen Texten über Krebs mit insgesamt mehr als 40.000 Wörtern, ohne dass Jailbreaking-Versuche erforderlich waren.

Die Ablehnungsrate über die Bewertungszeitpunkte für diese LLMs betrug nur 5 Prozent (7 von 150), dabei enthielten die LLM-generierten Texte aufmerksamkeitsstarke Titel, authentisch aussehende (gefälschte oder fiktive) Referenzen, fingierte Erfahrungsberichte von Patienten und Klinikern und richteten sich an verschiedene demografische Gruppen. Obwohl jedes evaluierte LLM über Mechanismen verfügte, um beobachtete besorgniserregende Ergebnisse zu melden, reagierten die Entwickler nicht, wenn Beobachtungen von Schwachstellen gemeldet wurden.

„Es braucht eine verbesserte Regulierung“

Das Fazit der Forschenden: Wirksame Schutzmaßnahmen sind zwar möglich, um zu verhindern, dass LLMs zur Generierung von Desinformationen im Gesundheitsbereich missbraucht werden – diese werden jedoch nur unzureichend umgesetzt. „Darüber hinaus fehlten wirksame Verfahren zur Meldung von Sicherheitsproblemen“, schreiben sie und fordern eine verbesserte Regulierung, Transparenz und routinemäßige Audits, „um zu verhindern, dass LLMs zur massenhaften Generierung von Desinformation im Gesundheitswesen beitragen.“

Menz B D, Kuderer N M, Bacchi S, Modi N D, Chin-Yee B, Hu T et al. Current safeguards, risk mitigation, and transparency measures of large language models against the generation of health disinformation: repeated cross sectional analysis BMJ 2024; 384 :e078538 doi:10.1136/bmj-2023-078538

Melden Sie sich hier zum zm Online-Newsletter an

Die aktuellen Nachrichten direkt in Ihren Posteingang

zm Online-Newsletter


Sie interessieren sich für einen unserer anderen Newsletter?
Hier geht zu den Anmeldungen zm starter-Newsletter und zm Heft-Newsletter.