Um die Chancen von Spracherkennung im medizinischen Umfeld zu erkennen, muss man zunächst Erfahrungen damit machen – zum Beispiel bei der Dokumentation. Was die Technik in Zukunft auch in weiteren Anwendungen bietet, erläutert Dr. Markus Vogel vom Softwareanbieter Nuance.
Herr Dr. Vogel, wo steht die Technik für Spracherkennung heute?
Sie funktioniert gut und verlässlich und ist in der Lage, Sprache zu erkennen. Auch wenn der Sprecher einen Dialekt wie schwäbisch, bayrisch oder sächsisch spricht, wenn er eine andere Muttersprache als Deutsch hat oder, wie in der Medizin üblich, viele Fachbegriffe nutzt oder Hintergrundgeräusche auftreten. Allerdings sind manchmal die Erwartungen an die Systeme zu hoch gesteckt, was zu Enttäuschungen führen kann. Denn eines geht trotz aller Fortschritte nicht: Ein Spracherkennungssystem wird das Gesagte nicht dem Sinne nach verstehen, wie wir das im Umgang mit Menschen gewohnt sind.
Welche Vorteile bieten solche Systeme im Krankenhaus?
Reden wir zunächst von der Dokumenta- tion, also Arztbriefen oder Gutachten, die medizinisches Fachwissen schriftlich festhalten. In vielen Krankenhäusern ist es noch üblich, dass der Arzt Kassetten bespricht oder digitale Aufzeichnungen macht, die an einen zentralen Schreibdienst gegeben werden. Was wir bei Nuance tun, geht aber deutlich weiter: Wir stellen dem Krankenhaus eine IT-Infrastruktur zur Verfügung, die man vielleicht am einfachsten mit einem E-Mail-Server vergleichen könnte. Was der Arzt dokumentieren möchte, spricht er in ein Mikrofon. Die Software überträgt das Gesprochene in Echtzeit in eine digitale Zeichenfolge, die auf dem Server abgelegt und von jedem Ort im Krankenhaus aus verfügbar ist. Das ermöglicht ganz neue Formen der Prozessabläufe. Diese zu definieren, ist aber auch eine Herausforderung für ein Haus, das ein so modernes Spracherkennungssystem einführen möchte.
Wohin muss der Arzt gehen, um sein Wissen dem Server mitzuteilen?
Dafür gibt es verschiedene Möglichkeiten: Aufnahmen lassen sich mit einem Mikrofon am PC einspeisen – oder, falls gewünscht, auch mit einem mobilen Gerät wie dem persönlichen Smartphone oder Ipad des Arztes. Bei einer Eingabe am PC ist die Anforderung, dass die Zuordnung der Daten zu einem Patienten gesichert sein muss, leichter zu erfüllen. Und man muss auch sagen, dass das Benutzen mobiler Endgeräte zwar technisch möglich, aber immer noch ein neues Feld ist. Dafür muss zum Beispiel der Empfang an allen in Frage kommenden Orten gesichert sein. Und manch einer hat persönliche Vorbehalte dagegen, ein Smartphone zu diesem Zweck zu nutzen.
Wie verbreitet ist Spracherkennung im Krankenhausumfeld derzeit?
In der Form mit dem zentralen Server, der die Daten in Echtzeit zur Verfügung stellt, ist das noch etwas sehr Neues. Allerdings gehen wir davon aus, dass sich schon in den nächsten zwölf Monaten viele Häuser zu einer Umstellung auf so ein System entschließen werden. Und wenn man erst mit der Spracherkennung Erfahrungen macht, sprudeln erfahrungsgemäß die Ideen, was man noch alles damit tun könnte. Dann sind wir schnell an dem Punkt, dass wir die Euphorie bremsen müssen. Denn wir empfehlen auf jeden Fall, als erstes die Dokumentation umzustellen. So lernen alle Beteiligten die Vorteile der Spracherkennung kennen- und schätzen und können weitere Möglichkeiten – zum Beispiel im OP – ausloten.
Ist spezielles Stimmtraining erforderlich?
Nein. Die Nutzer bekommen zwar eine Einweisung mit grundlegenden Informationen. Da geht es zum Beispiel darum, dass man im Text nicht ‚in Klammern‘ sagen kann, da eine Software nicht anhand von Stimmlage und Pause erkennen oder gar verstehen kann, was genau in die Klammern gehört. ‚Klammer auf‘, ‚Klammer zu‘ hingegen funktioniert problemlos. Das System stellt sich dann beim Sprechen in einem Interaktionsprozess auf die Person ein. Sobald deren Stimme einmal hinterlegt ist, bleibt ihr Sprachprofil an jedem vernetzten Punkt verfügbar.
Welche Parallelen gibt es zwischen Spracherkennung für die Dokumentation und Sprachsteuerung von Geräten im OP?
Technisch geht es da um ähnliche Dinge – und genau in diese Richtung gehen auch die Vorschläge, sobald es im Krankenhaus mit der Einführung eines Spracherkennungssystems konkreter wird. Man sollte sich meiner Meinung nach aber darüber im Klaren sein, dass es wenig Sinn hat, den Einstieg in diese Technik gleich im OP zu versuchen, während draußen noch diktiert und abgetippt wird.
Ließe sich die Sprachsteuerung für Geräte in den Dokumentations-Server einbinden?
Sofern alle Geräte über eine geeignete Schnittstelle verfügen, um auf den zentralen Server für die Spracherkennung zuzugreifen, würde auch im OP das jeweilige Sprecherprofil erkannt – und es gäbe die Möglichkeit, Befehle zu erkennen, auch wenn der Sprecher nicht das genau definierte Kommando benutzt. Heute gibt es das allerdings noch nicht. Man findet eher Insellösungen – also Geräte, die jeweils mit ihrem eigenen Spracherkennungssystem arbeiten. Aber auch das ist ja schon hilfreich: wenn ich zum Beispiel an die Arbeit der Chirurgen denke oder an den Umgang mit Frühgeborenen im Brutkasten, wo man eben nicht die Hände frei hat. Eine Verknüpfung der Systeme könnte die Möglichkeiten in Zukunft aber noch erweitern.
Wo sind Grenzen für die Spracherkennung, wo Potenziale?
Wenn es um die Ansteuerung sehr komplexer Medizingeräte geht, ist Spracherkennung nicht – vielleicht muss man sagen: noch nicht – das Mittel der Wahl. Und man muss den regulatorischen Rahmen betrachten. Um ein Gerät als Medizinprodukt zuzulassen, sind hohe Anforderungen zu erfüllen. Einen Chip für die Spracherkennung oder gar die Vernetzung mit einem überbegreifenden System zu implementieren, würde den Aufwand deutlich erhöhen. Diesen Schritt sollte man erst gehen, wenn Spracherkennung durch einen verbreiteten Einsatz in der Dokumentation überall eine gängige Technik ist, mit deren Umgang jeder vertraut ist. Im englischsprachigen Raum sehen wir schon, was da im internationalen Vergleich alles möglich ist. Aber auch bei der Dokumentation sehe ich Potenzial über die reine Erkennung von Sprache hinaus: In einer Software könnte zum Beispiel hinterlegt sein, dass in einen Arztbrief über einen Harnwegsinfekt ein Verweis auf Antibiotika gehört. Wenn dieser fehlt, könnte der Verfasser automatisch mit einer Warnmeldung darauf hingewiesen werden.
Dr. Birgit Oppermann birgit.oppermann@konradin.de
Weitere Informationen Nuance Communications, ein Anbieter von Sprach- und Bildbearbeitungslösungen, bietet seit 20 Jahren Spracherkennung für den medizinischen Einsatz an, darunter die Dragon-Medical-Lösungen. www.nuance.de/healthcare
Ihr Stichwort
- Spracherkennung in der Medizin
- Sprachsteuerung von Geräten
- Einführung in der Dokumentation
- OP und andere Umgebungen
- Vernetzung von Dokumentation und Gerätesteuerung
Unsere Webinar-Empfehlung
Erfahren Sie, was sich in der Medizintechnik-Branche derzeit im Bereich 3D-Druck, Digitalisierung & Automatisierung sowie beim Thema Nachhaltigkeit tut.
Teilen: