ViaVoice

Diese Produktlinie besteht seit 1997 (ViaVoice 98, ViaVoice Gold, ViaVoice Millenium Ed. und ViaVoice 8.0). Als Vorläuferprodukte mit diskretem Spracherkenner sind VoiceType und SimplySpeaking zu nennen. Letzteres war das erste Spracherkennungsprogramm von IBM, das für den Consumer-Markt vertrieben wurde und das mich für Spracherkennung begeistern konnte.

Die aktuelle deutsche Version verfügt über einen Wortschatz von 1 Million Wörtern. Der Grundwortschatz (“Allgemeines Diktieren”) kann gegen ein medizinisches Fachvokabular ausgetauscht werden. Dieses Vokabular enthält aber nur ca 30000 med. Fachbegriffe und 30000 allgemeine Vokabeln. Das Vokabular entspricht dem Entwicklungsstand von ViaVoice 98, kann aber auch in der aktuellen Version verwendet werden. Zusätzlich unterstützt ViaVoice das Hinzuladen von speziellen Fachwortschätzen, die Topics genannt werden. Diese Topics bereichern das Programm um die Aussprache von bestimmten Fachvokabeln und deren Kontextinformation (Trigramme).

ViaVoice arbeitet unter Windows 98/ME/NT4 mit SP5/2000 aber auch unter Windows XP, Ein halbwegs aktueller Computer ist vollkommen ausreichend, nur unter Windows ME wird etwas mehr Rechenleistung (600 MHz-Prozessor) gebraucht. USB-Mikrofone werden unterstützt (natürlich nicht unter Windows 95 und NT4).

ViaVoice kennt drei verschiedene Modi für das Diktat: am besten funktioniert das Diktieren in den Programm-eigenen Texteditor SpeakPad, der vom Funktionsumfang etwa dem Windows-eigenen WordPad entspricht. Daneben kann man in Word direkt diktieren, die Erkennungsgeschwindigkeit ist aber geringer als in SpeakPad. Als dritte Möglichkeit kann man direkt in Anwendungen diktieren, die erkannten Texte werden dabei über den Tastaturpuffer in die Anwendung übergeben.

Die Korrektur falsch erkannter Wörter kann sprachgesteuert in einem Korrekturfenster erfolgen. Daneben kann aber auch direkt im Text korrigiert werden, das Pragramm lernt durch eine anschließende Analyse des Textes die Kontextinformation. Da man das eigentliche Diktat mit dem Text speichern kann, ist auch eine deligierte Korrektur durch eine Schreibkraft möglich.

Die aktuelle Version verfügt über eine verbesserte Erkennung von Komposita, ein spezifisch deutsches Spracherkennungsproblem. Im Vokabular sind viele Bestandteile von Komposita als solche hinterlegt. Das Wort “Durchmesser” wird dadurch primär als “durch~” und “Messer~” erkannt und erst in einem zweiten Schritt zusammengefügt. Das Medizinische Fachvokabular beinhaltet diese Möglichkeit allerdings nicht!

Die Version 10 ist auch seit Ende Januar 2004 erhältlich. Dieses Spracherkennungsprogramm wurde von IBM an Scansoft weiterverkauft und ist mit der Übernahme von Scansoft durch Nuance jetzt von Nuance vertrieben. Es ist nicht zu erwarten, dass diese Produktreihe weiterentwickelt wird.

(Text am 1.4.2006 letztmalig aktualisiert)

Line111
Line110
CV-Gauer

© 2001-2014
Dr. A. Turzynski
Gemeinschaftspraxis
Pathologie
Lübeck