Spracherkennung für Windows-PC

  • Vor geraumer Zeit hatte ich die Windows 7/8 Spracherkennung getestet, die auch im Office Paket aktiv ist. Trotz Verwendung verschiedener auch technisch guter Mikrofone war ich fast wahnsinnig geworden. Das Thema hatte ich danach bis auf Weiteres abgehakt.


    Gestern hat mir ein Bekannter, den ich für sehr versiert halte, erläutert, dass die Windows-Spracherkennung trotz Einbindung in das Office-Paket lediglich für rudimentäre Anweisungen und nicht etwa zum Diktieren von Texten geeignet ist. Wolle man Texte diktieren, sei eine spezielle Software wie etwa Dragon Naturally Speaking von Nöten, mit der das dann auch reibungslos funktioniere.


    Aus den Anpreisungen von MS für die Windows-Spracherkennung geht aber nicht hervor, dass in Windows keine vollwertige Lösung integriert ist. Vielmehr wird der Eindruck erweckt, die Windows-Spracherkennung entspreche dem aktuellen Stand der Technik. Die Installation von Dragon hatte ich daher für obsolet gehalten.


    Ist das wirklich so? Besteht zwischen der Spracherkennung von Dragon und der von MS tatsächlich ein derart gravierender Unterschied? Erfahrungen?

  • Tjaa ... mir war gar nicht bewusst, dass es einen deutlichen Unterschied in der Erkennungsquote geben kann.


    Mit der Windows Handschrifterkennung habe ich wirklich herausragende Erfahrungen gemacht. Einmal hat sie sogar ein Wort entziffert, welches ich nicht einmal selbst mehr hätte entziffern können. Wahrscheinlich hatte ich diesen Qualitätsmaßstab ohne Prüfung auf die Spracherkennung übernommen.


    Dass eine Windowskomponente wirklich lausig funktioniert, hatte ich nicht erwartet. Gewundert hatte mich nur, dass ich bisher von nahezu jeder Schreibkraft für die gute Verständlichkeit und präzisen Formatierungsvorgaben meiner Diktate gelobt wurde, während Windows auch nach längerer Eingewöhnung bei jedem dritten Wort nur "Bahnhof" versteht. Selbst die Zahlen bei der Auswahl von Alternativvorschlägen versteht Windows oft nicht.


    Kaum zu fassen, wie lausig das funktioniert. Zunächst konnte ich es kaum glauben und habe in immer weitere Headsets investiert - zuletzt ein Gerät speziell für den Callcenter-Einsatz.


    Kann es eine andere Fehlerquelle geben?


    Sprache/Stimme und Mikrofon scheiden definitiv aus. Sprachaufzeichnungen mit dem Stimmrecorder haben eine einwandfreie Qualität.


    Woran könnte es sonst noch liegen?

  • Jetzt ganz ehrlich - hast Du die Spracherkennung denn trainiert?
    Was manche nicht wissen, in der Windows Spracherkennung steckt zum Teil Dragon Naturally Speaking. Cortana aus Windows 10 wurde dahingehend noch optimiert. Aber wie immer ist das a und o einer Spracherkennung das Training.

  • Zitat

    Original geschrieben von skybird1980
    ...
    Was manche nicht wissen, in der Windows Spracherkennung steckt zum Teil Dragon Naturally Speaking. ...


    Das habe ich zwar nicht gewusst, aber vermutet. Dass Microsoft sämtliche Komponenten von Windows selbst entwickelt, dürfte wohl niemand ernsthaft annehmen dürfen. Allerdings auch nicht, dass in Windows eine Vollversion von Naturally Speaking integriert ist.


    Allerdings ist die Bedienung beider Versionen verdächtig ähnlich. Insbesondere die gepriesene Lernfähigkeit mit der komfortoblen Auswahlmöglichkeit von Alternativvorschlägen und die Manifestierung sprachlicher Besonderheiten (wie etwa bei Abkürzungen) stimmen bei beiden Spracherkennungsprogrammen weitgehend überein.


    Von daher war ich davon ausgegangen, dass die Spracherkennung von Windows zumindest brauchbar ist, wenn Naturally Speaking inzwischen ein nahezu perfektes Ergebnis liefert/liefern soll.


    Zitat

    Original geschrieben von skybird1980
    Jetzt ganz ehrlich - hast Du die Spracherkennung denn trainiert?
    ...


    Das habe ich ... und zwar über einen Zeitruam von zumindest einer Woche, bevor mir der Kragen geplatzt ist, und sich das Callcenter-Headset in Plastik-Granulat mit Beilage verwandelte. Vom Küchenfester bis auf die Straße ist es nicht weit.


    Ich kann einfach nicht nachvollziehen, warum die Windows-Spracherkennung bei mir derart desolate Ergebnisse liefert. Wenn Windows doch nur die Zahlen beim Angebot der Alternativvorschläge verstehen würde. Das stellt für mich das größte Ärgernis dar. Wenn ich mich recht entsinne, waren es gerade die eins und die vier, bei denen die Spracherkennung zu verstehen glaubte, sie solle weitere Vorschläge unterbreiten. Furchtbar! :(


    Von daher schließe ich es nicht aus, dass ich irgendetwas falsch mache ... wie meist, wenn etwas nur bei mir nicht funktioniert.


    Aber was???



    Edit


    Jetzt fällt es mir wieder ein:


    Falls der Begriff in den Alternativvorschlägen nicht enthalten war und das Kommando "Buchstabieren" erforderlich wurde, gab es kaum einen Fall, in dem die Spracherkennung das verstanden hätte. Wenn es dann mal klappte, hatte ich größte Schwierigkeiten beim Buchstabieren, obwohl ich mich streng an die Vorgaben hielt (für Deutschland etwa "Samuel" statt "Siegfried")


    Bei einem anderen Befehl hatte ich zuvor im Internet eine Lösung gefunden: Der deutsche Befehl laut Anleitung traf einfach nicht zu! Den hätte man tausend mal wiederholen können, ohne dass was hätte passieren können. :mad:


    Der Fehler betraf entweder den Start oder die Beendigung der Spracherkennung.

Jetzt mitmachen!

Sie haben noch kein Benutzerkonto auf unserer Seite? Registrieren Sie sich kostenlos und nehmen Sie an unserer Community teil!