Ihre beiden Hauptaufgaben, das Diktieren und Transkribieren von gesprochenen Audiodateien, erledigt die Spracherkennungssoftware Voice Pro Enterprise von Linguatec sehr effektiv. Zudem sind alle Daten sicher auf lokalen Servern gespeichert. Von Nachteil sind aber der eingeschränkte Support des Unternehmens und die fehlende Sprachsteuerung.
Bei der Spracherkennungssoftware Voice Pro Enterprise des in München ansässigen Herstellers Linguatec handelt es sich um eine reine Serverlösung für Unternehmen. Das heißt: Alle Komponenten werden auf firmeneigenen Servern installiert und gepflegt. Das Diktieren und Transkribieren erfolgt mittels Windows- oder Java-Anwendung am Computer. Bei einem Diktat übermittelt die Anwendung die Audiodatei an den Erkennungsserver, der den Input in Text umwandelt und wieder an den Client sendet. Damit garantiert Linguatec, dass sensible Unternehmensdaten vor äußeren Eingriffen sicher sind.
Im Gegenzug verzichtete das Unternehmen auf die Bereitstellung einer passenden App. Es ist zwar möglich, die Software per VPN an mobilen Geräten zu bedienen, dennoch müssen Sie Audiodateien, die Sie unterwegs aufnehmen, im Anschluss in die Software importieren.
Prinzipiell steht in Voice Pro Enterprise immer ein allgemeiner Wortschatz zur Verfügung, den Sie bei Bedarf mithilfe von zusätzlichen Lizenzpaketen um juristisches oder medizinisches Spezialvokabular erweitern können. Mit einer zusätzlichen Lizenz kann man den Umfang der Software um die englische Sprache erweitern. Der Mindestpreis für den allgemeinen Wortschatz liegt bei 999 Euro und umfasst fünf Lizenzen. Für jede weitere Person zahlen Sie 200 Euro.
Zum Diktieren und Transkribieren selbst stehen zahlreiche praktische Features zur Verfügung, darunter eine Korrekturfunktion, eine Sprachausgabe des geschriebenen Textes und eine gebündelte Transkription mehrerer Dateien. Ein weiteres praktisches Feature ist die Textbausteinverwaltung. Sie ermöglicht es, häufig verwendete Inhalte wie Signaturen oder Briefköpfe zu speichern und mithilfe eines Kurzbefehls einzufügen.
Erkennt die Software unbekannte Wörter und Formulierungen, nimmt sie diese automatisch ins Vokabular auf. Bei Bedarf lassen sich manuell neue Begriffe ins Wörterbuch eintragen. Sehr praktisch ist auch das Feature, Textdateien aus einem Ordner auszuwählen und darin nach unbekannten Wörtern zu durchsuchen. Darüber hinaus bietet Voice Pro Enterprise weitere Funktionen, um das Wörterbuch zu optimieren. Es ist beispielsweise möglich, die Aussprache von Begriffen selbst einzustellen, Phoneme aus Wörterbucheinträgen zu erstellen und für die Aussprache von Anglizismen eine englische Phonetisierung zu erzeugen. Außerdem lassen sich Wortlisten im- beziehungsweise exportieren und mehrere Wörterbücher zusammenführen. Dank der integrierten Abkürzungsliste lernt die Software sogar den Umgang mit verwendeten Abkürzungen.
Im Gegensatz zur nicht mehr erhältlichen Voice-Pro-Reihe verzichtet Enterprise auf die Möglichkeit, den PC mit sogenannten Smart Commands per Sprachbefehl zu steuern. Für Personen, die aufgrund einer körperlichen Behinderung Schwierigkeiten mit der Bedienung von Tastatur und Maus haben, bietet die Software somit kaum Vorteile. Sie müssten die Software per Maus bedienen und Wortlisten mitunter manuell mit der Tastatur ergänzen. In puncto Barrierefreiheit ist die fehlende Smart-Command-Funktion somit ein Rückschritt.
In Bereichen wie Wortschatzerweiterung, Textblöcke-Definition oder Aufnahme von Diktaten und Transkription erbringt Linguatec in puncto Usability eine gute Leistung. Auch das Importieren von Sprachdateien gelingt problemlos. Für eine einfache Korrektur ist es zudem hilfreich, dass sich transkribierte Audiodateien gemeinsam mit den Transkripten wiedergeben lassen.
Linguatec liefert sogar zwei Dateiformate, .vpaf und .vpdf, um Audio und Text zusammen in einer Datei zu speichern. Letzteres ermöglicht das Speichern von Textdateien mit komplizierten Formatierungsbausteinen wie Tabellen und Grafiken. Beide Dateiformate sind nur mit Voice-Pro-Enterprise-Anwendungen nutzbar. Dank des gemeinsamen Speicherns von Audio und Text lässt sich der Text problemlos mit dem Original abgleichen. Daher ist nicht nur ein späteres Korrigieren des Transkripts besonders einfach, sondern es kann auch durch andere Personen erfolgen. Die Schreibweise der Pronomen als kontextabhängig zu definieren, erspart Arbeit bei der Korrektur.
Für alle, die Inhalte direkt in Word verfassen möchten, anstatt das Transkript nachträglich einzufügen, bietet Voice Pro Enterprise ein passendes Plug-in. Auch das verbale Verfassen von E-Mails erleichtert das Programm mit einem Plug-in für Microsoft Outlook.
Die Worterkennungsrate erreicht eine Genauigkeit von bis zu 99 Prozent, wenn man der Software ausreichend Zeit lässt. Voice Pro Enterprise bietet nämlich eine variable Gewichtung zwischen Qualität und Geschwindigkeit. Priorisieren NutzerInnen Geschwindigkeit, zeigt die Software das Erkennungsergebnis nach einer Pause im Diktat schneller an, als wenn Genauigkeit wichtiger eingestuft ist. Ist die Qualität maßgeblich, wartet die Software mit der Ergebnisausgabe für den Fall, dass kommende Textbausteine Inhalte liefern, die die Ausgabe verändern können.
Da es sich bei Voice Pro Enterprise um eine Serverlösung handelt, die direkt auf firmeninternen Rechnern installiert wird, gestalten sich die Systemanforderungen für die Server durchaus kompliziert. Die eigentliche Spracherkennung erfolgt nämlich auf diesen und lediglich das Resultat wird an die Client-Anwendung gesendet. Die Client-Anwendung, über die sich die Software bedienen lässt, stellt daher keine großen Anforderungen.
Systemanforderungen für Arbeitscomputer:
Beim Server oder bei den Servern sieht es anders aus, weil die Leistung der Spracherkennung von diesen abhängt. Je mehr Kerne es gibt und je größer der Arbeitsspeicher ist, desto mehr Erkennungsprozesse kann die Voice Pro Enterprise gleichzeitig durchführen. Ob es sich um Windows- oder Linux-Server handelt, ist unerheblich.
Auf folgenden Betriebssystemen und Paketen ist die Server-Einrichtung möglich:
Windows | Linux | |
---|---|---|
Betriebssysteme | Windows Server 2012R2, Windows Server 2016 und 2019, Windows 10 Desktop | Ubuntu in den Versionen 14.4 LTS, 16.4 LTS und 18.4 LTS., RHEL (Red Hat Enterprise Linux) ab Version 6.7, CentOS ab Version 6.7 |
Pakete | Oracle Java Runtime 8, PostgreSQL, ActiveMQ, Wildfly | ibxml2, libsndfile1, libgomp1, Oracle Java Runtime (Oracle JRE8 bevorzugt), alternativ OpenJDK, Docker (Version 18.06), pwget, unzip, curl |
Damit KundInnen die eigenen Bedürfnisse hinsichtlich der Leistung besser ermitteln können, stellt Linguatec eine Beispielkalkulation vor. Demzufolge sind für Softwarekern, Datenbank, Prozessmanager sowie 10 gleichzeitige Erkennungsprozesse 16 Prozessorkerne und ein Arbeitsspeicher von 96 Gigabyte nötig. Firmen können sowohl kleinere als auch größere Lösungen zusammenstellen. Pro Erkennungsprozess sind etwa acht Gigabyte Arbeitsspeicher und ein Prozessorkern nötig, dazu weitere acht Gigabyte für die grundlegenden Prozesse.
Der von Linguatec angebotene Support ist eingeschränkt: Weder ein Live-Chat noch ein Telefondienst stehen zur Verfügung. Lediglich ein Kontaktformular sowie eine E-Mail-Adresse ermöglichen die persönliche Kontaktaufnahme zum Unternehmen. In Anbetracht der Tatsache, dass eine Kontaktaufnahme erforderlich ist, um überhaupt die eigenen Anforderungen an Voice Pro Enterprise mit dem Vertrieb zu klären und einen individuell zugeschnittenen Preis zu erhalten, ist ein fehlender Telefondienst fragwürdig.
Für eine möglichst einfache Anwendung der Produkte bietet Linguatec aber ausführliche Handbücher an, die die Funktionen übersichtlich und verständlich erklären. Zudem liefert ein umfangreicher FAQ-Bereich Antworten auf allgemeine Fragen, sodass die meisten Probleme auch ohne Kontaktaufnahme mit dem Hersteller lösbar sind.
Bei Voice Pro Enterprise handelt es sich um eine leistungsstarke Transkriptions- und Diktiersoftware mit hoher Erkennungsgenauigkeit. Dank der zahlreichen Features lässt sich die Erkennungsleistung genau an die Bedürfnisse anpassen. Das ausführliche Handbuch, das sich auch auf der Webseite herunterladen lässt, sorgt für einen schnellen Einstieg in die Software.
Da es sich um eine Serverlösung handelt, ist die Einrichtung der Software kompliziert und zeitaufwendig. Dieser Mehraufwand stellt aber sicher, dass ein externer, unbefugter Zugriff auf die Unternehmensdaten äußerst schwierig ist.
Anders als die nicht mehr erhältliche Voice-Pro-Reihe ermöglicht die Serverlösung allerdings keine Sprachsteuerung per Smart-Command-Funktion. Damit verzichtet Linguatec auf ein essenzielles Feature für körperlich behinderte Personen, die Maus und Tastatur nicht oder nur schwer bedienen können. Die Kontaktaufnahme mit dem Unternehmen wird dank fehlender Telefon-Hotline deutlich erschwert, obwohl sie erforderlich ist, um das Produkt überhaupt zu bestellen oder sogar ein bedarfsgerechtes Preisangebot zu bekommen.
Logo: © Linguatec GmbH