Im «Google AI Blog» wurde angekündigt, dass die Spracheingabe in der Gboard-App jetzt auch offline funktioniere, wodurch der eingesprochene Text schneller transkribiert werden könne. Die zeitlichen Verzögerungen durch die Kommunikation mit Servern würden dadurch wegfallen.
Zeichen für Zeichen
Wer bislang die Spracherkennung in der Gboard-App nutzen wollte, musste dazu mit dem Internet verbunden sein. Denn zur Transkription, also für die Umwandlung des gesprochenen Wortes in Text, musste die App mit den Servern von Google kommunizieren. Die Verschriftlichung der Wörter innerhalb der Gboard-App erfolgte wegen der dadurch verursachten Verzögerungen etwas abgehackt.
Dank der Installation der Spracherkennungs-Software direkt auf dem Smartphone spart sich Gboard den Weg über die Server. Eine geräteseitige Sprachumwandlung kann schneller und flüssiger durchgeführt werden.
Ausserdem habe man die Methode der Spracherkennung geändert. Bislang sei die gesamte Eingabesequenz analysiert worden, bevor ein Wort ausgegeben worden sei. Das aktuelle Modell würde hingegen auf der Zeichenebene arbeiten. Die Wörter würden dabei Buchstabe für Buchstabe niedergeschrieben. Der Text werde also sozusagen in Echtzeit dargestellt.
Erstmal nur Google-Pixel-Smartphones
Eine Spracherkennungs-Software ist sehr komplex. Die Gboard-Spracheingabe-Funktion hätte einen Speicherumfang von 450 MB erreicht, wie Googles Sprachexperten erklären. Das sei selbst bei modernen Smartphones viel. Durch die Komprimierung der Software hätte die Grösse auf 80 MB reduziert werden können.
Zunächst, so Google, werde die geräteseitige Gboard-Spracherkennung auf allen Pixel-Smartphones möglich sein. Als Sprache werde am Anfang nur amerikanisches Englisch zur Verfügung stehen. Allerdings sei man optimistisch, dass es bald mehr Sprachen im Angebot geben werde und auch andere Anwendungsbereiche hinzu kommen werden.