Wird Speech-to-Speech Übersetzungstechnologie bald zum ultimativen Touri-Gadget?

Am heutigen Welttourismustag beschäftigen wir uns mit einer Technologie, die das Potenzial hat, zum ultimativen Gadget aller Weltenbummler zu werden. Wird man aktuell von Touristen meist noch auf Englisch nach dem Weg gefragt, muss man sich wohl nicht wundern, wenn einem schon bald regelmäßig ein Smartphone unter die Nase gehalten wird, um das Gespräch von diesem dolmetschen zu lassen.

Einige Unternehmen - die großen, uns allgegenwärtigen Tech-Riesen, sowie auch kleinere Entwickler - arbeiten schon länger daran, multilinguale Gespräche per App zu ermöglichen. Der grundlegende Ablauf ist dabei immer derselbe: Beide Personen sprechen ganz wie gewohnt ihre Muttersprache, während ein Smartphone ihre Aussagen in Echtzeit übersetzt. Beim Output gibt es jedoch verschiedene Optionen. Meist hören einfach beide Personen dem übersetzenden Smartphone zu, gelegentlich tragen beide einen kleinen Kopfhörer im Ohr, oder beide lesen einfach vom Display ab.

white Samsung Android smartphone turned beside white earbuds on brown board
Photo by William Iven / Unsplash

Machine Translation und die Frage nach der Geldquelle

Eines haben alle Varianten gemeinsam: Es handelt sich bei der Übersetzungssoftware um Anwendungen von Machine Translation. Und um diese erfolgreich zum Laufen zu bringen, braucht man vor allem eins: Daten. Viele Daten. Genau hier liegt aktuell noch ein großes Problem sämtlicher Machine Learning Projekte, denn die Ansammlung großer Datensätze und das Trainieren der Software auf diese ist zeit- und kostenintensiv, aber die Nutzer aktuell existierender S2S (Speech-to-speech) Apps scheinen nicht bereit zu sein, für die Funktionen der Apps wirklich zu zahlen. Solange man Nutzern also Zugriff auf viele kostenlose (wenn auch nur in den Grundzügen funktionierende) Anwendungen ermöglicht, werden kleinere Unternehmen, die die Technologie wirklich perfektionieren wollen, davon abgehalten überhaupt in den Markt einzutreten. Eine weitere Sorge der Branche ist die, dass Menschen tendenziell immer weniger mündlich miteinander kommunizieren. Je jünger die Generation, umso weniger wird zum Beispiel telefoniert. Warum also so viel Zeit und Geld in eine Technologie stecken, die auf mündliche Kommunikation ausgerichtet ist, wenn zukünftige Generationen voraussichtlich mehr tippen statt sprechen werden? Die Antwort ist simpel: Das größte Nutzungspotenzial sehen die Entwickler im Tourismus.

Wer nicht in Landessprache nach dem Weg fragen kann, und bei wem die Kommunikation auf Englisch auch nicht funktioniert, möchte wohl kaum mit einem Fremden das Handy hin- und herreichen und so vergleichsweise mühsam schriftlich nach dem Weg fragen. Hier ist es tatsächlich am einfachsten das Smartphone vor sich zu halten, die Frage laut zu stellen, und die angesprochene Person in ihrer Landessprache antworten zu lassen. Längere Gespräche - man denke an gemeinsame Abendessen mit Urlaubsbekanntschaften oder auch an Geschäftstreffen - werden dann dadurch vereinfacht, dass es bereits die ersten “wearable technologies” im S2S Bereich gibt: Mit einem Knopf im Ohr hören beide Gesprächspartner direkt alles klar und deutlich in der für sie richtigen Sprache. Das Handy liegt dabei einfach auf dem Tisch und macht die Arbeit von ganz allein.
Mal ganz abgesehen vom Tourismus besteht an der S2S Technologie auch in anderen Gebieten Interesse - dazu zählen humanitäre Arbeit, Medizin oder Vorträge an Universitäten. Also Bereiche in denen entweder kein Budget für Dolmetscher vorhanden ist, oder auch Situationen in denen sie einfach nicht schnell genug zu erreichen sind. Nur produzieren Felder wie diese eben nicht den benötigten Gewinn, der die (Weiter-)Entwicklung der S2S Technologie wirklich lohnenswert machen würde. Dieser Gewinn soll stattdessen durch Touristen generiert werden.

woman reading book on street during daytime
Photo by elCarito / Unsplash

Was kosten diese Apps und Gadgets aktuell überhaupt?

Wie immer gibt es auch in diesem Fall natürlich gratis Basis-Versionen von Apps, sowie auch zeitlich begrenzte Abos der vollständigen Versionen zu einem Kaufpreis von etwa 40€. Bei schickeren Gadgets wie den Kopfhörern liegt man dann schon schnell bei rund 350€. Je nach Größe des persönlichen Sparschweins ist hier also für jeden das richtige dabei, doch Online Reviews der Technologie sind stellenweise noch stark durchwachsen.

Ein Anwendungstest

Ob wir bald alle nur noch per Smartphone von Touristen nach dem Weg gefragt werden ist fraglich, aber vielleicht sollte man sich schon einmal darauf gefasst machen. Auch hier bestehen im Übrigen große Sorgen innerhalb der Branche: In manchen Ländern gilt es zum Beispiel als eine drohende Geste, jemandem relativ unvermittelt ein Smartphone vors Gesicht zu halten - und das sicher nicht zu unrecht. Wieder andere Gadgets (zum Beispiel in Form von Armbanduhren) sollen hier angeblich Abhilfe schaffen.
Speech-to-Speech Übersetzungen existieren also schon, doch wann ist mit ihrer Integration in den Alltag zu rechnen? Nach Anwendungstests wie diesem zu urteilen, wird eine regelmäßige Anwendung wohl morgen noch nicht der Fall sein ... aber vielleicht ja schon übermorgen: Instant Translation - Right in your Ear!