
Amazon hat seinen Lautsprecher Echo für Deutschland vorgestellt. Er soll zur Kommunikationszentrale im Wohnzimmer werden. Wer mit Alexa redet, soll Musik hören, Produkte bestellen oder Informationen abrufen. Ist das die Gerätegattung der Zukunft?
Alexa hat jetzt deutsch gelernt. Diese Nachricht könnte weitreichende Folgen für die Kommunikation in Deutschlands Wohnzimmer haben. Denn Amazon hat an diesem Mittwoch den Lautsprecher Echo vorgestellt, den es nun in Deutschland für 180 Euro geben wird. Prime-Kunden zahlen an den ersten beiden Tagen 50 Euro weniger.
Echo ist zunächst ein runder, etwa 23,5 Zentimeter großer Lautsprecher, der einen 360-Grad-Sound erzeugt, so dass er auf dem Wohnzimmertisch platziert werden kann. Weil es von Samsung, Sony und anderen Unternehmen ähnliche Lautsprecher gibt, wäre Echo die Nachricht nicht wert. Der eigentliche Clou ist ein anderer.
Sieben Mikrofone hören zu
Der kleine Zylinder hat auch sieben Mikrofone unter dem Deckel eingebaut. Er kann also auch Geräusche erkennen. Insbesondere die Stimme, also mittlere Frequenzen, sind für Echo interessant. Damit der Zylinder versteht, was gesprochen wird, hat er eine Assistentin namens Alexa. Sie übernimmt die Kommunikation mit dem Besitzer. Man könnte sie abwertend auch als Spracherkennungssoftware bezeichnen.
Alexa ist wohlerzogen und spricht nur, wenn sie gefragt wird. Um zu wissen, wann sie angesprochen wird, hört sie – wie manche Kritiker schon vor zwei Jahren befürchteten – nicht die ganze Zeit zu. Sie wird erst aktiv, wenn sie mit „Alexa“ angesprochen wird. Erst dann wird eine Verbindung zu den Servern hergestellt und werden Daten transferiert.
Alexa lernt gerne
Je schlauer Alexa ist, desto mehr Spaß macht der Umgang mit Echo. Deshalb lernt sie täglich dazu, indem sie das Gesprochene auswertet, sowohl phonologisch als auch semantisch. Natürlich lernt sie auch die Vorlieben des Besitzers kennen, ihm wird nach alter Amazontradition empfohlen, was er mögen könnte. Entscheidend dabei ist der Kontext. Die Software berücksichtigt den Aufenthaltsort des Sprechers, weil die Worte eine andere Bedeutung haben können.
Je mehr Alexa mit Informationen gefüttert wird, desto ungenauer dürfen die Fragen sein und desto spezifischer sind die Antworten. „Wie ist das Wetter morgen?“ lässt sich treffsicher beantworten, wenn Echo den Standort und das Datum erfasst hat. „Welche Termine habe ich heute?“ setzt voraus, dass Echo den Kalender (zum Beispiel den von Google) kennt. „Spiel mir die Playlist von gestern“ klappt nur, wenn Echo sich gemerkt hat, welche Musik gestern lief.
Je mehr Daten desto besser
Was einigen datensensiblen Menschen Angstschweiß verursachen dürfte, wird Intensivnutzer freuen: Mit der aufgenommenen und ausgewerteten Datenmenge steigt das Potenzial von Echo. Google macht es schon seit Jahren vor mit seiner Anwendung „Now“: Das Smartphone gibt eigenständig Hinweise über Ereignisse in der Zukunft und schlägt dem Nutzer vor, entsprechend zu handeln. Das wird Alex auch tun wollen.
Echo kann Geräusche erkennen, man kann ihm Stimmbefehle geben.Bilderstrecke
Technisch gesehen ist Echo als Lautsprecher zunächst keine Sensation. 360-Grad-Lautsprecher gibt es bereits einige, die Anbindung per W-Lan ist trivial, ebenso die adhoc-Verbindung mit den Amazon-Servern, wenn Alexa wach wird. Das kann Google mit seinen Smartphones schon lange.
Nur die Stimme zählt
Anspruchsvoll ist das Filtern der Stimme in einem großen Raum mit möglichen Hintergrundgeräuschen. Dass Amazon Spracherkennung ausgezeichnet kann, zeigt das Unternehmen bei seiner Streaming-Box Fire TV, bei der man mit der Fernbedienung per Sprache Titel suchen kann, was sehr gut funktioniert.
Echo hat die Schwierigkeit, dass der Nutzer nicht direkt in eines der sieben Mikrofone hinein spricht, sondern von irgendwo im Raum seine Anfrage stellt. Zudem läuft möglicherweise im Hintergrund Musik, oder die Kinder schreien. Echo muss die Stimme aus allen anderen Frequenzen herausfiltern, erst dann kann Alexa überhaupt etwas verstehen. Der Server kann nur gereinigte Spracheingaben gebrauchen. Was für den Mensch kein Problem ist, ist für ein Algorithmus eine anspruchsvolle Aufgabe. Bei der Vorstellung von Echo in London konnte Amazon überzeugend zeigen, dass es zu keinem Zeitpunkt ein sprachliches Missverständnis gab.
