1. Cookies optimieren die Bereitstellung unserer Dienste. Mit der Nutzung unserer Dienste erklärst Du dich damit einverstanden, dass wir Cookies verwenden. Weitere Informationen
    Information ausblenden
  2. Willkommen im Forum von DIGITAL FERNSEHEN - dem führenden Portal für digitales Fernsehen, Medien und Entertainment. Wenn du hier neu bist, schau dich ruhig etwas um und melde dich an, um am Forengeschehen teilnehmen zu können.
    Information ausblenden

CES 2018: Sprachassistenten nisten sich im Alltag ein

Dieses Thema im Forum "DF-Newsfeed" wurde erstellt von DF-Newsteam, 11. Januar 2018.

  1. emtewe

    emtewe Lexikon

    Registriert seit:
    4. August 2004
    Beiträge:
    31.456
    Zustimmungen:
    19.334
    Punkte für Erfolge:
    273
    Technisches Equipment:
    TechniSat Digipal ISIO HD DVB-T2, VU+ Uno 4K SE, LG 55EG9109 OLED, LG Largo 2.0 HF60LS
    Denon AVR X4300H, Teufel Viton 51, Fire TV Stick 4K, PS4 Pro + PSVR, Bluray Sony BDP S1200
    Multiroom Denon 3xHeos1 + 1xHeos7
    Anzeige
    Ich weiß nicht wer zuerst auf die Idee kam, vielleicht sogar Apple mit Siri, aber Amazon waren die ersten die liefern konnten. Da haben sie einen enormen Vorsprung, und mit der gesammelten Erfahrung haben sie heute einen großen Vorsprung. Alexa wird immer besser darin auch genuschelte Worte richtig zu verstehen, selbst einen Till Schweiger sollte Alexa inzwischen problemlos verstehen...;)
     
    FilmFan gefällt das.
  2. MartinP

    MartinP Talk-König

    Registriert seit:
    14. Januar 2007
    Beiträge:
    5.277
    Zustimmungen:
    760
    Punkte für Erfolge:
    123
    Technisches Equipment:
    Gibertini-Spiegel OP85L
    Multischalter Smart Titanium MS9/6ES
    2x Inverto Quattro LNB IDLP-QTL410-PREMU-OPN f. 19.2 E u 28,5E
    1 x Alps Single LNB für 9.0 E

    Edision progressiv HD

    Unitymedia 2Play 100
    Im öffentlichen Bereich hätten berührungslose Bedienungen auch gewisse Vorteile. Wie viele Infektionen wohl schon die immer häufiger anzutreffenden berührungslosen "Wasser-Marsch"-Auslöser an Urinalen und Waschbecken in öffentlichen Toiletten verhindert haben? Die "Haltewunsch" Tasten in Linienbussen wäre das Nächste, was ich gerne in "Berührungslos" hätte ...

    Fahrstühle, Fahrkartenautomaten, Fußgängerampeln....

    Nur die Geheimzahl am Geldautomaten würde ich ungerne per Spracheingabe .......
     
    emtewe gefällt das.
  3. Gorcon

    Gorcon Kanzler Premium

    Registriert seit:
    15. Januar 2001
    Beiträge:
    156.276
    Zustimmungen:
    31.254
    Punkte für Erfolge:
    273
    Technisches Equipment:
    VU+ Uno 4K SE mit Neutrino HD + VTi
    Macht wenig Sinn! Denn da man sich dort eh irgendwo festhalten muss ist dort eine deutlich höhere "Kontaminierungsgefahr". ;)
     
    Martyn gefällt das.
  4. Le Chiffre

    Le Chiffre Platin Member

    Registriert seit:
    2. März 2008
    Beiträge:
    2.808
    Zustimmungen:
    877
    Punkte für Erfolge:
    138
    Apple schuf mit Siri den ersten Assistenten für den Massenmarkt, Amazon schuf mit Alexa und Echo das erste System, das in Form eines Hardware-Assistenten ausschließlich nur dafür da war.

    Dennoch sind Microsoft und Google technologisch deutlich voraus, da sie schon deutlich länger (Google mindestens seit 2007, Microsoft schon seit 1993) an Sprachsteuerungen forschen.

    Das ist auch der Grund, warum es den Google Assistenten schon in deutlich mehr Sprachen (Englisch, Französisch, Deutsch, Italienisch, Japanisch, Koreanisch, Portugiesisch, Spanisch) als Alexa (Englisch, Deutsch) gibt. Außerdem ist der Google Assistant intelligenter und hat ebenfalls eine bessere Spracherkennung. Bisher "erkauft" sich Amazon diese Fähigkeit durch viele Mikrofone. Habe gerade von der CES in Las Vegas von einem Journalisten gehört, dass die Spracherkennung von Alexa auf Low-Cost-Fremdgeräten sehr schlecht sein soll, während Google hier relativ gut klarkommt.

    Zudem ist Google im Bereich KI führend und nutzt dieses Wissen auch für Spracherkennung und Sprachausgabe. Schon vor kurzem hat Google "Tacotron 2" vorgestellt, das sich fast wie ein echter Mensch anhört und sich relativ einfach auf andere Sprachen übertragen lässt (Quelle: Mensch oder Maschine? Mit Googles Tacotron 2 hört man kaum noch einen Unterschied). Dann kommt natürlich noch das gewaltige Suchmaschinenwissen und das ganze Ökosystem von Google dazu. Ein Beispiel: mit YouTube haben sie eine gewaltige Datenbank mit Sprachsamples, die schon seit Jahren automatisch oder mit Hilfe von Nutzern textualisiert und übersetzt wurden. Diese Daten sind dafür Gold wert, sind darunter doch viele Begriffe der Jugendsprache und Umgangssprache. Und Googles eigene Forschung im Bereich Übersetzungen sind ebenfalls hier wertvoll. Google hat ja sogar schon einen eigenen Real-Time-Übersetzer vorgestellt, Microsoft forscht an ähnlichen Produkten. Amazon hat im Bereich Privatkunden dagegen fast "nur" den Onlineshop. Abgesehen davon besitzen sie kaum persönliche Daten.

    Amazons Vorsprung begründet sich fast ausschließlich, weil sie der Erste hier waren und zudem viel darin investiert haben, viele Drittanbieter auf die Plattform zu locken. Aber hier hat Google mit seiner massiven Präsenz auf der CES ein Zeichen gesetzt, dass sie hier einiges nachholen wollen.

    Währenddessen hätte Microsofts Cortana eigentlich auch ähnliche Chancen gehabt. Technologisch sehr weit vorne, großes Ökosystem mit vielen Daten über die Nutzer, sehr weit vorne im Bereich KI und eine Wissensdatenbank ähnlich der von Google. Warum Microsoft hier aber nicht wie Google viel in den Markt investiert, um nicht noch einmal einen wichtigen Trend zu verpassen, kann ich nicht so richtig verstehen. Zumindest versuchen sie mithilfe einer Kooperation mit Amazon die eigene Technologie in Alexa einzubinden. Ich meine aber, dass sie sich da weit unter Wert verkaufen.

    Apple hätte dagegen ebenfalls mindestens mit Amazon mithalten können. Und wenn sie von Anfang an Siri deutlich besser weiterentwickelt hätten, wäre sicher auch deutlich mehr drin gewesen. Bis jetzt haben sie aber noch nicht einmal ein Produkt im Angebot und das bisher einzige vorgestellte Produkt, der Homepod, wird erst in paar Monaten für 350 US-Dollar verfügbar sein. Viel, viel zu teuer, um sich damit das Haus vollzustellen zu können. Auch gibt es kaum Anzeichen, dass Apple hierfür groß in ein Ökosystem entwickelt. Dabei halte ich das gerade für Apple für besonders gefährlich, da ich denke, dass die Sprachassistenten zum Teil Smartphones - und damit auch das iPhone - ersetzen könnten.
     
    Zuletzt bearbeitet: 12. Januar 2018
    emtewe gefällt das.
  5. Le Chiffre

    Le Chiffre Platin Member

    Registriert seit:
    2. März 2008
    Beiträge:
    2.808
    Zustimmungen:
    877
    Punkte für Erfolge:
    138
    Metall ist einerseits eh nicht der beste Ort für Bakterien und anderseits ist Keimfreiheit nicht gerade wünschenswert. Das Immunsystem muss regelmäßig mit Keimen in Berührung kommen, damit es trainiert bleibt und nicht etwa Überreaktionen wie Allergien entwickelt werden. Der Mensch ist dazu gemacht mit Keimen umzugehen.
     
    Gorcon gefällt das.
  6. FilmFan

    FilmFan Lexikon

    Registriert seit:
    4. April 2002
    Beiträge:
    28.438
    Zustimmungen:
    11.019
    Punkte für Erfolge:
    273
    Technisches Equipment:
    1x VU+ Solo²
    2x Dreambox DM8000
    2x Topfield SRP-2401CI+ mit HD+
    2x Topfield SRP-2410 mit AlphaCrypt
    3x Topfield CRP-2401CI+ mit AlphaCrypt
    1x Topfield TF5200PVRc (R.I.P.)
    2x Nokia d-Box 1 Kabel (R.I.P.)
    Und trotzdem bescheinigt man Alexa den natürlicheren Klang.

    Gerade das empfinde ich als Vorteil - Google weiß eh schon zuviel immer mich, da muß nicht noch mehr dazukommen.

    Und der soll ja ohne zusätzliche i*-Hardware, die dann ständig laufen muß, so gut wie nichts können.
     
  7. Le Chiffre

    Le Chiffre Platin Member

    Registriert seit:
    2. März 2008
    Beiträge:
    2.808
    Zustimmungen:
    877
    Punkte für Erfolge:
    138
    In den USA sieht es aber anders aus. Amazon konzentriert sich ja auch besonders auf Deutschland, während Google in mehrere Sprachen investiert. Mit Tacotron 2 wird Google eventuell noch innerhalb eines Jahres einiges nachholen. Amazon hat aber auch den Vorteil, dass viele die Stimme sympathischer empfinden, was aber nichts mit Technologie zu tun hat. Man wird ja bald sehen, ob hier Google in nächster Zeit die Stimme austauschen wird.

    KI hat die Eigenschaft, dass sie möglichst viele Daten braucht, um wirklich gut zu werden. Daher die Datensammelei. Ein weiteres Beispiel: Google kann aus E-Mails die Paketverfolgungsnummer herauslesen. Amazon hat aber keinen E-Mail-Dienst und muss diese Daten daher manuell vom Nutzer anfragen. Oder ein anderes echtes Beispiel: ich wollte einem Bekannten Android Auto vorführen, der die Sprachsteuerung mit einem schwierigen Straßennamen testen wollte. Der Assistent scheiterte zuerst und konnte die Straße nicht finden. Dann suchte er die Straße manuell per Google Maps, eingeloggt in seinem Konto. Kurz danach erkannte der Google Assistant die Straße, da er ja das Vorwissen über die eigenen Suchergebnisse hatte.

    Ja, wird interessant sein, ob Apple das noch ansatzweise aufholen kann. Auf jeden Fall werden die meisten Apple-Fans mit dem Unternehmen mehr Geduld haben als bei anderen Firmen.
     
  8. emtewe

    emtewe Lexikon

    Registriert seit:
    4. August 2004
    Beiträge:
    31.456
    Zustimmungen:
    19.334
    Punkte für Erfolge:
    273
    Technisches Equipment:
    TechniSat Digipal ISIO HD DVB-T2, VU+ Uno 4K SE, LG 55EG9109 OLED, LG Largo 2.0 HF60LS
    Denon AVR X4300H, Teufel Viton 51, Fire TV Stick 4K, PS4 Pro + PSVR, Bluray Sony BDP S1200
    Multiroom Denon 3xHeos1 + 1xHeos7
    Tja, die Zeiten ändern sich. Heute ist all die Forschung aus den neunzigern, oder selbst die bis 2010, nichts mehr wert. Überhaupt nichts. Rausgeschmissenes Geld. Man verfolgte damals einen völlig falschen Ansatz.
    Heute erledigt so etwas eine KI, und alles was für die Qualität dieser KI benötigt wird sind Daten. Und für eine Spracherkennung, sind das die aufgezeichneten Sprachbeispiele die ein Anbieter sammelt. So hart das für Microsoft sein mag, aber den Stand der Entwicklung der Spracherkennung, kannst du heute ausschließlich an den gesammelten Daten festmachen:

    Wieviel Daten (Sprachsamples) hat Google mit "Ok, Google" gesammelt?
    Wieviel Daten hat Apple mit "Siri" gesammelt?
    Wieviel Daten hat Amazon mit "Alexa" gesammelt?
    Wieviel Daten hat Microsoft mit "Cortana" gesammelt?

    Nur diese Fragen sind heute wichtig. Das ist die Welt von Big Data.

    Ich vermute in diesem Ranking Microsoft abgeschlagen auf dem letzten Platz, davor Apple mit Siri, und Amazon und Google werden sich um die Spitzenposition streiten.
     
  9. FilmFan

    FilmFan Lexikon

    Registriert seit:
    4. April 2002
    Beiträge:
    28.438
    Zustimmungen:
    11.019
    Punkte für Erfolge:
    273
    Technisches Equipment:
    1x VU+ Solo²
    2x Dreambox DM8000
    2x Topfield SRP-2401CI+ mit HD+
    2x Topfield SRP-2410 mit AlphaCrypt
    3x Topfield CRP-2401CI+ mit AlphaCrypt
    1x Topfield TF5200PVRc (R.I.P.)
    2x Nokia d-Box 1 Kabel (R.I.P.)
    Ja, aber keine persönlichen - ich möchte das jedenfalls nicht.

    Schlechtes Beispiel, oder nutzt jeder heute (nur) Google Mail?

    Und wie war das noch, Amazon konnte im Google Kalender Kontakte anlegen, aber Google über seinen eigenen Assistenten selbst nicht?

    Natürlich könnte auch Amazon auf E-Mails zugreifen, wenn man seine Zugangsdaten preisgibt. Aber möchte man das?

    Das hat aber nichts mit persönlichen Daten, sondern mit allgemeinen Daten zu tun. Und da ist Google mit seinem Maps und seiner Suchmaschine in der Tat im Vorteil. Aber Amazon könnte das eventuell auch mit seinen angebundenen Diensten von Microsoft.
     
  10. Le Chiffre

    Le Chiffre Platin Member

    Registriert seit:
    2. März 2008
    Beiträge:
    2.808
    Zustimmungen:
    877
    Punkte für Erfolge:
    138
    Diese Daten sind aber gerade für die Grundlagen wichtig. Außerdem muss man ja auch erst einmal die Forscher haben, mit denen man die KI-Technologie weiterentwickeln kann. Und wie ich ja schon zuvor geschrieben haben, sind Google, Microsoft, aber auch Facebook ebenfalls sehr weit vorne im Bereich KI. Microsoft hat schon vor Jahren einen Real-Time-Übersetzer vorgestellt, der direkt aus dem Englischen ins Chinesische übersetzen kann. Aber du hast Recht, Microsoft fehlen ein bisschen die Sprachsamples im großen Stil, da Cortana auf Windows 10 sicher deutlich weniger genutzt wird als die Sprachassistenten auf dem Smartphone.

    Außerdem sollte man nicht unterschätzen, dass der Google Assistant neben den YouTube-Sprachsamples (inklusive von Menschen überprüfter Transkribierung und Übersetzung), noch auf 400 Millionen Android-Geräten vorinstalliert ist.
     
    emtewe gefällt das.