Beiträge

Sprachsteuerungssysteme – Künstliche Intelligenz verhilft zum Durchbruch

„Liebes Auto, bitte rufe Stefan Mayer an!“ „Tut mir leid, ich kann die Adresse Eierstraße leider nicht finden.“ Solche Dialoge mit Sprachsteuerungssystemen sind den meisten Menschen genauso bekannt wie leidig. Die Möglichkeiten von Spracheingabe waren immer so verlockend wie begrenzt. Nur ganz bestimmte Begriffe in festgelegter Reihenfolge, langsam und unnatürlich gesprochen wie von einem Roboter und ganz ohne Nebengeräusche führten zum Erfolg. Die neueste Generation dieser Sprachsteuerungssysteme ist ihren Vorgängern einen großen Schritt voraus. Erstmals sind so etwas ähnliches wie natürliche Gespräche mit diesen Systemen möglich und mehrere gesprochene Wege führen zum Ziel.

ASR und NLU – Begriffe die man kennen sollte

Bei der automatischen Spracherkennung “ASR” (Automatic Speech Recognition) werden Computerhardware und softwarebasierte Techniken zur Erkennung und Verarbeitung der menschlichen Stimme verwendet. ASR wird verwendet um die Wörter zu identifizieren, die eine Person gesprochen hat, oder um die Identität der in das System sprechenden Person zu authentifizieren. Natural Language Verständnis “NLU” (Natural Language Understanding) ist ein Zweig der künstlichen Intelligenz, der Computersoftware verwendet, um die Eingabe in Form von Sätzen im Text- oder Sprachformat zu verstehen. ASR verwandelt Sprache also zu Text – kann es folglich “lesen”. NLU versteht aber erst die Bedeutung dahinter.

Was brachte den Durchbruch?

Der große Beschleuniger der Technologie war die Verlagerung der Spracherkennungssoftware in die Cloud. Den Anfang machte damals Apple mit der Einführung des Spracherkennungsassistenten “Siri” auf den iPhones. Amazon zog mit „Alexa“ nach. Auch Google mit seinem „Google Assistant“, Samsung mit „Bixby“ und Microsoft mit „Cortona“ sind neben anderen kleineren Herstellern die Haupttreiber der Entwicklung. Wird der Sprachassistent mit einem Codewort aktiviert und eine Frage gestellt, dann wird diese Anfrage zu einem Server des Anbieters gesendet, wo nach Analyse durch eine künstliche Intelligenz eine wahrscheinlich passende Antwort generiert und zurück beim Fragesteller über einen Lautsprecher ausgegeben wird. Internet basiertes maschinelles Lernen ist die technische Voraussetzung für ein möglichst natürliches Erlebnis mit Sprachsteuerung. Ein Zusammenspiel von Deep Learning, Cloud Computing, Neuronalen Netzwerken und künstlicher Intelligenz führt hierbei zu immer besseren Ergebnissen.

Welche Anwendungsmöglichkeiten ergeben sich?

Grundsätzlich geht es bei der Nutzung von Spracherkennung schon lange nicht mehr um das bloße Diktieren von Text, sondern darum, einen Computer zu steuern und ihn mit bestimmten Services zu beauftragen. Die Sprache wird hierbei zu einer weiteren Schnittstelle, welche die Interaktion von Mensch und Gerät erleichtern und verbessern soll. Anstatt sich in einem Auto umständlich durch verschachtelte Menüs klicken zu müssen, genügt ein einziger gesprochener Satz, um z.B. die Navigation mit einer neuen Zielführung zu beauftragen. Das spart Zeit, Nerven und es lenkt den Fahrer im Zweifel deutlich weniger vom Verkehrsgeschehen ab. Auch bei Betrachtung der Angebote von Amazon oder Google steht eine vereinfachte Nutzung der eigenen Dienste im Mittelpunkt. So lassen sich Suchanfragen zu Sportereignissen, Nachrichten oder dem Wetter durchführen, Musiktitel abspielen, Bestellungen aller Art aufgeben sowie Anrufe und Textnachrichten versenden und empfangen. Vereinfacht zeichnet sich folgendes Szenario für Spracherkennungen ab: MBUX kann alles was ein Mercedes kann, Google Home kann alles was Google kann und Alexa kann alles was Amazon kann.

Potenzierte Nutzungsmöglichkeiten durch Integration von Drittanbietern

Besonders spannend wird es, wenn die Sprachsteuerungssysteme “offen” sind auch die Geräte von Drittanbietern zu steuern. Smart Home ist hier ein wichtiges Stichwort. Dabei geht es darum, möglichst alle Funktionen eines Haushalts per Sprachbefehl zu steuern: Heizung, Licht, Rollläden, Musik, Backöfen, die Kaffeemaschine, die Verriegelung der Türen, den Staubsaugroboter oder die Überwachungskameras. Wöchentlich werden weltweit neue Produkte lanciert, die sich durch die zentralen Sprachsteuerungssysteme der großen Hersteller im wahrsten Sinne des Wortes ansprechen lassen. Somit sind Sprachsteuerung und das Internet of Things zwei große Technologietrends, die sich gegenseitig verstärken.

Integrierte Sprachassistenten im Fahrzeug

Neben Assistenten für reines Infotainment, die über das Smartphone funktionieren, also ohne direkten Zugriff auf das Fahrzeug wie beispielsweise Apple CarPlay und der Sprachassistent Chris von German Autolabs, spielen integrierte Sprachassistenten, die Zugriff auf das Fahrzeug haben eine immer wichtiger werdende Rolle in der Automobilbranche. Zu diesen integriertem Sprachassistenten zählen z.B. MBUX “Hey, Mercedes!” von Daimler unter Mitwirkung der Firma Nuance, der Sprachassistent Casey von Bosch sowie Android Auto von Volvo.  Auch Amazons virtueller und sprachgesteuerter Assistent Alexa geht unter die Autofahrer. Alexa ist “offen” und steht auch anderen Hardwareherstellern zur Verfügung.

So hat zum Beispiel VW eine Partnerschaft mit dem Online-Händler Amazon angekündigt und Anfang des Jahres (2018) skizziert, wie man aus dem Auto heraus mit Hilfe von Alexa daheim die Jalousien öffnen oder die Vorräte im Kühlschrank überprüfen kann. Continental zeigte in Las Vegas ein neu entwickeltes Infotainmentsystem, das in Zukunft sowohl mit der On-Board-Diagnose des Autos verbunden als auch mit der Alexa Sprachsteuerung ausgestattet sein soll. Ford integriert Amazon Alexa per Software-Update in allen Autos mit Sync 3 Entertainment System – vorerst aber nur in den USA. Seat hat Alexa in den Ibiza, den Leon, den Ateca und Ende August auch in den Arona geholt. BMW und Mini haben Alexa seit Mitte 2018 in alle neuen Modelle integriert. Beispielsweise kann der Autofahrer das aktuelle Kinoprogramm oder das Wetter am Zielort erfragen, die Lieblings-Playlist abspielen oder shoppen – einfach per Sprachbefehl in die Cloud. Heute sind Sprachsteuerungssysteme schon in 55 Millionen Autos (Statista) sowie in der Headunit integriert. Auch im Aftersalesbereich spielt die Integration von Alexa eine immer größere Rolle. Laut einer Veröffentlichung der FAZ im Januar 2019 hat Amazon die Marke von 100 Millionen verkauften Geräten mit seiner Sprachassistentin Alexa an Bord geknackt. In der StudieAn outlook on INTELLIGENCE in 2024 finden sich weitere Informationen und Zahlen zum Thema Sprachassistenten.  

Welche Einschränkungen gibt es?

Neben den vielen bereichernden Möglichkeiten von Spracherkennungssoftware gibt es noch einige Hindernisse zu überwinden. So ist es für die Erkennung eindeutiger Befehle immer noch hinderlich, wenn Anweisungen kontextbasiert erfolgen, wenn undeutlich gesprochen wird oder der eigene lokale Akzent allzu dominant ausgeprägt ist. Sehr vereinzelt verbreiten sich ab und an Zeitungsmeldungen über fehlgeleitete Sprachbefehle, so wurde laut Businessinsider einmal angeblich das Gespräch eines Ehepaares aufgenommen und automatisch per Email versandt. Noch deutlicher werden die Risiken bei Betrachtung der Datensicherheit. Die Hersteller beteuern zwar, dass Daten erst nach Aktivierung durch das Codewort an die eigenen Server gesendet werden. Kritische Konsumenten werden dennoch hellhörig, wenn beispielsweise Google durch personalisierte zielgenaue Werbung seine Umsätze erzielt. Je mehr ein digitaler Assistent über seinen Nutzer weiß, desto besser funktioniert er. Es gibt hier also einen klassischen Zielkonflikt zwischen dem Sammeln von persönlichsten Daten und der reibungslosen Funktionalität eines Produktes welches den Alltag erleichtern soll.

Was erwartet uns noch in der Zukunft?

Die künstliche Intelligenz der digitalen Assistenten soll den Nutzer beobachten, von ihm lernen und sich ihm anpassen. Nur so kann das entstehen was wir von einer Menschlichen Stimme erwarten: Nähe. Nur so kann aber auch das entstehen was viele fürchten: der gläserne Mensch, vollkommene Überwachung und das Vorhersagen sowie die Beeinflussung unserer Gedanken und Handlungen. Gleichzeitig erhöht sich dadurch die Effizienz der Kommunikation zwischen Mensch und Maschine. Denn nur mit Intuition ist ein gegenseitiges menschliches Verstehen möglich. Wir alle versuchen die Gedanken unseres Gegenübers zwischen den gesprochenen Zeilen zu lesen. Warum sollten wir es also fürchten, wenn unser guter alter Gehilfe Computer dasselbe tut? Vielleicht darum, weil diese Dienste und Services jemandem gehören der mit unseren Daten sein Geld verdienen will. Die Angst vor der finanziellen Ausschlachtung des eigenen Lebens bleibt also. Vielleicht ist dies aber auch die angemessene nächste Stufe – hin zu neuer Lebensqualität mit digitalen Helfern.

Was sprechen die Zahlen?

Laut einer von Tracticta erhobenen und von Statista im August 2016 veröffentlichten Studie, steigen die weltweiten Nutzer virtueller digitaler Assistenten von 390 Millionen im Jahr 2015 auf 1831 Millionen Nutzer bis zum Jahr 2021 an. Für das Jahr 2019 wurde die Zahl der weltweiten Nutzer von virtuellen digitalen Assistenten dabei auf rund 1,4 Milliarden prognostiziert. Laut Handelsblatt wurden im Jahr 2018 weltweit bereits 7,5 Milliarden Dollar mit Spracherkennungssoftware umgesetzt. 2015 waren es laut einer von Horizont veröffentlichten Erhebung von Tracticta (Horizont Nr. 9, 02.03.2017, Seite 18) noch 17,7 Millionen US-Dollar. Laut des Artikels im Handelsblatt lassen weitere Studien von Canalys und IDC einen Anstieg auf 27,8 Milliarden Dollar im Jahr 2022 erwarten. Das entspräche einer durchschnittlichen jährlichen Wachstumsrate von über 20%.

Neben der Sprachsteuerung in Fahrzeugen und den Services von Google, Apple und Amazon zählt auch der Gesundheitsbereich zu einer Industrie, der bedeutend zum Wachstum beiträgt. Auch bei mobilen Bankgeschäften ist die Authentifizierung über die Stimme ein Trend. Viele Experten nehmen inzwischen an, dass der gesamte Customer Service Bereich branchenübergreifend vor einer Revolution durch sprechende künstliche Intelligenzen steht.

Was kommt auf Ihr Unternehmen zu und wie profitieren Sie von den neuen Entwicklungen und Technologien? Kontaktieren Sie uns gerne und wir erörtern gemeinsam neue Wachstumschancen für ihr Unternehmen.

 

Virtual und Augmented Reality in der Automobilindustrie_magility

Virtual Reality – zunehmende Bedrohung aus der Cloud?

Spätestens seit der Einführung der Eisenbahn im 19. Jahrhundert gibt es Skepsis beim Aufkommen technischer Neuerungen. So klar die Vorteile innovativer Technologien meist auf der Hand liegen, so groß sind auch teilweise die Befürchtungen, die mit der Verbreitung von Neuem und Unbekanntem einhergehen. Auch die aktuellen Entwicklungen im Bereich Virtual- und Augmented Reality sind davon nicht ausgenommen.

 

Augmented Reality vs. Virtual Reality

 

Mit dem Begriff Augmented Reality (AR) wird eine durch Computer erweiterte Realität beschrieben. Die Kamera eines Computer zeichnet die Realität auf, analysiert sie in Echtzeit, reichert sie mit zusätzlichen Daten an und gibt diese erweiterte Realität auf einem Display wieder. Dieses Prinzip ist bereits bekannt durch die Spiele-App Pokémon Go. Im Gegensatz zur AR wird die Virtual Reality (VR) komplett im Computer erschaffen. Will ein Nutzer daran teilhaben, so muss er sich über ein elektronisches Gerät, beispielsweise eine VR Brille oder einen Computer, in die virtuelle Realität einwählen.

 

Die virtuelle Welt Second Life ist eine der ersten Anwendungen von VR. Aber auch manche Videospiele wie World of Warcraft oder Grand Theft Auto erreichen inzwischen mit großem wirtschaftlichen Erfolg eine programmierte Komplexität, die der Realität nahe kommt. Anwendungen, die AR und VR vermischen werden auch Mixed Reality genannt.

 

Gefahren bei digitalen Realitäten

 

Nicht umsonst widmete sich die Mainzer Kunsthalle mit einer großen Ausstellung im Jahr 2018 diesem Thema und überschrieb die Schau mit einem vielsagenden Titel: Virtual Insanity.

Je mehr der virtuelle Raum sich an die echte Realität anpasst, wenn die Geschehnisse der Realität mehr und mehr in die virtuelle Realität übertragen werden, dann wandern auch die bekannten Probleme des Alltags in den Cyberspace: Mobbing, Belästigung, Stalking und die Auslebung anderer illegaler und unmoralischer Handlungen.

 

Wenn es zudem möglich wird, im digitalen Raum mit dem eigenen Avatar rechtsverbindliche Geschäfte abzuschließen, dieser Avatar dann gehackt oder kopiert wird, dann ergibt sich eine Vielzahl an Möglichkeiten für illegale Aktivitäten. Auch Geldwäsche ist ein Thema das sich in diesem Kontext zunehmend etabliert und in den Fokus von Behörden gerät.

 

Virtual Reality in der Automobilindustrie

 

In den Entwicklungsabteilungen der Automobilindustrie gehört die Anwendung von VR in einigen Bereichen bereits zum Standard. In einem VR-Studio lassen sich Bauteile digital dreidimensional betrachten und vor der eigentlichen Produktion testweise zusammensetzen. Diese Räume werden CAVE genannt (Cave Automatic Virtual Environment) und erlauben einen realitätsnahen Blick auf virtuelle Bauteile. Auch die Kunden profitieren von dieser Entwicklung. So bietet etwa Audi einen dreidimensionalen Konfigurator an, durch den sich ein individualisiertes Wunschfahrzeug schon vor der eigentlichen Produktion anschauen und bewundern lässt.  

 

Bald schon könnten Geräte ähnlich dem Google Glass in unterschiedlichsten Berufsanwendungen zum Standard gehören. Dabei trägt ein Polizist, Arzt oder ein Teilnehmer eines Meetings in einem Büro eine Brille, die ihm zusätzliche Informationen direkt in sein Sichtfeld einblendet. Dadurch können komplizierte Situationen vereinfacht, beschleunigt und effizienter gestaltet werden.

 

Virtual Reality auch bei der Verteidigung im EInsatz

 

Auch im militärischen Bereich sind Virtual Reality und Augmented Reality bereits bei modernen Armeen und Luftwaffen im Einsatz. Weitere potenzielle Anwendungsmöglichkeiten sind zahlreich, sie reichen über Zusatzinformationen im Einzelhandel bis hin zum virtuellen Einbau von Möbeln in das eigenen Zuhause. Grundsätzlich sind der Fantasie hier keine Grenzen gesetzt. Die dahinterstehenden erfolgreichen Geschäftsmodelle bestätigen die positive Entwicklung der Technologie.

 

Steigendes Marktvolumen für Virtual Reality Anwendungen

 

Die M&A Beratung Hampleton Partners erwartet für den globalen Markt von VR-Anwendungen für das Jahr 2022 ein Volumen von 17,8 Mrd. $.  Zum Vergleich: 2016 betrug die Marktgröße noch 2 Mrd. $. Nach einem Marktvolumen von 4 Mrd. $ im Jahr 2016, wird für den AR-Markt bereits im Jahr 2020 ein Anwachsen auf 161 Mrd. $ erwartet. Hohe Prognosen, die in aller Klarheit verdeutlichen, wohin die Reise geht.

 

Google und Microsoft sind von Anfang an und bis heute Treiber dieser Entwicklung. Auch zahlreiche Start-Ups wie Magic Leap und Vuforia aus den USA oder INDE aus Großbritannien mischen mit. Analysten nehmen an, dass europäische Unternehmen sogar bis 2020 die Marktführerschaft im Bereich Virtual Reality übernehmen werden. Von einem Anwachsen des Produktionswertes um 13-34 Mrd. € ist die Rede und bis zu 480.000 Arbeitsplätze könnten auf dem europäischen Kontinent dafür geschaffen werden. Die Einführung schnellerer mobiler Internetverbindungen wie 5G werden diesen Trend zudem noch beschleunigen.

 

Erweiterte Angriffsfläche für digitale Hacker

 

Bei zunehmender Digitalisierung des Straßenverkehrs ist das größte Risiko ein digitaler Hackerangriff. Jedoch verringert sich auch das Risiko von menschlichem Fehlverhalten stark durch die Unterstützung von digitaler Technik. Wird dieses System allerdings von Kriminellen, Terroristen und anderen Akteuren mit kriminellen Absichten beeinflusst, können durch Störsignale und digitale Falschinformationen schlimme Unfälle oder sogar der Zusammenbruch des Automobilverkehrs die Folge sein. Dabei müssen nicht einmal einzelne Fahrzeuge attackiert werden, ein einzelner Angriff über die Cloud kann genügen um ganze Flotten lahmzulegen.

 

Auch Virtual Reality Anwendungen müssen ganzheitlich und von Anfang an digital sicher (cyber secure) gedacht werden und die Security muss im gesamten End-to-End System integriert sein. Zunehmende Vernetzung ermöglicht weitere Einfallstore für Hacker Angriffe und böswillige Manipulationen. Mit jeder technologischen Entwicklung wächst diese Herausforderung beträchtlich weiter an. Magility berät Sie gerne bei der Umsetzung Ihrer individuellen Lösungen zum sicheren Einsatz virtueller Realitäten in Ihrem Geschäft.

 

Allseits sichere Fahrt in die Zukunft wünscht Ihnen das Team von Magility!

Brain-Computer-Interfaces, KI und Androiden

Brain-Computer-Interfaces – Behalten wir die Oberhand?

Die Art und Weise wie der Nutzer in Zukunft mit Computern kommunizieren wird, steht vor einem großen Umbruch. Nach Tastaturen, Mäusen, Touchscreens, Gesten- und Stimmerkennung, setzt die Avantgarde der Computer Forschung auf sogenannte Brain-Computer-Interfaces (BCI’s). Die neuartigen Schnittstellen sollen es dem Nutzer erlauben, komplexer werdende Anwendungen direkt mit der Kraft der Gedanken zu steuern. Hintergrund der Entwicklung ist die Erfindung immer leistungsfähigerer künstlicher Intelligenzen (KI).

Was sind Brain-Computer-Interfaces?

Brain-Computer-Interfaces (BCI’s) sind Schnittstellen zwischen Gehirn und Computer. Die Gedankenkraft wird dabei übersetzt in digitale Eingabebefehle. Die Messung der Hirnströme kann auf zwei Arten stattfinden: nichtinvasiv und invasiv. Bei der ersten Methode wird über Elektroden die Hirnaktivität auf der Kopfhaut gemessen. Ein Nachteil liegt dabei in der Ungenauigkeit der Messergebnisse. Bei der zweiten, der invasiven Methode, wird mit einer kleinen Elektrode direkt im Gehirn gemessen. Diese Methode ermöglicht weitaus präzisere Messungen unserer Hirnaktivität und Elon Musk scheut nicht davor zurück, einen minimalinvasiven Eingriff zu präferieren. Das von ihm erst 2016 mitbegründete Unternehmen Neuralink will hierzu schon bald ein revolutionäres Produkt vorstellen.

Cyborg oder Android – Welches Konzept gewinnt die Zukunft?

Unter einem Cyborg versteht man einen Menschen, der durch technologische Erweiterungen seine Möglichkeiten erhöht. Bereits heute gibt es Prothesen oder Hör- und Sehhilfen, die erste Schritte in diese Richtung beweisen. Es muss dabei aber nicht lediglich darum gehen, körperlich eingeschränkten Personen Hilfe zu verschaffen. Die technologische Entwicklung wird auch dazu genutzt werden einen unbeeinträchtigten Menschen zu verbessern. Ein Exoskelett lässt einen Querschnittsgelähmten wieder gehen oder verleiht einem ‚Gesunden‘ übermenschliche Kraft und Ausdauer. Auch die Verwendung eines Implantats, das ein Gehirn mit einem Computer kommunizieren lässt, macht einen Menschen zu einem Cyborg. Unter einem Androiden hingegen versteht man eine möglichst menschenähnliche Maschine, wie etwa der aus dem Film Terminator bekannte Roboter und die Figur Data aus der Serie Star Trek. Wirft man einen Blick auf die Roboter des Unternehmens Boston Dynamics, wird leicht erkennbar wie nah sich Science-Fiction und aktuelle Realität bereits sind.

Menschmaschine vs. Maschinenmensch

Zwei Entwicklungen stehen sich gegenüber: die technologische Erweiterung des Biomenschen auf der einen Seite, und die Vermenschlichung von Robotern. Welcher Entwicklungsstrang die Bedeutungshoheit in Zukunft erlangen wird, kann noch nicht vorhergesehen werden. Aber Pioniere dieser Entwicklung, wie etwa Elon Musk, sehen die Herausforderung darin, dass künstliche Intelligenzen zukünftig die Intelligenz der Menschheit überragen werden. Damit aus dieser Entwicklung keine substanzielle Gefahr für unsere Spezies entsteht, empfiehlt Musk die Verbindung von menschlichem Gehirn und Künstlicher Intelligenz. Nur wenn wir mit der technologischen Entwicklung integrativ mit wachsen und selbst den digitalen Raum betreten, können wir dieser Ansicht nach künftige KIs unter Kontrolle halten.

Sind wir in Gefahr?

Was würde passieren wenn BCIs oder die Server auf denen die Interaktionen stattfinden Ziel eines Cyber-Angriffs und gehackt werden? Nicht nur von Menschen erstellte Informationen könnten zum Vorteil des Angreifers entwendet werden, im schlimmsten Fall würde eine digitalisierte Seele komplett gelöscht oder so verändert, dass ihre ursprüngliche Identität verloren ginge. Viele Fragen bleiben hier noch unbeantwortet. Wenn es etwa einem Bürger, welcher interaktiv mit einem BMI vernetzt ist, immer noch erlaubt wäre im Demokratieprozess zu wählen, wie stellt man dann sicher, dass seine Stimme nicht durch Hackerangriffe manipuliert wurde und wie bewertet man diese Stimme? Bei allen technologischen Herausforderungen werden die damit verbundenen ethischen Fragen und deren soziale Umsetzung uns noch lange mindestens genauso beschäftigen.

Was bedeutet das für die Mobilität der Zukunft?

Die oben angeführten Entwicklungen werden vielfältige Einflüsse auf unser Verständnis von Mobilität ausüben. Durch weiterentwickelte Brain-Computer-Interfaces könnten wir uns in einen Androiden einklinken und ihn steuern, als wäre er unser eigener Körper. Statt tatsächlich physisch an einen weit entfernten Ort zu reisen, könnten wir so z.B. die Steuerung eines Arbeitsroboters von unserem momentanen Standort aus übernehmen und Aufgaben an jedem Ort der Welt erledigen lassen.

Sind Sie am technologischen Fortschritt interessiert und möchten ihr Unternehmen daran profitieren lassen? Wir beraten Sie gerne, wie Sie neue Technologien sicher für sich nutzen.  Nehmen Sie Kontakt zu einem unserer Berater auf und wir gestalten gemeinsam mit Ihnen eine “cyber-sichere” und gleichzeitig innovative Zukunft.