Künstliche Intelligenz – leicht verständlich gemacht (Teil 1)

KI klingt erstmal schwierig und kompliziert. Dabei kann man Künstliche Intelligenz leicht verständlich erklären … wie in dieser Serie von Blog-Artikeln.

Dieser erste Beitrag von mehreren Blog-Artikeln zu „Künstliche Intelligenz – leicht verständlich“ stammt von Florian Werner-Jäger. Schon in seinem Informatik-Studium setzte er den Schwerpunkt auf Künstliche Intelligenz. Seit vielen Jahren beschäftigt sich Florian Werner-Jäger als Consultant und Trainer mit KI, insbesondere als IT-Berater in der Finanzbranche.

Die Medien sind voll von Meldungen zu Künstlicher Intelligenz und es vergeht keine Woche, ohne dass nicht eine neue Erfolgsmeldung über eine neue Errungenschaft in diesem Bereich verkündet wird.

Erstes Beispiel

Die chinesische Alibaba-Gruppe hat ein KI-Programm entwickelt, das erstmals Menschen in der Beantwortung von Fragen zum Textverständnis schlägt.

Das kennen wir alle aus der Schule: man bekommt einen Text, z. B. im Deutschunterricht, und muss Fragen beantworten. Damit stellt der Lehrer fest, ob man den Text richtig verstanden hat. Und genau das machen diese Systeme. Die Behauptung hier in den Medien ist, KI-Systeme könnten bereits heute Texte besser verstehen als Menschen. Stimmt das oder ist das noch Utopie?

Zweites Beispiel

Ein weiteres Beispiel ist ein Projekt von Google, entwickelt in Zusammenarbeit mit der Universität Stanford:

Wenn man in einer Stadt in den USA 15 Minuten ein Video in einem Stadtteil dreht und in diesem Video auch die Autos und Automarken erfasst, die am Straßenrand stehen, dann ist man in der Lage anhand dieses Videos festzustellen, ob in diesem Stadtteil entweder mehr Republikaner oder mehr Demokraten gewählt werden.

Drittes Beispiel

Stimmt das oder ist das noch eine Utopie? Und ein drittes Beispiel:

Es wird ein Video gedreht mit Personen im Bild, zum Beispiel ein Überwachungsvideo auf dem Bahnhof oder im Flughafen. Das System erkennt die Personen nicht anhand der Gesichter, sondern allein anhand der Art und Weise, wie sie gehen.

Das heißt, die Personen müssen gar nicht mithilfe des Gesichts erkannt werden. Es reicht vielleicht nur einen Schatten zu sehen, vielleicht nur eine Person, die in schwarz gekleidet ist. Es wird aber genau am Gang erkannt, dass diese Person bereits vor 30 Minuten auf einer anderen Überwachungskamera an einem anderen Ort gesehen wurde.

Stimmt das? Kann das KI heute oder ist das noch Utopie? Diese drei Beispiele schauen wir uns in weiteren Blog-Artikeln an, um besser zu verstehen, wie der Stand der Technik in der Künstlichen Intelligenz heute ist. Zuvor sind ein paar Grundlagen sinnvoll, um zu verstehen, wie diese herausragenden Leistungen in der KI möglich sind.

Neuronales Netz

Den Begriff Neuronales Netz haben wir sicherlich alle schon gehört. Er wird in vielen Artikeln gebraucht. Irgendwie sind Neuronale Netze die Wunderdinge, die KI-Systeme zum laufen bringen. Wie sie im Detail funktionieren, würde diesen Blog-Artikel „sprengen“ (dazu mehr in meinem KI-Seminar). Aber ich möchte gerne das Grundverständnis dafür wecken.

Neuronale Netze sind dafür da, um Entscheidungen zu treffen. Jedes KI-System ist im Prinzip ein System, das eine Entscheidung trifft. Das klassische Beispiel ist eine Bildverarbeitung. Es gibt beispielsweise Fotos von Autos und das System soll feststellen, welches auf dem Foto zu erkennen ist. Das Neuronale Netz liefert nach seiner Verarbeitung eine Ausgabe, ob es ein BMW ist, ein Audi, ein Fiat, ein Tesla, … und um welches konkrete Modell es sich handelt.

Anderes Beispiel: Es liegt eine Sprachaufnahme vor, auf der eine Person spricht. Der Input, den das System bekommt, ist also ein Audiosignal. Das System soll entscheiden, wie die Person spricht. Ist es eine Person, die sich gerade freut, zeigt die Person Furcht oder Ärger, formuliert sie ihre Aussagen neutral?

Klassifikation

Was haben diese beiden Beispiele von Bildverarbeitung und Spracherkennung gemeinsam? In beiden Fällen handelt es sich um eine Klassifikation. Das heißt, das Neuronale Netz liefert eine Entscheidung und liefert ein Ergebnis, das in eine Schublade passt, die dem System vorgegeben wurde: es soll ein bestimmtes Automodell erkannt werden bzw. eine bestimmte Emotion, die in einem Sprachsignal steckt.

Die Grundidee ist also, dass das System mit Daten als Ausgangsbasis (ohne Daten funktioniert die moderne KI nicht) eine Entscheidung liefert, die einer Klassifikation entspricht. Die Klassifikation gibt der Mensch am Anfang vor. Das System überlegt sich also nicht selbst, was es am Schluss liefern soll. Diese Vorgaben müssen in der Entwicklungsphase eines KI-Systems getroffen werden.

Regression

Klassifikation ist also ein wichtiger Aspekt bei Neuronalen Netzen. Es gibt noch eine Variante: die Regression. Bei der Regression geht es nicht darum, dass eine Maschine eine bestimmte Antwort (eine bestimmte „Schublade“) liefern soll, sondern einen bestimmten Wert, z.B. einen Zahlenwert.

Angenommen es liegt ein Bild von Barack Obama, Angela Merkel oder einer beliebigen anderen Person vor. Das Neuronale Netz soll folgende Frage beantworten: „Wie alt ist denn vermutlich die Person auf dem Bild?“ Im Fall von Barack Obama würde, wenn das Netz ziemlich gut arbeitet, die Antwort „58 Jahre“ lauten.

Anderes Beispiel – ich bin viel in der Finanzbranche unterwegs – ein System soll bei einer Bank beurteilen, ob der Kreditantrag eines Kunden bewilligt werden soll oder nicht. D. h. als Ausgangspunkt liegen nicht Bilder oder Audioaufzeichnungen vor, sondern die Angaben des Kunden zu sich selbst: wie er heißt, wie alt er ist, wo er wohnt, was er verdient, wie lange schon er dort wohnt und so weiter. Es sind also strukturierte Daten, die üblicherweise bereits in Datenbanken vorliegen. Aus diesen strukturierten Daten können Neuronale Netze auch sinnvolle Ergebnisse liefern. Im genannten Beispiel soll die Antwort sein:  „Wie wahrscheinlich ist es, dass diese Person als möglicher Kreditnehmer den Kredit zurückzahlt? Das ist also ein Prozentsatz zwischen 0 und 100 Prozent.

In beiden Beispielen (Alterserkennung anhand eines Bildes und Kreditentscheidung) wird nicht eine bestimmte Schublade erwartet, z. B. eine bestimmte Einteilung in ein Automodell, sondern ein bestimmter Zahlenwert (x Jahre oder y Prozent).

Damit gibt es also zwei grundlegende Verfahren: die Klassifikation und die Regression bei Neuronalen Netzen.

Ausblick

Wenn diese Netze das alles wunderbar können, stellt sich die Frage: „Weshalb können die das denn eigentlich?“ Natürlich kann das nicht anhand von starren Regeln passieren. Die Grundidee der modernen KI ist, dass Neuronale Netze sich Dinge selbst beibringen. Doch wie kann das sein, dass sich ein Neuronales Netz selber die Fähigkeit beibringt? Dazu mehr im nächsten Beitrag dieser Serie zu „KI „Künstliche Intelligenz – leicht verständlich“, siehe auch die Links in den Kommentaren unten.
Noch viel mehr gibt es im Seminar Künstliche Intelligenz (KI) erfolgreich einsetzen, das ausdrücklich auch für Nicht-Techniker verständlich, interessant und relevant ist.

Abonniere den Blog für rechtzeitige Infos über neue Inhalte.

7 comments

  1. Herzlichen Dank für die ausführliche Erklärung zur Funktionsweise neuronaler Netze. Besonders die industrielle Bildverarbeitung finde ich zur Zeit sehr spannend. Diese wird dazu genutzt, eine Qualitätskontrolle bei verschiedenen Produkten durchzuführen. Auf diese Weise werden Fehler automatisch erkannt, sodass die fehlerhaften oder unvollständigen Fertigteile herausselektiert werden können.

Kommentar verfassen