Künstliche Intelligenz: Wie arbeitet eine KI?

Wie sieht die Architektur von KI-Systemen aus?
Doch wie funktioniert ein KI-Algorithmus, der auch ChatGPT oder Bildgeneratoren wie Dall-E und Midjourney zugrunde liegt?
Aus meiner Sicht ist insbesondere die Transformer-Architektur entscheidend für die hohe Leistungsfähigkeit der genannten Systeme. Der Transformer-Ansatz existiert seit dem Jahr 2017. Mit einem Transformer lässt sich jegliche Art von Eingabe (Daten) in sogenannte Einbettungen überführen. Einbettungen (Embeddings) sind Listen von Zahlen, die Vektoren genannt werden. Die Vektoren für zwei Eingabewerte ähneln sich idealerweise so sehr, wie die zwei Eingabewerte sich semantisch ähneln.
Künstliche Intelligenz arbeitet mit Vereinheitlichung von Daten
Bei Textanwendungen wie der automatischen Übersetzung oder einer Textzusammenfassung bestehen die Eingabewerte aus Begriffen. Bildanwendungen wie Dall-E vektorisieren Bilder nebst vorliegenden Bildbeschreibungen. Sie überführen sie also in semantisch aufgeladene Zahlenreihen. Für Bilder werden deren Pixelwerte als Eingaben verwendet. Diese Vektorisierung funktioniert auch für jegliche andere Art von Eingaben, also etwa für Videos oder Audiosignale.
Weil KI-Anwendung…