Wenn ChatGPT derzeit in aller Munde ist, so erinnert dies an die Debatten der späten 1980er Jahre, war man überzeugt, dass die Künstliche Intelligenz den Menschen abschaffen werde. Damals wie heute wird ein wesentlicher Punkt ausgeblendet, die Frage nämlich, inwieweit die neuen Techniken Anwendungsfelder eröffnen, die vordem unmöglich waren, zudem überaus hilfreich sein können.
Hier ein kleiner Report jenes Psychotests, bei dem ich meinem Sohn Philipp Burckhardt assistiert habe, der als Director of e-Learning, Analytics, and Technology an der Carnegie Mellon University sich der Programmierung verschrieben und mit seinem ISLE-Programm eine Software für die Online-Lehre in die Welt gesetzt hat, die an verschiedenen amerikanischen Universitäten, aber auch in der Erwachsenen-Fortbildung (wie z.B. in einem großen Projekt mit ModRNA) Verwendung gefunden hat.
Was die Konstruktion dieses kleinen, im übrigen überaus heiteren Psychotests anbelangt, ist die Grundvoraussetzung, dass hier die Planung keineswegs an eine künstliche Intelligenz ausgelagert worden ist, sondern bereits verfügbare Techniken miteinander kombiniert werden. Strukturell betrachtet besagt dies, dass die Erzeugung eines solchen Produktes vor allem mit einem Kuratierungs- und Planungsaufwand einhergeht – und dass man die handwerklichen Arbeiten an die AI übergibt (welche de facto weniger eine Künstliche Intelligenz, als ein über machine learning augmentiertes und dann an die Maschine übertragenes Weltwissen darstellt).
So geht die Stimme des Avatars auf die Software der Firma Murf AI zurück. Dabei sind die Interventionsmöglichkeiten derzeit noch beschränkt. Man wählt eine Stimme aus – und hat dann die Gelegenheit, Pausen und Betonungen einzufügen. Das Ergebnis ist ein relativ nüchtern vorgetragener Text, der einem Nachrichtensprecher alle Ehre machen würde, der aber die emotionalen Zwischentöne, die Unsicherheiten (die Ähs und Öhs) eines menschlichen Sprecher exorziert. Und wahrscheinlich werden diese Praktiken (ähnlich wie in der Musikindustrie, wo man der Monotonie der Rhythmusmaschinen mit einer Humanizer-Funktion begegnete) die nächste Herausforderung sein.
Der Avatar wiederum ist ein Produkt der Firma D-ID – und seine Aufgabe besteht darin, der Stimme Gestalt zu verleihen. Weil man hier keine computergenerierte Stimme benutzen muss, stünde es dem Nutzer frei, auch seine eigene Stimme zu benutzen. Ja, man könnte sich sogar ein Szenario vorstellen, bei dem ein Mensch die eigene Stimme nutzt, um den Avatar seiner selbst in Bewegung zu setzen. Genau das ist ein Service, den die Firma anbietet: die Erzeugung von Doubles, welche auf die natürliche Person des Nutzers zurückgehen. Wie man an den erstaunlichen Handbewegungen des Avatars ersehen kann, liegen den Bewegungen des Avatars Bewegunsgstudien menschlicher Akteure zugrunde – handelt es sich eigentlich um das, was das 18. Jahrhundert mit seinen tableaux vivants erzeugt, ein gewissermaßen lebendig gewordenes Bild. Hält man sich die Qualität des Avatars vor Augen, kann man sich ausmalen, dass Nachrichten- oder Fernsehsprecher künftig durch derlei Avatare ersetzt werden – was schon deswegen ein gewisses Rationale besitzt, weil man einen solchen Avatar vor einem Greenscreen postieren und beliebig mit allem erdenklichen Videomaterial verküpfen kann – in diesem Falle ein Double seiner selbst und einer Atmosphäre von Storyblocks.
Bei den Bilder des Psychotests kam DALL-E 2 zum Einsatz, das, wie Chat GPT, auf das Open AI Projekt zurückgeht.
Auch hier kommt man nicht automatisch zu einem Ergebnis, sondern ist mit einem gewissen Kuratierungs- und Nachbereitungsaufwand konfrontiert. Weil DALL-E gewisse stilistische Vorgaben erlaubt (hier ein Comic-Style), ist der Aufwand, zu einem befriedigenden Ergebnis zu kommen, höchst überschaubar. Schlussendlich wurde auch Chat GPT 3 benutzt – allerdings nur, um die vorgegebenen Fragen des Psychotests zu variieren. Auf diese Weise sind die Ergebnisse des Psychotests, rein kombinatorisch, individualisiert, werden bei einer Million Tests weniger als ein Dutzend Doppelungen herauskommen.
Insgesamt lässt sich sagen, dass die Arbeit an diesem kleinen Psychotest sich in Bereiche verschoben hat, die mit künstlicher Intelligenz vergleichsweise wenig zu tun haben. Abgesehen davon, dass man die verfügbaren Techniken kombiniert und auf möglichst intelligente Art und Weise einsetzt (ähnlich wie ein Regisseur seine Akteure vor der Kamera dirigiert), besteht die Hauptaufgabe im Entwurf eines Drehbuchs und dann in der programmatischen Umsetzung. Oder anders gesagt: Hier kommt es auf Einbildungskraft und Programmierung an.
Anwendungsfelder
Nun mag es durchaus vorstellbar sein, dass bestimmte Tätigkeiten in Zukunft von derlei AI-augmentierten Lösungen ersetzt werden können – allerdings muss man hinzufügen, dass vor allem jene Tätigkeiten betroffen sein werden, die sich vor allem durch eine androide Schrumpfung des menschlichen Verhaltensrepertoires auszeichnen. Und weil dies ein Thema ist, dass seinerseits eine sehr viel gründlichere Behandlung verlangt, möchte ich hier auf die Diskussion dieser Grundsatzfrage verzichten. Stattdessen sollen Anwendungsmöglichkeiten einer solcher AI-augmentierten Technik ins Auge gefasst werden, mit denen eine Qualitätssteigerung des Angebots einhergeht. Ein Anwendungsfeld, das meinen Sohn beschäftigt hat, war die Möglichkeit, dass man den Studenten bei der Verfolgung eines hochgradig individualisierten Lernpfades einen solchen Assistenten zur Seite stellen könnte. Zum einen könnte dieser Assistent immer wiederkehrende Fragen beantworten, zum anderen könnte er als eine Art Motivationscoach in Erscheinung treten. Wie der Psychotest zeigt, vermag ein Programminterface, das die Interaktionen eines Nutzers festhält, auch über einige wenige Interaktionen bereits psychologische Rückschlüsse ziehen – womit sich eine Form der Assistenz denken lässt, die einerseits individualisiert ist, zum anderen in einem Langzeitrahmen unterstützend tätig sein kann (sei es, dass sie als aide mémoire wirkt, sei es, dass sie auf bestimmte Eigenheiten des Studenten eingeht). Genau hier wiederholt sich jene Thematik, die bereits bei der Verfertigung eines solchen Assistenten ausschlaggebend war. Denn das Wissen darüber, wie man Wissen erlangen kann, bedarf der Menschenkenntnis – sowie einer ausgeprägten programmatischen Finesse. Beides ist und wird nicht das Produkt einer Künstlichen Intelligenz sein können. In diesem Sinne ist, was heutzutage Customizing heißt, tatsächlich eine offene Frage – wäre die Frage zu stellen, wie und auf welche Weise ein Student motiviert werden und auf eine höhere Bildungsebene emporgehoben werden kann. Lief das moderne Bildungssystem auf ein Kohortenwesen und eine Form der Gleichschaltung hinaus (die Klasse), ist nun eine Gedankenbewegung vonnöten, die den Einzelnen (mit all seinen Eigenheiten) in den Blick nimmt. Schon diese Erwägung zeigt, wie deplatziert die Mutmaßung ist, dass die künstliche Intelligenz den Menschen ersetzen könne. Was sich ersetzen lässt, ist ein maschinenähnliches, androides Verhalten, während das Wissen um die psychologischen Mechanismen umso kostbarer wird.
Wenn Sie den Psychotest selbst machen wollen, hier geht es zum Link