Bot-Belegschaft mit Entlastungspotenzial: KI-Agenten für den Arbeitsalltag in der Testphase
Sie arbeiten selbstständig, erledigen Routineaufgaben und koordinieren sich untereinander: Autonome KI-Agenten stecken in den Betaphasen und finden bald ihren Weg in den Arbeitsalltag.
Stellt euch vor, ihr startet in den Büroarbeitstag, lest eure Mails und erledigt erste Vorbereitungen, bevor ihr mit größeren Aufgaben beginnt. Doch anstatt selbst alle Tasks auf eurem Arbeitsgerät anzugehen, promptet ihr ein Team von Bots mit Systemzugriff. Bei den kleinen Bots handelt es sich nicht um einfache Bedingungsskripte, sondern um sprachmodellbasierte und kontextverstehende Systeme, die eure Arbeitsgeräte über die gleichen Schnittstellen steuern wie ihr - quasi ein Assistent ohne Körper. Während ihr eure Zuständigkeiten verwaltet, erledigen die Bots im Hintergrund all die Aufgaben, die ihr früher händisch erledigen musstet.
Agentische KI-Systeme im Unterschied zu Chatbots
Das ist die Idee hinter KI-Agenten, einer neuen Generation von KI-Systemen, die weit über die Frage-Antwort-Interaktionen klassischer Sprachmodelle wie ChatGPT hinausgehen. Diese Programme basieren zwar auch auf Large Language Models, sind aber mit zusätzlichen Fähigkeiten ausgestattet: Sie können aktiv ihre Systemumgebung wahrnehmen, auf Dateien und Programme zugreifen, eigenständig Entscheidungen treffen und komplexe Workflows orchestrieren. Das Besondere: Anders als herkömmliche Chatbots oder Assistenten, die nach jeder Antwort "vergessen", was sie tun sollten, können KI-Agenten kontinuierlich an Aufgaben arbeiten und sich untereinander in natürlicher Sprache abstimmen – wie ein gut eingespieltes Team, das sich selbst koordiniert.
Workshops zum Thema
Ein weiteres Gedankenexperiment: Ihr beauftragt einen KI-Agenten mit der Vor- und Nachbereitung eines wichtigen Meetings. Während ein Agent eure E-Mails nach relevanten Vorinfos durchsucht und eine Zusammenfassung erstellt, aktualisiert ein anderer die Präsentationsfolien mit den neuesten Zahlen aus euren Datenbanken, ein dritter protokolliert später das Meeting in Echtzeit und ein vierter erstellt direkt im Anschluss eine priorisierte Follow-up-Liste für euch. All diese Teilaufgaben werden automatisch koordiniert, ohne dass ihr jeden Schritt manuell anstoßen müsst – ihr gebt nur die Zielrichtung vor und überprüft die Ergebnisse. Lange angekündigt und noch länger reine Zukunftsvision, werden diese autonomen Agenten, die uns wie von Zauberhand lästige Aufgaben abnehmen, Schritt für Schritt greifbare Realität.
Testphasen haben begonnen
OpenAIs größter direkter Mitbewerber, Anthropic, hat sein Sprachmodell Claude zu einem agentischen System weiterentwickelt und ist das erste Unternehmen, das solche Fähigkeiten über eine API anbietet, wenn auch in einer geschlossenen Beta-Version. Claude 3.5 Haiku kann Aufgaben am Computer fast wie ein Mensch ausführen, indem es den Bildschirm sieht und Maus- und Tastatureingaben simuliert. Unternehmen wie Canva und Replit testen bereits diese neuen Fähigkeiten, um Prozesse wie Designanpassungen oder Codierungsaufgaben zu automatisieren. Anthropic hat auch erste Benchmarks aus internen Tests veröffentlicht. Derzeit liegt die Trefferquote von Claude bei Aufgaben wie der Navigation in Betriebssystemen bei etwa 15 Prozent, während Menschen diese Aufgaben laut Wired zu 75 Prozent richtig erledigen – klassische LLMs wie GPT-4 kommen auf 7,7 Prozent.
Bei solchen autonomen Programmen ist die Nutzungssicherheit ein Kernaspekt. Um diese zu gewährleisten, integriert Anthropic spezielle Klassifikatoren – spezielle Algorithmen – die im Rahmen der Überwachungsfunktion dazu dienen, die Sicherheit und Ethik der autonom ablaufenden Prozesse zu gewährleisten und so beispielsweise die Nutzung von Kreditkarten einzuschränken. Das Unternehmen nennt das erste Quartal 2025 als Termin für die Veröffentlichung für die breite Öffentlichkeit. Bis dahin sollen einige der technischen Schwierigkeiten überwunden sein.
Mitbewerber ziehen hinterher
Microsoft wiederum hat im Rahmen seiner Build-2024-Konferenz seine Copilot-Plattform um Agentenfähigkeiten erweitert. Unternehmen können nun mithilfe von Copilot Studio ihre eigenen autonomen Agenten erstellen. Diese können nicht nur wiederkehrende Aufgaben wie E-Mail-Überwachung und Datenverwaltung übernehmen, sondern auch in komplexeren Geschäftsprozessen eingesetzt werden. Wie Anthropic testet auch Microsoft diese Funktionen derzeit mit ausgewählten Anwendern und will sie später in größerem Umfang einführen. Dabei legt der Redmonder Konzern nach eigenen Angaben besonderen Wert auf Sicherheits- und Kontrollmechanismen, damit die Agenten innerhalb definierter Grenzen arbeiten und bei Bedarf menschliches Eingreifen anfordern.
OpenAI hat kürzlich ein neues Open-Source-Projekt namens Swarm vorgestellt. Das Framework ermöglicht es Programmierern, mehrere autonome KI-Agenten zu orchestrieren, die in einem Netzwerk zusammenarbeiten, um komplexe Aufgaben zu erledigen. Diese Agenten interagieren miteinander, indem sie Daten und Aufgaben untereinander weitergeben, ähnlich wie bei einem Bienenschwarm, der ein kollektives Ziel verfolgt. Swarm ist darauf ausgelegt, leichtgewichtig und anpassbar zu sein, was bedeutet, dass viele kleinere, spezialisierte Agenten zusammenarbeiten, anstatt dass ein einzelner Agent alle Aufgaben übernimmt. Die Architektur ist momentan jedoch nur für Softwareentwickler geeignet und dient zu Experimentier- und Testzwecken.
Nvidia arbeitet seinerseits daran, die Infrastruktur für den großflächigen Einsatz von KI-Agenten bereitzustellen. Das Softwareunternehmen baut aktiv an der erforderlichen Rechenleistung und den Schnittstellen mit dem Ziel, in Zusammenarbeit mit anderen Unternehmen Hunderte Millionen von KI-Agenten gleichzeitig den Menschen zur Verfügung zu stellen.
Neue Kompetenzen in der KI-gestützten Arbeitswelt
Die graduelle Implementierung von KI-Agenten in die Arbeitsabläufe wird nicht ohne Auswirkungen auf die benötigten Kompetenzen von Fachkräften und die Personalstruktur von Unternehmen bleiben. Mithilfe der Assistenten wird praktisch jeder zum Manager seiner eigenen Abteilung, in der der Mensch Aufgaben delegiert, Ergebnisse kontrolliert und Strategien formuliert, während ein Team von Bots für die Ausführung des Minutiösen verantwortlich ist. Fach- und Prozesswissen bleiben zwar relevant, administrative Aspekte werden jedoch eine zunehmend größere Rolle im erforderten Skill-Portfolio spielen. Bereits ohne KI wird den Soft Skills seit geraumer Zeit eine wachsende Bedeutung beigemessen. Mit der breiten Integration der Technologie könnte sich das Verhältnis zu den Hard Skills weiter verschieben.
Die aktuellen Ankündigungen sind beispielhaft für die boomende Branche. Mit dem Roll-out der Testphasen nähern wir uns der dritten Stufe der Stages of Artificial Intelligence von OpenAI, die den Weg zum Ziel AGI – künstliche allgemeine Intelligenz, die in allen kognitiven Anwendungen so gut oder besser ist als ein Mensch – skizziert. Das Bemerkenswerte an dieser Entwicklung ist ihre Geschwindigkeit: Innerhalb weniger Wochen dringen wir von der zweiten Stufe, den Reasoner-Modellen - Sprachmodellen, die in mehreren Schritten reflektieren und so zu korrekteren Schlussfolgerungen kommen -, quasi parallel zur dritten Stufe vor, während sich die Reasoner noch in der Beta-Phase befinden und nicht alle Wettbewerber Schritt halten können.
Es ist zu erwarten, dass sich die Entwicklung der Technologie, unterstützt durch beispiellose Investitionsummen, auf der Grundlage der bisherigen Erfolge exponentiell beschleunigen wird. Mit dem sukzessiven Einsatz von KI-Agenten in der KI-Forschung sind wir nicht mehr weit von der nächsten Stufe auf der Evolutionstabelle entfernt, den von OpenAI genannten Innovators, die in der Lage sein werden, ihre eigene Forschung zu betreiben und die Entwicklung der Technologie noch weiter voranzutreiben.
Nicht trotz, sondern gerade wegen der rasanten Entwicklung ist es fundamental, mit der Technik Schritt zu halten, sich mit ihr zu familiarisieren und zu experimentieren. Wer mit den neuen Tools und Workflows vertraut ist oder zumindest eine Vorstellung davon hat, wird einen immensen Vorteil gegenüber denjenigen haben, die dem technischen Fortschritt hinterherhinken. Berufliche und persönliche Weiterbildung verschmelzen vor diesem Hintergrund und sind wichtiger und glücklicherweise auch vielfältiger denn je. Der Zugang zu Wissen und Mentoring ist dank des Internets praktisch für jeden zugänglich. Genauso wie Tipps zu den besten Lernmethoden.
Bild: KI-generiert mit Midjourney