Chatbots im Vergleich – ChatGPT vs. Copilot vs. Gemini
Wer große Sprachmodelle nutzen möchte, ohne ein Open-Source-Modell umständlich auf dem eigenen System aufzusetzen, kommt um Chatbots von Drittanbietern nicht herum. Die drei zugänglichsten und kompetentesten stellen wir hier vor, mitsamt ihren Vor- und Nachteilen.
Bewerbungen schreiben, Code generieren, Datenkontexte erfassen – es gibt kaum etwas, das große Sprachmodelle oder Large Language Models, LLMs, nicht können. Ihre universelle Trainierbarkeit und breite Anwendbarkeit machen sie zu Werkzeugen mit quasi unendlichem Potenzial, kognitive Prozesse aller Art zu erleichtern. Zwar existiert eine wachsende Vielfalt unterschiedlichster Modelle, von spezialisierten wie Coding-Modellen bis zu allgemeinen ChatGPT-Alternativen.
Hinsichtlich der Zugänglichkeit und der Output-Qualität ist der deutsche Durchschnittsnutzer derzeit jedoch auf drei Modelle beschränkt: OpenAIs ChatGPT, Microsofts Copilot und Googles Gemini. Alle drei sind u. a. deutschsprachig, schneiden bei Prompt-Tests gut ab, sind universell einsetzbar und ohne großen Aufwand kostenlos nutzbar. Wie genau sie sich unterscheiden und welcher Chatbot für welchen Zweck am besten geeignet ist, erklären wir hier.
Der Unterschied zwischen Chatbot und LLM
Um Verwirrungen zu entgehen, schauen wir kurz auf die Begrifflichkeiten: Ein Chatbot ist eine Softwareanwendung, die darauf ausgelegt ist, menschliche Konversationen zu simulieren. Diese können regelbasiert oder durch KI angetrieben sein und sind oft für spezifische Aufgaben wie Kundensupport konzipiert. Ein LLM hingegen ist ein komplexes maschinelles Lernmodell, das für sprachbezogene Aufgaben entwickelt wurde. Während regelbasierte Chatbots einfache, oft vordefinierte Antworten liefern können, basieren LLMs wie GPT-4 auf Deep-Learning-Architekturen und generieren komplexe Antworten auf der Grundlage von Mustern, die sie aus großen Textmengen gelernt haben. Kurz gesagt, alle LLMs können als Chatbots fungieren, aber nicht alle Chatbots sind LLMs.
Workshops zum Thema
Die drei Chatbots vorgestellt
Kommen wir zu den Chatbots. Alle drei benötigen zur Nutzung ein Konto auf der jeweiligen Plattform:
OpenAI's ChatGPT bleibt ein führender Akteur im Bereich der KI-Chatbots und nutzt das fortschrittliche GPT-4 Turbo-Modell sowie das neueste Flaggschiff-Modell GPT-4o. Vorgestellt im Mai 2024, bietet letzteres erweiterte multimodale Fähigkeiten, einschließlich der Verarbeitung von Text-, Bild-, Audio- und Videoeingaben in einem einzigen API-Aufruf. Die Fähigkeiten von ChatGPT erstrecken sich über menschliche und Programmiersprachen, mit signifikanten Verbesserungen in den Bereichen Mathematik und Coding.
Das neueste Flaggschiff-Modell GPT-o1 zeichnet sich durch seine fortschrittliche Konversationsfähigkeit, präzise Kontextverarbeitung sowie überlegene Leistung in Mathematik, Wissenschaft und Programmierung aus, während die o1-mini-Version eine kompaktere, aber dennoch effektive Variante darstellt. Die o1-mini-Version ist kostenlos auf Plattformen wie GizAI zugänglich, während das vollständige GPT-o1-Modell hauptsächlich ChatGPT Plus-Abonnenten vorbehalten ist.
ChatGPT hat seinen Sprachmodellen nun auch erweiterte Möglichkeiten zur Informationsbeschaffung und -verarbeitung, ohne (wie bisher – auf eine einzige Suchquelle beschränkt zu sein. GPT-4o zeichnet sich durch seine Multimodalität aus, die es ermöglicht, visuelle Erzählungen zu generieren, detaillierte Charakterdesigns zu erstellen und kausale Zusammenhänge in Bildern zu verstehen. Es bietet auch verbesserte Leistungen in nicht-englischen Sprachen und eine zweifach schnellere Textgenerierung.
Der Plugin-Store wurde weiterentwickelt und bietet eine breitere Palette von Funktionen und Integrationen. Die neuen Modelle ermöglichen nicht nur die Verarbeitung von Text und Bildern, sondern auch von Audio und Video, mit geplanten Erweiterungen für weitere multimodale Eingaben in naher Zukunft. OpenAI plant einen iterativen Rollout der neuen Funktionen, beginnend mit den Audio-Fähigkeiten. Diese Entwicklungen machen GPT-4o zu einem wichtigen Schritt in Richtung eines umfassenden Omni-Modells, das verschiedene Medienformate versteht und generiert.
Microsoft Copilot, ehemals als Bing Chat bekannt, hat sich seit seiner Einführung weiterentwickelt. Es basiert nun auf dem GPT-4 Turbo-Modell von OpenAI, das erweiterte multimodale Fähigkeiten bietet. Copilot ist nicht mehr nur eine Erweiterung der Suchmaschine Bing, sondern ein zentraler Bestandteil des Microsoft-365-Ökosystems.
Die Bildgenerierung in Copilot nutzt nun DALL-E 3, die neueste Version von OpenAIs Bildgenerator. Diese Funktion ist kostenlos über den Bing Image Creator zugänglich, was einen Vorteil gegenüber der kostenpflichtigen Integration in ChatGPT darstellt. Copilot behält die drei Konversationsstile bei: Precise, Balanced und Creative. Zusätzlich bietet Microsoft seinen Geschäftskunden seit April 2024 vorrangigen Zugriff auf GPT-4 Turbo in Microsoft 365 Copilot, mit unbegrenzten Chats und erweiterten Bildgenerierungsfunktionen.
Google Gemini hat seit seiner Einführung als Bard bedeutende Fortschritte gemacht. Es basiert nun auf dem fortschrittlichen Gemini 1.5 Pro-Modell, das in Deutschland und anderen EU-Ländern seit Juni 2024 offiziell verfügbar ist. Diese Version bietet ein erweitertes Kontextfenster von 1 Million Tokens, was die Verarbeitung von bis zu 1.500 Seiten ermöglicht. Gemini unterstützt jetzt multimodale Eingaben, einschließlich Text, Bild, Audio und Video. Die Bildgenerierung erfolgt durch das neue Imagen 3-Modell, das hochwertige, photorealistische Bilder erzeugen kann.
Die Integration von Gemini in verschiedene Google-Produkte wurde erweitert. Es ist nun in Google Calendar, Tasks, Keep, Gmail und Google Chat verfügbar, wo es komplexe Aufgaben übernehmen und personalisierte Unterstützung bieten kann. Ein neues Feature namens "Gems" ermöglicht es Nutzern, eigene spezialisierte Versionen von Gemini zu erstellen, die als Experten für bestimmte Themen dienen. Dies erhöht die Flexibilität und Anpassungsfähigkeit des Assistenten erheblich.
Gemini behält seine Fähigkeit, aktuelle Informationen aus dem Internet zu extrahieren, was es zu einem nützlichen Tool für Recherche, Onlineshopping und Reiseplanung macht. Die Option "Google It" für herkömmliche Suchergebnisse bleibt bestehen, wurde aber durch neue Suchfunktionen ergänzt, die Informationen thematisch gruppieren statt als Liste von Links zu präsentieren.
Die Eigenschaften, Vor- und Nachteile der Chatbots im Überblick
Chatbot / Eigenschaften | ChatGPT | Microsoft Copilot | Google Gemini |
---|---|---|---|
Modellbasis | GPT-4 Turbo, GPT-4o (multimodal) | GPT-4 Turbo | Gemini 1.5 Pro |
Multimodalität | Text, Bild, Audio, Video | Text, Bild (DALL-E 3) | Text, Bild, Audio, Video |
Verfügbarkeit | Reduzierte Modelle sind kostenlos (nur mit Registrierung) | Kostenlos integriert in Bing/M365 | Kostenlos mit erweiterten Funktionen in Google-Diensten |
Kontextfenster | GPT-4: 8,192 Tokens GPT-4o: 128,000 Tokens |
Limitiert, optimiert für Suchaufgaben | Bis zu 1 Million Tokens (1.500 Seiten) |
Antwortqualität | Präzise, ausführlich, viele Sprachen | Präzise, kreativ, suchfokussiert | Übersichtlich, thematisch strukturiert |
Bildgenerierung | DALL-E 3 | DALL-E 3 | Imagen 3 |
Zusätzliche Features | Erweiterter Plugin-Store, Audio-Funktionen | Teil von M365 (z. B. Outlook, Word) | Integration in Google Calendar, Gmail usw. |
Gesprächsführung | Keine Begrenzung der Anfragen | Unbegrenzte Chats (M365), 30 für Bing | Keine Begrenzung |
Anpassungsfähigkeit | Allgemein | Business-Fokus, unbegrenzte Bildgenerierung | "Gems" zur Erstellung spezialisierter Assistenten |
Informationsbeschaffung | Verbesserte Quellenverarbeitung | Präzise Suchergebnisse mit Integration | Aktuelle Infos, thematische Gruppierungen |
Geschäftsmodell | Abonnement, Daten-Opt-Out möglich | Teil des Microsoft-Ökosystems | Integration in Google-Dienste |
Hauptzielgruppen | Alltagsnutzer, Entwickler, Kreative, Forscher | Unternehmen, Teams, Produktivität | Alltagsnutzer, Recherche, Organisation |
Sprachen | Sehr gut für Mehrsprachigkeit | Wie ChatGPT | Unterstützt viele Sprachen |
Sicherheit & Datenschutz | Optionen für Daten-Opt-Out | Datenschutzrichtlinien von Microsoft | In Google-Cloud-Umgebung gesichert |
Ergänzend ist zu erwähnen, dass der Output immer von seinem Input bzw. seiner Quelle abhängt. Obwohl Halluzinationen immer seltener auftreten, existiert jedoch immer noch eine Wahrscheinlichkeit, speziell, wenn der Chatbot ihm fehlende Informationen ergänzt, um zu einem Ergebnis zu gelangen. Bei der Suche nach Internetquellen können Halluzinationen auch auf unausgereifte Crawling- und Indexierungsfunktionen der zugrunde liegenden Systeme hinweisen. Wenn Informationsquellen verfügbar sind, ist es ratsam, diese direkt zur Verfügung zu stellen, anstatt sich nur auf den Chatbot zu verlassen.
Darüber hinaus sind Chatbots einer ständigen Weiterentwicklung unterworfen. So kommt es regelmäßig vor, dass ChatGPTs Antworten aufgrund von Entwicklerupdates von einer zur nächsten Nutzung in ihrer Länge, Ausführlichkeit, und Ausdruck variieren. Das kann Auswirkungen auf das Prompting haben, das eventuell nach einem Update angepasst werden muss.
Es gibt neben spezialisierten KI-Services wie Jasper.ai und Frase.io natürlich auch weitere allgemeinere Chatbots wie Claude.ai oder You.com. Letztere haben zwar ihre eigenen Vorteile, sind jedoch für die allgemeine Weiterempfehlung nur bedingt geeignet. Claude bietet eine ähnliche hohe Qualität wie GPT-4, versteht aber nur Englisch und wurde bisher auch nur in den USA und im Vereinigten Königreich zugelassen. You.com bietet neben der Prämisse, eine datensicherheitsfreundliche Suchmaschine zu sein, mehrere Chatbots mit verschiedenen Spezialisierungen an, die jedoch jeweils noch nicht dieselbe Reife bieten, wie die hier dargestellten.
Bild: KI-generiert mit Midjourney
aktualisiert am 27.12.2024