Chatbots im Vergleich – ChatGPT vs. Copilot vs. Gemini
Wer große Sprachmodelle nutzen möchte, ohne ein Open-Source-Modell umständlich auf dem eigenen System aufzusetzen, kommt um Chatbots von Drittanbietern nicht herum. Die drei zugänglichsten und kompetentesten stellen wir hier vor, mitsamt ihren Vor- und Nachteilen.
Bewerbungen schreiben, Code generieren, Datenkontexte erfassen – es gibt kaum etwas, das große Sprachmodelle oder Large Language Models, LLMs, nicht können. Ihre universelle Trainierbarkeit und breite Anwendbarkeit machen sie zu Werkzeugen mit quasi unendlichem Potenzial, kognitive Prozesse aller Art zu erleichtern. Zwar existiert eine wachsende Vielfalt unterschiedlichster Modelle, von spezialisierten wie Coding-Modellen bis zu allgemeinen ChatGPT-Alternativen.
Hinsichtlich der Zugänglichkeit und der Output-Qualität ist der deutsche Durchschnittsnutzer derzeit jedoch auf drei Modelle beschränkt: OpenAIs ChatGPT, Microsofts Copilot und Googles Gemini. Alle drei sind u. a. deutschsprachig, schneiden bei Prompt-Tests gut ab, sind universell einsetzbar und ohne großen Aufwand kostenlos nutzbar. Wie genau sie sich unterscheiden und welcher Chatbot für welchen Zweck am besten geeignet ist, erklären wir hier.
Der Unterschied zwischen Chatbot und LLM
Um Verwirrungen zu entgehen, schauen wir kurz auf die Begrifflichkeiten: Ein Chatbot ist eine Softwareanwendung, die darauf ausgelegt ist, menschliche Konversationen zu simulieren. Diese können regelbasiert oder durch KI angetrieben sein und sind oft für spezifische Aufgaben wie Kundensupport konzipiert. Ein LLM hingegen ist ein komplexes maschinelles Lernmodell, das für sprachbezogene Aufgaben entwickelt wurde. Während regelbasierte Chatbots einfache, oft vordefinierte Antworten liefern können, basieren LLMs wie GPT-4 auf Deep-Learning-Architekturen und generieren komplexe Antworten auf der Grundlage von Mustern, die sie aus großen Textmengen gelernt haben. Kurz gesagt, alle LLMs können als Chatbots fungieren, aber nicht alle Chatbots sind LLMs.
Workshops zum Thema
Die drei Chatbots vorgestellt
Kommen wir zu den Chatbots. Alle drei benötigen zur Nutzung ein Konto auf der jeweiligen Plattform:
OpenAI ChatGPT hat nicht nur die Welle der LLM-basierten Chatbots eingeläutet, sondern bietet mit GPT-4 auch das fortschrittlichste, umfangreichste und menschenähnlichste Sprachmodell und setzt damit den Maßstab für KI-Chatbots. Die Fähigkeiten von ChatGPT reichen von menschlichen Sprachen bis hin zu Programmiersprachen, was den Chatbot zu einem bevorzugten Werkzeug für Entwickler macht. Nativ hat ChatGPT nur in der Bezahlversion über das Sprachmodell GPT-4 Zugang zur Suchmaschine Bing und damit zu Internetquellen. Um Suchen durchzuführen, muss der Chatbot mit einem gezielten Prompt dazu aufgefordert werden. Er nimmt auch eigenständig suchen vor, aber nur, wenn er seine Daten nicht ausreichen beziehungsweise aktuelle Informationen erfragt werden (beispielsweise Nachrichten oder Spielstände). Mit dem integrierten Plugin-Store bieten OpenAI dem Chatbot eine stark erweiterte Funktionalität, über die gezielte Anwendungen von Drittanbietern wie Trivago ermöglicht werden.
Microsoft Copilot (ehemals Bing Chat), Microsofts Erweiterung seiner Suchmaschine Bing, basiert auf OpenAIs fortschrittlichstem LLM, GPT-4, und positioniert sich als Alternative zu ChatGPT. Mit der Integration von Copilot konnte sich der Konzern einen Vorteil gegenüber Marktführer Google verschaffen, der zum Zeitpunkt der Veröffentlichung noch keine Antwort parat hatte. Das Besondere an Copilot ist die konsequente Quellenangabe, die den Chatbot in der angebotenen Qualität einzigartig macht. Ein weiteres großes Feature ist die Möglichkeit der Bildgenerierung mithilfe von DALL-E. Darüber hinaus bietet Bing Chat drei verschiedene Konversationsstile: Precise, Balanced und Creative. Dies gibt den Benutzern Flexibilität in der Art und Weise, wie sie Informationen erhalten möchten.
Google Gemini (ehemals Bard) basiert auf Googles proprietärem Sprachmodell Gemini und funktioniert in der EU und in anderen Ländern, obwohl mit dem Gedanken der Multimodalität entwickelt, aufgrund von Datenschutzbestimmungen derzeit nur mit einer "speziell angepassten" Version des Modells 1.0 Pro für textbasierte Prompts. Das bedeutet, dass die Unterstützung anderer Inhaltstypen (Sprache, Video, Dokumente) noch stark eingeschränkt ist bzw. erst noch folgen wird. Im Gegensatz zu ChatGPT neigt Gemini weniger zu lehrbuchartigen Antworten, sondern verwendet eine einfachere und direktere Sprache, was den Chatbot zu einer guten Wahl für alltägliche Kommunikations- und Produktivitätsanforderungen macht. Gemini kann aktuelle Informationen aus dem Internet extrahieren, was besonders bei der Recherche, beim Onlineshopping und bei der Reiseplanung nützlich ist. Und wenn eine Antwort nicht zufriedenstellend ist, bietet Gemini die Möglichkeit, mit einem Klick auf "Google It" herkömmliche Suchergebnisse zu erhalten.
Die Eigenschaften, Vor- und Nachteile der Chatbots im Überblick
Chatbot / Eigenschaften |
ChatGPT |
Copilot |
Gemini |
Webzugang |
ja (nur im Abo über GPT-4) |
ja |
ja |
Quellenangaben |
ja |
konsequent |
auf Anfrage |
Default-Schreibweise |
akademisches Schreibniveau |
drei Konversationsstile: präzise, ausgewogen und kreativ |
klar und simpel |
Antwortqualität |
präzise und ausführlich |
kurz und suchfokussiert, nicht umfassend |
übersichtlich |
Halluzinations-wahrscheinlichkeit |
selten |
selten, da Output gebunden an die Suchergebnisse |
gelegentlich; Zunahme der Wahrscheinlichkeit je länger der Output |
Gesprächsführung |
keine Begrenzung der Gesprächsanfragen |
limitiert auf 30 Antworten pro Gespräch |
keine Begrenzung der Gesprächsanfragen |
Disclaimer (Haftungsausschluss) |
unauffällig platziert |
unauffällig platziert |
bei jeder Antwort bis zur Aufforderung der Unterlassung |
Chat-Historie |
optional |
ja, die letzten Bing-Suchanfragen |
ja, aber abhängig von Länge, Anzahl usw. |
Fortführung vorheriger Chats |
ja |
ja |
ja |
Antwortempfehlungen |
ja |
ja |
ja |
Mobilität |
mobile App |
mobil zugänglich |
mobil zugänglich |
Besondere Features |
Plugin-Integration für erweiterte Anwendung |
anliegender Bildgenerator auf Grundlage von DALL-E |
direkter Export des Outputs zu spezifischen Google Apps (z. B. Docs) |
Sonstiges |
Möglichkeit zum Daten-Opt-Out |
betrieben durch OpenAI’s GPT-4 Modell |
|
Ergänzend ist zu erwähnen, dass der Output immer von seinem Input bzw. seiner Quelle abhängt. Obwohl Halluzinationen immer seltener auftreten, existiert jedoch immer noch eine Wahrscheinlichkeit, speziell, wenn der Chatbot ihm fehlende Informationen ergänzt, um zu einem Ergebnis zu gelangen. Bei der Suche nach Internetquellen können Halluzinationen auch auf unausgereifte Crawling- und Indexierungsfunktionen der zugrunde liegenden Systeme hinweisen. Wenn Informationsquellen verfügbar sind, ist es ratsam, diese direkt zur Verfügung zu stellen, anstatt sich nur auf den Chatbot zu verlassen.
Darüber hinaus sind Chatbots einer ständigen Weiterentwicklung unterworfen. So kommt es regelmäßig vor, dass ChatGPTs Antworten aufgrund von Entwicklerupdates von einer zur nächsten Nutzung in ihrer Länge, Ausführlichkeit, und Ausdruck variieren. Das kann Auswirkungen auf das Prompting haben, das eventuell nach einem Update angepasst werden muss.
Es gibt neben spezialisierten KI-Services wie Jasper.ai und Frase.io natürlich auch weitere allgemeinere Chatbots wie Claude.ai oder You.com. Letztere haben zwar ihre eigenen Vorteile, sind jedoch für die allgemeine Weiterempfehlung nur bedingt geeignet. Claude bietet eine ähnliche hohe Qualität wie GPT-4, versteht aber nur Englisch und wurde bisher auch nur in den USA und im Vereinigten Königreich zugelassen. You.com bietet neben der Prämisse, eine datensicherheitsfreundliche Suchmaschine zu sein, mehrere Chatbots mit verschiedenen Spezialisierungen an, die jedoch jeweils noch nicht dieselbe Reife bieten, wie die hier dargestellten.
Bild: KI-generiert mit Midjourney
aktualisiert am 29.4.2024