Gemini (Sprachmodell)
Gemini ist eine Serie multimodaler Sprachmodelle der Firma Google. Sie zählt zum Bereich Generativer Künstlicher Intelligenz (GenAI). Entwickelt wurde es von Googles Tochterunternehmen DeepMind und baut auf den zuvor bereits von Google herausgebrachten Sprachmodellen LaMDA und PaLM 2 auf. Gemini wurde am 6. Dezember 2023 angekündigt und wird von vielen Marktbeobachtern als Konkurrent zu OpenAIs GPT-4 gesehen.
Funktionsweise und Einsatz
Das Modell ist multimodal, das heißt, es kann verschiedene Arten von Eingaben, darunter geschriebenen Text, Bilder, Video, Audio und Computer-Code, verarbeiten – auch in der Kombination unterschiedlicher Informationen. Gemini 1.0 wurde in drei verschiedenen Varianten angekündigt: Gemini Pro als Basisversion, Gemini Nano, das speziell auf Mobilgeräte zugeschnitten sein soll, und das leistungsfähigste Modell Gemini Ultra.[1][2][3]
Gemini Pro kommt seit Dezember 2023 im Google-KI-Chatbot Bard zum Einsatz. Gemini Nano wird im Google-Handy Pixel 8 Pro integriert. Gemini Ultra soll Anfang 2024 in einer neuen Version von Bard („Bard Advanced“) starten und GPT-4 in einigen Bereichen überlegen sein. Google nennt hier im eigenen Blog vor allem Coding und Textverarbeitung.[4] In ersten Berichten von Medien und Blogs nach der Ankündigung wurde diese Überlegenheit allerdings infrage gestellt.[5][6]
Weitere Google-Dienste, wie der Webbrowser Chrome oder Gmail, werden laut Google ebenfalls um die KI-Fähigkeiten von Gemini ergänzt. Entwickler haben bereits im Dezember 2023 Zugang zu Gemini Pro über eine Gemini API erhalten, um das Sprachmodell in eigene Anwendungen integrieren zu können. Über Schnittstellen könnten, so die Einschätzung in Medien und Blogs, künftig auch viele andere Anwendungen auf Basis von Gemini um KI-Fähigkeiten ergänzt werden – von wissenschaftlicher oder medizinischer Software bis zum Smartphone-Betriebssystem Android.[7][8]
Kritik
Nach der Vorstellung von Gemini im Dezember 2023 wurde Kritik an Google geäußert, weil Demovideos offenbar deutlich bearbeitet wurden, um Gemini leistungsfähiger erscheinen zu lassen.[9]
Trivia
Der Name „Gemini“ steht für die Partnerschaft der beiden großen KI-Labore von Google, Google DeepMind und Google Brain, und ist zudem eine Anspielung auf das NASA-Projekt Gemini, das in den 60er-Jahren den Weg ebnete für die Mondlandungen des späteren Apollo-Programms.[10]
Weblinks
- Gemini: A Family of Highly Capable Multimodal Models White Paper (PDF, 62 Seiten, englisch)
Einzelnachweise
- Max Muth: Was Googles neue Super-KI Gemini kann. In: sueddeutsche.de. 7. Dezember 2023, abgerufen am 10. Dezember 2023.
- Simon Book, Patrick Beuth: Gemini: Google stellt neues KI-Modell vor und spricht von einer »neuen Ära«. In: spiegel.de. 6. Dezember 2023, abgerufen am 10. Dezember 2023.
- Gemini: Google stellt neues KI-Sprachmodell vor. In: zeit.de. 6. Dezember 2023, abgerufen am 10. Dezember 2023.
- Introducing Gemini: our largest and most capable AI model. 6. Dezember 2023, abgerufen am 9. Dezember 2023 (amerikanisches Englisch).
- Jakob von Lindern: Google Gemini: Ist die neue Google-KI besser als ChatGPT? In: Die Zeit. 6. Dezember 2023, ISSN 0044-2070 (zeit.de [abgerufen am 9. Dezember 2023]).
- Maximilian Sachse: Gemini KI von Google: Ob sie ChatGPT von OpenAI schlagen kann. In: FAZ.NET. 7. Dezember 2023, ISSN 0174-4909 (faz.net [abgerufen am 9. Dezember 2023]).
- Mark Minevich: Google’s Gemini: Challenging OpenAI ChatGPT And Changing The Game. Abgerufen am 21. Dezember 2023 (englisch).
- Timm Rotter: Google Gemini vs. GPT-4: Das sagt das Duell für die Zukunft der KI. In: disruptive-muenchen.de. 9. Dezember 2023, abgerufen am 21. Dezember 2023 (deutsch).
- Google’s Gemini Looks Remarkable, But It’s Still Behind OpenAI. In: Bloomberg.com. 7. Dezember 2023 (bloomberg.com [abgerufen am 9. Dezember 2023]).
- Will Knight: Google Just Launched Gemini, Its Long-Awaited Answer to ChatGPT. In: Wired. ISSN 1059-1028 (wired.com [abgerufen am 21. Dezember 2023]).