Google stellt Gemini 2.0 Flash und KI-Agenten vor
16:12, 13.12.2024
Gemini 2.0 Flash: Leistung und Geschwindigkeit
Google hat das neue Modell Gemini 2.0 Flash vorgestellt, das seinen Vorgänger Gemini 1.5 Pro in Leistung, Geschwindigkeit und multimodalen Fähigkeiten übertrifft. Das Modell ist doppelt so schnell und unterstützt multimodale Ausgaben wie die Generierung von Bildern, Audio mit Text und Text-zu-Sprachkonvertierung. Es kann Eingaben aus Bildern, Videos und Audio verarbeiten und externe Tools wie Google Search oder Codeausführung einbinden.
Für Entwickler ist Gemini 2.0 Flash im AI Studio und Vertex AI verfügbar, zusammen mit der neuen Multimodal Live API, die Echtzeit-Video- und Audio Streaming unterstützt. Die Einführung des Modells in der Gemini-Benutzer-App ist für Januar 2025 geplant.
Innovative KI-Agenten von Google
Zusätzlich zu Gemini 2.0 Flash hat Google Projekte mit erweiterten Agenten Funktionen vorgestellt:
- Project Astra bietet Unterstützung für mehrsprachige Kommunikation, einschließlich gemischter Sprachen, sowie die Integration von Google Search, Lens und Maps.
- Project Mariner analysiert und interpretiert Browser Daten mit einer Effizienz von 83,5 %.
- Jules, ein Tool für die Softwareentwicklung, das in GitHub integriert ist, vereinfacht den Arbeitsablauf für Programmierer, indem es die Planung und Lösung von Aufgaben unter der Kontrolle des Benutzers ermöglicht.
- Mit dem neuen Tool Deep Research nutzt Google Gemini, um Daten im Internet zu suchen und umfassende Analyseberichte zu erstellen.