Techno

Meta veröffentlicht Llama 3.2: Ein Open-Source-KI-Modell mit multimodalen Fähigkeiten

Meta, das Mutterunternehmen von Facebook, Instagram und WhatsApp, hat auf der Meta Connect-Veranstaltung sein neuestes großes Sprachmodell (LLM), Llama 3.2, veröffentlicht. Das KI-Modell ist ein Konkurrent zu OpenAIs GPT-4o Mini, das im Juli veröffentlicht wurde.

Mark Zuckerberg, CEO von Meta, erklärte, dass Llama 3.2 seit 2023 erhebliche Fortschritte gemacht hat und in Bezug auf die Fähigkeit, Bilder zu erkennen und visuelles Material zu verstehen, mit GPT-4o Mini vergleichbar sei. Er betonte auch, dass Llama 3.2 anderen Open-Source-KI-Modellen wie Gemmas von Google und Phi 3.5-mini von Microsoft in verschiedenen Bereichen überlegen sei, darunter das Befolgen von Anweisungen, das Zusammenfassen, die Verwendung von Werkzeugen und das Umformulieren von Befehlen.

Llama 3.2: Metas erster Schritt in die multimodale KI

„Llama entwickelt sich schnell weiter und eröffnet viele Möglichkeiten“, sagte Zuckerberg. Als multimodales Modell, das Bilder und Text verstehen kann, eröffnet Llama 3.2 neue Möglichkeiten für verschiedene Anwendungen, die visuelles Verständnis erfordern. „Llama 3.2 ist unser erstes Open-Source-Multimodal-Modell“, sagte Zuckerberg in seiner Eröffnungsrede auf der Meta Connect. Mit der Einführung von Llama 3.2 scheint Meta im Rennen um die globale KI aufzuholen. Denn andere KI-Entwickler wie OpenAI und Google haben bereits im letzten Jahr multimodale KI-Modelle veröffentlicht.

Wichtige Funktionen von Llama 3.2

Das Llama 3.2-Modell steht zum Download auf llama.com, Hugging Face und den Plattformen von Meta-Partnern zur Verfügung.