Das neue KI-Modell von Microsoft könnte GPT-4 und Google Gemini herausfordern
Laut einem Bericht von Microsoft arbeitet Microsoft an einem neuen groß angelegten KI-Sprachmodell namens MAI-1, das mit den neuesten Modellen von Google, Anthropic und OpenAI konkurrieren könnte. die Information. Dies ist das erste Mal, dass Microsoft ein internes KI-Modell dieser Größe entwickelt hat, seit Microsoft mehr als 10 Milliarden US-Dollar in OpenAI investiert hat, um die Rechte zur Wiederverwendung der KI-Modelle des Startups zu erwerben. GPT-4 von OpenAI unterstützt nicht nur ChatGPT, sondern auch Microsoft Copilot.
Die Entwicklung von MAI-1 wird von Mustafa Soliman geleitet, dem ehemaligen KI-Leiter von Google, der zuletzt als CEO des KI-Startups Inflection fungierte, bevor Microsoft im März die Mehrheit der Mitarbeiter und des geistigen Eigentums des Startups für 650 Millionen US-Dollar erwarb. Obwohl MAI-1 möglicherweise auf Technologien ehemaliger Inflection-Mitarbeiter basiert, soll es sich um ein völlig neues Large Language Model (LLM) handeln, wie zwei mit dem Projekt vertraute Microsoft-Mitarbeiter bestätigten.
Mit fast 500 Milliarden Parametern wird MAI-1 viel größer sein als die früheren Open-Source-Modelle von Microsoft (wie Phi-3, das wir letzten Monat behandelt haben) und mehr Rechenleistung und Trainingsdaten erfordern. Dies soll MAI-1 in eine ähnliche Liga wie OpenAIs GPT-4 bringen, das … Gerücht Für über eine Billion Parameter (in einer Kombination von Experten) und viel höher als kleinere Modelle wie die Meta- und Mistral-Modelle mit 70 Milliarden Parametern.
Die Entwicklung von MAI-1 signalisiert einen dualen Ansatz für KI innerhalb von Microsoft und konzentriert sich auf kleine Sprachmodelle, die lokal für mobile Geräte ausgeführt werden, und neuere, größere Modelle, die in der Cloud ausgeführt werden. Apple soll einen ähnlichen Ansatz verfolgen. Es unterstreicht auch den Wunsch des Unternehmens, die KI-Entwicklung unabhängig von OpenAI zu erforschen, dessen Technologie derzeit die anspruchsvollsten KI-Funktionen von Microsoft unterstützt, darunter einen in Windows integrierten Chatbot.
Der genaue Zweck von MAI-1 wurde Berichten zufolge nicht geklärt (auch nicht bei Microsoft), und seine optimale Nutzung wird laut einer Informationsquelle von seiner Leistung abhängen. Um das Modell zu trainieren, stellte Microsoft einen großen Cluster von Servern mit Nvidia-GPUs zur Verfügung und sammelte Trainingsdaten aus verschiedenen Quellen, darunter von OpenAIs GPT-4 generierter Text und öffentliche Internetdaten.
Abhängig von den Fortschritten in den kommenden Wochen deuten Informationen darauf hin, dass Microsoft den MAI-1 bereits auf seiner Build Developer-Konferenz später in diesem Monat vorstellen könnte, wie eine der in dem Beitrag zitierten Quellen berichtet.
„Lebenslanger Social-Media-Liebhaber. Fällt oft hin. Schöpfer. Leidenschaftlicher Feinschmecker. Entdecker. Typischer Unruhestifter.“