Czeski dostawca narzędzi dla programistów, JetBrains, wykonał właśnie krok, który dobrze wpisuje się w najnowszy trend na rynku sztucznej inteligencji: odwrót od gigantycznych, uniwersalnych systemów na rzecz głębokiej specjalizacji. Firma udostępniła na licencji open source swój najnowszy model językowy, Mellum2. Trafił on na platformę Hugging Face pod licencją Apache 2.0, co otwiera drogę do szerokiej adopcji komercyjnej oraz lokalnych wdrożeń korporacyjnych. Ruch ten bezpośrednio odpowiada na rosnące zapotrzebowanie biznesu na optymalizację kosztów operacyjnych systemów generatywnych w środowiskach produkcyjnych.
Mellum2 reprezentuje nową kategorię tzw. „focal models” – szybkich, skrojonych na miarę komponentów, które mają obsługiwać masowe, powtarzalne zadania w zaawansowanych systemach. Podczas gdy pierwsza generacja Mellum skupiała się wyłącznie na uzupełnianiu kodu, nowa wersja radzi sobie zarówno z kodem, jak i językiem naturalnym. Nie jest to jednak próba stworzenia kolejnego rywala dla modeli klasy frontier. JetBrains świadomie zrezygnował z multimodalności, aby zmaksymalizować wydajność w kluczowych dla deweloperów obszarach: routingu zapytań, orkiestracji agentów oraz potokach RAG o niskich opóźnieniach.
Kluczem do przewagi kosztowej Mellum2 jest architektura Mixture-of-Experts (MoE). Choć model posiada 12 miliardów parametrów, w przetwarzanie każdego tokenu angażowane jest zaledwie 2,5 miliarda z nich. W środowiskach produkcyjnych działających w czasie rzeczywistym Mellum2 skraca czas wnioskowania o ponad połowę w porównaniu z bezpośrednimi konkurentami, zachowując przy tym wysoką jakość odpowiedzi oraz precyzję w zadaniach logicznych i matematycznych.

1 godzina temu









