Model kombinuje silné stránky troch rôznych predchodcov – R1, R1-0528 a V3 – pomocou techniky Assembly-of-Experts (AoE). Tá nefunguje ako klasické „Mixture-of-Experts“ architektúry, ale namiesto toho spája váhové parametre z už natrénovaných modelov. Výsledkom je konzistentný a výkonný model bez potreby ďalšieho trénovania.
Nemecká technologická firma TNG Technology Consulting GmbH predstavila novú verziu AI modelu, ktorá si rýchlo získava pozornosť odbornej verejnosti. Ich R1T2 Chimera, odvodený z otvoreného modelu DeepSeek-R1-0528, je až o 200 % rýchlejší, no zachováva si až 90 % inteligencie svojho predchodcu.
Ako informuje portál Venture Beat, to znamená, že odpovede generuje oveľa kratšie, čím výrazne šetrí výpočtové náklady.
Otvorený, rýchly a bez zbytočnej vaty
Odborníci upozorňujú, že R1T2 sa zameriava na stručné a presné odpovede, čo je ideálne v situáciách, kde záleží na rýchlosti alebo cene výpočtov. Vďaka nižšiemu počtu výstupných tokenov je využitie tohto modelu zaujímavé najmä pre podniky pracujúce s veľkými objemami dát.
Model je dostupný na platforme Hugging Face a licencovaný pod MIT licenciou, čo umožňuje jeho komerčné využitie aj úpravy. Napriek výhodám však TNG upozorňuje, že model zatiaľ nepodporuje funkcie ako volanie nástrojov či funkcií, čo môže byť pre niektoré aplikácie limitujúce.
Pre firmy pôsobiace v Európe TNG zároveň odporúča skontrolovať súlad s nadchádzajúcim AI Actom EÚ, ktorý vstupuje do platnosti v auguste 2025.
Pridaj komentár