R1T2 Chimera: Nový AI model je 2x rýchlejší ako originál

6 júla, 2025

Zakladateľa portálu AItrend.sk

Henrieta Balázsová

Model kombinuje silné stránky troch rôznych predchodcov – R1, R1-0528 a V3 – pomocou techniky Assembly-of-Experts (AoE). Tá nefunguje ako klasické „Mixture-of-Experts“ architektúry, ale namiesto toho spája váhové parametre z už natrénovaných modelov. Výsledkom je konzistentný a výkonný model bez potreby ďalšieho trénovania.

Nemecká technologická firma TNG Technology Consulting GmbH predstavila novú verziu AI modelu, ktorá si rýchlo získava pozornosť odbornej verejnosti. Ich R1T2 Chimera, odvodený z otvoreného modelu DeepSeek-R1-0528, je až o 200 % rýchlejší, no zachováva si až 90 % inteligencie svojho predchodcu.

Ako informuje portál Venture Beat, to znamená, že odpovede generuje oveľa kratšie, čím výrazne šetrí výpočtové náklady.

Otvorený, rýchly a bez zbytočnej vaty

Odborníci upozorňujú, že R1T2 sa zameriava na stručné a presné odpovede, čo je ideálne v situáciách, kde záleží na rýchlosti alebo cene výpočtov. Vďaka nižšiemu počtu výstupných tokenov je využitie tohto modelu zaujímavé najmä pre podniky pracujúce s veľkými objemami dát.

Model je dostupný na platforme Hugging Face a licencovaný pod MIT licenciou, čo umožňuje jeho komerčné využitie aj úpravy. Napriek výhodám však TNG upozorňuje, že model zatiaľ nepodporuje funkcie ako volanie nástrojov či funkcií, čo môže byť pre niektoré aplikácie limitujúce.

Pre firmy pôsobiace v Európe TNG zároveň odporúča skontrolovať súlad s nadchádzajúcim AI Actom EÚ, ktorý vstupuje do platnosti v auguste 2025.

Nový AI model valcuje konkurenciu. Nemeckí vývojári ohúrili svet

Otvorený, rýchly a bez zbytočnej vaty

Pridaj komentár Zrušiť odpoveď