Битката за лидерство во AI сегментот брзо се префрла од чет-ботови на роботика, а Кина штотуку победи во важен натпревар.
Кинескиот стартап Spirit AI објави дека неговиот модел Spirit v1.6 го освои првото место на престижниот RoboArena бенчмарк, победувајќи компании како Nvidia и други водечки конкуренти.
Spirit v1.6 постигна резултат од 1.924 поени, победувајќи го моделот Cosmos3-Nano-Policy на Nvidia, кој освои 1.881 поен, како и DreamZero (друг модел поддржан од Nvidia) со 1.763 поени.
Ова достигнување, исто така, го означува првиот пат кога кинески модел за отелотворена вештачка интелигенција (embodied AI) успеа да се пласира на првата позиција на овој тест, пишува веб-страницата Gizmochina.
Зошто е важна RoboArena?
RoboArena е дизајнирана да мери колку ефикасно системите за вештачка интелигенција можат да ги преведат одлуките во конкретни роботски дејства во реалниот свет. За разлика од традиционалните тестови базирани на текст на вештачка интелигенција кои се фокусираат на јазик или логичко расудување, RoboArena ја оценува изведбата на физичките задачи.
Ова вклучува манипулација со објекти, навигација, употреба на алатки, перцепција, планирање и способност за прилагодување во сосема непознати средини.
Овој репер е високо ценет во индустријата бидејќи користи рандомизирани средини, сценарија за тестирање со спротивставени фактори и строги мерки против преоптоварување, што им отежнува на компаниите да ги оптимизираат своите системи само за тестот.
Трката за физичка AI се загрева
Овој резултат јасно покажува дека конкуренцијата во областа на вештачката интелигенција сè повеќе се префрла од чет-ботови и големи јазични модели (LLM) кон физичка вештачка интелигенција. Овие системи во суштина служат како „мозоци“ за хуманоидни роботи, роботски раце, автономни возила и платформи за индустриска автоматизација.
Успехот на Spirit AI се смета за доказ дека ефикасниот дизајн на модели и висококвалитетните податоци за обука можат да бидат исто толку важни како и поседувањето огромна компјутерска моќ.
Моделот на стартапот наводно покажал одлични перформанси во ракувањето со објекти, автономната навигација, користењето сложени алатки и прилагодувањето на нови ситуации со минимално фино подесување.





