Пожалуйста, войдите в свой аккаунт, или зарегистрируйтесь и добавьте свои Telegram-каналы и бизнес-сообщества ВКонтакте в личном кабинете.
Для бесплатной генерации поста использовался промт/статья:
<b>Китайская лаборатория BAAI выпустила открытую SOTA модель для робототехники </b>
RoboBrain 2.0 – это модель общего назначения для управления роботами. Это не просто VLA, а «<b>модель мозга</b>».
Модель поддерживает рассуждения и долгосрочное агентное планирование, устойчивое восприятие 3D-пространства и рассуждения на основе сцены, а также долгосрочную обновляемую память.
<b>Под капотом</b>: Vision Encoder + MLP Projector. На вход принимает и видео, и картинки, и, конечно, текст. Через адаптеры все подается в LLM декодер, который и выполняет поставленные задачи.
Пока доступна модель на 7В, скоро выйдет на 32В. Модель побольше на робо-бенчах обгоняет и открытых, и закрытых конкурентов. В том числе Claude Sonnet 4 и o4-mini.
Радует, что снова появляется явный тренд на открытую робототехнику
<a href="https://github.com/FlagOpen/RoboBrain2.0"><b>GitHub</b></a><b> | </b><a href="https://huggingface.co/collections/BAAI/robobrain20-6841eeb1df55c207a4ea0036"><b>HuggingFace</b></a>