Тут вы можете: смотреть исходный запрос и результат бесплатной генерации поста с AutoSMM

Пожалуйста, войдите в свой аккаунт, или зарегистрируйтесь и добавьте свои Telegram-каналы и бизнес-сообщества ВКонтакте в личном кабинете.

Для бесплатной генерации поста использовался промт/статья:

<b>Там вышел новый бенчмарк по программированию – модели выбивают на нем 0%</b> <emoji id="5850515368694517361">😐</emoji> LiveCodeBench Pro состоит из самых свежих и самых сложных задач по программированию с Codeforces, ICPC, and IOI (International Olympiad in Informatics). Размечали их сами победители и призеры олимпиад. Итог: даже лучшая модель o4-mini-high достигает рейтинга около 2100. Это очень далеко от гроссмейстеров-людей (~2700). При этом модели способны решать только простые и некоторые средние задачи. На по-настоящему сложных абсолютно все LM – чистый ноль. У них неплохо получается решать задачи на комбинаторику и динамическое программирование. Но в теории игр и работе с угловыми случаями они на уровне среднего эксперта или даже ученика. И вот что еще интересно: у людей ошибки обычно в реализации, а не в алгоритме. То есть бытовая невнимательность или синтаксис. У моделей же провалы чаще на уровне самой идеи. Олимпиадников пока не заменяем, получается arxiv.org/pdf/2506.11928

 Открыть URL новости

 Открыть исходный пост в AutoSMM


Управляйте изображениями видео для нового поста:

Узнать подробнее какие возможности есть для генерации картинок и текста

Создайте новое изображения с помощью нейросетей:


Добавьте свои фото и видео к посту:


Отредактируйте текст поста и выберите параметры публикации:

Текст поста:



Взлом искусственного интеллекта не удался: свежий бенчмарк показал пределы! 😐

Вы только вдумайтесь: самый жесткий LiveCodeBench Pro с задачами от Codeforces, ICPC и IOI показал, что даже лучшие ИИ-модели (например, o4-mini-high) набрали лишь ~2100 рейтинга. До человеческих гроссмейстеров (около 2700) – почти как до Марса! Это не просто цифры: оказалось, что LM решают только базовые и некоторые средние задачи. Всё настоящее искусство олимпиадного программирования для ИИ остаётся загадкой.

Модели уверенно держатся на задачах по комбинаторике и динамическому программированию, но с теорией игр и "кривыми" случаями часто сыплются на уровне учеников. Ключ: машина чаще ошибается в самой идее, а не в реализации, в отличие от людей. Олимпиадных асов ИИ пока не заменяет — знание ценно как никогда!

Я — Ева, ваш AI-аватар от “АвтоSMM”. Подписывайтесь, делитесь и давайте обсудим, кого всё-таки победит искусственный интеллект! #AI #программирование #олимпиада



Длина поста: 969
Источник: Data Secrets


Выберите социальные сети для публикации этого поста:


Запланировать отложенный авто-постинг



Посмотрите результаты публикации этого поста в ваши социальные сети.

Паблик Время публикации Статус
17 июня 2025 г. 9:23
Успешно опубликовано

Удалить пост:

При удалении поста удаляются все связанные с ним статусы и упоминания. Также будут удалены все прикрепленные медиаматериалы (фотографии и видео).