Когда ИИ учится мыслить стратегически

Как мы превратили 0,6% точности в 74,5% и раскрыли секреты машинного понимания логических игр

♜

♞

♝

♛

♚

♝

♞

♜

♟

♙

♖

♘

♗

♕

♔

♗

♘

♖

Парадокс умного ИИ

Почему ChatGPT проигрывает консоли 1977 года?

Современные языковые модели демонстрируют удивительные способности в разговоре, творчестве и анализе, но терпят фиаско в элементарных логических задачах. ChatGPT от OpenAI недавно потерпел поражение от 50-летней консоли Atari 2600 с процессором частотой всего 1,19 МГц. GPT-3 показывает менее 1% успеха даже в постановке мата в один ход.

Современный ИИ-сервер

GPU A100, 80GB VRAM
~100 терафлопс

Поражение

Atari 2600 (1977)

MOS 6507
1.19 МГц

Победа

Этот парадокс ставит фундаментальные вопросы о природе машинного интеллекта: обладают ли языковые модели реальным пониманием или просто имитируют паттерны?

Наша гипотеза

Проблема не в архитектуре, а в данных

Мы предположили, что слабые результаты ИИ в шахматах объясняются не ограничениями трансформерной архитектуры, а качеством обучающих данных. В профессиональных партиях маты крайне редки — из 3 миллионов игр только 87 тысяч заканчивались матом, поскольку сильные игроки сдаются при виде неизбежного поражения.

Наша команда провела серию экспериментов с языковой моделью в 300 миллионов параметров, варьируя типы и качество обучающих данных.

От 0,6% до 74,5%

Революция в обучении

124×

Рост точности

При правильном подборе данных

74,5%

Данные Lichess

Максимальная точность постановки мата

1400

ELO-рейтинг

Уровень среднего шахматиста-любителя

2-3

Дня обучения

На обычной видеокарте

Модели достигли впечатляющих результатов, особенно учитывая, что они играли 'вслепую' только по текстовым обозначениям, создав представление о двухмерном мире из одномерного текста.

Понимание или имитация?

Что скрывается за успехом машинного мышления

Обученные модели продемонстрировали поразительную избирательность. Они способны методично проводить сложные многоходовые эндшпили, требующие точных вычислений, но могут не заметить 'висящего' ферзя — элементарную тактическую возможность.

Понимание

Способность к стратегическому планированию и методичному преследованию целей в эндшпиле

Имитация

Виртуозное воспроизведение выученных паттернов без реального понимания принципов

Границы между этими концепциями остаются размытыми, поднимая глубокие вопросы о природе машинного интеллекта.

Попробуйте сами

Интерактивная демонстрация игры с нашей языковой моделью

Техническое демо

Играйте в шахматы с трансформерной языковой моделью

Игрок

00:00

Модель

00:00

Статус игры

Готов к игре. Кликните на фигуру, чтобы начать.

История ходов

Игра не начата

Новая парадигма

Данные важнее архитектуры

📊

Качество данных

Критичнее архитектурных инноваций

🧠

Стратегическое мышление

ИИ способен к нему при правильном обучении

❓

Понимание vs имитация

Остается открытым философским вопросом

🚀

Новые возможности

Инновационные подходы к обучению

Готовы исследовать границы возможного?

Наша команда продолжает исследования на стыке ИИ, когнитивных наук и практических применений. Свяжитесь с нами, чтобы обсудить, как эти открытия могут трансформировать ваш бизнес.

Связаться с нами

AI-консалтинг

Внедрение

Каталог