Когда ИИ учится мыслить стратегически
Как мы превратили 0,6% точности в 74,5% и раскрыли секреты машинного понимания логических игр
Парадокс умного ИИ
Почему ChatGPT проигрывает консоли 1977 года?
Современные языковые модели демонстрируют удивительные способности в разговоре, творчестве и анализе, но терпят фиаско в элементарных логических задачах. ChatGPT от OpenAI недавно потерпел поражение от 50-летней консоли Atari 2600 с процессором частотой всего 1,19 МГц. GPT-3 показывает менее 1% успеха даже в постановке мата в один ход.
Современный ИИ-сервер
~100 терафлопс
Atari 2600 (1977)
1.19 МГц
Этот парадокс ставит фундаментальные вопросы о природе машинного интеллекта: обладают ли языковые модели реальным пониманием или просто имитируют паттерны?
Наша гипотеза
Проблема не в архитектуре, а в данных
Мы предположили, что слабые результаты ИИ в шахматах объясняются не ограничениями трансформерной архитектуры, а качеством обучающих данных. В профессиональных партиях маты крайне редки — из 3 миллионов игр только 87 тысяч заканчивались матом, поскольку сильные игроки сдаются при виде неизбежного поражения.
Наша команда провела серию экспериментов с языковой моделью в 300 миллионов параметров, варьируя типы и качество обучающих данных.
От 0,6% до 74,5%
Революция в обучении
Модели достигли впечатляющих результатов, особенно учитывая, что они играли 'вслепую' только по текстовым обозначениям, создав представление о двухмерном мире из одномерного текста.
Понимание или имитация?
Что скрывается за успехом машинного мышления
Обученные модели продемонстрировали поразительную избирательность. Они способны методично проводить сложные многоходовые эндшпили, требующие точных вычислений, но могут не заметить 'висящего' ферзя — элементарную тактическую возможность.
Понимание
Способность к стратегическому планированию и методичному преследованию целей в эндшпиле
Имитация
Виртуозное воспроизведение выученных паттернов без реального понимания принципов
Границы между этими концепциями остаются размытыми, поднимая глубокие вопросы о природе машинного интеллекта.
Попробуйте сами
Интерактивная демонстрация игры с нашей языковой моделью
Техническое демо
Играйте в шахматы с трансформерной языковой моделью
Статус игры
История ходов
Новая парадигма
Данные важнее архитектуры
Готовы исследовать границы возможного?
Наша команда продолжает исследования на стыке ИИ, когнитивных наук и практических применений. Свяжитесь с нами, чтобы обсудить, как эти открытия могут трансформировать ваш бизнес.
Связаться с нами