[Перевод] Подробный технический разбор реализации Autoresearch, ИИ-исследователя Андрея Карпаты
Andrej Karpathy представил проект autoresearch – минималистичный репозиторий на GitHub, демонстрирующий автономный цикл экспериментов с большими языковыми моделями (LLM). ИИ-агент самостоятельно модифицирует код обучения (файл
train.py), запускает 5-минутный эксперимент, оценивает результат по метрике валидационных битов на байт (val_bpb) и принимает решение о сохранении или отмене изменений, повторяя цикл. Инструкции для агента содержатся в program.md, а неизменяемые функции — в prepare.py. Карпати сообщил об успешном улучшении целевой метрики в ходе множества автономных сессий.
💡 В чем бизнес-ценность?
Концепция автономного агента, способного итеративно изменять, тестировать и оптимизировать код, имеет потенциал для автоматизации разработки и адаптации программного обеспечения. В девелопменте это может ускорить создание специализированных инструментов, например, для BIM или управления проектами, снижая ручное вмешательство и оптимизируя процессы.
Первоисточник
Читать оригинал