[Перевод] Подробный технический разбор реализации Autoresearch, ИИ-исследователя Андрея Карпаты

Хабр — Все 15.03.2026 NEWS

IT.02 — Развитие и эксплуатация бизнес-приложений

Andrej Karpathy представил проект autoresearch – минималистичный репозиторий на GitHub, демонстрирующий автономный цикл экспериментов с большими языковыми моделями (LLM). ИИ-агент самостоятельно модифицирует код обучения (файл train.py), запускает 5-минутный эксперимент, оценивает результат по метрике валидационных битов на байт (val_bpb) и принимает решение о сохранении или отмене изменений, повторяя цикл. Инструкции для агента содержатся в program.md, а неизменяемые функции — в prepare.py. Карпати сообщил об успешном улучшении целевой метрики в ходе множества автономных сессий. 💡 В чем бизнес-ценность? Концепция автономного агента, способного итеративно изменять, тестировать и оптимизировать код, имеет потенциал для автоматизации разработки и адаптации программного обеспечения. В девелопменте это может ускорить создание специализированных инструментов, например, для BIM или управления проектами, снижая ручное вмешательство и оптимизируя процессы.

Первоисточник

Читать оригинал