AEC-Bench: Мультимодальный бенчмарк для агентных систем в архитектуре, инженерии и строительстве

arXiv cs.AI 01.04.2026 PAPER

Представлена научная работа, описывающая создание AEC-Bench — мультимодального бенчмарка для оценки агентных систем в сфере архитектуры, инженерии и строительства (AEC). Цель бенчмарка — стандартизировать проверку ИИ-агентов на задачах, приближенных к реальным условиям отрасли. Исследование охватывает такие аспекты, как интерпретация чертежей, логический анализ информации из различных проектных документов и координация на уровне строительного проекта. Научная новизна заключается в разработке комплексного инструмента для объективной оценки возможностей ИИ в решении сложных, многоаспектных задач девелопмента и строительства.

Первоисточник

Читать оригинал