AEC-Bench: Мультимодальный бенчмарк для агентных систем в архитектуре, инженерии и строительстве
Представлена научная работа, описывающая создание AEC-Bench — мультимодального бенчмарка для оценки агентных систем в сфере архитектуры, инженерии и строительства (AEC). Цель бенчмарка — стандартизировать проверку ИИ-агентов на задачах, приближенных к реальным условиям отрасли.
Исследование охватывает такие аспекты, как интерпретация чертежей, логический анализ информации из различных проектных документов и координация на уровне строительного проекта. Научная новизна заключается в разработке комплексного инструмента для объективной оценки возможностей ИИ в решении сложных, многоаспектных задач девелопмента и строительства.
Первоисточник
Читать оригинал