Дослідження виявило, що сучасні моделі генеративного штучного інтелекту не здатні якісно оцінювати студентські есе.
Вчені протестували AI на тисячах робіт і з'ясували, що він лише в 50% випадків відповідає оцінкам, присвоєним людьми.
Особливо проблематичною була вартість оцінювання якості надісланих есе, оскільки алгоритми часто не змогли правильно визначити найкращі та найгірші зразки робіт.