Популярният показател за производителност на AI може да бъде недостатъчен, предупреждават изследователите от мета
Популярен показател за измерване на работата на изкуствен интелект Моделите могат да бъдат недостатъчни, група от Мета платформи Изследователите предупредиха, повдигайки нови въпроси относно истинността на оценките, които са направени в големите AI системи. „Идентифицирахме множество вратички с проверена Swe-Bench“, пише Джейкъб Кан, мениджър в Meta AI Research Lab Справедливов публикация миналата седмица в платформата…









