The Guardian: популярные ИИ-боты провалили тесты ученых по замене людей в офисе

Газета.Ru 5 часов назад 16
Preview

В то время как некоторые видные деятели технологической индустрии предсказывают будущее, где искусственный интеллект (ИИ) вытеснит человеческих работников, недавние исследования показывают, что текущие возможности нейросетей далеки от требований полноценной офисной работы. Этот скептицизм разделяет преподаватель Стэнфордского университета Эд Ньютон-Рекс, который в интервью The Guardian отметил, что в американской Кремниевой долине нейросети все чаще рассматриваются не просто как инструмент автоматизации, а как средство для полной замены человеческого труда.

По словам Ньютона-Рекса, руководители технологических компаний все активнее обсуждают возможность полного исключения людей из экономической цепочки, где ИИ будет заниматься интеллектуальной деятельностью, а роботы — физическими задачами. На одном из недавних деловых ужинов в Сан-Франциско высказывалось мнение, что потенциал заработка на ИИ огромен и может позволить заменить всех работников в мире, присвоив их зарплаты.

Основными аргументами в пользу развития ИИ часто называют экономический рост и повышение уровня жизни, хотя существует и более циничная точка зрения, сводящая все к исключительно финансовой выгоде. Ветеран венчурных инвестиций Марк Андриссен отмечает, что "программное обеспечение поглощает весь мир", и Кремниевая долина видит в нейросетях возможность полностью захватить средства производства.

Однако, наряду с этими амбициозными прогнозами, существуют и более осторожные оценки. Ньютон-Рекс подчеркивает, что ключевой вопрос не столько в достижении высокого уровня развития ИИ, сколько в мотивации таких стремлений и реакции на них общества и государства.

Противоположную позицию подкрепляет недавнее исследование британских ученых, которое показало, что нейросети пока не готовы к полноценной замене офисных сотрудников. В рамках эксперимента была создана симуляция виртуальной IT-компании, где в качестве "работников" были задействованы популярные нейросети-агенты. Они выполняли рабочие задачи в условиях, имитирующих реальный офис, с использованием стандартных интерфейсов и систем отчетности.

Результаты оказались неутешительными. Одна из протестированных нейросетей, Claude, справилась лишь с 24% задач, при этом затраты на каждую задачу были значительными. Другая, Nova Pro, показала еще более низкий результат – всего 1,7% выполненных задач, а остальные участники эксперимента продемонстрировали худшие показатели.

Ученые выявили основные причины провала: нейросети испытывали трудности с пониманием контекста, не умели эффективно взаимодействовать в команде и не признавали своих ошибок. В ходе работы они совершали элементарные промахи, такие как искажение или забвение имен коллег, пометка задач как выполненных без фактического завершения, а иногда даже не могли закрыть всплывающие окна и требовали вмешательства исследователей.

 

Читать в Газета.Ru
Failed to connect to MySQL: Unknown database 'unlimitsecen'