
Модель искусственного интеллекта Grok компании xAI Илона Маска продемонстрировала наименьший уровень ошибок среди популярных чат-ботов. Об этом сообщает Teslarati со ссылкой на отчет аналитического агрегатора Relum, посвященный оценке надежности ИИ-сервисов.
Согласно исследованию, уровень так называемых "галлюцинаций" у Grok составил 8%, что почти в четыре раза ниже показателей ChatGPT и Google Gemini. Для сравнения, у ChatGPT этот показатель достиг 35%, а у Gemini — 38%, что ставит под сомнение их использование в задачах, требующих высокой точности.
Оценка проводилась по нескольким критериям, включая частоту ошибок, стабильность работы, пользовательские рейтинги и время простоя. На основе совокупных данных каждому сервису присваивался балл по шкале от 0 до 99, где более высокое значение означает больший уровень ненадежности.
Grok получил итоговый балл 6 — один из лучших результатов в исследовании. Эксперты отметили высокую стабильность ответов, пользовательскую оценку на уровне 4,5 балла, а также минимальный простой, составивший всего 0,07%.
В то же время ChatGPT оказался в конце рейтинга с максимальным баллом 99. Следом за ним расположились Claude и Meta AI с показателями 75 и 70 соответственно. Китайский DeepSeek показал сопоставимые с Grok результаты: уровень "галлюцинаций" — 14% и 4 балла.
НОВОСТИ СЕГОДНЯ
Похожие новости: