НИУ ВШЭ: ИИ сможет лучше понимать русскоязычные научные тексты

Газета.Ru 1 час назад 4
Preview

Исследователи НИУ ВШЭ адаптировали большую языковую модель для работы с русскоязычной научной терминологией. Разработка позволяет искусственному интеллекту точнее анализировать научно-технические тексты и при этом работать значительно быстрее и экономнее по памяти. Программа уже прошла государственную регистрацию. Об этом "Газете.Ru" рассказали в пресс-службе образовательного учреждения.

Как отмечают ученые, большинство популярных генеративных ИИ-систем, включая OpenAI ChatGPT, обучаются преимущественно на англоязычных данных. Это создает риск формирования своеобразной "монокультуры" в сфере искусственного интеллекта, где русскоязычная научная информация оказывается представлена хуже.

Чтобы решить эту проблему, специалисты Института статистических исследований и экономики знаний ВШЭ дообучили открытую языковую модель на специализированном корпусе iFORA-QA. Его вручную собрали более 150 экспертов института на основе аналитических материалов, научных отчетов и документов в области науки, технологий и инноваций.

После адаптации система стала лучше отвечать на профессиональные вопросы, связанные с научно-технической тематикой. Скорость генерации текста выросла в 2,7 раза, а потребление памяти сократилось на 73% по сравнению с исходной мультиязычной моделью. Это позволяет запускать ИИ на менее мощном и более доступном оборудовании.

"Универсальные языковые модели знают много, но поверхностно. Нам же нужна модель, которая понимает, о чем пишут российские ученые и инженеры", — пояснила Анастасия Малашина, главный аналитик проекта и научный сотрудник Центра стратегической аналитики и больших данных ИСИЭЗ ВШЭ.

В ближайшее время исследователи планируют создать на базе модели дополнительные инструменты. Один из них станет "умным" поисковиком, который будет формировать ответы только со ссылками на научные источники, снижая риск так называемых галлюцинаций ИИ. Второй инструмент — граф связей между данными, который поможет находить скрытые закономерности в научной информации.

Кроме того, разработчики хотят научить систему работать с неполными данными и задавать пользователю уточняющие вопросы перед формированием ответа.

В перспективе все инструменты планируют объединить в единую мультиагентную систему для автоматизированного анализа научно-технической информации.

Читать в Газета.Ru
Failed to connect to MySQL: Unknown database 'unlimitsecen'