Появление передовых ИИ-моделей, таких как китайская OmniHuman-1, которые способны создавать реалистичные видеозаписи, может привести к увеличению количества кибератак с использованием дипфейков, создаваемых в режиме реального времени. Об этом РИА Новости рассказал технический лидер направления антиспуфинга MTS AI Станислав Приходько.
Владеющая TikTok компания ByteDance представила новую систему искусственного интеллекта OmniHuman-1, которая способна создавать одни из самых реалистичных на сегодняшний день дипфейк-видео. По словам Приходько, внедрение таких моделей может привести к значительному увеличению количества атак как на пользователей, так и на корпоративных клиентов. Качество дипфейков, создаваемых в реальном времени, также значительно улучшится, что затруднит их распознавание.
Для создания видео с помощью OmniHuman-1 требуется лишь одна картинка и качественная аудиодорожка. На презентации модели были продемонстрированы примеры, где Тейлор Свифт исполняет песню на японском языке, а Альберт Эйнштейн читает лекцию. Оба этих видео были созданы нейросетями на основе фотографии, отметил эксперт.
Создание фейкового нейросетевого голоса тоже упрощается: достаточно лишь нескольких секунд записи голоса. Генерация таких характерных черт, как тембр и интонация голоса, проще, чем мимика лица, поэтому для видео требуются большие вычислительные мощности, подчеркнул Приходько.
По словам эксперта, в 2025 году специализированное ПО позволяет создавать дипфейки в режиме реального времени. Подобные атаки уже фиксируются в России и других странах и часто направлены на хищение крупных сумм денег.