В России разработали метод защиты от краж ИИ-моделей

By rb.ru On Май 21, 2024

В России разработали метод выявления краж моделей искусственного интеллекта, доступ к которым предоставляется по API. Протокол, основанный на создании триггерного набора данных и систем «водяных знаков», представили научная группа «Доверенные и безопасные интеллектуальные системы» Института искусственного интеллекта AIRI при участии специалистов «Сколтеха». Об этом RB.RU рассказали в пресс-службе AIRI.

В России разработали метод защиты от краж ИИ-моделей Автор: Наталья Гормалева Подписаться на RB.RU в Telegram

Институт приводит в пример кейс с французским стартапом, который развивает модель Mistral. Сотрудников слил в сеть помеченную водяным знаком версию старой модели, которую обучали открыто.

Как пояснили в AIRI, кражей ИИ-модели считается ситуация, при которой неавторизованные физические или юрлица незаконно получают и используют модели, права на которые принадлежат другим лицам, без их согласия. Самым популярным подходом является дистилляция модели и дообучение исходной модели на новом наборе данных. При этом способ получения исходной модели утаивается.

Предложенный специалистами AIRI метод позволяет получить уникальные наборы триггеров, которые встраиваются в ИИ-модель и с высокой вероятностью сохраняются в процессе любых изменений.

Этот подход не зависит от типа модели и не предполагает ограничений на размер набора триггеров. В AIRI отмечают, что подход можно применять к любой модели без ущерба для производительности.

«В первую очередь наш подход полезен «закрытым» моделям, распространяющимся через API, поскольку их кража с максимальной вероятностью свидетельствует о нарушении конфиденциальности данных внутри компании», — отметил руководитель научной группы «Доверенные и безопасные интеллектуальные системы» Института AIRI Олег Рогов.

Он добавил, что метод также поддерживает применение водяных знаков для опубликованных по open-sours лицензиям моделей.

Заставь искусственный интеллект самообучаться и совершенствоваться – выбирай онлайн-курсы в каталоге курсов по машинному обучению.

«Цифровые водяные знаки помогут установить, что открытая модель была скопирована без учета требований такой лицензии и помочь разработчикам в защите своей репутации», — уточнил Рогов.

Код метода уже прошел государственную регистрацию и находится в открытом доступе. Институт также подал на метод выявления краж патентную заявку. Доступ к алгоритму опубликован на Github.

Подписывайтесь на наш Telegram-канал, чтобы быть в курсе последних новостей и событий!

Источник: rb.ru