Почему «утекают» данные в больших языковых моделях. Часть 2

От

Июл 3, 2024

Добрый день, уважаемые читатели Хабра. Продолжаем разбираться в теме «утечки» конфиденциальных данных на примере больших языковых моделей и совершаемых для этого атак. В первой статье мы затронули такие механизмы атаки как Special Characters Attack (SCA), Leakage of Test Data in Training Data (LTDAT), Leakage in Prompt Atack (PLeak). Они несут угрозу для генеративных моделей. И мы показали, как можно маскировать данные для минимизации ущерба.

В этот раз мы затронем такую обширную проблему, как «отравление» обучающих данных (Data Poisoning) и возможность реализации «утечек». Уже известны многочисленные статьи, в которых разбирают атаки, когда входными данными являются изображения. Базовое объяснение существующим подходам даётся здесь и здесь, и говорится что они, как правило, служат бэкдорами и предназначены для повышения привилегий в системе.

Все статьи подряд / Информационная безопасность / Хабр

Ваша реакция?

Похожая запись

Агрегатор статей Разное

Рейтинг статьи

0 комментариев

Старые

Новые Популярные

Межтекстовые Отзывы

Посмотреть все комментарии

Почему «утекают» данные в больших языковых моделях. Часть 2

От

Похожая запись

Как бизнесу легально использовать метрические программы, если в законе не написано, что это такое

Базовый минимум: зачем вашей компании WAF

Пост @Jionin — Bug hunters (+1) — 01.02.2025 16:10

FinCore 2025

Вы пропустили

Как бизнесу легально использовать метрические программы, если в законе не написано, что это такое

Базовый минимум: зачем вашей компании WAF

Пост @Jionin — Bug hunters (+1) — 01.02.2025 16:10

Хакеры.RU. Глава 0х0D. Tere, Eesti

InfoSecPortal.ru