Я больше не верю публичным датасетам

От

Авг 13, 2024

Когда я прочитал новость о том, что исследователи MIT обнаружили вплоть до 10% ошибок в разметке самых популярных датасетов для обучения нейросетей, то решил, что нужно рассказать и о нашем опыте работы с публичными датасетами.

Уже более пяти лет мы занимаемся анализом сетевого трафика и машинным обучением моделей обнаружения компьютерных атак. И часто используем для этого публичные наборы обучающих данных. Расскажу, с какими сложностями мы при этом столкнулись и почему больше не верим публичным датасетам.

Все статьи подряд / Информационная безопасность / Хабр

Ваша реакция?

Похожая запись

Агрегатор статей Разное

Рейтинг статьи

0 комментариев

Старые

Новые Популярные

Межтекстовые Отзывы

Посмотреть все комментарии

Я больше не верю публичным датасетам

От

Похожая запись

Как бизнесу легально использовать метрические программы, если в законе не написано, что это такое

Базовый минимум: зачем вашей компании WAF

Пост @Jionin — Bug hunters (+1) — 01.02.2025 16:10

FinCore 2025

Вы пропустили

Как бизнесу легально использовать метрические программы, если в законе не написано, что это такое

Базовый минимум: зачем вашей компании WAF

Пост @Jionin — Bug hunters (+1) — 01.02.2025 16:10

Хакеры.RU. Глава 0х0D. Tere, Eesti

InfoSecPortal.ru