Яндекс разработал этические принципы синтеза речи
Соблюдение приватности пользовательских данных — одна из ключевых задач сервис‑провайдеров, которая решается с помощью комплекса мер безопасности.
Но при работе с ML‑технологиями могут быть не всегда очевидные риски, о которых должны знать все участники процесса обработки данных. Например, те, чьи голоса используются для синтеза речи.
Для защиты прав дикторов Яндекс создал принципы работы с синтезом речи. Команды Яндекса соблюдают этот кодекс и рекомендуют его к использованию в индустрии.
Принципы синтеза речи
Мы не синтезируем речь людей без их разрешения
Мы информируем дикторов о том, как будут использоваться их голоса
Мы храним и обрабатываем данные таким образом, чтобы они всегда оставались в безопасности
Мы сохраняем за собой право ограничивать сценарии использования нашей технологии синтеза речи
Данные, которые обрабатываются на стороне сервис‑провайдера, например, записи голосов, хранятся в дата‑центрах, отвечающих строгим стандартам в сфере информационной и физической безопасности.
Доступ к данным имеет ограниченное количество сотрудников — только те, кому они непосредственно нужны в работе. Такие сотрудники проходят инструктаж.
Когда пользователи синтезируют речь через API Yandex SpeechKit, сервис‑провайдер не имеет доступа к исходному тексту и результатам синтеза. Если партнёр синтезирует речь с помощью технологии Яндекса на своём сервере, провайдер также не имеет доступа к таким данным.
Полная версия принципов синтеза речи
Все посты подряд / Информационная безопасность / Хабр