Нейросеть научат находить «разные категории оскорблений и угроз» во «ВКонтакте»
«ВКонтакте» начала обучать нейросеть находить «враждебные высказывания», сообщается в блоге соцсети.
«Новая технология», как ее называют в Центре безопасности ВК, «призвана оградить пользователей от разжигающего ненависть контента»; ускорить автоматическую блокировку таких материалов и «повысить эффективность модерации».
Нейросеть должна научиться «определять самые разные категории оскорблений и угроз», поясняет блог ВК.
Это в том числе «проявления ксенофобии, расизма, гомофобии, сексизма и других предрассудков», оскорбления из-за религии, возраста, внешности или заболеваний.
Чтобы сообщить о материале, где, по мнению пользователя «ВКонтакте», есть такие оскорбления, нужно нажать на кнопку «Пожаловаться» и выбрать из предлагаемых категорий жалоб «Враждебные высказывания».
После этого пост изучат модераторы. Жалобы на «враждебные высказывания» позволят собрать датасет для обучения нейросети.
- По данным самой «ВКонтакте», за первую половину 2020 года из соцсети удалили «520 тысяч единиц контента по теме разжигания вражды и ненависти». За тот же период заблокировали «1340 профилей и 2470 сообществ, распространяющих враждебные высказывания».
- В 2017 году Facebook объявила, что созданные компанией алгоритмы научились распознавать и удалять из соцсети «террористический контент», связанный с ИГ и «Аль-Каедой». На тот момент алгоритм не умел находить посты, связанные с какими-либо другими террористическими группировками.