Нейросеть научат находить «разные категории оскорблений и угроз» во «ВКонтакте»

«ВКонтакте» начала обучать нейросеть находить «враждебные высказывания», сообщается в блоге соцсети.

«Новая технология», как ее называют в Центре безопасности ВК, «призвана оградить пользователей от разжигающего ненависть контента»; ускорить автоматическую блокировку таких материалов и «повысить эффективность модерации».

Нейросеть должна научиться «определять самые разные категории оскорблений и угроз», поясняет блог ВК.

Это в том числе «проявления ксенофобии, расизма, гомофобии, сексизма и других предрассудков», оскорбления из-за религии, возраста, внешности или заболеваний.

Чтобы сообщить о материале, где, по мнению пользователя «ВКонтакте», есть такие оскорбления, нужно нажать на кнопку «Пожаловаться» и выбрать из предлагаемых категорий жалоб «Враждебные высказывания».

После этого пост изучат модераторы. Жалобы на «враждебные высказывания» позволят собрать датасет для обучения нейросети.

По данным самой «ВКонтакте», за первую половину 2020 года из соцсети удалили «520 тысяч единиц контента по теме разжигания вражды и ненависти». За тот же период заблокировали «1340 профилей и 2470 сообществ, распространяющих враждебные высказывания».
В 2017 году Facebook объявила, что созданные компанией алгоритмы научились распознавать и удалять из соцсети «террористический контент», связанный с ИГ и «Аль-Каедой». На тот момент алгоритм не умел находить посты, связанные с какими-либо другими террористическими группировками.