Вятский государственный университет в составе Университетского консорциума исследователей больших данных реализует проект по поиску жертв супружеского насилия в сети Интернет. Техническое сопровождение проекта оказывают специалисты Томского государственного университета. Исследование проводится с поддержкой индустриального партнера Консорциума – российской компанией «Мегапьютер Интеллидженс», предоставившей инструменты для сбора данных в онлайн пространстве посредством парсинга, а также коллекции инструментов для проведения статистического анализа и наборы алгоритмов машинного обучения, собранные в аналитической платформе PolyAnalyst.
Проблема супружеского насилия особенно обострилась в условиях глобальной пандемии COVID-19, когда повседневная жизнь людей резко изменилась. Эти изменения принесли с собой множество новых вызовов, включая физические и психологические риски для здоровья, изоляцию и одиночество, закрытие школ и предприятий, а также потерю рабочих мест и как следствие экономическую уязвимость. Жертвами супружеского насилия становятся все больше людей как в России, так и по всему миру.
«Раскрытие информации о супружеском насилии и опыте обращения за помощью является затруднительным, и процент жертв, которые искали поддержку у профессиональных специалистов, полиции и медицинских работников, остается крайне низким. Кроме того, эксперты констатируют, что 56% жертв домашнего насилия, обратившихся в правоохранительные органы, а также в психологические и юридические службы, не удовлетворены работой этих организаций. Столкнувшиеся с насилием предпочитают искать механизмы помощи в интернет-пространстве, где действуют онлайн-сообщества их поддержки. Причины обращения к таким ресурсам кроются в желании людей убедиться в типичности или атипичности собственной ситуации, получить возможный вектор ее разрешения с сохранением конфиденциальности».
Екатерина Митягина
Проректор по развитию на основе анализа данных ВятГУ
Исследование онлайн-обращений и комментариев к ним кафедрой социальной работы и молодежной политики ВятГУ стало дополнительным источником информации о специфике супружеского насилия, его видах и формах, масштабах распространения.
Чаще всего для поиска ответов на вопросы о насилии люди обращаются к социальным сетям. Как показало исследование, это 82% от всех интернет-сообщений о насилии: vk.com (63%), instagram.com (7.8%), odnoklassniki.ru (6.7%), facebook.com (4.5%) и др. Значительно меньшее количество сообщений встречается в микроблогах (twitter.com), интернет-СМИ (skoronovosti.ru, kavkaz-uzel.eu и др.), форумах (woman.ru и др.), видео (youtube.com) и блогах (zen.yandex.ru) – совокупный процент составляет 9.8%, из которых микроблоги (7.2%), интернет-СМИ (5.3%), видео (1.3%) и форумы (2%). Совокупная доля тематических порталов (otvet.mail.ru), мессенджеров (telegram.org) и сайтов отзывов (otzyvru.com) занимает менее 1%. (таблица 1).
Таблица 1 — Основные источники данных.
Тип источника
Пример источника
Количество сообщений
Процент
Социальные сети
vk.com, instagram.com, odnoklassniki.ru, facebook.com
22,638
82.0
Микроблоги
twitter.com
1,994
7.2
Интернет-СМИ
skoronovosti.ru, kavkaz-uzel.eu
1,45
5.3
Форумы
woman.ru
563
2.0
Видео
youtube.com
356
1.3
Блоги
zen.yandex.ru
334
1.2
Тематические порталы
otvet.mail.ru
180
0.7
Мессенджеры
telegram.org
61
0.2
Сбор и обработка данных проекта осуществляется в рамках Центра коллективного пользования платформой PolyAnalyst на базе суперкомпьютера Томского государственного университета СКИФ Cyberia. Евгений Петров, сотрудник Центра прикладного анализа больших данных ТГУ, оказывающий техническое сопровождение проекта при работе с платформой PolyAnalyst заявляет, что «наиболее сложным этапом в работе с данными является их структурирование. Массивы должны быть подвергнуты серьезной проверке и качественному анализу, что требует значительных вычислительных ресурсов. Кроме того, в интернете встречается все больше сообщений, поддерживающих и оправдывающих насилие. Ориентация только на отрицательную тональность становится не единственным фактором, указывающим на релевантность сообщения» (рисунок 1).
Рисунок 1 — Тональность связей в сообщениях о супружеском насилии.
Основной формой насилия в сообщениях является физическое насилие (81%), на втором месте – психологическое (15%). Сексуальные (3.5%) и экономические (0.5%) формы насилия составляют менее 5% от всех релевантных сообщений. В сознании пользователей насилие ассоциируется, прежде всего, с применением физической силы. При этом женщины чаще являются жертвами насилия (72%). Если жертвой выступает мужчина, то чаще речь идет о смешанной форме насилия, когда женщина совершила деяние в ответ на мужское насилие.
Функция извлечения ключевых слов при помощи платформы PolyAnalyst позволила расширить перечень субъектов насилия, которыми, помимо мужа и жены, также являются дети и старшее поколение, проживающие в семьях. Побои, травмы, синяки, оскорбления являются постоянными спутниками насильственных действий по отношению ко всем членам семьи (рисунок 2).
Рисунок 2 — Ключевые слова в сообщениях, релевантных теме супружеского насилия.
Схема, представленная на рисунке 3, иллюстрирующая ключевые слова, наиболее часто встречающиеся с понятием жертва, наглядно показывает «путь» между «первым звоночком» и проявлением насилия, позволяет уточнить «пусковые» механизмы и «роль» агрессора, случая, отношений в семье в ситуации семейного насилия. (рисунок 3).
Рисунок 3 — Ключевые слова, связанные с понятием «жертва насилия».
Ученым удалось не только предложить теоретические механизмы анализа, но и применить открывшиеся возможности на практике. Из всего массива сообщений о насилии были выделены посылы, связанные с просьбами реальных жертв о помощи: помогите, спасите, караул, поддержите, прошу совета, прошу помощи, больше не могу терпеть (рисунок 4).
Рисунок 4 — База данных, содержащих сообщения с просьбой о помощи.
На основе данных сообщений кировский Центр социально-психологической помощи получил возможность улучшить работу и настроить чат-бот «Умный помощник «Лада»» (рисунок 5), который, благодаря возможностям машинного обучения, учится определять форму и вид насилия по обращению, а также адресует жертв к соответствующим специалистам.
Директор центра, кандидат психологических наук Нина Ершова считает, что самым важным в работе с жертвами насилия, особенно в отдаленных районах, является «создание условий для оказания комплексной онлайн-помощи на межведомственной и междисциплинарной основе. В этой ситуации апробированный постоянно действующий инструмент, которым является Умный помощник «Лада», просто незаменим».
Рисунок 5 — Умный помощник «Лада» в ситуации супружеского насилия.
Ученые продолжают статистическую обработку полученного корпуса сообщений. В ближайших планах представить типичные портреты жертвы и агрессора. К имеющимся данным планируется применить алгоритмы машинного обучения, что позволит проводить автоматизированный поиск фактов насилия, их классификацию и профилактику.
«Мы очень рады, что наша платформа PolyAnalyst помогает в исследовании и в борьбе со столь острой социальной проблемой, как семейное насилие. Мы делаем продукт, задача которого- облегчить работу с большими объемами данных, и для нас очень важно, что платформа несет прикладную пользу не только бизнес-заказчикам, но и обществу в целом».
Дмитрий Гольцов
Руководитель коммерческого направления «Мегапьютер Интеллидженс»
Команда исследовательского проекта благодарит компанию «Мегапьютер Интеллидженс», предоставляющую новые возможности в работе по такой чрезвычайно важной и трудной социальной проблематике.