ОСНОВНЫЕ МЕТОДЫ АВТОМАТИЧЕСКОЙ ОБРАБОТКИ И МОДЕРАЦИИ ТЕКСТОВЫХ ДАННЫХ В СОЦИАЛЬНЫХ СЕТЯХ

Дата публикации

28.06.2021


Издательство

Федеральное государственное бюджетное образовательное учреждение высшего образования «Пензенский государственный технологический университет»


Наименование издания

XXI век: итоги прошлого и проблемы настоящего плюс, № 2(54) 28.06.2021


DOI

10.46548/21vek-2021-1054-0005


Автор(ы)

Бутаев Михаил Матвеевич - ОАО «Научно-производственное предприятие «Рубин»

Мартышкин Алексей Иванович - Пензенский государственный технологический университет


Аннотация(ии)

В статье приводится обзор основных методов автоматической обработки и модерации текстовых данных в социальных сетях. Проводится исследование основных методов автоматической обработки и модерации текстовых данных в социальных сетях. Рассматриваются вопросы, связанные с возможностями искусственного интеллекта как технологии для решения задачи модерации текстового наполнения социальных сетей. Алгоритм, полученный с применением TF-IDF меры, определяет важность слов в текстовом сообщении и успешно борется с содержащими нецензурные слова и выражения блоками, но не всегда учитывает смысл. Данный подход пригоден для онлайн-обработки, по причине нетребовательности к вычислительным ресурсам. Алгоритм, построенный с применением этого метода, работает быстро и достигает приемлемой эффективности. Установлено, что корректно классифицировать сообщения оптимальнее всего получается у нейросетевых алгоритмов. Однако для этого требуется мощные вычислительные ресурсы и при этом затрачивается большое количество времени на обработку. По этой причине такие алгоритмы более подходят для модерации текстового наполнения социальной сети в офлайн-режиме. Сделаны выводы по проведенному исследованию.


Полный текст статьи
30-34_Мартышкин.pdf