ОСНОВНЫЕ МЕТОДЫ АВТОМАТИЧЕСКОЙ ОБРАБОТКИ И МОДЕРАЦИИ ТЕКСТОВЫХ ДАННЫХ В СОЦИАЛЬНЫХ СЕТЯХ

Дата на публикуване

28.06.2021


Издател

Федеральное государственное бюджетное образовательное учреждение высшего образования «Пензенский государственный технологический университет»


Име на изданието

XXI век: итоги прошлого и проблемы настоящего плюс, № 2(54) 28.06.2021


DOI

10.46548/21vek-2021-1054-0005


Автор(и)

Бутаев Михаил Матвеевич - ОАО «Научно-производственное предприятие «Рубин»

Мартышкин Алексей Иванович - Пензенский государственный технологический университет


Анотация(ии)

В статье приводится обзор основных методов автоматической обработки и модерации текстовых данных в социальных сетях. Проводится исследование основных методов автоматической обработки и модерации текстовых данных в социальных сетях. Рассматриваются вопросы, связанные с возможностями искусственного интеллекта как технологии для решения задачи модерации текстового наполнения социальных сетей. Алгоритм, полученный с применением TF-IDF меры, определяет важность слов в текстовом сообщении и успешно борется с содержащими нецензурные слова и выражения блоками, но не всегда учитывает смысл. Данный подход пригоден для онлайн-обработки, по причине нетребовательности к вычислительным ресурсам. Алгоритм, построенный с применением этого метода, работает быстро и достигает приемлемой эффективности. Установлено, что корректно классифицировать сообщения оптимальнее всего получается у нейросетевых алгоритмов. Однако для этого требуется мощные вычислительные ресурсы и при этом затрачивается большое количество времени на обработку. По этой причине такие алгоритмы более подходят для модерации текстового наполнения социальной сети в офлайн-режиме. Сделаны выводы по проведенному исследованию.


Пълен текст на статията
30-34_Мартышкин.pdf