28.06.2021
Федеральное государственное бюджетное образовательное учреждение высшего образования «Пензенский государственный технологический университет»
XXI век: итоги прошлого и проблемы настоящего плюс, № 2(54) 28.06.2021
10.46548/21vek-2021-1054-0005
Бутаев Михаил Матвеевич - ОАО «Научно-производственное предприятие «Рубин»
Мартышкин Алексей Иванович - Пензенский государственный технологический университет
В статье приводится обзор основных методов автоматической обработки и модерации текстовых данных в социальных сетях. Проводится исследование основных методов автоматической обработки и модерации текстовых данных в социальных сетях. Рассматриваются вопросы, связанные с возможностями искусственного интеллекта как технологии для решения задачи модерации текстового наполнения социальных сетей. Алгоритм, полученный с применением TF-IDF меры, определяет важность слов в текстовом сообщении и успешно борется с содержащими нецензурные слова и выражения блоками, но не всегда учитывает смысл. Данный подход пригоден для онлайн-обработки, по причине нетребовательности к вычислительным ресурсам. Алгоритм, построенный с применением этого метода, работает быстро и достигает приемлемой эффективности. Установлено, что корректно классифицировать сообщения оптимальнее всего получается у нейросетевых алгоритмов. Однако для этого требуется мощные вычислительные ресурсы и при этом затрачивается большое количество времени на обработку. По этой причине такие алгоритмы более подходят для модерации текстового наполнения социальной сети в офлайн-режиме. Сделаны выводы по проведенному исследованию.
| 30-34_Мартышкин.pdf |
|---|