Description of the article

Date of publication

31.08.2019


Publisher name

Научен Хронограф


journal name

Хуманитарни Балкански изследвания, № 3(5) 31.08.2019


DOI

10.34671/SCH.HBR.2019.0303.0026


Authors

RUS: Бородин Александр Иванович-Российский экономический университет имени Г.В. Плеханова,ENG: Borodin Alexander Ivanovich-Plekhanov Russian University of Economics,

RUS: Вейнберг Роман Рафаилович-Российский экономический университет имени Г.В. Плеханова,ENG: Veynberg Roman Rafailovich-Plekhanov Russian University of Economics,

RUS: Литвишко Олег Валерьевич-Российский экономический университет имени Г.В. Плеханова,ENG: Litvishko Oleg Valerevich-Plekhanov Russian University of Economics,


Titles

ENG METHODS OF TEXT PROCESSING WHEN CREATING CHATBOTS

RUS МЕТОДЫ ОБРАБОТКИ ТЕКСТА ПРИ СОЗДАНИИ ЧАТ-БОТОВ


Annotations

ENG As part of the development of a chatbot, a necessary and sufficient condition for working with text is the use of various methods of text analysis as an input element of communication with the bot and its training. The article deals with a number of solutions used for text analysis and construction of text data analysis models: lemmatization methods, text vectorization, various machine learning models. The main focus of the article is on the methods of text processing in different formats and using different technologies, which provides scalability and versatility of the proposed technology and the effectiveness of the future chatbot as a whole. The article will be interesting for programmers, text analysts and anyone interested in working with text and developing systems for working with text information.

RUS В рамках разработки чат-бота необходимым и достаточным условием работы с текстом является применение различных методик анализа текста, как входного элемента общения с ботом и его обучения. В статье был рассмотрен ряд решений, применяемых для анализа текста и построения моделей анализа текстовых данных: методы лемматизации, векторизации текста, различные модели машинного обучения. Основной упор в статье сделан на рассмотрение методики обработки текста в разном формате и с помощью разных технологий, что обеспечивает масштабируемость и универсальность предлагаемой технологии и эффективность работы будущего чат-бота в целом. Статья будет интересна для программистов, текстовых аналитиков и всех интересующихся работой с текстом и разработкой систем работы с текстовой информацией.


Full article text
24-borodin.pdf