Triagem automatizada de manifestações de clientes/usuários: aplicação de algoritmos à classificação de mensagens
Loading...
Date
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Ministério Público Federal
Abstract
Entre as tarefas desempenhadas pelo Processamento de Linguagem Natural (PLN), está a classificação de textos por assuntos, que é uma forma de extração de informação categórica a partir de trecho de texto. Esse procedimento tem aplicações práticas, como a triagem automatizada de mensagens ou documentos. Parte da literatura científica tem-se voltado a algoritmos de aprendizagem profunda (“Deep Learning”) e, mais recentemente, aos grandes modelos de linguagem (“Large Language Models”). Algoritmos tradicionais de “Machine Learning” podem ser preferíveis em certos contextos. Este trabalho comparou alguns desses algoritmos, aplicados a uma base de mensagens extraídas de um site brasileiro de grande audiência dedicado a registrar reclamações de consumidores, a fim de prever à qual categoria de serviço ou produto o texto da reclamação se referia. Dois algoritmos se destacaram: SVM Linear e FastText, tanto pelas métricas de classificação, pelo tempo de treinamento, quanto pelo bom desempenho com vários hiperparâmetros escolhidos, incluindo seus valores padrão. Essas características fazem desses dois algoritmos uma escolha confiável para a aplicação local da classificação, e este trabalho pretendeu mostrar que é viável implementar esse processo em “hardware” mediano.
Status da norma
Description
Acesso concedido aos públicos interno e externo.