Análise de sentimentos em comentários de vídeos do YouTube utilizando aprendizagem de máquinas supervisionada

Autores

  • Alexandre Ribeiro Afonso
  • Cláudio Gottschalg Duque UFMG

Resumo

O artigo descreve um conjunto de três experimentos em análise de sentimentos, especificamente, para comentários textuais em português brasileiro e para um vídeo do YouTube. Utiliza-se o pacote de mineração de dados Weka para filtragem e um classificador baseado em aprendizagem de máquinas supervisionada (SMO). Os experimentos diferenciam-se pelo corpus a classificar: o primeiro utiliza três classes de polaridade (positiva, negativa e neutra), o segundo e o terceiro experimentos trabalham com duas classes (negativa e não negativa). No terceiro experimento são selecionadas somente postagens que comentam uma entidade (referente) específica. Os resultados de Acurácia e Medida-F Média são consideravelmente melhores para os experimentos contendo duas classes. O terceiro experimento atinge valores em volta de 81% para as duas medidas citadas, e sugere que quanto mais entidades são comentadas nos discursos do corpus, mais difícil seria a classificação de polaridades.

Palavras-chave: Análise de sentimentos. YouTube. Português brasileiro. Aprendizagem de máquinas.

Link: http://revista.ibict.br/ciinf/article/download/4315/4287

Downloads

Não há dados estatísticos.

Biografia do Autor

Alexandre Ribeiro Afonso

Doutorado em Ciência da Informação, sendo o mestrado e a graduação em Computação. No doutorado foi desenvolvido um sistema com cerca de 4.500 linhas de código, para indexar (selecionar termos-chave) a partir de artigos científicos em português e agrupar esses artigos pela similaridade dos índices gerados. Tenho pesquisado sobre Mídias Sociais Digitais; Mineração de Dados, Opiniões e Textos; Recuperação da Informação; Inteligência Computacional e Processamento de Linguagem Natural. Tanto a descrição de aspectos linguísticos e informacionais de vários tipos de texto (jurídicos, científicos e informais), como o desenvolvimento de software que processa a língua portuguesa têm sido enfoques de pesquisa. Participante do grupo de pesquisa interinstitucional: Research Expert Group for Intelligent Information in Multimodal Environment using Natural language Technologies and Ontologies (R.E.G.I.I.M.E.N.T.O.). Consultor na área de desenvolvimento de sistemas em JAVA e na resolução de problemas evolvendo Processamento de Linguagem Natural.

Cláudio Gottschalg Duque, UFMG

Doutor em Ciência da Informação pela Universidade Federal de Minas Gerais (UFMG) - Belo Horizonte,
MG - Brasil. Líder do grupo de pesquisa Research Expert Group for Intelligent Information in Multimodal
Environment using Natural language Technologies and Ontologies (R.E.G.I.I.M.E.N.T.O.).

Publicado

2020-03-29

Edição

Seção

Resumos de artigos científicos