A novel hybrid model by using convolutional neural network and long short-term memory for text sentiment analysis

Authors

  • Ma Xiaohui Author

Abstract

El aprendizaje automático se ha aplicado ampliamente en el

análisis de las emociones. Sin embargo, el lenguaje natural

tiene una relación dependiente de la estructura, confiando

en una sola red para la extracción de características, lo que

limita la precisión de la clasificación del sentido del texto. Para

extraer características semánticas y realizar la clasificación

de manera efectiva, se propuso en el estudio la red neural

convolucional y el modelo de memoria a largo plazo (CNN

LSTM). Se empleó el método Word2vec para entrenar el vector

inicial de la palabra. Se introdujeron la capa convolucional

de la CNN y la capa de agrupación máxima para extraer

las características locales del texto. Se adoptó el módulo

LSTM para capturar las dependencias a largo plazo entre

las secuencias de palabras. Las características extraídas con

el LSTM y la CNN se fusionaron, y se mejoró la eficiencia

utilizando la tecnología de regularización de la deserción.

Se realizó un estudio de caso en el conjunto de datos de la

revisión de la película para analizar el efecto de la clasificación

utilizando los métodos tradicionales y propuestos. Los

resultados demuestran que, en comparación con los modelos

únicos de CNN y LSTM, el índice de evaluación F1 de este

modelo mejora en un 1,93% y un 0,97%, respectivamente.

En comparación con el vector de características inicializadas

aleatoriamente, la precisión del modelo mejora un 2,74% por

la incrustación de palabras. El método propuesto puede recibir

la entrada paralela de la información de texto, lo que reduce

el tiempo de formación del modelo de red. El mecanismo

que combina la CNN y el LSTM compensa las deficiencias de

depender únicamente de la incrustación de palabras para la

extracción de características, lo que permite al modelo obtener

una característica de la opinión y una polaridad de la misma

efectivamente identificada sin conocimientos externos como

el análisis de sintaxis de dependencia. El método propuesto

proporciona una referencia específica para la clasificación de

las opiniones en los textos de los comentarios en los medios de

comunicación social.

Published

2024-05-24

Issue

Section

Articles