A novel hybrid model by using convolutional neural network and long short-term memory for text sentiment analysis
Abstract
El aprendizaje automático se ha aplicado ampliamente en el
análisis de las emociones. Sin embargo, el lenguaje natural
tiene una relación dependiente de la estructura, confiando
en una sola red para la extracción de características, lo que
limita la precisión de la clasificación del sentido del texto. Para
extraer características semánticas y realizar la clasificación
de manera efectiva, se propuso en el estudio la red neural
convolucional y el modelo de memoria a largo plazo (CNN
LSTM). Se empleó el método Word2vec para entrenar el vector
inicial de la palabra. Se introdujeron la capa convolucional
de la CNN y la capa de agrupación máxima para extraer
las características locales del texto. Se adoptó el módulo
LSTM para capturar las dependencias a largo plazo entre
las secuencias de palabras. Las características extraídas con
el LSTM y la CNN se fusionaron, y se mejoró la eficiencia
utilizando la tecnología de regularización de la deserción.
Se realizó un estudio de caso en el conjunto de datos de la
revisión de la película para analizar el efecto de la clasificación
utilizando los métodos tradicionales y propuestos. Los
resultados demuestran que, en comparación con los modelos
únicos de CNN y LSTM, el índice de evaluación F1 de este
modelo mejora en un 1,93% y un 0,97%, respectivamente.
En comparación con el vector de características inicializadas
aleatoriamente, la precisión del modelo mejora un 2,74% por
la incrustación de palabras. El método propuesto puede recibir
la entrada paralela de la información de texto, lo que reduce
el tiempo de formación del modelo de red. El mecanismo
que combina la CNN y el LSTM compensa las deficiencias de
depender únicamente de la incrustación de palabras para la
extracción de características, lo que permite al modelo obtener
una característica de la opinión y una polaridad de la misma
efectivamente identificada sin conocimientos externos como
el análisis de sintaxis de dependencia. El método propuesto
proporciona una referencia específica para la clasificación de
las opiniones en los textos de los comentarios en los medios de
comunicación social.