Las pruebas de las redes neuronales variarán en el pre-procesamiento de los datos:
- Normalización de texto:
- Se incluyen pruebas eliminando (al máximo posible) los errores de ortografía, lematización de los verbos, eliminación de abreviaturas, etc.
- Eliminación de palabras frecuentes:
- Quitar las palabras que frecuentemente se utilizan en el español y que no aporten información sustancial al contexto del mensaje, se encontró una lista de palabras frecuentes en: http://corpus.rae.es/creanet.html
- Estandarización de los datos de entrada:
- Se sigue tratando con la manera de introducir los valores a la red neuronal, se había pensado en utilizar una función de mapeo directo como una tabla hash pero se están analizando las posibles implicaciones.
No comments:
Post a Comment