El lenguaje natural es el lenguaje hablado y escrito por humanos para comunicarse entre ellos, El termino lenguaje natural se refiere al estudio de las propiedades computacionales y de otro tipo, implicadas en la compresión, producción y eso de lenguas naturales.

El procesamiento de lenguaje natural, es una subdisciplina de la Inteligencia Artificial, que empezó sobre los años 40, mucho antes que se acuñara el termino Inteligencia Artificial, pero los primeros intentos debido a que los ordenadores no eran suficientemente potentes ni las técnicas lingüísticas, fue un fracaso. En los sesenta y setenta la cosa mejoro, pero fue a finales de los ochenta y principios de los noventa donde se vio el resurgimiento de la investigación de la traducción automática.

Para mi la mejor herramienta para empezar con el lenguaje natural es empezar por NLTK, Natural Language ToolKit, software open source en constante evolución. Esta desarrollado en python. Clickeando en este enlace http://www.nltk.org/download , podréis bajaros la ultima versión e instalad la. Después id al IDLE de python y escribid esto:

>>> import nltk
>>> nltk.download()


Una nueva ventana se abrirá, mostrando el instalador de NLTK, en la pestaña Collections podreis elegir que paquete instalar. El paquete más pequeño es el paquete book, que esta preparado para seguir todos los ejemplos del libro que existe sobre el tema, son unos 100 megas. Yo recomiendo que os bajeis el de All, que baja todo lo que existe.

Para probar que todo va bien escribid:

>>> import nltk.book import *

Os saldrá un listado de textos ya precargados en memoria listos para probar.

En el próximo capitulo os contare comandos con los que hacer cosas con esos textos.




0 comentarios:

Publicar un comentario

About Me

Seguidores