Por qué se requieren las tecnologías del lenguaje?
IMAGINE si una computadora pudiera automáticamente:
Responder el teléfono y responder a cualquier pregunta
Traducir diariamente los periódicos, blogs y sitios web, de cualquier idioma a cualquier otro … ya algo es posible …)
Entender el texto de revistas/libros para construir sistemas expertos basados en el conocimiento adquirido
Procesamiento de Lenguaje Natural (NLP)
Es un campo interdisciplinario que incorpora conocimientos de las ciencias computacionales, la inteligencia artficial y la lingüística computacional.
El NLP tiene como propósito lograr que la computadora entienda el lenguaje humano, hablado y/o escrito.
Procesamiento de Lenguaje Natural
Es importante porque:
El más grande repositorio del conocimiento humano existe en TEXTOS y sigue creciendo rápidamente.
Necesitamos de herramientas para analizar, entender y generar lenguajes humano, igual que lo hacen los humanos..
La idea es hacer que las computadoras aprendan nuestros lenguajes más que nosotros aprendamos el suyo.
Sin embargo, no es necesario entender completamente a ser útil…
emails, noticias, artículos, páginas web, reclamos de aseguradoras, documentos notariales, cartas de quejas de clientes, transcripciones de llamadas telefónicas, documentos técnicos, documentos gubernamentales, patentes, decisiones judiciales, contratos,…
¿Cómo se ubica en la taxonomía de las CC?
Ciencias Computacionales
Inteligencia Artificial
Algoritmos
Bases de datos
Redes
Robótica
Búsqueda
Procesamiento de Lenguaje Natural
Recuperación de
información
Traducción por computadora
Análisis del
Lenguaje
Semántica
Parsing
Natural Language Processing (NLP/PLN)
El ENTENDIMIENTO del Lenguaje Natural, involucra las siguientes tareas:
Mapear la entrada provista en lenguaje natural hacia representaciones útiles
Analizar los diferentes niveles del lenguaje (fonología, morfología, sintaxis, semántica y análisis del discurso).
? interpretación del
SIGNIFICADO
Niveles de Análisis del Lenguaje
Fonología
Morfología
Sintaxis
Semántica
Pragmática y
Análisis del discurso
Breve historia del PLN
60's
70's
80's
90's
2000-xx
Breve historia del PLN
60's
70's
80's
90's
2000-xx
PLN se enfocó en métodos de estados finitos y traducción automática.
Creación y uso de distintos corpora basados en documentos de texto.
Extracción y análisis de elementos lexicales relacionados con un tópico específico.
Introducción de técnicas de PLN como la teoría de la dependencia conceptual para representar conocimiento en una computadora.
Creación de métodos de estados finitos y traducción automática del lenguaje usando un enfoque de análisis sintáctico.
Breve historia del PLN : Década de 1960
60's
PLN se enfocó en métodos de estados finitos y traducción automática.
70's
80's
90's
Creación de ontologías conceptuales y diferentes técnicas de parsing
2000-xx
Breve historia del PLN
Implementación de diferentes técnicas de parsing para entender la estructura gramatical de las oraciones.
Creación de ontologías conceptuales que estructuren información del mundo real en datos entendibles a la computadora.
Creación de diferentes técnicas lógicas y de razonamiento para representar y extraer conocimiento de una computadora.
Breve historia del PLN : Década de 1970
60's
70's
80's
90's
2000-xx
Los sistemas se basaron en técnicas estadísticas y aparecieron los algoritmos de aprendizaje por computadora.
Breve historia del PLN
Creación de ontologías conceptuales y diferentes técnicas de parsing
PLN se enfocó en métodos de estados finitos y traducción automática.
Introducción de algoritmos de aprendizaje por computadora para procesamiento del lenguaje, para eliminar la dependencia de conjuntos complejos de reglas del texto manuscrito.
Uso de técnicas estadísticas que hacen decisiones probabilísticas suaves basadas en la incorporación de pesos de valor real asociados con las características lingüísticas de los datos de entrada.
Uso de algoritmos de aprendizaje supervisado.
Breve historia del PLN : Década de 1980
60's
PLN se enfocó en métodos de estados finitos y traducción automática.
70's
80's
90's
Creación de ontologías conceptuales y diferentes técnicas de parsing
2000-xx
Breve historia del PLN
Se implementan técnicas de extracción de información.
Los sistemas se basaron en técnicas estadísticas y aparecieron los algoritmos de aprendizaje por computadora.
La investigación se enfocó en algoritmos de aprendizaje no supervisado y semisupervisado.
Extracción de características lexicales sintácticas de documentos de texto.
Uso de técnicas de Recuperación de información (information retrieval IR) para extraer información relevante de la web.
Se hicieron muy populares distintas técnicas:
Named entity recognition.
Part-Of-Speech tagging.
Reconocimiento de voz (Speech recognition).
Breve historia del PLN : Década de 1990
60's
PLN se enfocó en métodos de estados finitos y Traducción Automática.
70's
80's
90's
Creación de ontologías conceptuales y diferentes técnicas de parsing
2000-xx
Breve historia del PLN
Se implementan técnicas de Extracción de información.
Tendencias y
retos
Los sistemas se basaron en técnicas estadísticas y aparecieron los algoritmos de aprendizaje por computadora.
Página siguiente |