- Linguística
- Análisis
Lingüístico - Lenguaje
- Lenguaje
Formal - Comprensión del
lenguaje - Generación de
textos - Gramáticas
Formales - Definiciones empleadas en las
gramáticas formales - Conclusiones
- Bibliografía
El tesoro más valioso de la raza humana es
el
conocimiento, es decir, la información. Existen en el mundo
volúmenes inmensos de información en forma de
lenguaje natural: los libros, los
periódicos, los informes
técnicos, etcétera. Pero la posesión
verdadera de este tesoro implica la habilidad de hacer
ciertas operaciones con
la información:
Buscar la
información necesaria,
Comparar las
fuentes
diferentes, y hacer inferencias lógicas y
conclusiones,
Manejar los
textos, por ejemplo, traducirlos a otros
idiomas.
En realidad, las computadoras
son más capaces de procesar la información que las
personas. Pueden procesar muchísimos más grandes
volúmenes de información que una persona puede
leer en su vida. A base de ésta, pueden hacer inferencias
lógicas tomando en cuenta más hechos y más
fuentes.
Todo parece estar preparado para el uso de las
computadoras para procesar volúmenes grandes de
información: los métodos
lógicos ya son muy fuertes, los procesadores muy
rápidos, muchos textos ya están disponibles en
forma digital, tanto en las casas editoriales como en Internet. El único
problema para la computadora
al procesar los textos es que simplemente ¡no los entiende!
Hasta ahora, los textos son para la computadora
solamente cadenas de letras sin cualquier sentido y no una
información útil para el razonamiento
lógico.
Para convertir la computadora en nuestro verdadero
ayudante en el procesamiento de textos, se necesita pasar un
largo camino de aprendizaje de la
estructura de
textos y de su formalización; más abajo vamos a
hablar de algunos problemas en
este camino. Pero si es tan largo el camino, ¿existe
una razón práctica para trabajar en esta
área ahora? Sí, existe, porque con cada paso
obtenemos las herramientas
que ya tienen gran valor
práctico, que ayudan en nuestras tareas
cotidianas.
Desarrollo
La Lingüística es la disciplina que
se ocupa del estudio científico del lenguaje. Dentro de la
Lingüística se pueden identificar diferentes
áreas de interés,
tales como:
- Lingüística Aplicada – aplicación
de la lingüística a áreas específicas
como la traducción, enseñanza de un segundo idioma, pronósticos, etc. - Antropología Lingüística – estudio
de las relaciones entre lenguaje y cultura. - Lingüística Computacional – procesamiento
del lenguaje natural. - Neuro-lingüística: estudio del cerebro y de su
funcionamiento en la producción, percepción y adquisición del
lenguaje. - Sociolingüística: estudio de las
relaciones entre el lenguaje
y estructuras
sociales, variación
lingüística y actitudes
hacia el lenguaje. - Psico-lingüística: estudio de la
adquisición del lenguaje. - Lingüística Teórica – análisis
lingüístico.
Cuando se hace análisis lingüístico,
se está trabajando dentro del campo de la Teoría
Lingüística o Lingüística Teórica.
Desde este punto de vista, la gramática de una lengua es una
representación explícita del conocimiento
(consciente e inconsciente) que un hablante nativo tiene de su
lengua. Una teoría lingüística debe de
proporcionar las nociones y herramientas analíticas
necesarias que nos permitan describir de manera explícita
el conocimiento.
Cuando un lingüista escribe una gramática,
este lingüista no sólo describe una lengua, sino que
también nos está diciendo algo sobre los procesos
cognoscitivos del ser humano. Por lo tanto, una teoría
lingüística debe no sólo proveer los medios para
describir gramáticas de manera explícita, sino que
debe de permitir hacer generalizaciones racionales que permitan
describir los procesos gramaticales de un lenguaje.
El análisis lingüístico consiste
en:
1. Analizar los datos existentes
y descubrir las reglas, leyes y
regularidades del lenguaje;
2. Expresar de manera formal una generalización
que describa esas reglas, leyes y regularidades de forma
racional;
La Lingüística tiene por objetivo
descubrir los métodos para describir no sólo una
lengua en concreto, sino
de cualquier lenguaje natural, es conocer con profundidad una
lengua particular, y llegar a entender la facultad humana del
lenguaje. Por lo tanto, el análisis de fenómenos
gramaticales en una lengua determinada ayuda a entender, no
sólo la lengua en cuestión, sino el proceso
cognoscitivo del hombre.
Lenguaje es el empleo de la
palabra para expresar ideas, comunicarse, establecer relaciones
entre los seres humanos. Un lenguaje es un conjunto de palabras,
su pronunciación y los métodos para combinarlas en
frases y oraciones, generalmente infinito y que se forma mediante
combinaciones de palabras definidas en un diccionario
terminológico previamente establecido. Las combinaciones
posibles deben respetar un conjunto de reglas sintácticas
establecidas, a ello se le conoce con el nombre de Sintaxis.
Además, las palabras deben tener determinado sentido,
deben ser comprendidas por un grupo humano
en un contexto dado, a ello se le denomina Semántica.
A lo largo de la historia el ser humano a
utilizado el lenguaje para trasmitir sus conocimientos,
sentimientos, emociones,
sensaciones, comunicarse con el resto de los humanos y esta
función
del lenguaje la ha desarrollado de manera oral, gráfica,
escrita o por señas.
Cuando hablamos de lenguajes se pueden diferenciar dos
clases muy bien definidas
- Los lenguajes naturales como el español, el ruso , el ingles, el
francés, etc. - Los lenguajes formales como los lenguajes de
programación, el lenguaje de la lógica
matemática, etc.
Existen muchas definiciones de lenguaje natural, una que
pudiera acercarnos a entender mejor este concepto
plantea:
Se denomina Lenguaje Natural a un lenguaje escrito o
hablado usado por una comunidad que es
precisamente lo contrario a un lenguaje para establecer comunicación con una computadora, mediante
la entrada de datos, o la programación de su funcionamiento.
(Guzmán 1997)
Los lenguajes han sufrido un largo y complejo proceso de
desarrollo
desde el surgimiento del hombre sobre la faz de la Tierra. Los
lenguajes se han desarrollado a partir de la experiencia
práctica de los diferentes grupos humanos.
La riqueza de sus componentes semánticos otorga a los
lenguajes naturales gran poder
expresivo y valor como herramienta para expresar y exteriorizar
los razonamientos más sutiles y complejos. La sintaxis de
un LN se puede modelar mediante la utilización de un
lenguaje formal. Otra propiedad
importante de los lenguajes naturales es la
poli-semántica, es decir la posibilidad de que una palabra
posea significados diferentes.
Los lenguajes naturales se caracterizan por las
propiedades siguientes:
- Han sufrido un largo y complejo proceso
histórico de perfeccionamiento previo a la
aparición de una teoría científica que
explique las leyes fundamentales de su desarrollo; - Su capacidad para expresar el pensamiento
humano en toda su complejidad y belleza; - Dificultad para lograr una formalización
científica completa; - Su capacidad para transmitir la historia, las ideas,
las costumbres, la cultura y la ciencia
de las diferentes sociedades
humanas.
La comprensión y reconocimiento del lenguaje
natural es uno de los problemas mas complejos a que se enfrenta
la Inteligencia
Artificial debido a la complejidad, irregularidad y
diversidad del lenguaje humano y a los problemas
filosóficos y psicológicos asociados al significado
de frases, oraciones y textos en su conjunto.
La concepción principal que orienta el desarrollo
de las tecnologías del habla y del lenguaje natural tiene
por objetivo estratégico lograr que la interacción con las máquinas
sea análoga a la que se ha desarrollado
históricamente en la interacción entre las
personas. En otras palabras, estratégicamente se plantea
como objetivo lograr una relación hombre/máquina
análoga a la relación hombre/hombre. En
múltiples y diversas aplicaciones el reconocimiento del
hablar y el lenguaje natural son de gran utilidad. En
ocasiones se presentan problemas en el reconocimiento y
comprensión de las expresiones orales y escritas. La
escritura, los
símbolos, las imágenes y
la voz son los medios de
comunicación fundamentales en la interacción
hombre/máquina. La experiencia practica acumulada, en el
campo del Lenguaje Natural, ha señalado la conveniencia de
orientar el reconocimiento del lenguaje natural más al
análisis de frases, oraciones y textos en su conjunto, que
al reconocimiento de palabras aisladas. En otras palabras,
priorizar el reconocimiento del sistema en su
conjunto, sobre el reconocimiento de sus partes
integrantes.
Un lenguaje formal es un lenguaje artificial o sea
creado por el hombre que
esta formado por símbolos y formulas y que tiene como
objetivo fundamental formalizar la programación de
computadoras o representar simbólicamente un
conocimiento.
Las palabras y oraciones en un lenguaje formal poseen
definición rigurosa desde el punto de vista
científico. Son utilizados para modelar teorías
científicas con la ventaja de que en estos se reduce la
ambigüedad.
En resumen las características de los lenguajes
formales son las siguientes:
- Se han desarrollado como un medio para formalizar
matemáticamente una teoría; - Su sintaxis es capaz de definir oraciones
rigurosamente definidas; - Constituyen un poderoso instrumento para la investigación y el procesamiento del
Lenguaje Natural por computadora.
Un lenguaje de
programación es un lenguaje Artificial usado para
escribir instrucciones que pueden ser traducidas a lenguaje
maquina y ejecutadas en una computadora.
Un lenguaje de programación esta formado por un
conjunto de reglas sintácticas que permiten escribir un
programa, de
forma tal que sea entendido por la computadora. Un programa es un
conjunto de instrucciones con un orden determinado que permite
realizar una tarea computacional dada.
Un lenguaje de programación se basa en dos
conceptos fundamentales:
- Sintaxis – garantiza la utilización
correcta de cada una de las expresiones de determinado lenguaje
de programación. - Semántica – garantiza que las
expresiones de un lenguaje de programación posean un
significado correcto.
Procesamiento del Lenguaje natural
El procesamiento del lenguaje es de manera general, el
conjunto de instrucciones que una computadora recibe en un
lenguaje de programación dado (formal), que le
permitirán comunicarse con un humano en su propio
lenguaje, (ingles, francés, español,
etc).
El procesamiento del lenguaje natural presenta
múltiples aplicaciones:
- Corrección de textos
- Traducción automática
- Recuperación de la
información - Extracción de Información y
Resúmenes - Búsqueda de documentos
- Sistemas Inteligentes para la
Educación y el Entrenamiento
La corrección de textos permite la
detección y corrección de errores
ortográficos y gramaticales, Para detectar este tipo de
errores, la computadora necesita entender en cierto grado el
sentido del texto. Los
correctores de gramática detectan las estructuras
incorrectas en las oraciones aunque todas las palabras en la
oración estén bien escritas en el lenguaje en
cuestión. El problema de detectar los errores de este tipo
es complejo debido a la existencia de gran variedad de
estructuras permitidas.
Para describir las estructuras de las oraciones en el
idioma, se usan las llamadas gramáticas formales, o sea
conjuntos de
reglas de combinación de palabras y su orden relativo en
las oraciones.
La traducción automática se refiere a la
traducción correcta de un lenguaje a otro, tomando en
cuenta lo que se quiere expresar en cada
oración.
En el campo de la recuperación de la
información han desarrollado sistemas que
permiten obtener información sobre estadísticas deportivas, información
turística, geografía etc.. En
lugar de buscar los documentos para encontrar en ellos la
respuesta a su pregunta, el usuario podría hacer su
pregunta a la computadora: ¿Cómo se llama el
Presidente de Francia?,
¿Cuáles son los centros más avanzados en
Procesamiento del Lenguaje Natural?, y otras.
Por otra parte Se han desarrollado sistemas con la
capacidad de crear resúmenes de documentos a partir de los
datos suministrados. Estos sistemas son capaces de realizar un
análisis detallado del contenido del texto y elaborar un
resumen.
También se han desarrollado sistemas inteligentes
que permiten modelar el comportamiento
del estudiante, reconocer y procesar sus errores, desarrollar
habilidades en la resolución de problemas y otras
actividades del proceso enseñanza y aprendizaje. En ellos
el Procesamiento del Lenguaje Natural juega un papel de relevante
importancia en la creación y desarrollo de interfaces
amigables.
Arquitectura de un sistema de Procesamiento del
Lenguaje Natural
Uno de los elementos fundamentales en el diseño
de un sistema PLN es sin lugar a dudas la determinación de
la arquitectura
del sistema, es decir, como se introducen los datos a la
computadora y como ella interpreta y analiza las oraciones que le
sean proporcionadas. A continuación se muestra un
esquema del análisis léxico/ sintáctico por
computadora. El sistema consiste de:
- El usuario le expresa (de alguna forma) a la
computadora que tipo de procesamiento desea hacer; - La computadora analiza las oraciones proporcionadas,
en el sentido morfológico y
sintáctico; - Luego, se analizan las oraciones
semánticamente, es decir se determina el significado de
cada oración; - Se realiza el análisis pragmático del
texto. Así, se obtiene una expresión
final.
Se ejecuta la expresión final y se entrega al
usuario para su consideración.
El verbo comprender, proviene del latín
comprenhendere, y significa entender, penetrar, concebir,
discernir, descifrar. Se entiende entonces por comprensión
– al conocimiento perfecto de alguna cosa; a la captación
del significado de alguna cosa o fenómeno; a la acción
de aceptar un hecho o un suceso como cierto o plausible sin lugar
a duda; a tener certeza completa del significado, naturaleza o
explicación de alguna cosa o fenómeno.
La comprensión adecuada del texto es la tarea
más importante y compleja del análisis
lingüístico.
¿Qué es comprensión del
lenguaje?
¿Cómo se puede determinar si la
computadora comprende el texto?
La comprensión del texto consiste en su
transformación en determinada representación
formal. Esta representación formal puede ser una red de conceptos, un
conjunto de predicados lógicos, etc. Ella puede usarse
posteriormente para responder preguntas, compilar
resúmenes, y otras tareas lingüísticas. En la
actualidad, los resultados prácticos alcanzados en el
área de la comprensión de texto son aun modestos.
Por ello, los científicos que trabajan en la
lingüística computacional realizan ingentes esfuerzos
en esta área del conocimiento.
Problemas en el procesamiento del lenguaje
natural
Debido a que el Procesamiento del Lenguaje Natural tiene
por objetivo fundamental la comprensión del lenguaje
natural el hecho de que se presenten en textos y expresiones
habladas elementos ambiguos constituye uno de los problemas que
se fundamentales que deben ser resueltos racionalmente. El
problema de la ambigüedad surge cuando una expresión
hablada o escrita posee más de un significado o interpretación.
Ejemplo 1
"Pedro vio a Luisa, con la
computadora"
"Pedro vio a Luisa con la
computadora"
Ejemplo 2
Otro ejemplo de ambigüedad podría estar
relacionado con las diversas alternativas de escribir la
oración:
"Determine y Analice los errores del texto con
estructuras complejas",
posiblemente, sería más correcto
escribir:
- Determine y analice los errores del texto que tiene
estructuras complejas - Determine y analice en el texto los errores que
poseen estructuras complejas - Determine y analice a través de estructuras
complejas los errores en el texto
Los problemas de ambigüedad también se
presentan en la traducción automática, la
detección y corrección de errores
ortográficos y gramaticales, etc.
Por ejemplo, para traducir las oraciones como
John took a cake from the table and ate it.
John took a cake from the table and cleaned
it.
se necesita realmente entender qué hizo John:
tomó un pastel de la mesa y ¿lo comió o la
comió? ¿lo limpió o la limpió? Al
revés, para traducir el texto Juan le dio a María
un pastel. Lo comió, hay que elegir entre las variantes He
ate it, She ate it, It ate him, She ate him, etc.
El complemento natural a la capacidad de entender el
lenguaje es el segundo componente de la
comunicación, que es la capacidad de producir el texto
o bien el habla. En cierto grado es una tarea más simple
que la comprensión, ya que por lo menos la computadora
puede elegir las expresiones que sabe producir.
Uno podría pensar que para la generación
de texto sólo es suficiente saber las reglas de
gramática, es decir, saber palabras de cuales
números, tiempos y géneros hay que usar en la
oración y en que orden ponerlas. Sin embargo, hay algunos
problemas en la generación de texto. Uno reside en la
necesidad de elegir las palabras y expresiones que «se
usan» en el contexto dado. Por ejemplo, hay que saber que
para expresar la idea ‘muy, mucho’, hay que usar
palabras diferentes: té cargado, voz alta, borracho como
una uva, trabajar duro.
El otro problema es que el texto producido con los
métodos de fuerza bruta
es aburrido, incoherente y a veces no entendible. Hay que saber
en qué ocasiones se deben usar los pronombres y en
qué otras las palabras completas, en qué ocasiones
hay que explicar, de qué se trata la oración y en
qué otras es entendible para el lector. Esto se refiere a
los métodos de la nombrada planificación textual.
El propósito del lenguaje es transferir
conocimientos de una persona a otra. El conocimiento es una
estructura compleja, multidimensional, que usualmente se
representa como una red, o grafo, de conceptos.
Pero el modo que usamos para transferir el conocimiento es
unidimensional: en cada momento sólo podemos decir un
sonido, una
letra. Entonces, el trabajo del
lenguaje es codificar el conocimiento multidimensional en una
cadena de letras, y después, en el cerebro del escuchante
o el lector, decodificar esta secuencia en el conocimiento
original.
El lenguaje es una estructura muy compleja.
Afortunadamente, el codificador y decodificador funcionan en
pasos, construyendo las estructuras más complejas de
ladrillos más simples:
Palabras de
letras,
Oraciones de
palabras,
Textos de
oraciones.
Para ver el gráfico seleccione la
opción "Descargar" del menú superior
En cierta forma un programa de PLN, simula los
mecanismos de comunicación que se establecen entre dos
humanos.
Hay una clase de
sistemas de generación de interés primario para los
Informáticos – ellos son los sistemas conocidos como
Gramáticas.
El concepto de Gramática fue originalmente
formalizado por los lingüistas en su estudio de los
lenguajes naturales
Los lingüistas tenían relación no
sólo con la definición precisa de lo que es o no es
una sentencia u oración válida de un lenguaje, sino
también de dar o suministrar descripciones estructurales
de las sentencias u oraciones
Uno de estos objetivos
estuvo relacionado con el desarrollo de una Gramática
Formal capaz de describir la lengua inglesa
Se podría pensar, que si por ejemplo, se tiene
una gramática formal para describir la lengua inglesa,
podríamos usar el computador en
los campos que necesiten una comprensión de la lengua
inglesa
Tal uso puede ser la traducción de de lenguajes o
la solución computacional de problemas de
enunciados
Hasta el momento actual, este objetivo sigue siendo en
gran parte irrealizable
Aun no se dispone de una gramática bien definida
de la lengua inglesa.
Además, existen contradicciones sobre que tipo de
gramática formal seria capaz de describir al idioma
Ingles.
Sin embargo, han sido alcanzados mejores resultados en
la descripción de los lenguajes de computación
Por ejemplo, la Forma Backus – Naur usada para
describir el lenguaje de programación ALGOL es una
"gramática de libre contexto ", esto es, un tipo de
gramática con la que tendremos relación en esta
disciplina.
Existe costumbre de realizar diagramas o
análisis (parsing) de una sentencia u oración
inglesa
Por ejemplo, la sentencia u oración :"The little
boy ran quickly "
se analiza (parsed) por medio de la notación de
que la oración consiste de:
nome (noun phrase):
"The little boy"
seguido de la frase verbal (verb phrase)
"ran quickly"
El nombre puede ser decompuesto en nombre singular "boy"
modificado por dos adjetivos:
"The" y
"little"
La frase verbal puede ser decompuesta, a su vez, en un
verbo singular
"ran"
modificado por el adverbio
"quickly"
Esta estructura de la oración es indicada en el
siguiente diagrama.
Figura Árbol Sintáctico de una
oración
Se reconoce la estructura de la sentencia u
oración como gramaticalmente correcta.
Si se tiene un conjunto completo de negras para analizar
(parsing) todas las oraciones en idioma Ingles, entonces
podríamos tener una técnica para determinar si la
oración es o no gramaticalmente correcta. Sin embargo, tal
conjunto de negras realmente no existe. En parte, esto se debe a
que no existen reglas claras y precisas para determinar lo que
constituye una oración:
<sentencia u oracion> ® < nombre> <frase
verbal>
<frase verbal> ® <adjetivo> <frase
nominativa>
<frase nominativa> ® <adjetivo> <nombre
singular>
<frase verbal> ® <verbo singular>
<adverbio>
<adjetivo> ® The
<adjetivo> ® little
<nombre singular> ® boy
<verbo singular> ® ran
<adverbio> ® quickly
La flecha indica que el elemento de la izquierda de la
flecha puede generar los elementos colocados en el lado derecho
de la flecha. Note que se ha encerrado entre corchetes los
nombres de las partes de las oraciones, tales como, nombre,
verbo, frase verbal, etc., para evitar confusión con las
palabras en Ingles y las frases "nombre", "frase verbal", etc. Se
puede notar que no es sólo posible verificar las oraciones
por su correlación gramatical, sino también es
posible generar oraciones correctas gramaticalmente. Para ello se
comienza con la cantidad <oración> y se sustituye
<oración> por <frase nominativa> seguida de
<frase verbal> . Luego se selecciona una de las dos reglas
para <frase nominativa> y se aplica, y así
sucesivamente , hasta que ninguna otra aplicación
adicional de las negras sea posible. En esta forma, un
número infinito de oraciones puede ser derivada –
esto es, cualquier oración consistente de una cadena de
ocurrencias de "the" y "little" seguido por "boy ran quickly" tal
como "little the the boy ran quickly" puede generarse. La
mayoría de las oraciones no tiene sentido, son
gramaticalmente correctas en un sentido amplio.
Definiciones
empleadas en las gramáticas formales.
Alfabeto: Un alfabeto es un conjunto arbitrario,
pero finito, de símbolos.
Por ejemplo, el código
de maquina se basa en el alfabeto binario A1={0,1};
otros ejemplos son A2{0,1,2,3,4,5,6,7,8,9},
A3{+,-,*,/,} etc.
Símbolos: Los elementos del vocabulario
(alfabeto) de un lenguaje formal se denominan símbolos; en
el caso de los lenguajes naturales los conocemos como
palabras.
Componente Léxico: las ocurrencias
múltiples de símbolos (o palabras) se denominan
componentes léxicos.
Frase: Una frase es una secuencia de
símbolos.
Gramática (sintaxis): La gramática o la
sintaxis de un lenguaje define si una secuencia arbitraria de
símbolos es correcta, es decir, si es una frase
significativa. Decimos que una frase correcta será
aceptada por el lenguaje.
Cadena: Sentencia (finita) de elementos de un cierto
conjunto (alfabeto).
Producción: Las reglas para la sustitución
de cadenas se denominan producciones.
Símbolos terminales: Son los símbolos que
realmente aparecen en una frase.
Símbolos no terminales: Los símbolos no
terminales deben ser definidos por otras producciones o reglas ;
es decir, también aparecen en el lado izquierdo de las
producciones. Los símbolos no terminales son variables
sintácticas.
Vocabulario = alfabeto: Al igual que los lenguajes
naturales, los lenguajes formales se basan en un vocabulario
específico, a saber, los elementos del
lenguaje.
Forma de Backus – Naur
La forma de Backus – Naur fue creada para definir
la estructura del lenguaje de programación
ALGOL60.
Tabla Forma Backus – Naur
|
| ||
| Símbolo | Significado | |
| "se define como" fin de definición | ||
| | "or", alternativa | ||
[x] | Una o ninguna ocurrencia de x | ||
{x} | Número arbitrario de ocurrencias x (0,1,2,…) | ||
(x | y) | Selección (x o y) | ||
|
La forma Backus – Naur es un
metalenguaje, o sea, un lenguaje con el que se pueden
describir otros lenguajes. Hay algunos dialectos de la
notación BNF. En la tabla se presentan algunos de los
símbolos más comunes de la BNF. Con esa
notación y los símbolos terminales.
T= {+,-, 0,1,2,3,4,5,6,7,8,9}
Además de los símbolos no
terminales
N= {int, unsigned_int, digit}
Podemos definir los enteros con las siguientes reglas
(producciones) BNF:
int à [+ | – ] unsigned_int
unsigned_int à digit unsigned_int
digit.
digit à 0|1|2|3|4|5|6|7|8|9|
La primera regla define un entero como un entero sin
signo mas un signo inicial. Este signo puede estar ausente o ser
"+" o "-". La segunda regla indica que la notación BNF
permite definiciones recursivas.
Existe una descripción formal de un lenguaje si
existe un número finito de reglas BNF que permiten derivar
cualquier frase del lenguaje. En este aspecto, el conjunto finito
de reglas anterior es una descripción formal del conjunto
infinito de los enteros.
El procesamiento del lenguaje natural tiene como
objetivo fundamental lograr una comunicación
maquina-humano similar a la comunicación
humano-humano.
El empleo del lenguaje le permite al hombre trasmitir
sus conocimientos, sentimientos, sensaciones, emociones, y
estados de ánimo
A lo largo de la historia los lenguajes naturales han
ido evolucionando, de forma paralela al desarrollo y evolución de la especie humana.
Han sido varios los sistemas informáticos
inteligentes que se han desarrollado que emplean el procesamiento
del lenguaje natural.
1. Adolfo
Guzmán-Arenas. Hallando los temas principales en un
artículo en español. Soluciones
Avanzadas. Vol. 5, No. 45, p. 58, No. 49, p. 66, 1997.
2. Adolfo
Guzmán-Arenas. Finding the main themes in a Spanish
document. Journal Expert Systems with Applications, Vol. 14,
No. 1/2. Jan/Feb 1998, pp. 139-148.
3. I. A. Bolshakov, A.
Gelbukh. Lexical functions in Spanish. CIC-98 – Simposium
Internacional de computación, November 11 – 13, 1998,
México
D.F., pp. 383 – 395.
4. Alexander Gelbukh.
Using a semantic network for lexical and syntactic
disambiguation. Proc. of Simposium Internacional de
Computación: Nuevas Aplicaciones e Innovaciones
Tecnológicas en Computación, November 1997,
México.
5. A.Gelbukh, I.
Bolshakov, S. Galicia-Haro. Statistics of parsing errors can help
syntactic disambiguation. CIC-98 – Simposium Internacional de
Computación, November 11 – 13, 1998, México D.F.,
pp. 405 – 515.
6. I.A. Bolshakov, A.F.
Gelbukh, S.N. Galicia-Haro. Syntactical managing patterns for the
most common Spanish verbs. CIC’97, Nuevas Aplicaciones e
Innovaciones Tecnológicas en Computación, Simposium
Internacional de Computación, 12-14 de noviembre, pp. 367
– 371, 1997, CIC, IPN, México D.F.
7. I. A. Bolshakov, A.
Gelbukh, S. Galicia Haro, M. Orozco Guzmán. Government
patterns of 670 Spanish verbs. Technical report. CIC, IPN,
1998.
8. Manuel Montes y
Gómez, Aurelio López López, Alexander
Gelbukh. Text Mining as a Social Thermometer. Text Mining
Workshop (forthcoming) at IJCAI'99, Stockholm, August,
1999.
9. A. Gelbukh, S.
Galicia-Haro, I.Bolshakov. Three dictionary-based techniques of
disambiguation. TAINA-98, International Workshop on Artificial
Intelligence, CIC-IPN, México D.F., pp. 78 –
89.
10. Adolfo Guzmán Arenas.
Colaboración Dirigida entre Agentes con Propósito.
Memorias del
Congreso Internacional de Computación CIC-99, CIC, IPN,
1999, México.
Lic Ernesto González Díaz
MsC.
Licenciado en Matemática
Master en Ciencias
Cibernéticas
Profesor de Inteligencia Artificial
Universidad de las Ciencias Informáticas La
Habana Cuba
Categoría: Informática y Computación