| 1. Introducción.
Los lenguajes documentales aparecen
como una necesidad para estructurar el pensamiento, agrupando
y asociando cada documento a una lista clasificatoria, o bien
mostrando el contenido, sobre todo a través de resúmenes o
palabras claves.
En el comienzo, los lenguajes
documentales se presentaron como sistemas clasificatorios.
Algunos teóricos de la documentación consideran que el primer
sistema clasificatorio fue el realizado por Brunet en 1804,
aunque terminó por imponerse la Clasificación Decimal de Dewey.
Melvil Dewey, en 1876, clasificó y dividió el pensamiento
en varias clases y a cada una de estas las volvió a dividir
y subdividir sucesivamente, dando origen de esta manera a
una Clasificación Decimal.
El Instituto Internacional de Bibliografía adoptó este sistema,
publicando en 1905 la primera edición internacional. Con posterioridad,
la federación Internacional de Documentación realizó varias
modificaciones hasta que se constituyó la CLASIFICACIÓN DECIMAL
UNIVERSAL.
2. Concepto
de lenguaje documental.
El lenguaje documental es un
sistema convencional que utiliza una unidad de información
para describir el contenido de los documentos, con miras a
su almacenamiento y recuperación.
Por regla general, un documento trata de más de una noción,
más de un contenido.
El lenguaje documental (AMAT):
"es un conjunto de términos o procedimientos sintácticos
(frases nominales) y convencionales utilizados para representar
el contenido de un documento, con el fin de permitir su recuperación.
Se le denomina también lenguaje de indización".
Es, por tanto, un lenguaje artificial
para diferenciarlo del lenguaje natural, aunque en algunos
casos se empleen los mismos términos.
Lenguaje documental, según Inocencia
Soria, de la Unidad Coordinadora de Bibliotecas del CSIC:
"es el sistema convencional creado para poder expresar
el contenido de los documentos sin los impedimentos del lenguaje
natural. Simplifica el lenguaje común utilizando sólo una
pequeña parte del léxico, algunas formas y poco o casi nada
de gramática. Los lenguajes documentales pueden consistir
simplemente en una lista de palabras admitidas aunque lo más
frecuente es que consten de un sistema estructurado que relacione
sus distintos términos".
Cuando se incluyen relaciones
sintácticas permiten recuperar la información de términos
relacionados. Si son relaciones jerárquicas como las
que se encuentran en las clasificaciones enciclopédicas, alfabéticos
de materias y tesauros, permiten respetar el nivel específico
del texto, es decir, contemplar los términos en su profundidad.
Para Coll-Vinent y Bernal Cruz:
Lenguaje natural:
es aquel en el que están escritos todos los documentos primarios
sometidos al análisis documental.
Es también el lenguaje hablado y el que se emplea en todas
las informaciones originales, sea cual sea su soporte.
Lenguaje artificial o convencional: es un lenguaje estructurado
con un propósito particular y con unas características que
le son propias.
Para ellos, el lenguaje documental: es el lenguaje convencional
que apunta a la descripción del contenido de un documento
primario en orden a su almacenamiento y ulterior recuperación.
Es, además, un lenguaje
que produce la transformación de un texto original en otro
distinto mucho más breve, en el que queda fielmente representado.
En resumen: el lenguaje documental
actúa como vehículo de comunicación entre el contenido del
documento y el usuario y con él se pretende reducir y, a ser
posible, evitar la multiplicidad de sentidos que tiene el
lenguaje natural.
2.1 Diferencias entre
lenguajes documentales y lenguajes naturales.
Si el lenguaje natural
se usa para la comunicación inmediata, esta que realizamos
ahora mismo; el lenguaje documental se emplea para
conseguir una comunicación, que es primordialmente un medio,
un código unívoco y estereotipado, controlado y no libre,
normalizado y no arbitrario.
En el lenguaje natural coexisten diferentes significados
para un solo significante o diversos significantes sinónimos.
Por el contrario, el lenguaje documental ejerce un
control léxico que impide la utilización de distintos significantes
libres para un mismo significado con el objeto de sobrevivir
dentro de un código normalizado.
3. Funciones del
lenguaje documental.
El lenguaje documental sirve
como elemento aglutinador de todos los trabajos que se lleven
a cabo en el proceso documental. Así, puede considerarse la
expresión lenguaje natural como sinónimo de discurso común,
el lenguaje normalmente usado en la escritura y la conversación.
Pero, en el contexto de la recuperación de la información,
la expresión usualmente se refiere a las palabras que ocurren
en los textos impresos y "texto libre" hay que considerarlo
como sinónimo.
El lenguaje documental ha de
precisar cada uno de los diferentes encuadres que presenta
el documento para facilitar la recuperación. Se trata de un
lenguaje que recoge los elementos más importantes cuando se
está elaborando el análisis y los aplica para hacer efectiva
la recuperación.
Sin embargo, existen una serie
de problemas:
• Las palabras contienen varios
significados
• Las traducciones de otros idiomas
• Los nuevos términos que se introducen
• Las especificaciones técnicas resultan para la mayoría
de los usuarios incomprensibles.
• La forma en que se presentan los nuevos documentos, avalados
por unas tecnologías que no disponen de aspectos comunes
adaptados internacionalmente
• El desacuerdo entre los documentalistas a la hora de aplicar
los diferentes lenguajes.
Para Blanca Gil, otra de las
funciones pasa por una normalización y una inducción: "El
lenguaje documental tiene capacidad para representar los mensajes
contenidos en los documentos, lo que permite cumplir dos objetivos
fundamentales: el de normalización y el de inducción, estando
encaminadas a éste último todas las demás funciones que desempeña
a lo largo del proceso documental".
El objetivo básico de un lenguaje
documental es suministrar los conceptos que aporta cada palabra,
una vez efectuado el análisis. Se trata de reducir los términos
que aporta el lenguaje documental, como precisa Blanca Gil:
"El lenguaje documental reduce considerablemente el
volumen de términos del lenguaje natural no tomando en consideración
más que los sustantivos o los sintagmas nominales".
4.Tipología de lenguajes
documentales.
Hay diversas formas de tipificar
los lenguajes documentales; sin embargo, las más usadas son:
4.1. Dependiendo
del control ejercido sobre el vocabulario.
4.1.1 Lenguajes controlados (Clasificaciones, tesauros.etc):
aquellos que han establecido una lista de descriptores antes
de proceder al análisis documental. Esta es cerrada y nominativa.
Define todos los términos y únicamente aquellos que se pueden
utilizar para presentar el contenido de un documento. La
búsqueda y recuperación es más rápida y eficaz.
4.1.2 Lenguajes libres (Listas
de descriptores libres). Al contrario, cuando se trabaja
con un vocabulario o lenguaje libre no se conocen
a priori listas de términos autorizados. Basta con extraer
de los documentos los términos más apropiados. La búsqueda
es más lenta y menos eficaz.
De todas formas, hay que señalar
que ningún lenguaje es completamente puro, ninguno es pre
o poscoordinado, libre o controlado.
4.2. De acuerdo
con la coordinación de términos.
4.2.1 Lenguajes Precoordinados (clasificaciones, listas
de encabezamiento de materias): aquellos que coordinan los
diferentes conceptos que forman un tema, antes de memorizar
los documentos. Son lenguajes utilizados en bibliotecas:
sistemas de clasificación y listas tradicionales de alfabéticos
de materias. Permiten pocos términos de indización por documento
4.2.2 Lenguajes Poscoordinados
(Listas de descriptores libres, listas de palabras claves,
tesauros): los que permiten yuxtaponer los conceptos en
el momento del análisis, de manera que se pueda coordinar
después del almacenamiento. Hay que recordar siempre
que en los lenguajes postcoordinados es necesaria la utilización
de ficheros suplementarios, llamados también ficheros inversos.
En resumen:
La precoordinación permite pocos términos de indización
por documento, pero proporciona en una sola búsqueda los
elementos esenciales de la información.
La poscoordinación permite utilizar un gran número
de vías de acceso a los documentos, pero teniendo como intermediario
ficheros especiales que necesitan una búsqueda en dos tiempos;
primero la identificación de los documentos pertinentes
y después su localización.
4.3. De acuerdo
con su estructura.
4.3.1 Lenguajes de estructura jerárquica o clasificatoria
(clasificaciones jerárquicas) aquellos que siguen un orden
lógico que agrupa y aproxima los conceptos más sencillos
o específicos dentro de los conceptos más generales. Este
tipo de lenguaje se puede emplear para localizar un documento,
pero no para indizar con profundidad.
Se establece una clasificación sistemática lineal, en la
cual los conceptos se encuentran ordenados siguiendo una
jerarquía natural, definida por el estado de los conocimientos
en el momento en que ha sido elaborada.
Cada concepto de estas estructuras jerárquicas se halla
representado por un símbolo numérico, alfabético o alfanumérico
que indica la situación de cada materia.
Los lenguajes de estructura
jerárquica se dividen en:
4.3.1.1 Clasificaciones enciclopédicas:
• Permiten la organización
de documentos que tratan sobre cualquier materia: son
de ámbito universal y multidisciplinario.
• Presentan dos inconvenientes: el objetivo de su universalidad
limita la descripción de un documento especializado y
su rigidez dificulta una puesta al día ágil y rápida.
4.3.1.1.1 Clasificación
de Dewey (1876): divide el
conjunto de los conocimientos en 9 clases principales, designadas
en números arábigos del 1 al 9, reservando el 0 para las
generalidades. Cada clase se subdivide sucesivamente en
10 subclases y así sucesivamente, con números que se dividen
en grupos de tres por medio de puntos para hacer más fácil
la lectura.
4.3.1.1.2 Clasificación expansiva de Cutter (1891):
se compone de 7 tablas o esquemas, cada una de los cuales
incluye la totalidad de los conocimientos, pero con una
complejidad progresiva.
4.3.1.1.3 Clasificación de la Libray
of Congress (LCC 1897): cuenta con 21 clases principales,
tomadas del sistema de Cutter, que designa con otras tantas
letras mayúsculas, dejando las restantes para futuras ampliaciones.
4.3.1.1.4 Clasificación bibliográfica de Bliss (1935):
está formada por 4 esquemas generales que son filosofía,
ciencias zoológicas, físico y social que se dividen en un
total de 26 clases principales. Es muy similar a las facetadas.
4.3.1.5 Clasificación Decimal Universal (CDU 1905):
es una ampliación de la clasificación decimal de Melvil
Dewey (se basa en su quinta edición). Es numérica hasta
cierto punto, precoordinada, universal, multidimensional
y arborescente. Está agrupada en 10 clases, reducidas
a 9 por la fusión de lingüística, filología y literatura,
dejando la clase 4 vacía. Cada una de ellas se subdivide.
0 generalidades. 1 Filosofía. 2 Religión. Teología.
3. Ciencias Sociales. Estadística. Política. Economía. Derecho.
Administración. Asistencia social. Seguros. Educación. Etnología.
4 sin ocupar. 5 Ciencias puras. Ciencias exactas y naturales.
6 Ciencias aplicadas. Medicina. Técnica. 7 Arte. Artes industriales.
Fotografía. Música. Juegos. Deportes. 8 Lingüística. Filología.
Literatura. Crítica literaria. 9 Arqueología. Prehistoria.
Geografía. Biografía. Genealogía. Historia.
La tarea de actualizar la CDU está encomendada a la FID
(Federación Internacional de Documentación), si bien como
señala Inocencia Soria: "En 1992 se constituyó
el consorcio CDU, que asumió las responsabilidades que antes
tuviera la FID sobre su edición, actualización, versiones,
etc. Este consorcio, cuyos socios fundadores son Bélgica,
España, Holanda, Japón, Reino Unido y la propia FID, se
comprometió a organizar y mantener la CDU y sus esfuerzos
ya han dado algunos importantes frutos: se ha creado un
fichero informático con más de 60.000 entradas que está
sirviendo de base para facilitar su manejo y actualización".
4.3.1.2 Clasificaciones especializadas:
Son instrumentos de indización que abarcan disciplinas o
campos especializados (medicina, derecho, economía, etc.)
que no quedarían profunda y ampliamente representados en
una estructura jerárquica de ámbito universal y multidisciplinario.
Por ejemplo, la mayoría de las bases de datos disponen de
este tipo de clasificaciones.
4.3.1.3 Clasificaciones de
facetas: Son de origen enciclopédico, pero su organización
permite construir áreas concretas de los conocimientos,
ya que faceta es cada uno de los aspectos o puntos de vista
que pueden incluirse en un área concreta. Se basan en:
4.3.1.3.1 Clasificación colonada de S.R. Ranganathan
(1933): Se llama colonada porque utiliza el colon como
único signo de síntesis. No es, por tanto, una división
lineal y jerárquica como el resto sino la aplicación que
tienen algunas materias para descomponerlas. Son muchas
su características, pero en el campo de la biblioteconomía
se reducen a cinco: personalidad, materia, energía, espacio
y tiempo. Sin embargo, tiene subdivisiones de lengua, geografía,
cronología, etc.
4.3.2 Lenguajes de estructura
asociativa (Léxicos documentales, tesauros): aquellos que
se organizan por orden alfabético en términos que expresan
los conceptos retenidos durante la indización. Los términos
o descriptores se combinan libremente entre sí sin quedar
sujetos a una posición determinada del lenguaje, según las
necesidades de los documentos. Esta estructura proporciona
un acceso más inmediato a la información, pero tiende a
dispersar los términos parecidos.
Los lenguajes de estructura
asociativa se dividen en:
4.3.2.1 Alfabético de materia:
Se organizan alfabetizando encabezamientos de palabras
o grupos de palabras que expresan conceptos. Tienen como
requisito la uniformidad de los términos empleados, estableciendo
un juego de referencias cuando sea necesario para relacionar,
completar o no marginar temas. Utilizan un lenguaje precoordinado
y un vocabulario controlado.
4.3.2.2 Uniterms: Se caracteriza por corresponder a una
estructura asociativa alfabética, pero cada término (uniterm)
representa una palabra-clave sin determinar el nivel que
hay de asociación.
4.3.2.3 Descriptores: Un término o grupo de términos que
representan un concepto preciso.
4.3.2.4 Índices permutados: se permuta en forma circular
todas las palabras del texto o del título para distinguir
la palabra que se utiliza como descriptor.
4.3.2.4.1 Índices KWIC (Key word in context):
se recoge cada palabra significativa del texto o título
en una lista alfabética, de tal manera que están las más
significativas. Y de ellas se elige la que aparece siempre
en el mismo lugar: el centro.
4.3.2.4.2 Índices KWOC (Key word out of context):
Se buscan de la misma forma, pero se obtendrán aquellas
palabras que sobresalgan fuera del título.
4.3.2.4.3 Otros índices: Cruzados, Acumulativos e Índices
de citas.
Bibliografía:
Amat Noguera, Nuria. Documentación científica y nuevas
tecnologías de la Información. Madrid: Pirámide, 1989.
Véase especialmente el capítulo 5: Lenguajes documentales
y Thesaurus, p. 189-234, de donde se han obtenido las principales
aportaciones de este tema.
Véase además:
Chaumier, J.: Análisis y lenguajes documentales: el tratamiento
lingüistico de la información. Barcelona: Mitre, 1986.
Currás, Emilia. Thesaurus, lenguajes terminológicos.
Madrid: Paraninfo, 1991.
Díez Carrera, C.: Técnicas y régimen de uso de la CDU.
Gijón: Trea, 1999.
García Gutiérrez, Antonio. Lingüística documental: aplicación
a la documentación de la comunicación social. Barcelona:
Mitre, 1984.
Gil Urdiciain, Blanca. Manual de lenguajes documentales.
Madrid: Noesis, 1996.
Gleyze, A. : Pour une méthode d'indexation alphabétique
de matières. Villeurbanne: E.N.S.B., 1983.
Lancaster, F.W.: El control del vocabulario en la recuperación
de información. Valencia: Universitat de Valencia, 1995.
López-Huertas Pérez, Mª. J.: Lenguajes documentales: aproximación
a la evolución histórica de un concepto. En: Boletín
de la ANABAD, XLI (1991), núm. 1, enero-marzo., p.61-70.
López-Huertas Pérez, Mª. J.: Lenguajes documentales: terminología
para un concepto. En: Boletín de la ANABAD, XLI
(1991), núm. 2, abril-junio, p.171-188.
López Yepes, José (Comp.). Manual de información y documentación.
Madrid: Pirámide, 1996.
Maltese, D.: Elementi di indicizzazione per sogetto.
Milan: Bibliografica, 1982.
Maniez, J.: Los lenguajes documentales y de clasificación:
concepción, construcción y utilización en los sistemas documentales.
Madrid: Fundación Germán Sánchez Ruipérez, 1992.
Pinto, María. Manual de clasificación documental.
Madrid: Síntesis, 1997.
Soria González, Inocencia. La organización de la información,
los lenguajes documentales y la normalización. Consejo
Superior de Investigaciones Científicas.
Van Slype, G.: Los lenguajes de indización. Madrid:
Fundación Germán Sánchez Ruipérez, 1991.
|