1.
Introducción.
Los lenguajes
documentales aparecen como una necesidad para estructurar
el pensamiento, agrupando y asociando cada documento a una
lista clasificatoria, o bien mostrando el contenido, sobre
todo a través de resúmenes o palabras claves.
En el comienzo,
los lenguajes documentales se presentaron como sistemas
clasificatorios. Algunos teóricos de la documentación consideran
que el primer sistema clasificatorio fue el realizado por
Brunet en 1804, aunque terminó por imponerse la Clasificación
Decimal de Dewey.
Melvil Dewey, en 1876, clasificó y dividió el pensamiento
en varias clases y a cada una de estas las volvió a dividir
y subdividir sucesivamente, dando origen de esta manera
a una Clasificación Decimal.
El Instituto Internacional de Bibliografía adoptó este sistema,
publicando en 1905 la primera edición internacional. Con
posterioridad, la federación Internacional de Documentación
realizó varias modificaciones hasta que se constituyó la
CLASIFICACIÓN DECIMAL UNIVERSAL.
2.
Concepto de lenguaje documental.
El lenguaje documental
es un sistema convencional que utiliza una unidad de información
para describir el contenido de los documentos, con miras
a su almacenamiento y recuperación.
Por regla general, un documento trata de más de una noción,
más de un contenido.
El lenguaje documental
(AMAT): "es un conjunto de términos o procedimientos
sintácticos (frases nominales) y convencionales utilizados
para representar el contenido de un documento, con el fin
de permitir su recuperación. Se le denomina también lenguaje
de indización".
Es, por tanto,
un lenguaje artificial para diferenciarlo del lenguaje natural,
aunque en algunos casos se empleen los mismos términos.
Lenguaje documental,
según Inocencia Soria, de la Unidad Coordinadora de Bibliotecas
del CSIC: "es el sistema convencional creado para
poder expresar el contenido de los documentos sin los impedimentos
del lenguaje natural. Simplifica el lenguaje común utilizando
sólo una pequeña parte del léxico, algunas formas y poco
o casi nada de gramática. Los lenguajes documentales pueden
consistir simplemente en una lista de palabras admitidas
aunque lo más frecuente es que consten de un sistema estructurado
que relacione sus distintos términos".
Cuando se incluyen
relaciones sintácticas permiten recuperar la información
de términos relacionados. Si son relaciones jerárquicas
como las que se encuentran en las clasificaciones enciclopédicas,
alfabéticos de materias y tesauros, permiten respetar el
nivel específico del texto, es decir, contemplar los términos
en su profundidad.
Para Coll-Vinent
y Bernal Cruz:
Lenguaje
natural: es aquel en el que están escritos todos los documentos
primarios sometidos al análisis documental.
Es también el lenguaje hablado y el que se emplea en
todas las informaciones originales, sea cual sea su soporte.
Lenguaje artificial o convencional: es un lenguaje estructurado
con un propósito particular y con unas características que
le son propias.
Para ellos, el lenguaje documental: es el lenguaje convencional
que apunta a la descripción del contenido de un documento
primario en orden a su almacenamiento y ulterior recuperación.
Es, además, un lenguaje
que produce la transformación de un texto original en otro
distinto mucho más breve, en el que queda fielmente representado.
En resumen:
el lenguaje documental actúa como vehículo de comunicación
entre el contenido del documento y el usuario y con él se
pretende reducir y, a ser posible, evitar la multiplicidad
de sentidos que tiene el lenguaje natural.
2.1
Diferencias entre lenguajes documentales y lenguajes naturales.
Si el lenguaje
natural se usa para la comunicación inmediata, esta
que realizamos ahora mismo; el lenguaje documental
se emplea para conseguir una comunicación, que es primordialmente
un medio, un código unívoco y estereotipado, controlado
y no libre, normalizado y no arbitrario.
En el lenguaje natural coexisten diferentes significados
para un solo significante o diversos significantes sinónimos.
Por el contrario, el lenguaje documental ejerce un
control léxico que impide la utilización de distintos significantes
libres para un mismo significado con el objeto de sobrevivir
dentro de un código normalizado.
3.
Funciones del lenguaje documental.
El lenguaje documental
sirve como elemento aglutinador de todos los trabajos que
se lleven a cabo en el proceso documental. Así, puede considerarse
la expresión lenguaje natural como sinónimo de discurso
común, el lenguaje normalmente usado en la escritura y la
conversación. Pero, en el contexto de la recuperación de
la información, la expresión usualmente se refiere a las
palabras que ocurren en los textos impresos y "texto
libre" hay que considerarlo como sinónimo.
El lenguaje documental
ha de precisar cada uno de los diferentes encuadres que
presenta el documento para facilitar la recuperación. Se
trata de un lenguaje que recoge los elementos más importantes
cuando se está elaborando el análisis y los aplica para
hacer efectiva la recuperación.
Sin embargo,
existen una serie de problemas:
• Las palabras
contienen varios significados
• Las traducciones de otros idiomas
• Los nuevos términos que se introducen
• Las especificaciones técnicas resultan para la mayoría
de los usuarios incomprensibles.
• La forma en que se presentan los nuevos documentos,
avalados por unas tecnologías que no disponen de aspectos
comunes adaptados internacionalmente
• El desacuerdo entre los documentalistas a la hora de
aplicar los diferentes lenguajes.
Para Blanca Gil,
otra de las funciones pasa por una normalización y una inducción:
"El lenguaje documental tiene capacidad para representar
los mensajes contenidos en los documentos, lo que permite
cumplir dos objetivos fundamentales: el de normalización
y el de inducción, estando encaminadas a éste último todas
las demás funciones que desempeña a lo largo del proceso
documental".
El objetivo básico
de un lenguaje documental es suministrar los conceptos que
aporta cada palabra, una vez efectuado el análisis. Se trata
de reducir los términos que aporta el lenguaje documental,
como precisa Blanca Gil: "El lenguaje documental
reduce considerablemente el volumen de términos del lenguaje
natural no tomando en consideración más que los sustantivos
o los sintagmas nominales".
4.Tipología
de lenguajes documentales.
Hay diversas
formas de tipificar los lenguajes documentales; sin embargo,
las más usadas son:
4.1.
Dependiendo del control ejercido sobre el vocabulario.
4.1.1 Lenguajes controlados (Clasificaciones, tesauros.etc):
aquellos que han establecido una lista de descriptores
antes de proceder al análisis documental. Esta es cerrada
y nominativa. Define todos los términos y únicamente aquellos
que se pueden utilizar para presentar el contenido de
un documento. La búsqueda y recuperación es más rápida
y eficaz.
4.1.2 Lenguajes
libres (Listas de descriptores libres). Al contrario,
cuando se trabaja con un vocabulario o lenguaje libre
no se conocen a priori listas de términos autorizados.
Basta con extraer de los documentos los términos más apropiados.
La búsqueda es más lenta y menos eficaz.
De todas formas,
hay que señalar que ningún lenguaje es completamente puro,
ninguno es pre o poscoordinado, libre o controlado.
4.2.
De acuerdo con la coordinación de términos.
4.2.1 Lenguajes Precoordinados (clasificaciones, listas
de encabezamiento de materias): aquellos que coordinan
los diferentes conceptos que forman un tema, antes de
memorizar los documentos. Son lenguajes utilizados en
bibliotecas: sistemas de clasificación y listas tradicionales
de alfabéticos de materias. Permiten pocos términos de
indización por documento
4.2.2 Lenguajes
Poscoordinados (Listas de descriptores libres, listas
de palabras claves, tesauros): los que permiten yuxtaponer
los conceptos en el momento del análisis, de manera que
se pueda coordinar después del almacenamiento. Hay
que recordar siempre que en los lenguajes postcoordinados
es necesaria la utilización de ficheros suplementarios,
llamados también ficheros inversos.
En resumen:
La precoordinación permite pocos términos de indización
por documento, pero proporciona en una sola búsqueda los
elementos esenciales de la información.
La poscoordinación permite utilizar un gran número
de vías de acceso a los documentos, pero teniendo como
intermediario ficheros especiales que necesitan una búsqueda
en dos tiempos; primero la identificación de los documentos
pertinentes y después su localización.
4.3.
De acuerdo con su estructura.
4.3.1 Lenguajes de estructura jerárquica o clasificatoria
(clasificaciones jerárquicas) aquellos que siguen un orden
lógico que agrupa y aproxima los conceptos más sencillos
o específicos dentro de los conceptos más generales. Este
tipo de lenguaje se puede emplear para localizar un documento,
pero no para indizar con profundidad.
Se establece una clasificación sistemática lineal, en
la cual los conceptos se encuentran ordenados siguiendo
una jerarquía natural, definida por el estado de los conocimientos
en el momento en que ha sido elaborada.
Cada concepto de estas estructuras jerárquicas se halla
representado por un símbolo numérico, alfabético o alfanumérico
que indica la situación de cada materia.
Los lenguajes
de estructura jerárquica se dividen en:
4.3.1.1 Clasificaciones enciclopédicas:
• Permiten
la organización de documentos que tratan sobre cualquier
materia: son de ámbito universal y multidisciplinario.
• Presentan dos inconvenientes: el objetivo de su universalidad
limita la descripción de un documento especializado
y su rigidez dificulta una puesta al día ágil y rápida.
4.3.1.1.1
Clasificación de Dewey (1876):
divide el conjunto de los conocimientos en 9 clases principales,
designadas en números arábigos del 1 al 9, reservando
el 0 para las generalidades. Cada clase se subdivide sucesivamente
en 10 subclases y así sucesivamente, con números que se
dividen en grupos de tres por medio de puntos para hacer
más fácil la lectura.
4.3.1.1.2 Clasificación expansiva de Cutter (1891):
se compone de 7 tablas o esquemas, cada una de los cuales
incluye la totalidad de los conocimientos, pero con una
complejidad progresiva.
4.3.1.1.3 Clasificación de la Libray
of Congress (LCC 1897): cuenta con 21 clases principales,
tomadas del sistema de Cutter, que designa con otras tantas
letras mayúsculas, dejando las restantes para futuras
ampliaciones.
4.3.1.1.4 Clasificación bibliográfica de Bliss (1935):
está formada por 4 esquemas generales que son filosofía,
ciencias zoológicas, físico y social que se dividen en
un total de 26 clases principales. Es muy similar a las
facetadas.
4.3.1.5 Clasificación Decimal Universal (CDU 1905):
es una ampliación de la clasificación decimal de Melvil
Dewey (se basa en su quinta edición). Es numérica hasta
cierto punto, precoordinada, universal, multidimensional
y arborescente. Está agrupada en 10 clases, reducidas
a 9 por la fusión de lingüística, filología y literatura,
dejando la clase 4 vacía. Cada una de ellas se subdivide.
0 generalidades. 1 Filosofía. 2 Religión. Teología.
3. Ciencias Sociales. Estadística. Política. Economía.
Derecho. Administración. Asistencia social. Seguros. Educación.
Etnología. 4 sin ocupar. 5 Ciencias puras. Ciencias exactas
y naturales. 6 Ciencias aplicadas. Medicina. Técnica.
7 Arte. Artes industriales. Fotografía. Música. Juegos.
Deportes. 8 Lingüística. Filología. Literatura. Crítica
literaria. 9 Arqueología. Prehistoria. Geografía. Biografía.
Genealogía. Historia.
La tarea de actualizar la CDU está encomendada a la FID
(Federación Internacional de Documentación), si bien como
señala Inocencia Soria: "En 1992 se constituyó
el consorcio CDU, que asumió las responsabilidades que
antes tuviera la FID sobre su edición, actualización,
versiones, etc. Este consorcio, cuyos socios fundadores
son Bélgica, España, Holanda, Japón, Reino Unido y la
propia FID, se comprometió a organizar y mantener la CDU
y sus esfuerzos ya han dado algunos importantes frutos:
se ha creado un fichero informático con más de 60.000
entradas que está sirviendo de base para facilitar su
manejo y actualización".
4.3.1.2 Clasificaciones
especializadas: Son instrumentos de indización que abarcan
disciplinas o campos especializados (medicina, derecho,
economía, etc.) que no quedarían profunda y ampliamente
representados en una estructura jerárquica de ámbito universal
y multidisciplinario. Por ejemplo, la mayoría de las bases
de datos disponen de este tipo de clasificaciones.
4.3.1.3 Clasificaciones
de facetas: Son de origen enciclopédico, pero su organización
permite construir áreas concretas de los conocimientos,
ya que faceta es cada uno de los aspectos o puntos de
vista que pueden incluirse en un área concreta. Se basan
en:
4.3.1.3.1 Clasificación colonada de S.R. Ranganathan
(1933): Se llama colonada porque utiliza el colon
como único signo de síntesis. No es, por tanto, una división
lineal y jerárquica como el resto sino la aplicación que
tienen algunas materias para descomponerlas. Son muchas
su características, pero en el campo de la biblioteconomía
se reducen a cinco: personalidad, materia, energía, espacio
y tiempo. Sin embargo, tiene subdivisiones de lengua,
geografía, cronología, etc.
4.3.2 Lenguajes
de estructura asociativa (Léxicos documentales, tesauros):
aquellos que se organizan por orden alfabético en términos
que expresan los conceptos retenidos durante la indización.
Los términos o descriptores se combinan libremente entre
sí sin quedar sujetos a una posición determinada del lenguaje,
según las necesidades de los documentos. Esta estructura
proporciona un acceso más inmediato a la información,
pero tiende a dispersar los términos parecidos.
Los lenguajes
de estructura asociativa se dividen en:
4.3.2.1 Alfabético
de materia: Se organizan alfabetizando encabezamientos
de palabras o grupos de palabras que expresan conceptos.
Tienen como requisito la uniformidad de los términos
empleados, estableciendo un juego de referencias cuando
sea necesario para relacionar, completar o no marginar
temas. Utilizan un lenguaje precoordinado y un vocabulario
controlado.
4.3.2.2 Uniterms: Se caracteriza por corresponder a
una estructura asociativa alfabética, pero cada término
(uniterm) representa una palabra-clave sin determinar
el nivel que hay de asociación.
4.3.2.3 Descriptores: Un término o grupo de términos
que representan un concepto preciso.
4.3.2.4 Índices permutados: se permuta en forma circular
todas las palabras del texto o del título para distinguir
la palabra que se utiliza como descriptor.
4.3.2.4.1 Índices KWIC (Key word in context):
se recoge cada palabra significativa del texto o título
en una lista alfabética, de tal manera que están las
más significativas. Y de ellas se elige la que aparece
siempre en el mismo lugar: el centro.
4.3.2.4.2 Índices KWOC (Key word out of context):
Se buscan de la misma forma, pero se obtendrán aquellas
palabras que sobresalgan fuera del título.
4.3.2.4.3 Otros índices: Cruzados, Acumulativos e Índices
de citas.
Bibliografía:
Amat Noguera, Nuria. Documentación científica y nuevas
tecnologías de la Información. Madrid: Pirámide, 1989.
Véase especialmente el capítulo 5: Lenguajes documentales
y Thesaurus, p. 189-234, de donde se han obtenido las principales
aportaciones de este tema.
Véase además:
Chaumier, J.: Análisis y lenguajes documentales: el
tratamiento lingüistico de la información. Barcelona:
Mitre, 1986.
Currás, Emilia. Thesaurus, lenguajes terminológicos.
Madrid: Paraninfo, 1991.
Díez Carrera, C.: Técnicas y régimen de uso de la CDU.
Gijón: Trea, 1999.
García Gutiérrez, Antonio. Lingüística documental: aplicación
a la documentación de la comunicación social. Barcelona:
Mitre, 1984.
Gil Urdiciain, Blanca. Manual de lenguajes documentales.
Madrid: Noesis, 1996.
Gleyze, A. : Pour une méthode d'indexation alphabétique
de matières. Villeurbanne: E.N.S.B., 1983.
Lancaster, F.W.: El control del vocabulario en la recuperación
de información. Valencia: Universitat de Valencia,
1995.
López-Huertas Pérez, Mª. J.: Lenguajes documentales:
aproximación a la evolución histórica de un concepto.
En: Boletín de la ANABAD, XLI (1991), núm. 1, enero-marzo.,
p.61-70.
López-Huertas Pérez, Mª. J.: Lenguajes documentales:
terminología para un concepto. En: Boletín de
la ANABAD, XLI (1991), núm. 2, abril-junio, p.171-188.
López Yepes, José (Comp.). Manual de información y documentación.
Madrid: Pirámide, 1996.
Maltese, D.: Elementi di indicizzazione per sogetto.
Milan: Bibliografica, 1982.
Maniez, J.: Los lenguajes documentales y de clasificación:
concepción, construcción y utilización en los sistemas documentales.
Madrid: Fundación Germán Sánchez Ruipérez, 1992.
Pinto, María. Manual de clasificación documental.
Madrid: Síntesis, 1997.
Soria González, Inocencia. La organización de la información,
los lenguajes documentales y la normalización. Consejo
Superior de Investigaciones Científicas.
Van Slype, G.: Los lenguajes de indización. Madrid:
Fundación Germán Sánchez Ruipérez, 1991.