Documentación, internet y medios de comunicación
PROCESO DOCUMENTAL, DEL ANÁLISIS A LA RECUPERACIÓN
Lenguajes documentales

1. Introducción.

Los lenguajes documentales aparecen como una necesidad para estructurar el pensamiento, agrupando y asociando cada documento a una lista clasificatoria, o bien mostrando el contenido, sobre todo a través de resúmenes o palabras claves.

En el comienzo, los lenguajes documentales se presentaron como sistemas clasificatorios. Algunos teóricos de la documentación consideran que el primer sistema clasificatorio fue el realizado por Brunet en 1804, aunque terminó por imponerse la Clasificación Decimal de Dewey.
Melvil Dewey, en 1876, clasificó y dividió el pensamiento en varias clases y a cada una de estas las volvió a dividir y subdividir sucesivamente, dando origen de esta manera a una Clasificación Decimal.
El Instituto Internacional de Bibliografía adoptó este sistema, publicando en 1905 la primera edición internacional. Con posterioridad, la federación Internacional de Documentación realizó varias modificaciones hasta que se constituyó la CLASIFICACIÓN DECIMAL UNIVERSAL.

2. Concepto de lenguaje documental.

El lenguaje documental es un sistema convencional que utiliza una unidad de información para describir el contenido de los documentos, con miras a su almacenamiento y recuperación.
Por regla general, un documento trata de más de una noción, más de un contenido.

El lenguaje documental (AMAT): "es un conjunto de términos o procedimientos sintácticos (frases nominales) y convencionales utilizados para representar el contenido de un documento, con el fin de permitir su recuperación. Se le denomina también lenguaje de indización".

Es, por tanto, un lenguaje artificial para diferenciarlo del lenguaje natural, aunque en algunos casos se empleen los mismos términos.

Lenguaje documental, según Inocencia Soria, de la Unidad Coordinadora de Bibliotecas del CSIC: "es el sistema convencional creado para poder expresar el contenido de los documentos sin los impedimentos del lenguaje natural. Simplifica el lenguaje común utilizando sólo una pequeña parte del léxico, algunas formas y poco o casi nada de gramática. Los lenguajes documentales pueden consistir simplemente en una lista de palabras admitidas aunque lo más frecuente es que consten de un sistema estructurado que relacione sus distintos términos".

Cuando se incluyen relaciones sintácticas permiten recuperar la información de términos relacionados. Si son relaciones jerárquicas como las que se encuentran en las clasificaciones enciclopédicas, alfabéticos de materias y tesauros, permiten respetar el nivel específico del texto, es decir, contemplar los términos en su profundidad.

Para Coll-Vinent y Bernal Cruz:

Lenguaje natural: es aquel en el que están escritos todos los documentos primarios sometidos al análisis documental.
Es también el lenguaje hablado y el que se emplea en todas las informaciones originales, sea cual sea su soporte.
Lenguaje artificial o convencional: es un lenguaje estructurado con un propósito particular y con unas características que le son propias.
Para ellos, el lenguaje documental: es el lenguaje convencional que apunta a la descripción del contenido de un documento primario en orden a su almacenamiento y ulterior recuperación.
Es, además, un lenguaje que produce la transformación de un texto original en otro distinto mucho más breve, en el que queda fielmente representado.

En resumen: el lenguaje documental actúa como vehículo de comunicación entre el contenido del documento y el usuario y con él se pretende reducir y, a ser posible, evitar la multiplicidad de sentidos que tiene el lenguaje natural.

2.1 Diferencias entre lenguajes documentales y lenguajes naturales.

Si el lenguaje natural se usa para la comunicación inmediata, esta que realizamos ahora mismo; el lenguaje documental se emplea para conseguir una comunicación, que es primordialmente un medio, un código unívoco y estereotipado, controlado y no libre, normalizado y no arbitrario.
En el lenguaje natural coexisten diferentes significados para un solo significante o diversos significantes sinónimos.
Por el contrario, el lenguaje documental ejerce un control léxico que impide la utilización de distintos significantes libres para un mismo significado con el objeto de sobrevivir dentro de un código normalizado.

3. Funciones del lenguaje documental.

El lenguaje documental sirve como elemento aglutinador de todos los trabajos que se lleven a cabo en el proceso documental. Así, puede considerarse la expresión lenguaje natural como sinónimo de discurso común, el lenguaje normalmente usado en la escritura y la conversación. Pero, en el contexto de la recuperación de la información, la expresión usualmente se refiere a las palabras que ocurren en los textos impresos y "texto libre" hay que considerarlo como sinónimo.

El lenguaje documental ha de precisar cada uno de los diferentes encuadres que presenta el documento para facilitar la recuperación. Se trata de un lenguaje que recoge los elementos más importantes cuando se está elaborando el análisis y los aplica para hacer efectiva la recuperación.

Sin embargo, existen una serie de problemas:

• Las palabras contienen varios significados
• Las traducciones de otros idiomas
• Los nuevos términos que se introducen
• Las especificaciones técnicas resultan para la mayoría de los usuarios incomprensibles.
• La forma en que se presentan los nuevos documentos, avalados por unas tecnologías que no disponen de aspectos comunes adaptados internacionalmente
• El desacuerdo entre los documentalistas a la hora de aplicar los diferentes lenguajes.

Para Blanca Gil, otra de las funciones pasa por una normalización y una inducción: "El lenguaje documental tiene capacidad para representar los mensajes contenidos en los documentos, lo que permite cumplir dos objetivos fundamentales: el de normalización y el de inducción, estando encaminadas a éste último todas las demás funciones que desempeña a lo largo del proceso documental".

El objetivo básico de un lenguaje documental es suministrar los conceptos que aporta cada palabra, una vez efectuado el análisis. Se trata de reducir los términos que aporta el lenguaje documental, como precisa Blanca Gil: "El lenguaje documental reduce considerablemente el volumen de términos del lenguaje natural no tomando en consideración más que los sustantivos o los sintagmas nominales".

4.Tipología de lenguajes documentales.

Hay diversas formas de tipificar los lenguajes documentales; sin embargo, las más usadas son:

4.1. Dependiendo del control ejercido sobre el vocabulario.
4.1.1 Lenguajes controlados (Clasificaciones, tesauros.etc): aquellos que han establecido una lista de descriptores antes de proceder al análisis documental. Esta es cerrada y nominativa. Define todos los términos y únicamente aquellos que se pueden utilizar para presentar el contenido de un documento. La búsqueda y recuperación es más rápida y eficaz.

4.1.2 Lenguajes libres (Listas de descriptores libres). Al contrario, cuando se trabaja con un vocabulario o lenguaje libre no se conocen a priori listas de términos autorizados. Basta con extraer de los documentos los términos más apropiados. La búsqueda es más lenta y menos eficaz.

De todas formas, hay que señalar que ningún lenguaje es completamente puro, ninguno es pre o poscoordinado, libre o controlado.

4.2. De acuerdo con la coordinación de términos.
4.2.1 Lenguajes Precoordinados (clasificaciones, listas de encabezamiento de materias): aquellos que coordinan los diferentes conceptos que forman un tema, antes de memorizar los documentos. Son lenguajes utilizados en bibliotecas: sistemas de clasificación y listas tradicionales de alfabéticos de materias. Permiten pocos términos de indización por documento

4.2.2 Lenguajes Poscoordinados (Listas de descriptores libres, listas de palabras claves, tesauros): los que permiten yuxtaponer los conceptos en el momento del análisis, de manera que se pueda coordinar después del almacenamiento.  Hay que recordar siempre que en los lenguajes postcoordinados es necesaria la utilización de ficheros suplementarios, llamados también ficheros inversos.

En resumen:
La precoordinación permite pocos términos de indización por documento, pero proporciona en una sola búsqueda los elementos esenciales de la información.
La poscoordinación permite utilizar un gran número de vías de acceso a los documentos, pero teniendo como intermediario ficheros especiales que necesitan una búsqueda en dos tiempos; primero la identificación de los documentos pertinentes y después su localización.

4.3. De acuerdo con su estructura.
4.3.1 Lenguajes de estructura jerárquica o clasificatoria (clasificaciones jerárquicas) aquellos que siguen un orden lógico que agrupa y aproxima los conceptos más sencillos o específicos dentro de los conceptos más generales. Este tipo de lenguaje se puede emplear para localizar un documento, pero no para indizar con profundidad.
Se establece una clasificación sistemática lineal, en la cual los conceptos se encuentran ordenados siguiendo una jerarquía natural, definida por el estado de los conocimientos en el momento en que ha sido elaborada.
Cada concepto de estas estructuras jerárquicas se halla representado por un símbolo numérico, alfabético o alfanumérico que indica la situación de cada materia.

Los lenguajes de estructura jerárquica se dividen en:
4.3.1.1 Clasificaciones enciclopédicas:

• Permiten la organización de documentos que tratan sobre cualquier materia: son de ámbito universal y multidisciplinario.
• Presentan dos inconvenientes: el objetivo de su universalidad limita la descripción de un documento especializado y su rigidez dificulta una puesta al día ágil y rápida.

4.3.1.1.1 Clasificación de Dewey (1876): divide el conjunto de los conocimientos en 9 clases principales, designadas en números arábigos del 1 al 9, reservando el 0 para las generalidades. Cada clase se subdivide sucesivamente en 10 subclases y así sucesivamente, con números que se dividen en grupos de tres por medio de puntos para hacer más fácil la lectura.
4.3.1.1.2 Clasificación expansiva de Cutter (1891): se compone de 7 tablas o esquemas, cada una de los cuales incluye la totalidad de los conocimientos, pero con una complejidad progresiva.
4.3.1.1.3 Clasificación de la Libray of Congress (LCC 1897): cuenta con 21 clases principales, tomadas del sistema de Cutter, que designa con otras tantas letras mayúsculas, dejando las restantes para futuras ampliaciones.
4.3.1.1.4 Clasificación bibliográfica de Bliss (1935): está formada por 4 esquemas generales que son filosofía, ciencias zoológicas, físico y social que se dividen en un total de 26 clases principales. Es muy similar a las facetadas.
4.3.1.5 Clasificación Decimal Universal (CDU 1905): es una ampliación de la clasificación decimal de Melvil Dewey (se basa en su quinta edición). Es numérica hasta cierto punto, precoordinada, universal, multidimensional y arborescente. Está agrupada en 10 clases, reducidas a 9 por la fusión de lingüística, filología y literatura, dejando la clase 4 vacía. Cada una de ellas se subdivide. 0 generalidades.   1 Filosofía. 2 Religión. Teología. 3. Ciencias Sociales. Estadística. Política. Economía. Derecho. Administración. Asistencia social. Seguros. Educación. Etnología. 4 sin ocupar. 5 Ciencias puras. Ciencias exactas y naturales. 6 Ciencias aplicadas. Medicina. Técnica. 7 Arte. Artes industriales. Fotografía. Música. Juegos. Deportes. 8 Lingüística. Filología. Literatura. Crítica literaria. 9 Arqueología. Prehistoria. Geografía. Biografía. Genealogía. Historia.
La tarea de actualizar la CDU está encomendada a la FID (Federación Internacional de Documentación), si bien como señala Inocencia Soria: "En 1992 se constituyó el consorcio CDU, que asumió las responsabilidades que antes tuviera la FID sobre su edición, actualización, versiones, etc. Este consorcio, cuyos socios fundadores son Bélgica, España, Holanda, Japón, Reino Unido y la propia FID, se comprometió a organizar y mantener la CDU y sus esfuerzos ya han dado algunos importantes frutos: se ha creado un fichero informático con más de 60.000 entradas que está sirviendo de base para facilitar su manejo y actualización".

4.3.1.2 Clasificaciones especializadas: Son instrumentos de indización que abarcan disciplinas o campos especializados (medicina, derecho, economía, etc.) que no quedarían profunda y ampliamente representados en una estructura jerárquica de ámbito universal y multidisciplinario. Por ejemplo, la mayoría de las bases de datos disponen de este tipo de clasificaciones.

4.3.1.3 Clasificaciones de facetas: Son de origen enciclopédico, pero su organización permite construir áreas concretas de los conocimientos, ya que faceta es cada uno de los aspectos o puntos de vista que pueden incluirse en un área concreta. Se basan en:
4.3.1.3.1 Clasificación colonada de S.R. Ranganathan (1933): Se llama colonada porque utiliza el colon como único signo de síntesis. No es, por tanto, una división lineal y jerárquica como el resto sino la aplicación que tienen algunas materias para descomponerlas. Son muchas su características, pero en el campo de la biblioteconomía se reducen a cinco: personalidad, materia, energía, espacio y tiempo. Sin embargo, tiene subdivisiones de lengua, geografía, cronología, etc.

4.3.2 Lenguajes de estructura asociativa (Léxicos documentales, tesauros): aquellos que se organizan por orden alfabético en términos que expresan los conceptos retenidos durante la indización. Los términos o descriptores se combinan libremente entre sí sin quedar sujetos a una posición determinada del lenguaje, según las necesidades de los documentos. Esta estructura proporciona un acceso más inmediato a la información, pero tiende a dispersar los términos parecidos.

Los lenguajes de estructura asociativa se dividen en:

4.3.2.1 Alfabético de materia: Se organizan alfabetizando encabezamientos de palabras o grupos de palabras que expresan conceptos. Tienen como requisito la uniformidad de los términos empleados, estableciendo un juego de referencias cuando sea necesario para relacionar, completar o no marginar temas. Utilizan un lenguaje precoordinado y un vocabulario controlado.
4.3.2.2 Uniterms: Se caracteriza por corresponder a una estructura asociativa alfabética, pero cada término (uniterm) representa una palabra-clave sin determinar el nivel que hay de asociación.
4.3.2.3 Descriptores: Un término o grupo de términos que representan un concepto preciso.
4.3.2.4 Índices permutados: se permuta en forma circular todas las palabras del texto o del título para distinguir la palabra que se utiliza como descriptor.
4.3.2.4.1 Índices KWIC (Key word in context): se recoge cada palabra significativa del texto o título en una lista alfabética, de tal manera que están las más significativas. Y de ellas se elige la que aparece siempre en el mismo lugar: el centro.
4.3.2.4.2 Índices KWOC (Key word out of context): Se buscan de la misma forma, pero se obtendrán aquellas palabras que sobresalgan fuera del título.
4.3.2.4.3 Otros índices: Cruzados, Acumulativos e Índices de citas.

Bibliografía:
Amat Noguera, Nuria. Documentación científica y nuevas tecnologías de la Información. Madrid: Pirámide, 1989. Véase especialmente el capítulo 5: Lenguajes documentales y Thesaurus, p. 189-234, de donde se han obtenido las principales aportaciones de este tema.
Véase además:
Chaumier, J.: Análisis y lenguajes documentales: el tratamiento lingüistico de la información. Barcelona: Mitre, 1986.
Currás, Emilia. Thesaurus, lenguajes terminológicos. Madrid: Paraninfo, 1991.
Díez Carrera, C.: Técnicas y régimen de uso de la CDU. Gijón: Trea, 1999.
García Gutiérrez, Antonio. Lingüística documental: aplicación a la documentación de la comunicación social. Barcelona: Mitre, 1984.
Gil Urdiciain, Blanca. Manual de lenguajes documentales. Madrid: Noesis, 1996.
Gleyze, A. : Pour une méthode d'indexation alphabétique de matières. Villeurbanne: E.N.S.B., 1983.
Lancaster, F.W.: El control del vocabulario en la recuperación de información. Valencia: Universitat de Valencia, 1995.
López-Huertas Pérez, Mª. J.: Lenguajes documentales: aproximación a la evolución histórica de un concepto. En: Boletín de la ANABAD, XLI (1991), núm. 1, enero-marzo., p.61-70.
López-Huertas Pérez, Mª. J.: Lenguajes documentales: terminología para un concepto. En: Boletín de la ANABAD, XLI (1991), núm. 2, abril-junio, p.171-188.
López Yepes, José (Comp.). Manual de información y documentación. Madrid: Pirámide, 1996.
Maltese, D.: Elementi di indicizzazione per sogetto. Milan: Bibliografica, 1982.
Maniez, J.: Los lenguajes documentales y de clasificación: concepción, construcción y utilización en los sistemas documentales. Madrid: Fundación Germán Sánchez Ruipérez, 1992.
Pinto, María. Manual de clasificación documental. Madrid: Síntesis, 1997.
Soria González, Inocencia. La organización de la información, los lenguajes documentales y la normalización. Consejo Superior de Investigaciones Científicas.
Van Slype, G.: Los lenguajes de indización. Madrid: Fundación Germán Sánchez Ruipérez, 1991.

 

 



Volver