Nuevo paradigma del análisis documental de programas y materiales de televisión

Félix del Valle Gastaminza

Work in progress. 21 de marzo de 2000.

 

Paradigma clásico del análisis documental   

En la cadena documental el análisis documental consiste en el resumen, en texto libre, y la indización, en lenguaje controlado, de los documentos. Esto permite el acceso al contenido del documento con el objeto de recuperarlo, explotarlo y difundirlo. Una vez identificada la unidad documental que debe ser catalogada se trata de obtener una representación de la misma que sea manejable por el ordenador. En televisión se trabaja con una cierta diversidad de unidades documentales que además, en ocasiones, son interdependientes. Es el caso de los programas informativos, considerados como unidad, y las noticias que los integran. O estas mismas noticias, sus premontajes y los materiales brutos utilizados para realizarlas.

 

Información "bibliográfica": Datos de creación y de emisión.

Afecta al documento completo
Información técnica. Afecta al documento completo pero también al documento segmentado
Información del contenido: Resumen, Minutado, Indización. Segmenta el documento,  que puede suele representarse globalmente (descriptores y resumen) y jerárquicamente (minutado)

  

La operación de indización y representación de material de informativos de TV sigue los pasos siguientes:

  1. Segmentar el video jerarquicamente en segmentos, secuencias y planos. ( Un plano es una toma continua de cámara. Una secuencia está compuesta por uno o más planos que presentan diferentes tomas del mismo acontecimiento con una relación espacial y temporal. Un segmento está compuesto por una o más secuencias relacionadas.)
  2. Describir la información videobibliográfica completa - Título/s, autor/es, fechas,   datos de publicación/edición, formato, duración, etc
  3. Describir cada segmento - TCR (Time Code Recording) del frame de comienzo, duración, descripción textual.
  4. Describir cada secuencia - TCR (Time Code Recording) del frame de comienzo, duración, descripción textual.
  5. Describir cada plano - TCR (Time Code Recording) del frame de comienzo, duración, descripción textual.

Para realizar todas estas operaciones el documentalista tiene que ver el documento completo a veces más de una vez, tomando notas y sintetizando el contenido sonoro y visual para transformarlo en texto. Tiene que atender a la esencia del contenido y detectar cómo se ha expuesto en el documento; localizar los temas, personas y lugares relevantes; observar los aspectos formales y compositivos reseñables. El resultado final se expone en un registro catalográfico de una base de datos integrado por campos especialmente diseñados para los documentos en cuestión. 

Un ejemplo muy sencillo incompleto en su desarrollo sería el siguiente:

 

PROG: El Semanal. TIT: El Ojo público. SIGN: BTC009675. FECHEM: 19980814

AUT: Luis Ortega (ED); Ana Silas (REP); Elena Dueso (REP).

RES: El, ojo público: La instalación de cámaras de video en lugares públicos para controlar los disturbios en el País Vasco reabre un debate ya planteado: la seguridad y la protección de los derechos fundamentales. En el reportaje se analiza la experiencia llevada a cabo por tres ayuntamientos catalanes que tienen instaladas videocámaras desde hace varios años para el control de la seguridad ciudadana.

PLATEM: /DERECHOS FUNDAMENTALES/ /PRIVACIDAD/ /SEGURIDAD CIUDADANA/ /VIDEOVIGILANCIA/

PLALUG: /VILASSAR/ /CANET DE MAR/ /CALAFELL/

PLAPERS: /CARRILLO, MARC/

CONT: (21:17) a (34:00). "El ojo público".

              (21:21) SEG Cámaras de videovigilancia en las calles de Calafell (Tarragona). (22:36)

              (21: 25) PG Gente paseando. Automóviles detenidos en un semáforo.

              (21:38) DP Cámaras instaladas en puntos estratégicos.

              (22:06) PM Marc Carrillo, Catedrático de Derecho Constitucional de la Universitat Pompeu Fabra expone los pros y                              los contras legales y constitucionales de la videovigilancia./ (24:24)/ (25:45)/

 

   

Un nuevo paradigma.

 

En los centros de documentación de televisión se está comenzando a utilizar nuevos programas y tecnologías que permiten automatizar algunas de las operaciones descritas hasta aquí y plantear nuevas formas de representación. Estas tecnologías utilizan técnicas avanzadas de análisis de imagen y sonido que son capaces de comprender automáticamente la señal de video. Detectan cambios de plano y  movimientos de cámara, y generan un storyboard de fotogramas (keyframe images). Simultaneamente, extrae cualquier texto presente en la señal de video. Transforma la señal de audio en texto e identifica así palabras, hablantes, etc. Toda la información que genera es susceptible de contrastarse con un lenguaje documental incluído en el sistema y, por supuesto, es susceptible de revisión y amp`liación por un documentalista.

Estos programas no generan ya un solo registro por documento, sino que aprovechan la segmentación y jerarquización propia del documento para obtener un registro matriz del que dependen otros miniregistros con sus correspondientes "metadatos".

Datos bibliográficos globales del documento

Datos técnicos globales del documento.

marta.jpg (5621 bytes) Metadatos correspondientes a este Key frame: Contenido, descriptores, información visual o sonora.

TCR: 01:00 PM Marta Guiñol (Presentadora) explica la relación entre Elvis Costello y Elvis Presley

DUR: 45"

anim.gif (3550 bytes) Metadatos correspondientes a este Key frame: Contenido, descriptores, información visual o sonora.

TCR 01:45 PP Elvis Costello, músico británico, presenta su nuevo disco en el que incluye una vesrión de un tema de Elvis Presley.

DUR: 45"

PLAPERS /Elvis Costello/.

elvis.jpg (2880 bytes) Metadatos correspondientes a este Key frame: Contenido, descriptores, información visual o sonora.

TCR 02:30 PE Elvis Presley, intérprete estadounidense de Rock and Roll en un concierto en Hawaii en 1966 cantando "Love me tender"

DUR: 45"

PLAPERS /Elvis Presley/

PLATEM /Rock and Roll/

Debe tenerse en cuenta que el TCR actúa como señal física que permite ir automáticamente al punto del documento que nos interesa.

 

El resultado es que los niveles de descripción vienen determinados por el contenido; la unidad documental clásica se disgrega y sólo es perceptible si es necesaria. La recuperación es mucho más precisa, el índice de relevancia aumenta y el acceso físico a la documentación solicitada es mucho más rápido.


Normalización de la representación en Internet.

    El enorme crecimiento de la información audiovisual en Internet exige  el diseño de herramientas capaces de facilitar la indización, recuperación, obtención y revisión de datos audiovisuales. El desarrollo de normas de metadatos orientadas al contenido aplicables a documentos multimedia puede facilitar la tarea de diseño de los ingenios de búsqueda de información multimedia en la WWW.   Revisaremos dos propuestas de normalización, integrables entre sí. Los Metadatos del Dublin Core y la norma MPEG-7.

 

Dublin Core.

Los elementos del DC son los siguientes:

Element Descriptions

  1. Title
    Label: TITLE
    The name given to the resource by the CREATOR or PUBLISHER.
  2. Author or Creator
    Label: CREATOR
    The person or organization primarily responsible for creating the intellectual content of the resource. For example, authors in the case of written documents, artists, photographers, or illustrators in the case of visual resources.
  3. Subject and Keywords
    Label: SUBJECT
    The topic of the resource. Typically, subject will be expressed as keywords or phrases that describe the subject or content of the resource. The use of controlled vocabularies and formal classification schemas is encouraged.
  4. Description
    Label: DESCRIPTION
    A textual description of the content of the resource, including abstracts in the case of document-like objects or content descriptions in the case of visual resources.
  5. Publisher
    Label: PUBLISHER
    The entity responsible for making the resource available in its present form, such as a publishing house, a university department, or a corporate entity.
  6. Other Contributor
    Label: CONTRIBUTOR
    A person or organization not specified in a CREATOR element who has made significant intellectual contributions to the resource but whose contribution is secondary to any person or organization specified in a CREATOR element (for example, editor, transcriber, and illustrator).
  7. Date
    Label: DATE
    The date the resource was made available in its present form. Recommended best practice is an 8 digit number in the form YYYY-MM-DD as defined in http://www.w3.org/TR/NOTE-datetime, a profile of ISO 8601. In this scheme, the date element 1994-11-05 corresponds to November 5, 1994. Many other schema are possible, but if used, they should be identified in an unambiguous manner.
  8. Resource Type
    Label: TYPE
    The category of the resource, such as home page, novel, poem, working paper, technical report, essay, dictionary. For the sake of interoperability, TYPE should be selected from an enumerated list that is under development in the workshop series at the time of publication of this document. See http://sunsite.berkeley.edu/Metadata/types.html for current thinking on the application of this element
    Image
    • Moving
      • Animation
      • Film
        • Feature
        • Musical
        • Animation
        • Documentary
        • Silent
        • Short
        • Staged
        • Performance
        • etc.
      • TV
        • Drama
        • Serial
        • Documentary
        • News
        • Current Affairs
        • Performance
        • Comedy
        • Children's
        • Review
        • Interview
        • etc.
    • Photograph

       

      • Sequence
        • Scene
          • Shot
            • Frame
              • Object/Actor/Person
  9. Format
    Label: FORMAT
    The data format of the resource, used to identify the software and possibly hardware that might be needed to display or operate the resource. For the sake of interoperability, FORMAT should be selected from an enumerated list that is under development in the workshop series at the time of publication of this document.  Format.type = 35mm film, VHS etc.
                                                 Format.colour.depth = 256
                                                 Format.length = 31 mins.
                                                 Format.videocodec = MJPEG, MPEG1, MPEG2, AVI, QT, etc.
                                                 Format.framerate = 25
                                                 Format.videocolourdepth
                                                 Format.videores
                                                 Format.videowidth
                                                 Format.videoheight
                                                 Format.sound = Yes/No
                                                 Format.sound.channels
                                                 Format.sound.samplerate
                                                 etc.
  10. Resource Identifier
    Label: IDENTIFIER
    String or number used to uniquely identify the resource. Examples for networked resources include URLs and URNs (when implemented). Other globally-unique identifiers,such as International Standard Book Numbers (ISBN) or other formal names would also be candidates for this element in the case of off-line resources.
  11. Source
    Label: SOURCE
    A string or number used to uniquely identify the work from which this resource was derived, if applicable. For example, a PDF version of a novel might have a SOURCE element containing an ISBN number for the physical book from which the PDF version was derived.
  12. Language
    Label: LANGUAGE
    Language(s) of the intellectual content of the resource. Where practical, the content of this field should coincide with RFC 1766.
  13. Relation
    Label: RELATION
    The relationship of this resource to other resources. The intent of this element is to provide a means to express relationships among resources that have formal relationships to others, but exist as discrete resources themselves. For example, images in a document, chapters in a book, or items in a collection. Formal specification of RELATION is currently under development. Users and developers should understand that use of this element is currently considered to be experimental.
  14. Coverage
    Label: COVERAGE
    The spatial and/or temporal characteristics of the resource. Formal specification of COVERAGE is currently under development. Users and developers should understand that use of this element is currently considered to be experimental.
  15. Rights Management
    Label: RIGHTS
    A link to a copyright notice, to a rights-management statement, or to a service that would provide information about terms of access to the resource. Formal specification of RIGHTS is currently under development. Users and developers should understand that use of this element is currently considered to be experimental.

MPEG-7.

    Aunque todavía está en una fase inicial es muy interesante referirse también al MPEG-7, Interfaz de Descripción de contenido multimedia, norma ISO creada por el Moving Pictures Expert Group para tratar el contenido de todo tipo de objeto multimedia. La descripción obtenida estará unida al contenido mismo, para facilitar el acceso al material que sea de interés del usuario.

 

 

Figure 1.1: An abstract representation of possible applications using MPEG-7.