Bibliotecas, archivos y museos siguen diferentes criterios de normalización de vocabularios y metadatos, pero es necesario acogerse a normas para permitir la consulta centralizada de todos los fondos. Veamos a continuación cómo se normaliza y qué nos aporta el Linked Open Data (datos enlazados).

¿De cuántas formas diferentes tenemos escritos nuestros datos?

PabloPablo PicassoPicasso, Pablo, 1881-1973Pablo Picasso (Pablo Ruiz Picasso)Pablo Picasso Spanish, 1881-1973Picasso, Pablo (Spanish painter, sculptor, and printmaker, 1881-1973)

Normalización significa “crear, establecer o acogerse a normas”. Podemos normalizar: nombres de autores, descriptores geográficos, tipológicos o temáticos, etc.

¿Cómo lo podemos conseguir? Linked Open Data

En primer lugar, tenemos que normalizar los datos teniendo en cuenta obras de referencia, como por ejemplo:

Por otra parte, se puede ir más allá y adaptar nuestros datos al Linked Open Data. Para conseguirlo, vinculamos un término con un identificador único que describe su significado concreto.

Con esto conseguimos crear nuestros datos indicando que “Pablo Picasso” sea inequívocamente el pintor, o que el término “mesa” corresponda al objeto de cuatro patas y superfície lisa, etc.

¿Qué es el Linked Open Data?

El Linked Open Data (datos enlazados) describe un método de publicación de datos estructurados para que puedan ser interconectados entre ellos y resulten más útiles. Consiste en:

  • Identificadores únicos: ya no podemos confundir de quién o qué estamos hablando.
  • Datos online: consulta desde cualquier momento y lugar.
  • Lenguaje estándar (ej: RDF) / interoperabilidad: podemos buscar todos los datos desde un mismo lugar y sincronizar los datos entre aplicaciones.
  • Datos enlazados entre ellos: permite navegar entre términos e ir filtrando a medida que consultamos datos.

A medida que las obras de referencia se han posicionado, nos ha permitido:

  • Multlinguismo: obtenemos los términos traducidos y validados en otros idiomas.
  • Identificar alternativas terminológicas: obtenemos variantes de los términos en nuestro idioma y otros.
  • Coordenadas geográficas: identificamos dónde se encuentra una ubicación y la podemos pintar en un mapa.
  • Y otros datos complementarios según la tipología de término.

¿Y qué esfuerzo supone?

Tenemos que normalizar aquellos términos que nos hacen únicos. Recordemos el principio de Pareto: aunque la normalización afecte a un 20% de los términos, generalmente esto afectará al 80% de nuestros datos.

¿Cómo? Veamos un ejemplo práctico

El proceso de normalización consiste en consultar las fuentes de referencia y enriquecer tus datos a partir de estas. Por ejemplo, en el caso del término «mesa» consultaremos el Tesauro de Arte y Arquitectura del Getty Institute.

De entre todos los términos propuestos para mesa (table), escogeremos el que describe mejor nuestro objeto mesa y aprovecharemos toda su información complementaria:

  • Nombre preferente en inglés: tables (support furniture)
  • Nombre preferente en español: mesa (mueble de soporte)
  • Identificador: http://vocab.getty.edu/page/aat/300039337
  • Descripción: Artículos de mobiliario que consisten en una cubierta plana parecida a una tabla apoyadas en una o más patas o soportes.
  • Término padre: muebles de soporte
  • Faceta: objeto

Para facilitar este trabajo, de modo que se pueda hacer semiautomáticamente, desde Coeli hemos creado Poligraf, una herramienta de soporte a la normalización abierta online.