Aprofitem el Linked Open Data? Eines i recursos per normalitzar i enllaçar

Biblioteques, arxius i museus segueixen diferents criteris de normalització de vocabularis i metadades, però és necessari acollir-se a normes estandarditzades per permetre la consulta centralitzada de tots els fons. Vegem a continuació com es normalitza i què ens aporta el Linked Open Data (dades enllaçades).

De quantes maneres diferents tenim escrites les nostres dades?

Pablo Picasso
Picasso, Pablo, 1881-1973
Pablo Picasso (Pablo Ruiz Picasso)
Pablo Picasso Spanish, 1881-1973
Picasso, Pablo (Spanish painter, sculptor, and printmaker, 1881-1973)

Normalització significa “crear, establir o acollir-se a normes”. Podem normalitzar noms d’autors, descriptors geogràfics, tipològics o temàtics, etc.

Com ho podem aconseguir? Linked Open Data

En primer lloc, cal normalitzar les dades tenint en compte obres de referència com per exemple:

Per altra banda, es pot anar més enllà i adaptar les nostres dades al Linked Open Data. Per aconseguir-ho, vinculem un terme amb un identificador únic que en descriu el significat concret.
Amb això aconseguim crear les nostres dades indicant que “Pablo Picasso” sigui inequívocament el pintor, o que el terme “taula” correspongui a l’objecte de quatre potes i superfície llisa, etc.

Què és el Linked Open Data?

El Linked Open Data (dades enllaçades) descriu un mètode de publicació de dades estructurades perquè puguin ser interconnectades entre elles i resultin més útils. Consisteix en:

  • Identificadors únics: ja no podem confondre de qui o què estem parlant.
  • Dades online: consulta en qualsevol moment i lloc.
  • Llenguatge estàndard (ex: RDF) / interoperabilitat: podem cercar totes les dades des d’un mateix lloc i sincronitzar les dades entre aplicacions.
  • Dades enllaçades entre elles: permet navegar entre termes i anar filtrant a mesura que consultem dades

A mesura que les obres de referència s’han posicionat, ens han permès:

  • Multilingüisme: obtenim els termes traduïts i validats a altres idiomes.
  • Identificar alternatives terminològiques: obtenim variants dels termes en el nostre idioma i altres.
  • Coordenades geogràfiques: identifiquem on es troba una ubicació i la podem pintar en un mapa
  • I altres dades complementàries segons la tipologia de terme.

I quin esforç suposa?

Cal que normalitzem aquells termes que ens fan únics. Recordem el principi de Pareto: encara que la normalització afecti a un 20% dels termes, generalment això afectarà al 80% de les nostres dades.

Com? Veiem-ne un exemple pràctic

El procés de normalització consisteix en consultar les fonts de referència i enriquir les teves dades a partir d’aquestes. Per exemple, en el cas del terme taula (table) consultarem el Tesaurus d’Art i Arquitectura de Getty Institute.

D’entre tots els termes proposats, escollirem el que descriu millor el nostre objecte taula i n’aprofitarem tota la informació complementària:

  • Nom preferent en anglès: tables (support furniture)
  • Nom preferent en castellà: mesa (mueble de soporte)
  • Identificador: http://vocab.getty.edu/page/aat/300039337
  • Descripció en castellà: Artículos de mobiliario que consisten en una cubierta plana parecida a una tabla apoyadas en una o más patas o soportes.
  • Terme pare en castellà: muebles de soporte
  • Faceta: objecte
  • ...

Per facilitar aquesta feina, de manera que es pugui fer semi-automàticament, des de Coeli hem creat Poligraf, una eina de suport a la normalització oberta online.


Vestit vermell de la col·lecció històrica de Santa Eulalia, publicada amb Coeli

Santa Eulalia treu a la llum el seu arxiu històric de vestits i disseny de moda

Santa Eulalia, botiga de moda de Barcelona i referent de marques de luxe i sastreria d’home, va posar sobre la taula obrir el seu arxiu històric online com a celebració del seu 175è aniversari.

Amb aquest fi, es va arrencar el projecte de reactivació de l’arxiu històric de Santa Eulalia, on Coeli hi ha entrat amb el rol de gestor i publicador de la col·lecció.

Un dels principals reptes que ha plantejat el cas de Santa Eulalia ha estat trobar l’equilibri entre fer atractiva la publicació de continguts per a un públic mol ampli, que significa una interlocució amb el client per la selecció de les col·leccions, la cura de la imatge corporativa i de marca, etc., combinat amb mantenir un rigor tècnic en el tractament intern de la informació dels objectes que, a més, són de naturalesa molt variada (indumentària, documentació administrativa, imatge digital,…).

Per Santa Eulalia, la versatilitat de Coeli ha permès combinar la publicació de l’arxiu digital amb la gestió dels objectes físics de manera senzilla i pràctica per a usuaris no especialitzats.

Tot seguit expliquem aquest cas d’èxit.

Preparant la col·lecció

Analitzant la col·lecció vam identificar la tipologia d’objectes que conserva, la quantitat, així com aquells elements més atractius i interessants per a publicar.

Ràpidament es va considerar que el tèxtil havia de ser el producte estrella, seguit pel disseny de moda, el disseny gràfic, i també les fotografies i premsa relacionades amb l’empresa. Tot aquest material havia de ser visual i atractiu, seguint la imatge de marca.

Els objectes estaven informatitzats, però no tots tenien imatge. L’arxiver, el gestor de continguts digitals, i els coordinadors del projecte es van posar d’acord per fer un calendari de publicació per fases.

Els vestits de moda, com a objectes més destacats, van estar a la primera fase i es van demanar noves fotografies dels que no en tenien o eren d’escassa qualitat. Santa Eulalia es va posar en contacte amb un expert en moda per afinar les datacions, materials i tècniques, tipologia de peces, finalitat i descripcions dels vestits.

Així doncs, les dades es van enriquir i/o modificar, per completar descripcions, revisar la informació errònia, crear vocabularis controlats, etc. Això era essencial per aconseguir una cerca i recuperació d’informació efectiva, homogeneïtzar les fitxes, i també per crear un menú de filtres.

Arxiu històric Santa Eulalia publicat amb Coeli Platform. Fitxa detall

Amb l’eina Poligraf (eina de suport de Coeli), es van normalitzar els llistats de vocabularis controlats (tipus d’objecte, material, autors…) i es va crear un tesaurus per poder jerarquitzar els descriptors.

A tall d’exemple, el vocabulari de tipus de vestits va ser el que es va pensar més. La jerarquia que proposa el Getty Institute (font de referència per a noms d’objectes) classifica:

  • Peça de roba principal:
    • vestit [femeni/nens]
      • vestit per forma
        • bata
        • vestit camiser
        • vestit recte
        • vestit
        • maxi vestit
        • ...
      • vestit per funció
        • vestit de comunió
        • vestit de còctel
        • vestit de nit
        • vestit d'embarassada
        • vestit d'estiu
        • vestit de tè
        • vestit de núvia
        • ...
    • Vestit [traje]
      • vestit pantaló
      • esmòquing
      • vestit esportiu
      • vestit de carrer
      • vestit jaqueta
      • vestit d'esquí
      • roba de gimnàstica
      • vestit de platja
      • "Chándal"
      • roba de passeig
      • ...

Tenint en compte la realitat de la col·lecció de Santa Eulalia, que preserva principalment vestits de dona utilitzats per a esdeveniments especials, s’ha seguit la línia del Getty Institut, però focalitzada i ampliada amb els vestits per funció:

  • Vestits
    • Vestits camisa
    • Vestits de còctel
    • Vestits de festa
    • Vestits de nit
    • Vestits de núvia
    • Vestits de posada de llarg
  • Conjunts
    • Conjunts de còctel
    • Conjunts de festa
    • Conjunts de nit
    • Vestits jaqueta

El procés de normalització també va ajudar a traduir els termes al català, castellà i anglès, ja que la col·lecció s’havia de mostrar en tots 3 idiomes.

Retocs finals i publicació online

Amb les dades preparades, es va crear un primer prototip de la col·lecció online, basat en el microsite (petit web) per defecte de Coeli. Llavors, Santa Eulalia va especificar quina era la seva proposta de disseny.

Es va adaptar l’estètica de Coeli, i també algunes funcionalitats, per exemple:

  • Limitar els filtres de cerca a aquells més rellevants per la col·lecció
  • Definir les opcions de cerca avançada
  • La visualització de les fitxes
  • Amagar aquells camps descriptius poc rellevants per l’usuari
  • L’ordenació dels resultats de cerca i el número d’elements per pàgina
  • etc.

Finalment, una vegada les dades i el disseny estaven tancats, els equips tècnics d’ambdues parts van integrar l’aplicació dins el que seria la pàgina web de l’arxiu històric de Santa Eulalia.

Per fer-ho, Santa Eulalia va preparar la pàgina principal de l’arxiu, molt atractiva i visual, on es veuen les caixes temàtiques destacades amb imatge. Per part de Coeli es va proporcionar el fragment de codi a inserir dins la pàgina (iframe del widget de cerca), el qual mostrar la caixa de cerca de la col·lecció. Aquesta caixa de cerca obre el llistat de resultats una vegada es realitza una cerca, o es clica a una de les caixes temàtiques destacades.

Arxiu històric Santa Eulalia publicat amb Coeli. Pàgina principal

L’arxiu va sortir a la llum al febrer de 2018 amb gairebé un miler d’objectes, que mica a mica es va ampliant i enriquint. Projecte viu que va evolucionant dia rere dia, cobrint les necessitats de Santa Eulalia.

Descobreix la història de la moda del segle XX gràcies a l’arxiu històric de Santa Eulalia.



Diseño del widget de Coeli en fondo gris claro

Volem publicar les nostres col·leccions patrimonials online, però com?

Per què hem de difondre online el nostre patrimoni cultural?

Perquè la valorització del patrimoni passa per donar-li un ús.
Perquè internet és el nou mètode que utilitzem per a informar-nos.
Perquè els entorns digitals ens donen un ampli ventall de possibilitats.

El patrimoni cultural cada vegada està més informatitzat i digitalitzat, però encara falta  desenvolupament perquè es normalitzi la publicació de col·leccions en entorns online entre les institucions de la memòria (arxius, museus, galeries d’art, biblioteques).

Què hem de tenir en compte per a la publicació de col·leccions patrimonials?

Presa la decisió de publicar el nostre patrimoni online, hem de considerar el següent:

Respecte les dades de la col·lecció:

  • Metadades / Thesaurus
  • Diversos idiomes
  • Què publiquem? Identificar els materials publicables + netejar i/o completar dades
  • Formats: imatge, vídeo, àudio, text, etc.
  • Col·lecció estàtica vs. dinàmica: creix la col·lecció? es faran destacats? compartirem a xarxes socials?
  • Enriquiment de dades: normalització de termes i Linked Open Data

Respecte la plataforma o entorn que utilitzarem:

  • Gestor website i/o gestor de col·leccions
  • Navegació
  • Gràfics o entorns visuals dinàmics?
  • Accessibilitat
  • Usabilitat
  • Disseny
  • Posicionament web

Respecte les nostres possibilitats:

  • Cost de preparació de les dades
  • Cost d’implementació
  • Cost de manteniment

Cas pràctic de la publicació d’una col·lecció amb Coeli

Posem en pràctica com aplicar el que hem comentat fins ara. Seguidament us mostrem com es realitzaria la publicació d’una col·lecció amb Coeli.

1. Preparem les dades i les carreguem a Coeli

Coeli permet crear fitxes manualment o carregar dades massivament a través de fitxers CSV.

Fins i tot podem sincronitzar la nostra base de dades d’origen directament amb Coeli a través de Coeli Sync (programa Java que s’executa des de l’ordinador i sincronitza les dades).

Coeli Sync pot funcionar de dues maneres: si tenim una base de dades SQL amb accés al SQL, o pujant directament fitxers CSV

2. Revisem i publiquem les dades

A través del panell podem revisar, modificar, crear o eliminar dades, una per una o massivament.

Un cop revisades les dades, publiquem. Clicant el botó “publicar”, automàticament es genera un entorn per defecte on es poden visualitzar les fitxes i tots el llistat de resultats.

Colección Coeli. Fondo gris claro

Si després no ens convenç, podem despenjar la publicació també amb un simple clic. Des de l’entorn de gestió mantenim el control de què és públic i que no.

3. Disseny

Si volem personalitzar l’estètica del site per defecte de Coeli, podem aplicar canvis senzills a través de l’editor de HTML i CSS. Això ens permetrà afegir una capçalera o un peu de pàgina, canviar els colors, les fonts tipogràfiques, l’aspecte dels enllaços, etc.

Colección Coeli. Fondo oscuro

4. Afegir la col·lecció dins el teu web

Una possibilitat més avançada de personalització consistiria en incrustar un widget de la col·lecció a una de les seccions del teu propi web.

El procediment és senzill, ja que el widget és un petit codi que es copia a dins la pàgina web on es mostrarà. Paral·lelament, des de l’editor CSS de Coeli s’ajusten els aspectes de disseny perquè estiguin alineats amb el web.

Un dels casos que podeu consultar online és el de la botiga de moda Santa Eulalia. A la pàgina principal de l’arxiu històric es mostra la caixa de cerca i unes caixes temàtiques destacades. Al clicar sobre una d’elles apareix el llistat de la col·lecció, amb les categories a un lateral.

Archivo histórico de Santa Eulalia publicado con Coeli

5. Fes el teu web a mida

També pots fer la web completament a mida i recollir directament les dades a nivell d’API.

Un dels casos que podeu consultar amb una personalització 100% és la Col·lecció Filatèlica Ramon Marull.

El cercador permet buscar per regió i període directament. Dels llistat de resultats, amb un primer clic s’obra un desplegable amb dades bàsiques, i posteriorment amb un clic més s’accedeix a la fitxa detall.

Colección filatélica Ramon Marull publicada con Coeli

Des de Coeli seguim treballant en projectes tan interessants com els que us hem presentat, i que ens omplen d’il·lusió ja que contribueixen a difondre el patrimoni i la cultura.

Aquest post fa referència al taller que vam presentar a les 15 Jornades Catalanes d’Informació i Documentació (#15JCID) el dia 11 de maig a Barcelona.

Seguiu-nos a les xarxes socials per conèixer les novetats sobre casos d’èxit, esdeveniments i millores de l’eina.


FESABID 2017

Gestió i difusió de col·leccions de museus (II): integració de dades i normalització

En aquest segon post seguim amb la presentació: Gestió i difusió de col·leccions de museus: oportunitats per l’enriquiment i la interoperabilitat de les dades.

Continuem parlant sobre la integració de dades, concretament sobre la normalització de dades.

A l’anterior post vam introduir el tema de la interoperabilitat i els seus 3 nivells:

  • Interoperabilitat organitzacional
  • Interoperabilitat tècnica
  • Esquemes de metadades
  • Vocabularis de valors -> aquí és on continuem ara

Vocabularis de valors


Entrem en la qüestió dels vocabularis de valors, les llistes d’encapçalaments, els tesaurus, taxonomies, etc.

De quantes maneres diferents tenim escrit un mateix nom entre totes les nostres bases de dades?

Pablo Picasso

Picasso, Pablo, 1881-1973

Pablo Picasso (Pablo Ruiz Picasso)

Pablo Picasso Spanish, 1881-1973

Picasso, Pablo (Spanish painter, sculptor, and printmaker, 1881-1973)

Això, permeteu-me que ho digui, ni tan sols s’aconsegueix sempre en els catàlegs bibliogràfics col·lectius, que són el paradigma de la normalització i de l’èxit de la integració basada en estàndards!

En el cas que ens ocupa, ja no parlem de les inconsistències de la normalització de les dades, o diferències idiomàtiques, de vegades només s’ha de tenir en compte la diversitat de criteris de normalització que prescriuen cada una de les tradicions documentals en funció de les necessitats d’explotació de les dades.

Els estàndards de biblioteques, arxius o museus no sempre prescriuen (o es senten còmodes amb) la mateixa sintaxis per escriure els noms d’autors, els descriptors geogràfics, tipològics o temàtics, etc.

Unificar aquestes tradicions a les bases de dades d’origen no sempre és factible, però resulta imprescindible per una veritable integració de les dades, i permetre una consulta unificada dels fons.

Com aconseguir-ho? Vegem què és Linked Data

Amb la interrupció i l’avanç del Linked Open Data s’han consolidat obres de referència internacional en la normalització de dades segons el seu àmbit d’actuació.

Pablo Picasso vinculado con VIAF. VIAF vinculado con LC, BNE y ULAN. ULAN vinculado con el MoMA

Aquestes obres de referència ens proporcionen identificadors que ens són útils per garantir la interoperabilitat externa, a la vegada que poden ser útils també per facilitar la interoperabilitat interna, dins de la institució, al marge de les particularitats de cada unitat.

En aquest cas, jo, nosaltres, tenim a disposició un ampli ventall de fonts de referència que ens permeten fer-nos entendre per tot el món.

  • Tesaurus d’Art i Arquitectura del Getty Institute
  • Viaf per autoritats
  • Geonames per noms geogràfics
  • En l’àmbit espanyol els Tesaurus del patrimoni cultural d’Espanya

Yo (colección de museo) vinculado con VIAF, Geonames, AAT, TPCE, Wikipedia.

Poc a poc aquestes referències s’han posicionat com a font normalitzada i fiable de les taxonomies o vocabularis.

Alguns amb peculiaritats que faciliten la seva expansió com pot ser:

  • Multilingüisme
  • Coordenades geogràfiques
  • Formes variants dels noms
  • Dades complementàries

Però moltes vegades, quan plantegem projectes de normalització per adaptar les dades d’una institució a estàndards, ens trobem amb certes reticències:

Però que ens diu la realitat?

Normalització


A les següents gràfiques podem veure:

  • Institucions: 90
  • Total de registres: 690.000
  • Descriptors únics: 29.000

Les dades ens mostren que, per norma general, el 90% de registres de les col·leccions utilitzen tan sols un 7% dels descriptors existents.

Per altra banda, el 86% dels descriptors els utilitza una sola institució i representa només el 23% dels registres. En canvi, l’1% dels descriptors que són utilitzats per més de 20 institucions, representen casi el 50% de tots els registres.

Ens quedem amb que, en la majoria dels casos, es compleix de llarg la regla de Pareto que diu que un 80% dels efectes són conseqüència del 20% de les accions, que traduït a aquest cas seria:

Encara que la normalització afecti tan sols a un 20% dels termes, per norma general aquests s’utilitzen en un 80% dels objectes.

Per tant:

20% de esfuerzo, 80% de resultados

Prioritzem els esforços, dedicant el 20% als aspectes més generals on podem aprofitar la cooperació i compartició dels recursos i dediquem el 80% a millorar aquells aspectes que ens fan particulars o únics. Que posin en valor la nostra col·lecció.

Poligraf


Des de Coeli treballem d’acord a aquestes necessitats. Com a complement hem creat Poligraf: un joc d’eines de suport a la normalització, servei obert i a disposició de tot el món.

Poligraf és un sistema semi-automàtic que permet vincular i enriquir els propis descriptors amb algunes de les fonts de referència internacionals.

Hem posat aquests serveis en obert, gratuïts i a disposició de tot el món.

Poligraf està compost pels següents serveis:

Autograf. Página de carga de datos

Aquestes eines no fan miracles, només ens ajuden. En base a la nostra experiència hem creat un conjunt de regles i una base de coneixement que ens permet proposar valors possibles, però és responsabilitat de cadascú validar si aquestes correspondències són certes o no.

A més a més: una vegada realitzat el procés i validades les correspondències, si envieu els resultats a Poligraf, aquests mapejos milloraran la base de coneixement i altres centres podran beneficiar-se d’aquest esforç col·lectiu.

Linked Data:

El resultat dels mapejos ens faciliten les URIs d’enllaç amb la font de referència, ja sigui VIAF, Getty AAT o Geonames. Posteriorment, quan carreguem les dades a Coeli o al nostre sistema, aquests ja estaran enllaçats.

Conclusions


L’objectiu és ajudar a les institucions a que les seves col·leccions estiguin disponibles i usables, facilitant que cada institució es centri en el seu negoci i per tant a:

  • Nivell organitzacional
  • Nivell tècnic: la capacitat dels components d’intercanviar informació
  • Nivell de dades: en relació a la capacitat de compartir el significat de la informació (ens n’encarreguem nosaltres).

Així doncs, hem vist que només el 5% dels fons de museus estan online i que en molts casos la reutilització de les seves dades és pràcticament nul·la.

Per aquesta raó s’ha de seguir treballant en serveis i eines que tinguin en compte la interoperabilitat, integració de dades, estàndards, esquemes de metadades internacionals, normalització de termes, etc.

I difondre la col·lecció per totes bandes: web, agregadors, aplicacions mòbils, etc.

Pots consultar la presentació completa de Prezi.

 

Tens algun dubte? Pots deixar un comentari, comentar a les xarxes socials o contactar directament amb nosaltres.

I si estàs interessat en la normalització de dades, prova ara les nostres eines Poligraf.


FESABID 2017

Gestió i difusió de col·leccions de museus (I): Interoperabilitat i integració de dades

Somos una gota en un mar de datos

Encara que estiguem hiperconnectats i tinguem abundants eines per cobrir totes les necessitats imaginables, en gran mesura estem aïllats, cadascú realitzant les seves funcions segons els seus criteris, invertint molts esforços, amb un retorn molt baix en quant a reutilització i difusió.

En España hay censados 1.468 museos o colecciones. 39.085.912 fondos de colecciones estables. 44,1% inventariados. 32,5% informatizados. 5,1% informatizados y accesibles por internet. [Fuente: Ministerio de Educación, Cultura y Deporte, 2014]

En conclusió: “Queda molt per fer”

Veiem que queda molt per fer, i els professionals de la documentació tenen molt per aportar.

Interoperabilitat i integració de dades


Interoperabilidad e integración de datos

Al voltant de la documentació de les peces de museu hi ha tot un aparell crític que és fonamental per la seva posada en valor i contextualització.

En aquest context és important registrar les diferències o les relacions que hi ha entre les peces de museu i els documents que es troben a l’arxiu, a la biblioteca, als fons fotogràfics, biografies d’autors, cronologies, exposicions, etc.

Habitualment, tota aquesta informació es troba gestionada per diferents departaments i dispersa en diferents aplicacions o bases de dades, generalment sense relació entre elles.

Com a conseqüència ens trobem:

  • Informació redundant: informació repetida a múltiples bases de dades, és a dir, que probablement hem reescrit més d’una vegada, duplicant esforços.
  • Estàndards de metadades descriptius diferents: clarament, els estàndards de metadades per descriure col·leccions de museu prescriuen camps diferents respecte als de la catalogació bibliogràfica.
  • Diferents fonts de referència pels vocabularis de valors
  • Relacions dèbils entre les dades: dins d’una mateixa institució, els fons gestionats per les diferents unitats d’informació (museu, arxiu, biblioteca, etc.) sovint estan interrelacionats. Tot i que sovint aquestes relacions s’enregistrin a les corresponents bases de dades, no sempre és fàcil materialitzar-les en enllaços, quan, per exemple, es publiquen al web.

La interoperabilitat o integració a nivell d’aplicacions i la integració de dades són estratègies, sovint complementàries, que ens poden ajudar a pensar la manera de bastir ponts entre illes d’informació.

Veiem a continuació els diferents nivells d’interoperabilitat:

  1. Interoperabilitat organitzacional
  2. Interoperabilitat tècnica
  3. Integració a nivell d’esquema de metadades
  4. Integració a nivell de vocabularis de valors

1r nivell: interoperabilitat organitzacional

Sovint ens centrem en la part més tecnològica i comencem a parlar de protocols, XML, OAI, Z39.50, etc., però hi ha un altre factor que, per sobre de tot, acostuma a ser el més complex de resoldre i, en general, converteix un projecte en un èxit o un fracàs:

La interoperabilitat organitzacional.

És a dir, “interoperabilitat” entre els objectius i processos de cadascuna de les unitat operatives de l’organització (col·leccions, comunicació, exposicions, activitats, centre de documentació…). Si realment desitgem donar un pas endavant és important apostar a nivell de tota la institució en l’establiment de polítiques, rols i lideratges que permetin dur a terme aquests projectes.

2n nivell: interoperabilitat a nivell tècnic

Per altra banda, hi ha aspectes tècnics a tenir en compte.

“La interoperabilitat és l’habilitat de dos o més sistemes o components d’intercanviar informació entre ells i utilitzar-la”

Tecnològicament parlant, existeixen dos models o estratègies principals per a la integració d’un sistema documental:

  • La interoperabilitat entre aplicacions
  • La integració conjunta a un dipòsit de dades

L’Institut d’Enginyeria Elèctrica i Electrònica (Institute of Electrical and Electronics Engineers, IEEE) defineix la interoperabilitat com l’habilitat de dos o més sistemes o components d’intercanviar informació entre ells i utilitzar-la.

En aquest sentit podem distingir entre:

  • Interoperabilitat interna: som interoperables de portes endins?
    • Les diferents aplicacions de la nostra institució, “parlen” entre elles?
    • Comparteixen dades?
    • Per exemple, podem compartir la mateixa llista d’autoritats, de descriptors temàtics o de registres bibliogràfics entre diferents aplicacions?
  • Interoperabilitat externa: som interoperables amb el món?
    • Els de fora, poden reutilitzar les nostres dades? En cas de que es puguin connectar, ens entenen?
    • Nosaltres, reutilitzem les seves dades? Podem integrar fàcilment informacions disponibles en bases de dades o fonts de referència externes?

A nivell intern, aquest model d’integració de les aplicacions té l’avantatge de resoldre la qüestió de normalització i interrelació de les dades des del principi.

Ara bé, encara que els tecnòlegs “poden amb tot” no sempre és fàcil fer que dues aplicacions parlin entre elles de manera eficaç.

Integració de dades

Per altra banda, però no menys important, hi ha la interoperabilitat a nivell de dades, és a dir:

  • Esquema de metadades
  • Vocabulari de valors

“La integració de dades és la combinació de dades residents a diferents fonts independents en una vista unificada d’acord amb un esquema global.”

Habitualment la integració de dades s’aconsegueix mitjançant processos anomenats ETL, de l’anglès Extract, Transform, Load (ETL): Extreure, Transformar i Carregar les dades en un nou dipòsit de dades.

Aquest procés intermedi de “Transformació” permet executar accions de normalització, interrelació i adaptació dels esquemes de metadades.

Perquè ens entenguem, és el que habitualment coneixement quan des del departament de Comunicació ens demanen: “passem les dades de col·leccions que hem de publicar el catàleg al web” o quan ens decidim a publicar el catàleg raonat en línia.

Llavors, sovint ens ataca el pànic:

  • I ens posem a revisar els autors perquè resulta que al web han d’aparèixer en un format diferent.
  • I a sobre s’ha de traduir tot perquè també ha de sortir en anglès.
  • I afegir les “URIs”, perquè sembla que algú aconseguirà convertir a EDM i enviar-ho a Europeana, etc.
  • Etc.

En molts casos aquests processos es realitzen a la fase de “Transformació”, fora de les aplicacions de treball habituals, i per tant són poc aprofitables, perquè el dia que toca actualitzar les dades, s’ha de tornar a fer.

3r nivell: esquemes de metadades

Un dels reptes de la integració de dades és la unificació dels esquemes descriptius de les diferents fonts de dades.

Quan es tracta d’un conjunt de recursos homogenis, el problema es redueix. Un cas d’èxit de la integració basada en estàndards, seria el dels catàlegs consorciats de biblioteques, que prescriuen la utilització en origen d’un mateix format estàndard, el MARC, que facilita enormement la integració en catàlegs col·lectius.

Però quan es tracta d’integrar fonts de dades heterogènies com objectes de museu, documents d’arxiu, bibliografia, esdeveniments i exposicions, etc.: com sumem peres amb pomes? Quin és l’estàndard dels estàndards?

No podemos sumar peras con manzanas.

Aquí entra l’anomenada integració basada en un esquema de mesura, que consisteix en establir una sèrie de mapejos (transformació) dels esquemes de metadades originals amb un esquema de metadades global comú per totes les tipologies.

Nosaltres ens hem atrevit a caracteritzar dos possibles plantejaments:

  1. Un, consisteix a buscar el Màxim Comú Divisor, és a dir, un esquema mínim comú a totes les tipologies documentals: si jo tinc 30 i tu en tens 40, doncs ens quedem amb 15.
    Un cas paradigmàtic d’aquest tipus d’aproximació és el Dublin Core, que amb els seus 15 elements s’ha utilitzat per descriure tot tipus de recursos.
  2. L’altra aproximació és adoptar un model de referència que sigui capaç d’integrar amb la màxima riquesa totes les tipologies documentals, el que seguint la “metàfora” podríem anomenar la cerca del Mínim Comú Múltiple: jo tinc 30, tu en tens 40, doncs anem a per 90.
    El CIDOC-CRM no és pròpiament un esquema de metadades com Dublin Core, però és una ontologia de referència que pretén donar resposta a tota aquesta diversitat amb més de 90 classes o entitats i més de 150 propietats.

I finalment ens quedarien els vocabularis de valors per tancar aquest apartat d’integració de dades, però farem un break i us ho deixarem per una segona part del post: Gestió i difusió de col·leccions de museus (II): integració de dades i normalització.


Aquesta entrada correspon a la primera part de la conferència: Gestió i difusió de col·leccions de museus: oportunitats per l’enriquiment i la interoperabilitat de les dades.

Des de Coeli vam assistir a les “XV Jornades Espanyoles d’Informació i Documentació” (2017) a títol de gestors documentals, i també com a conferenciants per parlar sobre la importància de la interoperabilitat i la integració de dades per gestionar i difondre col·leccions de museus.

Pots consultar la presentació completa de Prezi, la mateixa que vam veure a les jornades.


COELI Banner Ceramica

Coeli Platform. La nostra raó de ser

Volem donar-vos la benvinguda i explicar-vos qui som, els nostres objectius i les nostres il·lusions en aquest nou projecte: Coeli.

La primavera de 2017 vam presentar Coeli, i obrim el blog per compartir continguts actuals i especialitzats amb museòlegs, documentalistes, arxivers, bibliotecaris i tots aquells interessats en el món de la gestió de les col·leccions patrimonials.

Arrel de les consultories i serveis que desenvolupem en els projectes de NUBILUM per museus, arxius, galeries o altres tipus d’institucions culturals en trobàvem, en la majoria dels casos, amb dificultats per aconseguir visualitzar les col·leccions online. Així va néixer la idea de Coeli per cobrir una necessitat i donar una oportunitat per a la gestió de col·leccions patrimonials digitals.

La importància de publicar les nostres col·leccions online


¿Per què difondre el nostre patrimoni online?

Published collection

Una de les principals raons és que volem valoritzar el patrimoni i això requereix donar-li un ús. És a dir, el nostre objectiu ha de ser fer atractiva i accessible la col·lecció als usuaris.

Una part ha de sortir del coneixement, experiència, innovació i creativitat dels professionals de cada institució: com mostrar l’atractiu de la nostra col·lecció, crear emocions, ensenyar història…

Tot i així, hi ha una altra part necessària: la transformació digital. És una realitat a la que tots ens hem d’anar adaptant.

Conquerir el món digital ens permet:

  • Arribar a gran quantitat dusuaris: espai i temps ja no seran una limitació.
  • Fer les col·leccions més accessibles: l’accessibilitat web permet adaptar la visualització, els mètodes de navegació, el llenguatge, etc.
  • Més flexibilitat per la difusió: un entorn online és més flexible per crear objectes destacats, llistes, categories, etc.
  • Més canals: publica la teva col·lecció al teu website, utilitza les xarxes socials, crea una aplicació o guia digital, comparteix novetats a través de newsletters, etc.
  • Adaptació als canvis: el món de la informació ha canviat, ja no aprenem, llegim, consultem, estudiem… de la mateixa manera. Les nostres col·leccions també han de formar part d’aquest nou món si volem que s’adaptin als nous hàbits.

Llavors, per què no es publiquen?


Excloent el cas de les biblioteques, que han aconseguit estandarditzar-se i crear xarxes de col·laboració molt extenses, en altres àmbits com l’arxivístic o el museogràfic la situació és més complexa, perquè:

  • Absència de difusió online: en molts casos no es disposa de web o d’altres entorns digitals de difusió, de manera que la publicació de la col·lecció requereix de la creació d’un entorn web des de zero i formació o contractació d’empleats per a la seva gestió.
  • Dificultat per reutilitzar les dades: moltes de les eines per documentar i gestionar les col·leccions no estan pensades per reutilitzar les dades en altres plataformes o tecnologies.
  • Especificitat de cada col·lecció: cada museu, arxiu o galeria disposa de col·leccions molt particulars, fet que no facilita l’ús d’estàndards o termes normalitzats.
  • Mercat poc competitiu i innovador: altres sectors estan desenvolupant eines pensant en els avenços tecnològics i la transformació digital, on el mercat és molt competitiu. No passa el mateix respecte les aplicacions per a la gestió de col·leccions.

Així doncs, Coeli neix per resoldre totes aquestes problemàtiques.

I aquí teniu la nostra proposta


Coeli és un software i és un servei, el que anomenem tècnicament SaaS (Software as a Service).

Amb Coeli hem solucionat tots els problemes abans citats, perseguint els següents objectius:

  1. Publicar col·leccions ha de ser fàcil: l’esforç a destinar per la publicació va des de crear un website per defecte a través d’un clic, fins a deixar que els desenvolupadors web personalitzin fins l’últim detall.
  2. Reutilitzar les dades: la interoperabilitat i la integració són la base. Les col·leccions que surtin de Coeli podran reutilitzar-se en qualsevol entorn (aplicacions, canals de difusió…).
  3. Treballar de manera còmoda, amb una eina intuïtiva, moderna i àgil: només necessites un navegador i connexió a internet.
  4. Normalització de termes: identifica els termes (descriptors) més adequats, definits per fonts de referència internacionals: noms d’autors, objectes, llocs o períodes, entre d’altres.
  5. Estàndards documentals: som experts en gestió documental, per això considerem essencial l’ús d’estàndards.
  6. Obre les dades al món: si vols anar més enllà, pots obrir les teves dades a portals com Europeana. Ho aconseguim gràcies a les dades enllaçades (Linked Open Data).
  7. Plans flexibles: els nostres plans s’adapten a les necessitats de cada client. Només necessites normalitzar termes? Vols publicar la teva col·lecció a un website creat per defecte o en la teva pròpia web corporativa? Només vols documentar? T’interessa una eina de gestió de col·leccions integral?…
  8. Consultoria: des del primer contacte assessorem, proposem i busquem les solucions més adequades per a cada client.

En definitiva…


Coeli està format per un equip d’experts en gestió documental, museus, arxius i continguts digitals, que creu en el poder de la transformació digital, i que a través de l’experiència ha creat un software i un servei per poder gestionar les col·leccions patrimonials de manera senzilla i adaptada a les noves necessitats tecnològiques.

Si vols saber una mica més…

O contacta directament amb nosaltres!