La sisena estrella

9.06.2016

Tim Berners-Lee, creador del World Wide Web i impulsor de la Web semàntica a través de les dades enllaçades (Linked Data), va formular un esquema de valoració del nivell d’obertura de les dades públiques estructurat en cinc nivells. Aquests nivells, que es qualifiquen amb estrelles, són els següents:

Tim Berners-Lee, creador del World Wide Web | Foto: Paul Clarke

Tim Berners-Lee, creador del World Wide Web | Foto: Paul Clarke

– Una estrella: les dades s’han de publicar al Web (és a dir, han d’estar disponibles en línia), i sota una llicència d’ús oberta que en permeti la reutilització. Qualsevol format (per exemple PDF) és vàlid en aquest nivell de l’esquema.

– Dues estrelles: les dades s’han de publicar en un format estructurat, de manera que puguin ser directament processables per base de dades un cop descarregats. Formats com Microsoft Excel o Acces, o bé Open/Libre Office, serien vàlids en aquest nivell.

– Tres estrelles: les dades s’han de publicar en formats no propietaris, i en cas que siguin estàndards que no estiguin vinculats a cap programari concret. Els formats de text delimitat i no formatats, com CSV, serien vàlids en aquest nivell.

– Quatre estrelles: les dades s’han de referenciar mitjançant identificadors unívocs (Uniform Resource Identifiers, o URI’s), per tal que puguin ser enllaçats per altres agents. La codificació RDF (Resource Description Framework) seria un requisit en aquest cas.

– Cinc estrelles: les dades s’han de publicar enllaçades semànticament amb altres dades, és a dir en format de Linked Data.

Les Administracions públiques, en l’afany per surfejar l’onada de la transparència en un món d’opinió que es genera a cop de tuit, s’han dedicat a mesurar-se els nivells de transparència i a publicar-los al més aviat possible. I en aquesta cursa han fet públics índex de transparència altíssims, convençuts que en menys d’una legislatura havíen completat els deures acumulats durant dècades. En la majoria de casos la feina feta no ha anat més enllà de crear un portal Web amb el rol d’agregador de fonts ja existents, i posar una legió més o menys nombrosa de persones al darrera fent la feina artesanal de demanar i publicar periòdicament les dades que la legislació obliga a posar a disposició de la ciutadania. L’excel·lent treball portat a terme prèviament pels portals de dades obertes (Open Data) de moltes Administracions públiques no ha estat aprofitat en la mesura que el repte requeria.

Una anàlisi molt ràpida d’un àmbit del Portal de la Transparència de la Generalitat de Catalunya (el corresponent a organització institucional i administrativa, en els apartats d’estructura organitzativa, funcionament, alts càrrecs i directius), ens ofereix com a resultat que, de deu ítems d’informació, només tres assoleixen dues estrelles, mentre que la resta es queden amb una estrella. En quatre dels casos la naturalesa de la informació a publicar (bàsicament documents) no facilita anar més enllà d’una estrella, però en els altres sis és factible arribar fins a tres. La notícia positiva en aquest cas és que en un dels casos les dades també estan disponibles a través del Portal de Dades Obertes de la Generalitat de Catalunya, i en aquest cas assolint les tres estrelles.

De les Lleis de transparència aprovades a l’Estat espanyol es pot inferir clarament l’obligació de que les dades publicades als portals de transparència siguin preferentment de tres estrelles (és a dir, estructurades i en formats no propietaris). Però hi ha una altra obligació que també es deriva d’aquesta legislació, i que té un vincle directe amb la gestió documental: i és la d’assegurar que les dates siguin fiables i actualitzades. És el que, al meu entendre, constitueix la sisena estrella que caldria afegir al model de Tim Berners-Lee, especialment quan es tracta de dades del sector públic.

Aconseguir que les dades siguin fiables i actualitzades és difícil quan es treballa amb un model de publicació diferit i intermediat, en el qual les dades publicades són una reelaboració de les dades obtingudes de les fonts originals. L’escenari ideal és que l’usuari pugui interrogar directament aquestes fonts originals, i això només és possible quan hi ha una integració automatitzada entre el portal de transparència i els sistemes que gestionen les dades en origen. Obtenir la sisena estrella presenta per tant el doble repte de gestionar el màxim possible de tràmits amb sistemes d’informació que emmagatzemin la informació de forma ja estructurada, i desenvolupar les integracions adients per tal que la publicació de la informació en el portal de la transparència corresponent es faci de forma automàtica i, a ser possible, en temps real.

En el fons no estem tant lluny d’aquest objectiu. Dels deu ítems que he valorat en l’exemple abans esmentat, quatre gestionen les seves dades en format estructurat, mitjançant sistemes d’informació d’absoluta solvència. Però d’aquests quatre, només dos estan disponibles en línia, i només un permet descarregar-ne les dades en format estructurat. Tenim doncs la base, només manca la voluntat d’avançar en aquesta línia.