Fundación CTIC

Archivo etiqueta ogd

La creciente importancia del Open Data en Europa

La semana pasada se celebró en Bruselas la primera Asamblea Digital, un evento de esos especiales que organiza la Comisión Europea de vez en cuando. Unos 1.300 asistentes de lo más granado; a cada paso que dabas te encontrabas lo mismo a un Director General que a un Ministro que a un desarrollador (si bien los primeros predominaban).Primera Asamblea Digital Europea

El evento reunió a los diferentes agentes implicados para debatir sobre las mejores maneras de avanzar en la consecución de los objetivos de la Agenda Digital para Europa (2010-2020).

Con este motivo se organizaron 24 talleres temáticos y dos sesiones plenarias. CTIC ha tenido la oportunidad de participar como experto invitado en el taller sobre “Open Data y Reutilización de Información del Sector Público” en una mesa impecablemente moderada por Nigel Shadbolt. Todo el material de presentaciones, etc. producido en el taller se encuentra disponible; también fue retransmitido por la Web en directo y se anuncia que próximamente el vídeo completo también estará disponible.

Se puede decir con tranquilidad que el taller fue un éxito rotundo. Algunas cuestiones a destacar:

  • Más de 220 personas en la audiencia (cifras de la CE), en la sala plenaria.
  • El Director General de Contenido Digital y Sistemas Cognitivos, Khalil Rouhana, anunció un par de cosas importantes:
    • Portal Open Data de la Comisión Europea en 2012
    • Portal Open Data Pan-Europeo en 2013
    • Decisión de la CE sobre la revisión de la directiva RISP en Noviembre 2011
  • El nivel de las ponencias fue realmente alto y fueron muy útiles, algunas cosas a destacar:
    • Muchas barreras aún persisten. Por ejemplo, aún hoy en día es muy difícil acceder a la información en formatos procesables (ni hablemos de 5 estrellas), pero hay que tender hacia ellas, subiendo lo posible en la escala
    • Existe la necesidad de unificar vocabularios
    • Sería importante que la CE diera un paso al frente y estableciera una licencia por defecto
    • Europeana eliminó el NC de su licencia para dejarlo en CC-BY por buenas razones (muy recomendable lectura de “Why drop the non-commercial clause from the agreement?” en sus términos de uso)
    • El potencial económico del RISP se vuelve a medir en miles de millones de €: 140.000 en palabras de Graham Vickery (OCDE)
    • El interés por la reutilización es claramente creciente
  • El nivel de debate y preguntas de los asistentes también fue muy bueno

    Josema impartiendo su ponencia en la DAA11PSI

    Josema impartiendo su ponencia en el taller (by José Luis Marín)

Pero esto no fue todo. En absoluto. Open Data y RISP también se convirtieron en protagonistas de la sesión plenaria del primer día. Al inicio de la sesión, la Vice-Presidenta de la Comisión Europea, Neelie Kroes, hizo entrega de los premios del Open Data Challenge (¡más de 400 participantes!) y del Hack4Europe y tanto el impresionante nivel de participación, como el de los trabajos recibidos.

Para CTIC, este es otro paso adelante. Uno muy importante. Son ya varios años trabajando en esta línea y empujando a nivel nacional, europeo e internacional, y una satisfacción enorme el ver que el discurso va calando y que la que comunidad Open Data continua creciendo.

, , , ,

1 Comentario

The Open Government Data Catalog is Now Collaborative

New OGD Initiative Entry Form

New OGD Initiative Entry Form

We are pleased to announce the new features of the Repository of Open Government Data Catalogs. Until now, only the Open Data initiatives led by either governments or public agencies have been published. Now, any public sector information catalog (managed by citizen movements, transparency commissions, NGOs, and other institutions) is welcomed. The only requirement is that those catalogs must contain public sector information.

Furthermore, we have automatized the catalog. Up to date, our catalog was maintained by hand, and when we found new initiatives we typed the meta-information in RDF, and it was submitted to our triplestore. Now, anyone may contribute submitting new catalogs using a simple form. Also, if a mistake or inaccuracy in any of the catalog entries is detected, it can be updated with the right information. Anyone may update the information selecting the marker on the map, and clicking the link “update it”.

How Does the Catalog Work?

The process of a new entry creation is simple:

  1. A nonexistent Open Government Data initiative is launched
  2. This initiative/catalog is defined using some metadata (title, description, issued date, location, etc.) by the form. The location info (latitude, longitude, name, etc.) is got from a Geonames service, so be careful with the jurisdiction of the initiative (is a city?, a state?, a nation?,…)
  3. The metadata are modeled in RDF triples, and we receive an alert
  4. We check that the RDF code is right to avoid spam, and to assure the location is correct.
  5. The new entry is available in the triplestore, and its marker on the map

If you detect a typo or mistake in any entry, please let us know using a similar form, after clicking on the link titled as “update it” in the balloon with the information of the initiative to modify. The update process is the same as the creation one, we will moderate the changes to avoid spam or inaccuracies. Spam entries will be rejected.

Link to update the information

Link to update the information

, , ,

No hay Comentarios

Trabajando para que el Open Government llegue a todo el mundo

Cuando observamos el mapa de las iniciativas Open Data a nivel mundial se detecta rápidamente que casi la totalidad de estas iniciativas se concentran en el Oeste de Europa y Norte América.

Existe un gran vacío en el resto del mapa, especialmente en lo que concierne a países en vías de desarrollo.

Mapa mundial del Open Government Data

Hoy se ha cumplido un hito importante a la hora de intentar paliar ese problema. La Web Foundation presenta los borradores de los resultados de los estudios de viabilidad para una estrategia Open Goverment Data en Chile y Ghana, un trabajo realizado en asociación con CTIC Centro Tecnológico.

Para llevar a cabo los estudios hemos tenido que dar un paso atrás y realizar un interesante y productivo ejercicio de reflexión con el objetivo de intentar comprender cuáles son los elementos y condiciones que dan lugar a que una iniciativa de este tipo sea exitosa y poder así aplicarlos en estos países.

Dado lo novedoso de la inicativa estamos especialmente interesados en conocer las opiniones de la comunidad OGD, por lo que os invitamos a leer los informes (informe de Chileinforme de Ghana) y enviar vuestros comentarios a ogd-comments@webfoundation.org antes de finales de Marzo.

Desde el equipo de Open Data @ CTIC queremos también agredecer a la World Wide Web Foundation el haber pensado en nosotros para llevar a cabo este trabajo. Estamos deseando continuar y extender este proyecto conjunto para realizar nuevos estudios, llevar a cabo experiencias piloto y proporcionar nuevas herramientas y conocimientos a la comunidad OGD mundial, con el objetivo de hacer que los beneficios de estas iniciativas puedan extenderse de una forma realmente global.

, , ,

1 Comentario

Uso de Linked Data para el tratamiento de datos estadísticos

Hace unos días se presentó una aplicación que, mediante el uso de Linked Data, nos permite visualizar de manera sencilla datos de Estadísticas INE sobre equipamiento y uso de las TIC y el comercio electrónico en las empresas y hogares asturianos (2005-2010).

Lo más destacable de esta aplicación es que, gracias al uso de las tecnologías Linked Data, permite combinar datos estadísticos almacenados en decenas de hojas Excel con diferentes estructuras y nomenclatura, una tarea que anteriormente resultaba tediosa y complicada.

Utilizando tecnologías semánticas como RDF o SPARQL hemos conseguido modelar, unificar y exponer los datos, haciendo posible realizar comparaciones de los indicadores estadísticos a lo largo del tiempo (evolutivos), comparaciones entre los datos asturianos y nacionales y, además, hemos dejado la puerta abierta para, en un futuro, poder comparar los datos entre diferentes comunidades autónomas.

Como no podía ser de otra forma en un proyecto Open Data, los datos utilizados por la aplicación se han hecho públicos y son accesibles desde el portal de Reutilización de Información del Sector Público del Principado de Asturias para que cualquiera pueda acceder a ellos y utilizarlos en sus propios desarrollos.

En el siguiente vídeo podéis ver la aplicación en funcionamiento:

, , , ,

1 Comentario

Comentarios a la consulta pública del borrador de Real Decreto RISP

Hace unos días, el Ministerio de Industria, Turismo y Comercio junto con el de Política Territorial y Administración Pública, han abierto a consulta pública el borrador de Real Decreto por el que se desarrolla la Ley 37/2007, de 16 de noviembre, sobre reutilización de la información del sector público. Este post recoge los comentarios desde CTIC a dicho borrador.

Ante todo, desde CTIC queremos agradecer la oportunidad de poder realizar comentarios a dicho borrador y esperamos que este tipo de aperturas a consulta pública se produzcan con mayor asiduidad. Es posible que algunos de los comentarios excedan los límites de un Real Decreto, y comprendemos que dicho desarrollo debe estar enmarcado dentro del alcance establecido en la ley de referencia. Pero permítansenos estas pequeñas libertades con el objetivo adicional de generar más debate sobre aspectos de la ley y del marco de la reutilización en España que creemos debieran ser reformados en un futuro, preferiblemente cercano.

Comentarios Generales

Si bien ahondaremos en estas cuestiones posteriormente, los problemas generales más importantes que vemos son los siguientes:

  • el borrador de RD (al igual que la ley) vuelve a ser de cumplimiento voluntario, lo que se refleja en varios “procurarán”, “podrán”… es hora de que sea de cumplimiento obligatorio a no ser que existan razones que justifiquen en casos muy concretos la no puesta a reutilización de la información pública
  • en este sentido apreciamos positivamente los intentos del borrador en dar paso a una puesta a disposición más proactiva, intentando minimizar el estilo reactivo, si bien creemos que se queda corto en este sentido, dejando la puerta demasiado abierta al cumplimiento con el RD mediante la segunda opción
  • se vuelven a quedar fuera muchos tipos de información de alto valor añadido; ejemplo: publicaciones científicas procedentes de proyectos financiados con fondos públicos, archivos culturales…
  • se recalca la posibilidad de sancionar a los reutilizadores por diversos incumplimientos, pero:
    • algunos de ellos no están del todo claros aunque pueden dar lugar a sanciones graves (desnaturalización, por ejemplo)
    • no se contempla ningún tipo de mecanismo sancionador por incumplimiento para la Administración
  • nos parece muy positivo que se refuerce el impulso al uso de formatos electrónicos, estándares abiertos y accesibles y el establecimiento de una figura responsable RISP en los organismos
  • nos parece confusa la diferenciación entre la publicación de la información en las respectivas sedes electrónicas y el catálogo centralizado y creemos que esta relación debe ser aclarada
  • el marco de la reutilización debería ser complementado (de una vez) con una ley de transparencia y acceso a la información adecuada, que esperamos pueda seguir este mismo camino de consulta pública en vez del que ha venido siguiendo de filtraciones a los medios de comunicación y otros terceros.

Comentarios Específicos

Título

Para empezar y, aunque pueda parecer trivial, creemos que es importante hacer un apunte sobre el título del borrador en cuestión: “Borrador de proyecto de Real Decreto por el que se desarrolla la Ley 37/2007, de 16 de noviembre, sobre reutilización de la información del sector público”. Este documento realiza un cambio sustancial con respecto a la ley 37/2007 en lo que a su ámbito subjetivo de aplicación se refiere y, para no conducir a equívoco, sugerimos se añada al título la coletilla “en la Administración General del Estado”.

Artículo 1

Se restringe el ámbito subjetivo de aplicación de la Ley 37/2007, de ahí que propongamos el cambio en el título reflejado anteriormente.
El apartado 3 refiere a las excepciones previstas en el artículo 3 de la Ley 37/2007. Algunas de las mismas pueden llegar a ser barreras infranqueables según la interpretación (unilateral) que se realice por parte del organismo en cuestión, concretamente aquella que se refiere a “ser titular de un derecho o interés legítimo.”

Especialmente en este último asunto creemos altamente recomendable y útil la realización de un estudio extenso en la AGE sobre el impacto de la reutilización en algunos de los conjuntos de información excluidos como, por ejemplo, la información registral, que si bien se puede acceder de forma tradicional en pequeños trozos mediante el pago de unas tasas, no entra dentro del ámbito de la Ley, ni le será de aplicación el futuro RD derivado del presente borrador.

Artículo 2

Se vuelve a hablar de “documento reutilizable”. Esto ya nos causó problemas en la revisión del primer borrador del Manual Aporta. La Ley 37/2007 define documento como “…toda información cual quiera que sea su soporte material o electrónico así como su forma de expresión gráfica, sonora o en imagen utilizada”.

En el mundo del Open Data en el que nosotros trabajamos los datos se explotan preferiblemente en crudo, con el mayor nivel de desagregación posible. Creemos que la no distinción de estos casos puede dar lugar a problemas posteriores que resaltaremos en el artículo 8.

Artículo 3

Coincidimos plenamente con los comentarios aportados por Pro Bono Público sobre este artículo, en los que se propone añadir texto que refleje que en los nuevos desarrollos se incluirán las cláusulas necesarias que permitan respetar o incorporar formatos en bruto, procesables y accesibles de modo automatizado.

Entre otros áreas de actuación, es de todos sabido que CTIC tiene una grandísima experiencia y tradición en el desarrollo de políticas de accesibilidad Web, como pioneros en este campo en España. Nuestra experiencia en ese terreno y en el campo del Open Data coincide plenamente con la justificación dada: si se tiene en cuenta desde el principio, el coste se minimiza o se anula, y adicionalmente se produce algo que es de mayor calidad.

Adicionalmente nos parecen muy acertada las referencias a formatos en bruto, procesables, accesibles automáticamente, utilizando estándares abiertos , y que sean accesibles a personas con discapacidad.

Artículo 4

Nos complace especialmente la creación de la figura del responsable RISP. Sugerimos que en sus funciones, función c) se añada que (en el caso de recursos denegatorios) deberá indicar las vías de recurso a instancias superiores a las que pueda acogerse el solicitante, según está previsto en el apartado 7 del artículo 10 de la Ley 37/2007.

Adicionalmente, en la función g), nos gustaría ver más proactividad sobre los acuerdos exclusivos, tendente a su eliminación. Por lo tanto, más allá de incluir  una referencia, se debería elaborar un informe detallado sobre su justificación e idealmente una hoja de ruta para su eliminación.

Artículo 5

De nuevo coincidimos plenamente con las aportaciones de Pro Bono Público en este sentido. Nos parece que la redacción sugerida para el apartado 1 aporta mayor claridad.

En los apartados 2 y 3 nos preocupa la aparición de “procurarán” y “podrán” respectivamente. Si RISP, como el borrador presupone en uno de sus grandes objetivos, favorecerá el crecimiento económico, se crearán negocios que faciliten productos y servicios de valor añadido en base a la información puesta a disposición de los reutilizadores (como ya ha empezado a ocurrir). Dichos negocios necesitarán de unas mínimas garantías, por ejemplo si un conjunto de información sólo es útil si se facilita en tiempo real, de poco servirá el facilitarlo con un día de retraso. Las modificaciones propuestas al apartado 1 antes referidas, paliarían en parte este problema, si bien en nuestra experiencia el problema mayor habitual son el de la calidad de la información puesta a disposición, así como el de la “desaparición” de la propia información. No se debería pues, excluir completamente la responsabilidad de la Administración en estos dos casos. ¿Qué ocurre si dicho negocio no puede acceder a la información en cuestión por dejación o error por parte de la Administración? ¿Y si el servicio ofrecido genera conclusiones erróneas en base a la información ofrecida simplemente porque ésta no es correcta o es de baja calidad?

Adicionalmente se debería tener en cuenta lo que pasará con las distintas versiones de la información en el tiempo (si se archivarán o no y como) y sobre los cambios de propiedad de la misma, por ejemplo, cuando un organismo desaparece o cambia de nombre. Es necesario un mecanismo que tenga estos dos aspectos en cuenta. Al menos proponemos que se elimine “procurarán garantizar” y se sustituya por “garantizarán” y el final se cambie por “disponibilidad en el tiempo, completitud e integridad”.

Sobre el apartado 4, el caso de la aplicación de tasas debería ser altamente excepcional. De nuevo nos remitimos a la recomendación de estudiar a fondo porqué se cobran dichas tasas, en qué casos, y si realmente son necesarias o no. Se debe favorecer, salvo justificación de necesidad absoluta, la reutilización gratuitamente o en el peor de los casos a coste marginal.

Artículo 6

Creemos que puede causar confusión la responsabilidad que se atribuye a los responsables RISP de los organismos en cuanto al catálogo, adicionalmente a la previamente desarrollada en el borrador sobre la publicación de la información reutilizable en la sede electrónica del propio organismo. Entendemos que la idea subyacente es que el catálogo no contenga la información en sí, si no sólo la metainformación, que quizás en un principio se deba actualizar por parte del responsable pero que en un futuro podría agregarse de forma automatizada a partir de la disponible en las respectivas sedes electrónicas.

Esta es nuestra recomendación, que ya hicimos extensiva en la reciente workshop privada de la Comisión Europea sobre un potencial portal pan-europeo, en la que señalamos que el catálogo sólo debería almacenar información si ofrecía algún tipo de servicio de valor añadido, por ejemplo, conversión a un formato que facilite más la reutilización.

Si esta es la teoría subyacente en el borrador, creemos debería explicitarse más para no llamar a confusión. Si no lo es, sugerimos que lo sea.

Artículo 7

Se habla de fijación de líneas estratégicas y coordinación, pero vemos dos problemas potenciales:

  • No se habla de soporte. ¿Quién dará soporte legal, técnico, otros, a los organismos? Creemos que esto es muy necesario y debe ser considerado y añadido.
  • ¿Cómo se evaluará periódicamente? Podemos decir desde la experiencia que esto no es, en absoluto, trivial y que necesita de un análisis muy detallado y de la creación de algún tipo de metodología de monitorización y evaluación específica.

Artículo 8

Coincidimos plenamente con las apreciaciones de Pro Bono Público sobre la posibilidad de extractar la información.  Ya nos habíamos referido a este problema anteriormente cuando hablábamos de “documento reutilizable” y la diferencia que existe con lo que se conoce como “conjunto de datos” (dataset) en el mundo del Open Data. Las modificaciones propuestas son extremadamente necesarias y la extractación de información, siempre y cuando se mantenga la integridad del extracto no debería suponer una interpretación de desnaturalización de la misma, y es necesaria en muchos de los casos para poder procesarla y mezclarla con otros extractos y producir aplicaciones y servicios de valor añadido.

Artículo 9

Nos complace ver que el supuesto c) se reserva a casos excepcionales. En todo caso, el uso de los supuestos b) y c) deberían ir siempre acompañados de una justificación detallada.

Adicionalmente en el caso de las licencias-tipo, sugerimos se incluya la creación de un marco de licencias para la AGE, en el que se propondría el uso de diversas licencias tipo procesables automáticamente y a poder ser ya existentes en el ámbito internacional (y  que aparecen mencionadas en el borrador) como CC, EUPL, GPL y otras, de forma que se facilite la labor de los responsables RISP y que a toda información reutilizable le sea asignada una o varias de estas licencias. Recomendamos la revisión, entre otros, del trabajo hecho a este respecto por el Gobierno de Nueva Zelanda.

Artículo 11

Después de varias lecturas del segundo párrafo del apartado 2, seguimos sin entenderlo adecuadamente. Sugerimos su edición y simplificación.

Artículo 12

Nos parece acertada su inclusión ya que la experiencia nos dicta que esto suele ser una preocupación para quien empieza en la materia.

Un apunte también desde la experiencia sobre “siempre y cuando los medios técnicos y económicos lo permitan”. Hemos visto en muchos casos que se realiza la disociación a la hora de publicar en formatos tipo papel y que este tipo de disociación es comprendido y se utilizan los medios necesarios para realizarla. Sin embargo a la hora de hablar de formatos electrónicos (donde debe ser aún más fácil y menos costoso) existe un cierto rechazo e incluso en ocasiones se valora aplicar tasas por los costes incurridos. Sugerimos, como hicimos en casos anteriores, que si esa frase permanece, se añada la obligatoriedad de ofrecer una justificación detallada de la imposibilidad de llevar a cabo la disociación.

Disposiciones

Lamentamos la disposición adicional primera. Somos conscientes que cualquier tipo de puesta en marcha requiere de esfuerzos y que en los tiempos que vivimos, una aportación presupuestaria sería de gran ayuda. Igualmente comprendemos que es extremadamente complicado por la propia situación presupuestaria de la Administración. No obstante, esperamos que se puedan buscar algunas vías de ayuda, quizás vía Proyecto Aporta, para amortiguar el efecto de esta disposición.

Nos agrada ver el apartado 1 de la disposición adicional segunda y su referencia al ENI. Siempre hemos mantenido desde CTIC que, bien realizada, la puesta a disposición de información reutilizable contribuye a un incremento de la interoperabilidad y, por ende, de la eficiencia de la Administración. Además, creemos que este apartado intenta paliar las preocupaciones que mostramos anteriormente sobre la calidad de la información y su persistencia en el tiempo, aunque sólo sea una parte (pero importante) de la solución.

, , ,

2 Comentarios

Catalonia Launched its Open Data Website

Dades obertes gencat. Generalitat de Catalunya

Dades obertes gencat. Generalitat de Catalunya

Generalitat de Catalunya has launched its Open Data (Dades Obertes) website, as part of its Reusing Public Sector Information Initiative. Some news and high quality aspects has been included in this project: the government agreement, which regulates the opennes of the public sector data in Catalonia in order to satisfy the current rules about Reusing Public Sector Information; the use terms almost without restrictions; and the focus on Linked Data technologies.

High Quality and Structured Data

Gencat is another government interested in Linked Data Technologies, and it started to represent and publish some data in RDF. Among those data there are more than 26000 public buildings, defined using the vCard standard in RDF; over 700 proceedings and services; and many more data in structured and easy-to-re-use data (XML, RSS, APIs, etc.).

An example of representation of a vCard, could be:

 Oficina d'informació al Consumidor del Consell Comarcal de La Cerdanya> Oficina d'informació al Consumidor del Consell Comarcal de La Cerdanya> Dept. d'Economia i Finances > Reg, 5> Puigcerdà> 17520> Cerdanya> Spain 42.4342 1.925387 972884884> 972882283> Equipaments> Comerc_Consum> Oficines_comarcals_dinformacio_al_Consumidor> 

Standard Dataset Catalog

Gencat’s Dades Obertes includes the representation of the data catalog using the international vocabulary dcat, Dataset Catalog, which enables the RDF semantic description of the dataset catalog.

The full catalog has been modeled with dcat and it is available in RDF-XML format. It enables interoperability among similar platforms around the World.

Example of dataset represented in dcat:

 000074 Servei Meteorològic de Catalunya Predicció al Pirineu Predicción en el Pirineo El Servei Meteorològic de Catalunya cada dia a les 14 hores actualitza la predicció al Pirineu. Aquesta informació està formada per una descripció general a 3 dies i per la Val d'Aran, pel Pirineu Occidental i Oriental i per Andorra. A més per cada una d'aquestes zones es descriu el temps cada 3 hores per diverses zones. El Servicio Meteorológico de Cataluña actualiza cada día a las 14 horas la predicción para el Pirineo. Esta información está formada por una descripción general a 3 días, y se refiere al Valle de Arán, al Pirineo Occidental y Oriental, y a Andorra. Además, para cada una de estas áreas se describe el tiempo cada 3 horas por diversas zonas. Generalitat de Catalunya P1D Diària Diaria temps meteorologia prediccions meteorològiques tiempo meteorología predicciones meteorológicas Medi ambient Medio ambiente http://www.meteo.cat/servmet/opendata/pirineu.xml 86016 84.0 Kb text/xml XML 

Although there is no SPARQL endpoint at the website, all the data expressed in RDF are published as RDF-XML documents, and the initiative claims the engagement of using Linked Data in its full potential. It is one of the best approach, similar to the solutions developed by Gobierno del País Vasco, Gobierno del Principado de Asturias, and Ayuntamiento de Zaragoza.

, , ,

2 Comentarios