Fundación CTIC

Archivo etiqueta linked data

Usando App Inventor para desarrollar aplicaciones basadas en Open Data

A partir de Blockly (servicio alojado por Google) el MIT creó la plataforma de desarrollo denominada App Inventor, con la idea de que cualquiera pudiese cronstruir aplicaciones para el sistema Android de una forma sencilla, visual y sin necesidad de escribir una sola línea de código. Y aunque tenga sus limitaciones, hoy por hoy App Inventor rebaja la dificultad para que cualquier persona sin experiencia previa en programación pueda llegar a crear algo útil a la medida de sus necesidades.

Para diseñar una aplicación o el comportamiento de sus elementos, el usuario simplemente va colocando y uniendo objetos (bloques y componentes) dentro de un editor web visual. App Inventor proporciona numerosos componentes de alto nivel para usar los recursos del smartphone, y también para comunicarse con otros recursos web externos.

Por ejemplo hay componentes para leer la localización proporcionada por el sensor GPS, para hacer fotos con la cámara, para recibir SMS, o incluso para enviar mensajes por redes sociales como Twitter.

Pero el que quiero destacar en este post, por su utilidad para poder crear aplicaciones basadas en la reutilización de los datos abiertos por las AA.PP., es un componente denominado “Web”, el cual proporciona funciones para realizar peticiones HTTP GET, POST, PUT y DELETE. El componente en cuestión puede operar con datos tanto en formato JSON como HTML.

En este tutorial ofrecido por el sitio “App Inventor en Español” se muestra con un ejemplo cómo utilizar el componente Web para crear una aplicación que permita localizar en un mapa las farmacias de guardia en la Comunidad Navarra, empleando para ello el conjunto de datos disponible desde el portal Open Data Navarra.

Por otro lado, y aunque App Inventor por defecto no ofrece soporte para guardar los datos de la aplicación como Linked Data o para integrarse con otros recursos Linked Data, un grupo del MIT extendió en 2013 la plataforma App Inventor para que pudiese interactuar con fuentes Linked Data, ocultando así la complejidad de trabajar con RDF y SPARQL en el desarrollo de aplicaciones. Para ello crearon nuevos componentes (SemanticForm, SemanticWeb y SemanticWebListPicker) y modificaron algo el interfaz de usuario. El código fuente de esta versión extendida puede obtenerse aquí y su descripción en el paper “Democratizing Mobile App Development for Disaster Management“.

, , ,

2 Comentarios

Actualización de datos en la herramienta del Principado de Asturias de visualización de datos INE sobre equipamiento y uso de las TIC en Asturias.

Recientemente, hemos realizado en la actualización de datos de la aplicación para la visualización de datos estadísticos sobre el Equipamiento y uso de las TIC en Asturias.

Para ponernos en antecedentes, tal vez conviene recordar que este proyecto del Gobierno del Principado de Asturias aborda un proceso de transformación de datos estadísticos sobre el estado de la Sociedad de la Información en Asturias (datos obtenidos a partir del convenio de colaboración entre el Instituto Nacional de Estadística, el Instituto Asturiano de Estadística y Fundación CTIC) pertenecientes al catálogo de datos de Asturias a formatos abiertos con una doble finalidad:

  • Ponerlos a disposición de terceros (empresas, ciudadanía, etc.) para su reutilización y generación de nuevos contenidos y servicios de valor.
  • Generar una herramienta de gestión de datos estadísticos que permita la publicación de los datos del INE relativos al equipamiento y uso de las TIC en los hogares y en las empresas asturianas (encuestas TIC-H y TIC-E), facilitando la agregación de los mismos y la generación de visualizaciones que favorezcan su consumo.

La herramienta maximiza la experiencia de usuario mediante el uso tecnologías web (visualización en base a Linked Data), permitiendo una interacción con la herramienta sencilla e intuitiva, dotando al usuario de múltiples canales para personalizar consultas (configuración de consulta a través de selectores de datos con posibilidad de interactuar con los objetos gráficos, gráficas, tablas y mapas).

Con esta última actualización, se han añadido los datos de las últimas encuestas correspondientes al ejercicio 2011, por lo que los usuarios podrán consultar las estadísticas sobre equipamiento y uso de las TIC desde 2005 hasta 2011, pudiendo realizar visualizaciones de análisis evolutivos y comparativos entre Asturias y la media nacional registrada para los principales indicadores TIC, así como desagregados de los principales datos de Asturias por comarcas SADEI.

Entre las novedades incorporadas en los indicadores destacados de este año, destacan los relativos al uso de Internet por la ciudadanía en servicios relacionados con la participación política y social.

Esta aplicación es un ejemplo sobre el potencial de este tipo de herramientas para la visualización de datos estadísticos, así como para facilitar el acceso (configuración de consultas) y comprensión (representaciones sencillas) sin necesidad de realizar arduos ejercicios con herramientas de explotación estadística.

, , ,

No hay Comentarios

No es Linked Data todo lo que reluce

Echando un vistazo al mapa nacional de las iniciativas Open Data, observamos que cada vez hay mayor preocupación dentro de las Administraciones Públicas por la transparencia y por ofrecer los datos públicos a sus verdaderos dueños: la ciudadanía y las empresas. Los catálogos de datos públicos crecen como setas, y algunas administraciones empiezan a notar la creciente demanda de información específica, lo que fomenta la aparición de aplicaciones realmente útiles para la sociedad.

Algo que realmente llama la atención es el compromiso de las distintas iniciativas de hacer Open Data realmente abierto, usando formatos estándar. Todas buscan la excelencia tecnológica, con la vista puesta en las 5 estrellas de Tim Berners-Lee, lo que nos congratula enormemente y motiva para seguir apostando por la base de la Web del futuro próximo, las tecnologías Linked Data que ayudan a crear la Web de los Datos. Pero, entre esta vorágine tecnológica, nos encontramos con un problema… no todos lo hacen bien y esto pone en peligro el crecimiento de la Web de los Datos.

Después de varios posts argumentando el uso de Linked Data, no hace falta insistir en las bondades de estas tecnologías 5 estrellas y cada vez surgen más aplicaciones de última generación, que hacen uso de la semántica estos datos enlazados y se aprovechan de la gran potencia de estos mecanismos de asociación conceptual, combinación y enriquecimiento de la información. El problema surge cuando se desconoce y, por lo tanto, malinterpreta el funcionamiento de la representación semántica –usando RDF– y los conceptos básicos ligados a este modelo. Hemos observado la proliferación de conjuntos de datos que se proclaman erróneamente “semánticos” y en “formato” RDF.

El concepto y las tecnologías Linked Data, no son triviales y son desconocidas para la mayoría de los desarrolladores clásicos. Si estos pretendieran entrar en materia e intentaran usar datos que supuestamente están representados erróneamente mediante estas tecnología, se encontrarían con una situación frustrante y contraproducente para ellos y el futuro del Linked Government Data.

Pero, ¿por qué se hace mal? Básicamente, no se aplica la esencia del Linked Data. Para ilustrar algunos de los problemas comunes y que sea algo más comprensible, se llevará al plano del XML tradicional.

Confusión RDF y XML

El RDF es una infraestructura para describir semánticamente recursos, es decir, dotar de sentido a lo que representamos para que las máquinas lo comprendan. Aunque la información RDF se puede representar en distintos formatos: XML, N3, Turtle… Muchos creen que el RDF es simplemente XML, no es así.

El XML es un formato para representar información en forma de árbol, mientras que RDF representa grafos. XML es útil para la interoperabilidad sintáctica, pero RDF ofrece una dimensión más, la interoperabilidad semántica.

No se representa correctamente la información

Para representar de forma correcta la información se debería atomizar, indicando los tipos de datos representados (numérico, textual, fecha,…). Además, siempre que sea posible, toda la información que no literal (fechas, nombres, descripciones textuales, etc.) se deberían representar cualquier recurso (objeto real o concepto) como tal. De esta forma, podemos acceder directamente a la información que nos interesa y procesarla de forma automática.

Sería similar a un desarrollador que pretende hacer una aplicación que lee el siguiente XML:

<elemento>
  <![CDATA[<fecha>2001-01-03</fecha>]]>
</elemento>

La herramienta de análisis del documento, no podría tener acceso directo a elemento2… Esto es algo obvio, ¿no? Pero tampoco sabría que la información útil es de tipo fecha. Habría que hacer un procesamiento léxico y sintáctico.

Solución:

Especificar correctamente los tipos de datos que se representan. Por ejemplo, un curso titulado “Técnico en Software Ofimático”, del servicio de empleo del Principado de Asturias representa el inicio y fin indicando el tipo de tipos representado, en este caso una fecha.

...
<x:Accion-Formativa rdf:about="http://risp.asturias.es/empleo/oferta-formativa/Accion-Formativa/2010_123">
  ...
  <cal:dtstart rdf:datatype="http://www.w3.org/2001/XMLSchema#date">2010-03-19</cal:dtstart>
  ...

No se definen esquemas (vocabularios)

Lo ideal sería utilizar vocabularios (esquemas) estándar, aunque si no existieran se definirían ad-hoc. De esta forma se dota de semántica a la información. Si no se especifica un vocabulario asociado a la representación de la información, ésta no tiene sentido semántico. Puede que tenga sentido para el propio productor de la información, pero para el resto, sólo vería un contenido (aunque con sintaxis correcta) sin sentido. Ni hablar del tratamiento automatizado.

Llevándolo al plano del desarrollo usando XML sería como ofrecer el documento siguiente y no ofrecer un esquema XSD ni información relativa a la estructura que se sigue:

<info>
  <elem0001>1000292</elem0001>
  <elem0002>New York</elem0002>
  <elem0001>2001-03-02</elem0001>
  <elem0001>2014-02-12</elem0001>
  <elem0003 att00x="disabled">true</elem0003>
  ...

Inútil, ¿no? ¿Qué significa 1000292? ¿y 2001-03-02?…

Solución:

Usar vocabularios estándar o ampliamente utilizados como, por ejemplo, el Dades Obertes de la Generalitat de Catalunya que utiliza una representación basada en el estándar VCard para representar la información de contacto de sus equipamientos públicos.

Estos vocabularios se pueden especializar en función de los requisitos de la organización, como lo ha hecho con los centros municipales el Ajuntament de Barcelona, quienen han adaptado el esquema de VCard para sus necesidades. Después de modificarlo, lo han documentado y expuesto para que pueda ser también reutilizado (http://bcn.cat/data/v8y/xvcard#).

No se identifican los recursos

La mayoría de los recursos definidos mediante RDF deberían tener asociadas URIs resolubles para acceder a ellos desde las aplicaciones o desde otros recursos. Si se identifican con URIs (direcciones Web unívocas) a las que no se pueden acceder, perdemos la mitad del Linked Data (en concreto, el “Linked”).

No tendría sentido tener que descargarse el documento para tratarlo localmente.

Solución:

Identificar los recursos mediante URIs resolubles. Un ejemplo de esto, puede verse en los las ofertas de empleo publicadas en el Datos Abiertos de la ciudad de Zaragoza. Cada oferta de empleo tiene asociada un URI (por ejemplo, una oferta de Oficial Conductor es http://www.zaragoza.es/datosabiertos/id/empleo/Oferta/455).

Gracias a esto, podemos enlazar los datos entre sí. Por ejemplo, podemos ver en las definiciones de los datasets del Open Data de Euskadi que se hace referencia a la zona geográfica del propio dataset usando enlaces a recursos de una base de datos especializada sobre lugares poblados, Geonames. En este caso, http://sws.geonames.org/3104469/ define a la provincia de Vizcaya.

Conclusiones

Estos y otros problemas nos lo encontramos en muchos de los catálogos de datos 4 o 5 estrellas. Está claro que no es sencillo y pueden cometerse errores, pero habría que respetar al menos la esencia del Linked Data. No es necesario tratar de publicar todos los conjuntos de datos en RDF, ni accesibles desde un SPARQL endpoint (para hacer consultas sobre RDF), pero aquellos que se publiquen deberían poder usarse de la forma que se esperaría.

Cuando publicamos un conjunto de datos en Linked Data, entre otras, deberíamos plantearnos las siguientes preguntas:

  • ¿Puede ser combinado con un conjunto de datos del mismo tipo procedente de otra administración, esto es, hacer Linked Data?
  • El vocabulario usado, ¿está claramente especificado y es reutilizable?
  • ¿Puede un agente reutilizador usar los datos sin falta de descargarse ficheros?
  • ¿Se puede acceder a cada uno de los recursos definidos mediante una dirección Web (URI)?
  • ¿Se podrá acceder dentro de un año a estos recursos de la misma forma?
  • ¿Están los recursos Linked Data enlazados entre sí?

Todas estas preguntas deberían tener respuestas afirmativas.

1 Comentario

Uso de Linked Data para el tratamiento de datos estadísticos

Hace unos días se presentó una aplicación que, mediante el uso de Linked Data, nos permite visualizar de manera sencilla datos de Estadísticas INE sobre equipamiento y uso de las TIC y el comercio electrónico en las empresas y hogares asturianos (2005-2010).

Lo más destacable de esta aplicación es que, gracias al uso de las tecnologías Linked Data, permite combinar datos estadísticos almacenados en decenas de hojas Excel con diferentes estructuras y nomenclatura, una tarea que anteriormente resultaba tediosa y complicada.

Utilizando tecnologías semánticas como RDF o SPARQL hemos conseguido modelar, unificar y exponer los datos, haciendo posible realizar comparaciones de los indicadores estadísticos a lo largo del tiempo (evolutivos), comparaciones entre los datos asturianos y nacionales y, además, hemos dejado la puerta abierta para, en un futuro, poder comparar los datos entre diferentes comunidades autónomas.

Como no podía ser de otra forma en un proyecto Open Data, los datos utilizados por la aplicación se han hecho públicos y son accesibles desde el portal de Reutilización de Información del Sector Público del Principado de Asturias para que cualquiera pueda acceder a ellos y utilizarlos en sus propios desarrollos.

En el siguiente vídeo podéis ver la aplicación en funcionamiento:

, , , ,

1 Comentario

Catalonia Launched its Open Data Website

Dades obertes gencat. Generalitat de Catalunya

Dades obertes gencat. Generalitat de Catalunya

Generalitat de Catalunya has launched its Open Data (Dades Obertes) website, as part of its Reusing Public Sector Information Initiative. Some news and high quality aspects has been included in this project: the government agreement, which regulates the opennes of the public sector data in Catalonia in order to satisfy the current rules about Reusing Public Sector Information; the use terms almost without restrictions; and the focus on Linked Data technologies.

High Quality and Structured Data

Gencat is another government interested in Linked Data Technologies, and it started to represent and publish some data in RDF. Among those data there are more than 26000 public buildings, defined using the vCard standard in RDF; over 700 proceedings and services; and many more data in structured and easy-to-re-use data (XML, RSS, APIs, etc.).

An example of representation of a vCard, could be:

 Oficina d'informació al Consumidor del Consell Comarcal de La Cerdanya> Oficina d'informació al Consumidor del Consell Comarcal de La Cerdanya> Dept. d'Economia i Finances > Reg, 5> Puigcerdà> 17520> Cerdanya> Spain 42.4342 1.925387 972884884> 972882283> Equipaments> Comerc_Consum> Oficines_comarcals_dinformacio_al_Consumidor> 

Standard Dataset Catalog

Gencat’s Dades Obertes includes the representation of the data catalog using the international vocabulary dcat, Dataset Catalog, which enables the RDF semantic description of the dataset catalog.

The full catalog has been modeled with dcat and it is available in RDF-XML format. It enables interoperability among similar platforms around the World.

Example of dataset represented in dcat:

 000074 Servei Meteorològic de Catalunya Predicció al Pirineu Predicción en el Pirineo El Servei Meteorològic de Catalunya cada dia a les 14 hores actualitza la predicció al Pirineu. Aquesta informació està formada per una descripció general a 3 dies i per la Val d'Aran, pel Pirineu Occidental i Oriental i per Andorra. A més per cada una d'aquestes zones es descriu el temps cada 3 hores per diverses zones. El Servicio Meteorológico de Cataluña actualiza cada día a las 14 horas la predicción para el Pirineo. Esta información está formada por una descripción general a 3 días, y se refiere al Valle de Arán, al Pirineo Occidental y Oriental, y a Andorra. Además, para cada una de estas áreas se describe el tiempo cada 3 horas por diversas zonas. Generalitat de Catalunya P1D Diària Diaria temps meteorologia prediccions meteorològiques tiempo meteorología predicciones meteorológicas Medi ambient Medio ambiente http://www.meteo.cat/servmet/opendata/pirineu.xml 86016 84.0 Kb text/xml XML 

Although there is no SPARQL endpoint at the website, all the data expressed in RDF are published as RDF-XML documents, and the initiative claims the engagement of using Linked Data in its full potential. It is one of the best approach, similar to the solutions developed by Gobierno del País Vasco, Gobierno del Principado de Asturias, and Ayuntamiento de Zaragoza.

, , ,

2 Comentarios

José Manuel Alonso to speak at ICT 2010

Today starts ICT 2010, an event organised by the European Commission and hosted by the Belgian Presidency of the European Union. During three days, 6000 participants are expected to attend this important conference in Brussels.

Tomorrow, September 28, José Manuel Alonso (CTIC) will be take part in one of the Networking Sessions, called Governmental Linked Data, where there will be presented the successes and challenges around Open Government Data using Linked Data tecnologies. José Manuel Alonso will give an speech titled Adventures with Open Data in a Government World in a panel moderated by Ivan Herman (CWI/W3C), and with other panelists such as Sören Auer (University of Leipzig), Jonathan Gray (Open Knowledge Foundation), Jeni Tennison, and Andreas Harth (KIT).

See José Manuel’s slides, and read more about ICT 2010.

, , , , , ,

No hay Comentarios