Fundación CTIC

Archivo etiqueta visualizacion

Actualización de datos en la herramienta del Principado de Asturias de visualización de datos INE sobre equipamiento y uso de las TIC en Asturias.

Recientemente, hemos realizado en la actualización de datos de la aplicación para la visualización de datos estadísticos sobre el Equipamiento y uso de las TIC en Asturias.

Para ponernos en antecedentes, tal vez conviene recordar que este proyecto del Gobierno del Principado de Asturias aborda un proceso de transformación de datos estadísticos sobre el estado de la Sociedad de la Información en Asturias (datos obtenidos a partir del convenio de colaboración entre el Instituto Nacional de Estadística, el Instituto Asturiano de Estadística y Fundación CTIC) pertenecientes al catálogo de datos de Asturias a formatos abiertos con una doble finalidad:

  • Ponerlos a disposición de terceros (empresas, ciudadanía, etc.) para su reutilización y generación de nuevos contenidos y servicios de valor.
  • Generar una herramienta de gestión de datos estadísticos que permita la publicación de los datos del INE relativos al equipamiento y uso de las TIC en los hogares y en las empresas asturianas (encuestas TIC-H y TIC-E), facilitando la agregación de los mismos y la generación de visualizaciones que favorezcan su consumo.

La herramienta maximiza la experiencia de usuario mediante el uso tecnologías web (visualización en base a Linked Data), permitiendo una interacción con la herramienta sencilla e intuitiva, dotando al usuario de múltiples canales para personalizar consultas (configuración de consulta a través de selectores de datos con posibilidad de interactuar con los objetos gráficos, gráficas, tablas y mapas).

Con esta última actualización, se han añadido los datos de las últimas encuestas correspondientes al ejercicio 2011, por lo que los usuarios podrán consultar las estadísticas sobre equipamiento y uso de las TIC desde 2005 hasta 2011, pudiendo realizar visualizaciones de análisis evolutivos y comparativos entre Asturias y la media nacional registrada para los principales indicadores TIC, así como desagregados de los principales datos de Asturias por comarcas SADEI.

Entre las novedades incorporadas en los indicadores destacados de este año, destacan los relativos al uso de Internet por la ciudadanía en servicios relacionados con la participación política y social.

Esta aplicación es un ejemplo sobre el potencial de este tipo de herramientas para la visualización de datos estadísticos, así como para facilitar el acceso (configuración de consultas) y comprensión (representaciones sencillas) sin necesidad de realizar arduos ejercicios con herramientas de explotación estadística.

, , ,

No hay Comentarios

Uso de Linked Data para el tratamiento de datos estadísticos

Hace unos días se presentó una aplicación que, mediante el uso de Linked Data, nos permite visualizar de manera sencilla datos de Estadísticas INE sobre equipamiento y uso de las TIC y el comercio electrónico en las empresas y hogares asturianos (2005-2010).

Lo más destacable de esta aplicación es que, gracias al uso de las tecnologías Linked Data, permite combinar datos estadísticos almacenados en decenas de hojas Excel con diferentes estructuras y nomenclatura, una tarea que anteriormente resultaba tediosa y complicada.

Utilizando tecnologías semánticas como RDF o SPARQL hemos conseguido modelar, unificar y exponer los datos, haciendo posible realizar comparaciones de los indicadores estadísticos a lo largo del tiempo (evolutivos), comparaciones entre los datos asturianos y nacionales y, además, hemos dejado la puerta abierta para, en un futuro, poder comparar los datos entre diferentes comunidades autónomas.

Como no podía ser de otra forma en un proyecto Open Data, los datos utilizados por la aplicación se han hecho públicos y son accesibles desde el portal de Reutilización de Información del Sector Público del Principado de Asturias para que cualquiera pueda acceder a ellos y utilizarlos en sus propios desarrollos.

En el siguiente vídeo podéis ver la aplicación en funcionamiento:

, , , ,

1 Comentario

“Open Government Data” On the Rise All Over the World

Screenshot of Public Dataset Catalog Faceted Browser

Public Dataset Catalog Faceted Browser

The number of public dataset catalogs has risen since the publication of our first post, which announced a classification of these collections of public datasets. Approximately, this occurred a year ago, when there were barely a dozen of entries registered. Since then, we have continued feeding the catalog using the original form (in RDF), and now there are almost 50 entries included in it.

In order to visualize the catalog we have developed a simple faceted browser, using Exhibit, where the datasets catalogs may be located on a map, and filtered according to different facets: spatial coverage, country, and maturity of the initiative. This application uses data from the triple-store through the SPARQL endpoint, and the geographical information (name of places, coordinates, etc.) comes from the Geonames database.

Catalogs are represented by different colors which shows the status or level of maturity, based on the 5-star classification of the Linked Government Data:

  • ( ) Announced. The catalog has been announced, and there is an initiative involved.
  • (★) Stuff published. Any data has been published.
  • (★★) Structured Data. Data published in structured formats (e.g., Excel format)
  • (★★★) Open formats. Data published in non-proprietary formats (e.g., CSV, XML format)
  • (★★★★) RDF Data. Data in RDF format
  • (★★★★★) Linked Data. Data in RDF linked with other data on the Web.

This catalog is maintained and updated periodically. If you have any comments or if you are aware of more catalogs, please let us know.

, ,

1 Comentario

Ciberpaís: los Gobiernos se ‘appuntan’

Después del artículo publicado sobre la liberación de datos de Asturias, el Ciberpaís publica hoy el artículo “Planeta App” sobre aplicaciones y widgets variados en el que se resalta el uso de información pública para la construcción de algunos de ellos. Una interesante lectura de lo que ocurre desde el punto de vista del consumo de la información.

artículo del ciberpaís sobre apps

artículo del ciberpaís sobre apps y el destaque del uso de datos públicos

, ,

No hay Comentarios

Publicamos los primeros datasets del sector público: la oferta de formación ocupacional

En Open Data @ CTIC hemos ido contando en las semanas anteriores algunas de las razones estratégicas para embarcarse en un proyecto de reutilización de datos del sector público, así como varios aspectos técnicos y no técnicos del camino a seguir que proponemos como el más adecuado. Hemos ofrecido una prueba de concepto de todo lo expuesto utilizando como modelo los catálogos de datos abiertos que varias administraciones han publicado a nivel mundial. Como os habréis podido imaginar, hay mucho más en lo que hemos estado trabajando, y por fin ha llegado el momento de hablar de ello.

Hemos modelado la oferta de formación ocupacional del Servicio Público de Empleo del Principado de Asturias. Se resume en tres datasets: las acciones formativas (o cursos), los centros donde se imparten dichos cursos, y las organizaciones que imparten dichos cursos. Éstos a su vez constituyen un super-dataset.

los tres datasets de la formacion ocupacional en el cubo de la web semántica

Hemos trabajado con una foto de los datos que tomamos en Julio de 2009. Te puedes descargar todos los datos en RDF/XML en bruto (como pedía Tim Berners-Lee con su Raw Data Now!). Pero hay más formatos, o como parece ser el estándar de facto:

Nombre Área Última Actualización Formatos
Formación Ocupacional 2009 Servicio Público de Empleo, Principado de Asturias 2009-07-24 RDF/XML
XML
HTML
JSON
Excel

Por supuesto, también tienes nuestro SPARQL endpoint para filtrar los datos a tu antojo y, si te preguntas como interpretarlos, está también disponible el vocabulario que hemos utilizado para modelar toda la oferta formativa.

Para acabar, por ahora, también hemos creado algunas visualizaciones de ejemplo, en las que puedes filtrar los datos visualmente y ver los resultados en un mapa, una línea de tiempo e incluso descargarte los cursos que te interesen a tu calendario (en formato iCal).

visualizaciones de los datos en mapa, línea de tiempo y calendario

visualizaciones de los datos en mapa, línea de tiempo y calendario

¿Quién da más? Nosotros. Hay mucho, mucho más que contar sobre estos datasets, y muchas más cosas en las que estamos trabajando intensivamente. Atentos a los próximos artículos.

, , , , ,

7 Comentarios

Reutilización de datos desde una aplicación Java

El uso de estándares abiertos para la publicación de datos permite que, sea cual sea la tecnología utilizada, se puedan crear de forma sencilla aplicaciones o mashups que aprovechen y combinen la información disponible. En posts anteriores hemos comentado los pasos a seguir para desarrollar una aplicación que se alimente de datos públicos, hoy vamos a ver como realizar esto utilizando la tecnología Java.

Descripción del ejemplo

Desarrollo de una aplicación web Java que liste los catálogos de datos públicos disponibles y genere un mapa señalando su localización. El listado de catálogos se obtendrá realizando una consulta a un SPARQL endpoint.

Tecnologías necesarias

  • Jena: Ofrece una API que permite trabajar y realizar consultas sobre modelos o grafos RDF.
  • ARQ: Entre otras cosas, su API permite realizar consultas a servicios SPARQL remotos.

Implementación

Paso 1: Se define la consulta SPARQL que devuelve el conjunto de datos que necesitamos y se ejecuta contra el SPARQL endpoint:


QueryExecution qe = QueryExecutionFactory.sparqlService(sparql_enpoint_uri, query);
ResultSet rs= qe.execSelect();

La consulta que se ha ejecutado es:

prefix ds: <http://data.fundacionctic.org/vocab/catalog/datasets#>
prefix  dcterms: <http://purl.org/dc/terms/>
prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#>
prefix foaf: <http://xmlns.com/foaf/0.1/>  
SELECT * FROM <http://data.fundacionctic.org/dataset-catalog>
WHERE {
 ?catalog a ds:Catalog;
 dcterms:spatial ?uriGeonames;
 dcterms:description ?description;
 rdfs:label ?name;
 foaf:homepage ?homepage.
 FILTER langMatches( lang(?name), 'es' )
 FILTER langMatches( lang(?description), 'es' )
}

Este es el SPARQL endpoint sobre el que se ha ejecutado la consulta.

Paso 2: Una vez obtenidos los datos se recorre el conjunto de resultados y para cada uno de ellos se recupera su nombre, descripción, URL de su homepage y el identificador del recurso de Geonames que indica su localización.

A continuación se obtienen los datos del recurso de Geonames para obtener los valores necesarios para la geolocalización:


Model m = ModelFactory.createDefaultModel();
m.read(uri_geonames_resource);
// creación de las propiedades para obtener la latitud y la longitud
Property lat = m.createProperty("http://www.w3.org/2003/01/geo/wgs84_pos#", "lat");
Property lon = m.createProperty("http://www.w3.org/2003/01/geo/wgs84_pos#", "long");
// obtención del valor de las propiedades
Resource geoName = m.getResource(uriResource);
lat= geoName.getProperty(lat);
lon= geoName.getProperty(lon);

Paso 3: Se muestra el listado de catálogos y se crea un mapa utilizando la API Javascript de GoogleMaps en el que se muestra su localización.


var map = new GMap2(document.getElementById("map"));
map.setCenter( new GLatLng(0,0), 1);
// para cada punto se genera un "marker"
var point= new GLatLng( lat, lon );
map.addOverlay(marker);

En estos tres sencillos pasos se ha implementado una aplicación que combina recursos remotos para obtener datos y genera una visualización en un mapa. Este es el resultado obtenido

, , , ,

No hay Comentarios