Cinco investigadores de Goi Eskola Politeknikoa toman parte en el proyecto Smartur "El turismo en destinos inteligentes"

Es un proyecto del programa ETORTEK del Departamento de Industria, Innovación, Comercio y Turismo del Gobierno Vasco (2012-2014). El principal propósito es la gestión eficiente de los datos y la información, ya que éstos conforman la materia prima donde la Economía de los Datos y la infomediación empiezan a configurar nuevos modelos de negocio y oportunidades.
Card image cap
En el proyecto se aplican tecnologías de Web Semántica y Social Media utilizando datos abiertos Open Data.
07/07/2014

Cinco investigadores de la línea de investigación Ingeniería de Software-Ingeniería Web de Mondragon Unibertsitatea toman parte en el proyecto, y Ainhoa Serna es la coordinadora del mismo.

Ainhoa Serna

- ¿Cuál es el contexto de este proyecto?

- En el departamento de Ingeniería de Software y de Ingeniería Web de Mondragon Unibertsitatea investigamos cómo ofrecer soluciones integrales relacionadas con metodologías y desarrollo de software en diferentes dominios: Administración Pública, Construcción, Salud, Turismo, Transporte y Energía etc. Aplicamos tecnologías de Web Semántica y “Social Media” utilizando datos abiertos “Open Data”, y del paradigma de “Linked Open Data”, así como técnicas de procesamiento de lenguaje natural PLN, para poder analizar los comentarios vertidos en redes sociales y otros medios digitales.

- ¿Cómo surgió la idea de participar en este proyecto?

Desde 2006 llevamos trabajando con tecnologías de Web Semántica y las llevamos aplicando a diferentes dominios: transporte vertical con Orona, en el ámbito de la salud para la posible predicción del cáncer de mama con el Hospital de Cruces, y ahora gracias a este programa Etortek estas tecnologías las adaptamos al dominio del turismo. Para ello hemos desarrollado unos algoritmos de aprendizaje semisupervisado, que consiguen un porcentaje de precisión del 92% a la hora de calcular el análisis de sentimiento y la categorización semántica de los conceptos que aparecen en los textos vertidos en Internet, ya sean foros, reviews, redes sociales generales y redes sociales de viajeros...

Es importante decir que el proyecto contiene diferentes paquetes y que éste es el paquete de la economía de los datos.

- ¿Qué es la economía de los datos?

- La economía de los datos surge después de la toma de posesión de Barack Obama en 2009 en que se apuesta por un memorándum de transparencia para la apertura de datos administrativos para fomentar la participación y la colaboración ciudadana.

Algunas de los características más importantes de la economía de datos son: el libre acceso a la información y la posibilidad de utilizar y reutilizar libremente esta información (por ejemplo, datos, contenidos, etc.).

El consorcio de apertura de datos gubernamentales se puso en marcha el 20 de septiembre, del 2011, cuando los ocho gobiernos fundadores (Brasil, Indonesia, México, Noruega, Filipinas, Sudáfrica, Reino Unido, Estados Unidos) aprobaron una declaración de gobierno abierto (Open Government), anunciando sus planes de acción y acogieron con satisfacción el compromiso de 38 gobiernos de unirse a la asociación.

En ese momento en el 2011, hubo diferentes gobiernos que se sumaron a esa iniciativa, y la Administración Vasca también se sumó y realizó una apertura de datos que se denomina “Open Data Euskadi”. Se publicaron una serie de datos catalogados sobre diferentes dominios: Cultura, Ocio y Turismo, Transporte y movilidad, Meteorología, Salud, etc. A partir de ellos, nuestra idea es poder gestionar esos datos de forma eficiente y poder ayudar a mejorar la toma de decisiones analizando esos datos y enriqueciendo esos datos, utilizándolos y vinculándolos a otros datos de apertura pública a nivel mundial. En consecuencia podemos crear un nuevo nivel de conocimiento que pueda ser ventajoso para la creación de nuevas empresas innovadoras que aprovechen esos datos.

- ¿Cómo se lleva a la práctica esa extrapolación de datos?

Lo que hacemos es capturar los datos abiertos, que son públicos desde “Open Data Euskadi” y esos datos se enriquecen con más datos de redes sociales como Twitter, Facebook, etc. y con otras redes sociales de viajeros como minube, TripAdvisor, etc. Posteriormente se adecúan a un formato procesable automáticamente por las maquinas. Después aplicamos herramientas de procesamiento del lenguaje natural para poder saber qué se está diciendo, cómo se está hablando, de qué, … en definitiva gracias a la semántica y a otros algoritmos estadísticos y semánticos podemos categorizar todos esos datos para además saber qué emociones subyacentes hay en esos textos vertidos en la web. Tras la manipulación correcta podemos publicar esos datos con un formato estándar siguiendo el paradigma de “Linked Open Data”. De esta manera, conseguimos que la apertura de datos realizada desde el gobierno sea efectiva a la hora de poder ser explotada, para poderse consumir o reutilizar y que otros terceros puedan utilizarlos.

En nuestro proyecto todos los datos están relacionados con destinos y movilidad, pero podríamos aplicarlos a cualquier otro tema que pudiera interesarnos.

Tras la manipulación correcta podemos publicar esos datos con un formato estándar siguiendo el paradigma de “Linked Open Data”.

- ¿En qué fase se encuentra el proyecto?

- Lo que hemos logrado hasta ahora es el desarrollo de un monitor  que realice el proceso de captura de datos, transformación, almacenamiento, y vinculación con otros datos abiertos a nivel mundial. Posteriormente, nos queda la parte de publicación de los datos obtenidos de forma abierta en “Linked Open Data”. En una fase final, el proyecto culminará con la creación de un prototipo de datos enlazados para que puedan ser consumidos.

Este año, con los avances del proyecto se han realizado diferentes acciones de difusión en diversos foros de “Open Data”, Economía de los Datos, Innovación y Turismo (Aporta, Turistic, PUCK,..). Además de una suma de  6 publicaciones científicas, incluyendo la ponencia en el congreso más relevante en Turismo y Tecnología a nivel Internacional ENTER 2014 organizado por International Federation for Information Technology and Travel & Tourism (IFITT).

El proyecto terminará en diciembre de 2014, por lo que nos encontramos ya en la última fase.

En este programa, participa CICtourGUNE como empresa líder, que nos aporta la visión del campo que analizamos (el turismo) y nosotros como ingenieros analizamos las posibles soluciones para procesar y modelar esos datos.

- ¿Qué pasos vais a dar con el conocimiento adquirido?

- Poder hacer análisis predictivo, desarrollar capacidades de anticipación y escenarios de simulación basada en la Ciencia de los Datos.

Impulsar modelos basados en la Economía de los Datos y las cadenas de aprovisionamiento de datos, que den soporte a la creación de un "long tail" de empresas con modelos innovadores,  un exponencial decreciente de infinitas organizaciones que tienen poco volumen, es decir el mucho de pocos, muchas microempresas.

Se pueden crear empresas basadas en estos modelos productivos que se basen en los datos.

Por otra parte, podemos decir que el análisis de datos en tiempo real nos permite predecir eventos y medir tendencias. Por ejemplo, podemos ver cuáles son los “Trending Topic” y ver qué patrones hay al respecto. Este sistema se ha utilizado, por ejemplo, para predecir resultados en las elecciones de Obama en 2012, para predecir terremotos en 2010, o para predecir cuánto va a recaudar una película.

Además hemos identificado la oportunidad de aplicar este sistema a los datos bancarios para medir tendencias, patrones de comportamiento y de consumo.

Facultad de ingeniería de Mondragon Unibertsitatea