Archivo | febrero, 2014

Datos Abiertos

5 Feb

Este artículo lo escribí para el número de enero de la revista PITS (Procesos, Innovación, Transformación y Servicios) de PEMEX

datosabiertos

El pasado 25 de noviembre de 2013, el Presidente Enrique Peña Nieto, presentó la “Estrategia Digital Nacional“, la cual tiene cinco objetivos (Transformación Gubernamental, Economía Digital, Educación de Calidad, Salud Universal y Efectiva y Seguridad Ciudadana) y cinco habilitadores, entre los que se encuentra el correspondiente a “Datos Abiertos”. ¿Qué son los “datos abiertos”?

La definición del Open Data Handbook es “Los Datos Abiertos son datos que se pueden utilizar libremente, reusar y distribuir por cualquier persona, sujetos principalmente al requerimiento de compartir los resultados y dar crédito a los autores originales”[1], aunque generalmente se refiere a datos del gobierno[2].

Una de las condiciones que no son forzosamente obligatorias, pero si recomendables para las iniciativas de Datos Abiertos es la utilización de estándares para guardar la información, de forma tal que sean fácilmente  asequibles y modificables, habilitando la interoperabilidad de sistemas de información.

Cumpliéndose estas condiciones no es de extrañar por qué las iniciativas de Datos Abiertos han generado mucho entusiasmo alrededor del mundo en los países donde se han implementado, ya que entre otros muchos beneficios, permite que los ciudadanos tomen poder real sobre el actuar de sus gobiernos, permitan que se modifique la forma en que se gobierna y mejoren la entrega de los servicios públicos. De acuerdo al McKinsey Global Institute (MGI), también pueden generar valor económico significativo[3] (de entre 3 y 5 trillones de dólares, solo en Estados Unidos).

El presente artículo no tiene como intención abordar los temas técnicos relacionados a la implementación de Datos Abiertos, ni de todos los prerrequisitos que una iniciativa en este sentido requiere tanto en términos de recursos humanos, infraestructura tecnológica así como de andamiaje legal, o las consecuencias económicas, políticas y sociales de la misma; sino de presentar algunas aplicaciones que ya han mostrado cierto grado de éxito en algunas otras partes del mundo.

En el gobierno, quizás la iniciativa más conocida es la de data.gov correspondiente al gobierno de los Estados Unidos cuyo propósito es “incrementar el acceso del público a grupos de datos de alto valor, que sean leíbles por sistemas de cómputo, generados por el Ejecutivo del Gobierno Federal”[4]. Iniciativas como esta han sido replicadas en muchos países con diferentes grados de profundidad y éxito.

En Estados Unidos una persona no puede seleccionar la escuela pública a la que asistirán sus hijos, sino que tienen que ir a la que le corresponde a su distrito. A través de la información que el gobierno publica sobre las calificaciones de los colegios, uno puede saber cuál es el nivel educativo de la zona donde pretende comprar una casa. Como es de esperarse, esto puede llevar a que los bienes raíces fluctúen dadas las diferentes capacidades de los distritos escolares.

En México contamos con la prueba ENLACE y la SEP ha hecho públicos los datos desde ya varios años. Una iniciativa del Instituto Mexicano de la Competitividad (IMCO) conocida como mejoratuescuela.org[5] ha puesto en un portal de Internet la información de la prueba, permitiendo comparar la calidad educativa de una zona (a través de indicar el municipio), o de escuelas de formas específicas, por grado escolar y diferentes criterios de búsqueda y georeferenciar los datos para ubicar las escuelas en un mapa.

Pero los datos abiertos, como cualquier otra tecnología, pueden utilizarse para objetivos no tan claros, y que se encuentran en un área totalmente gris, por ejemplo, unos días después de la masacre de Sandy Hook en Estados Unidos, un reportero del Journal News, un diario de Nueva York, puso en Internet un mapa geolocalizado con los nombres y las direcciones de los permisionarios para portar armas, que se titulaba “¿Dónde viven los permisionarios de armas en tu vecindario?”. Dado que la portación de armas es un Derecho Constitucional protegido por la Segunda Enmienda esto provocó grandes quejas hacia el periódico que terminó en dos cosas: un sitio de Internet publicó un mapa con los nombres y las direcciones de los empleados del periódico bajo el título “Donde viven los empleados del Journal News en tu vecindario”[6] y el despido del periodista que subió el mapa[7].

En ambos casos, tanto el de los permisionarios como el de los periodistas se trataba de información del dominio público que un tercero confeccionó para hacer un mapa interactivo. En el sitio de la National Public Radio se puede encontrar un buen artículo que discute sobre los límites a la utilización de la información pública y aún se puede ver una imagen estática del tan polémico mapa[8].

Pero la industria también puede beneficiarse de iniciativas de datos abiertos, por ejemplo, GoldCorp, una compañía minera canadiense se encontraba al borde de la quiebra hace apenas unos años, la situación era difícil en un mercado en contracción y con problemas de huelgas, se vio obligada a cerrar sus operaciones de forma temporal[9]. Sin tener recursos económicos para seguir analizando su información sísmica, recurrió a poner todos los datos geológicos y sismológicos que tenía a su disposición sobre su propiedad de 222 km2 en Red Lake y ofreció un premio de 575,000 dólares al público en general para quienes hicieran la mejor prospectiva.

GoldCorp obtuvo información de más de 1,000 contratistas virtuales en más de 50 países diferentes. El experimento desesperado fue todo un éxito, ya que se encontraron 110 zonas objetivos dentro de Red Lake, de las cuales el 80% resultaron tener grandes cantidades de oro.

Adicionalmente a los sitios de producción nuevos, el concurso expuso a GoldCorp a nuevas tecnologías de exploración y extracción, así como procedimientos de recolección de datos y modelos geológicos.

En el sector de petróleo y gas existen muchas oportunidades para los datos abiertos, de acuerdo al MGI se podrían capturar entre 240 a 500 millones de dólares al año, a través de algunas iniciativas que usasen Datos Abiertos como[10]: optimización de las inversiones en upstream, haciendo públicos los datos, como lo hizo GoldCorp; hacer más eficientes las operaciones de upstream a través de identificar oportunidades estratégicas a través de comparar el desempeño interno contra benchmarks operacionales; optimizar las inversiones en downstream a través de obtener mejores ubicaciones para nuevas plantas que se orienten a atender a mercados de futura expansión; hacer más eficiente el consumo energético en los hogares, a través de que el consumidor pueda tener decisiones más informadas.

Sin embargo una de las barreras más importantes que se encontrarán para la adopción de Datos Abiertos en la industria petrolera proviene del lograr que haya un convencimiento de que existe un interés mutuo en compartir ciertos juegos de datos, así como la clasificación histórica de confidencialidad de la información y la variedad de formas en las que se recolectan los datos.

Como se puede ver, las posibilidades de generar nuevas aplicaciones a partir de los datos que ya existen en diferentes actores de la economía, gobierno, industria, consumidores, organizaciones no gubernamentales, entre otros, son prácticamente infinitas y están acotadas solo por la imaginación de quién las explota, los llamados “científicos de datos”, pero eso es historia para otro artículo…


[1] Open Data Handbook. http://opendatahandbook.org/en/what-is-open-data/index.html (Consultado el 26 de noviembre de 2013)

[2] McKinsey Global Institute. Open Data: Unlocking innovation and performance with liquid information

[3] Ibídem

[4] About data.gov. http://www.data.gov/about (Consultado el 26 de noviembre de 2013)

[10] McKinsey, op. cit.