manifiestito #OpenData, por Mariano Crowe

Regresa mañana a Argentina nuestro compañero Mariano Crowe, luego de casi seis meses de productivo asilo hacker en escuelab. Mariano se instaló en escuelab como investigador asociado residente liderando procesos como Campamento Cívivo , Hablemos Quechua , Lléname tu Agenda aportando al ambiente escolábico y hacker limeño valiosas enseñanzas durante los últimos seis meses. 

 

Es pertinente pubicar en este momento uno de sus textos en borrador:

Manifestito OpenData por Mariano Crowe
(recuperado de una agenda de reunión con la municipalidad de Lima alrededor de la inciativa de datos abiertos de la munilima )

Datos Abiertos

libre acceso a la información científica, estadística y administrativa generada y/o recopilada por las entidades públicas, sin licencias ni patentes ni controles


¿Por qué liberar la información?

Los datos que recopilan las entidades oficiales, son de todos.


Pero la data ya está pública y accesible

pdfs, xls y gráficos no son realmente accesibles para realizar análisis automatizados y/o estadísticos

datos ya procesados.

información disgregada => mayor brecha de acceso a la info desalienta el hackeo.


¿Para qué liberar la información?

Ante el gobierno y la ocultación de información, presunción de culpabilidad: si el gobierno tiene algo que quiere esconder, es porque algo está haciendo mal. Los ciudadanos pueden ayudar a encontrar qué


¿Cómo hacerlo?

  • Antes que nada identificando y analizando la información existente.

  • Luego, en un primer estadío, proveyendo la data cruda, en formato standard y sobre tecnologías abiertas. 

  • En un segundo paso, mejores herramientas:

    • Herramientas infográficas y filtros de búsqueda y navegación. Promueve el descubrimiento.

    • APIs para el consumo de la información sin necesidad de replicación (sin bajarse los datasets). Promueve el descubrimiento.

    • Aplicaciones que utilicen la información publicada. Facts

  • En un tercer estadío, mayor fiabilidad y valor, minimizando los procesos y tiempos de liberación. La info de hoy hoy, es mas valiosa que la info de hoy mañana.

Fortalecimiendo la innovación

Reorientando los fondos antes dedicados a licencias, hacia focos locales de promoción del desarrollo tecnológico.

Impulsando el estímulo a la diversificación y la experimentación, a través de start-ups que desarrollen herramientas ciudadas.

La filosofía open como estrategia sostenibleextiende mandatos, intereses pesonales e ideologías políticas.
el open source tienen ciclos de vida más largos y evoluciones más constantes y menos críticas.
El peor escenario

Y una vez hecha pública esa información, el peor escenario posible es que no sea utilizada por nadie. Ese escenario es casi idéntico al escenario actual con la diferencia de que el Estado ya habrá hecho su parte... de ahí dependerá de la ciudadania.

 
Datos Abiertos (versión extendida)

La filosofía de datos abierto (opendata) lo que busca es el libre acceso a la información sin restricciones de licencias ni patentes, en particular para la información científica, estadística y administrativa generada y/o recopilada por las entidades públicas.

¿Por qué liberar la información?

Los datos que recopilan las entidades oficiales, son de todos. Nosotros (los ciudadanos) los generamos, nosotros debemos tener acceso a ellos tal y cómo se produjeron.

De la misma manera con los datos científicos, la era de la información requiere de las entidades de gobierno una actitud acumulativa y protectora. Pero además esa información tiene que ser accesible de manera análoga (digital) a los ciudadanos. Es como la evolución de una “Biblioteca Nacional”.

Pero la data ya está pública y accesible

Toneladas de pdfs, xls y gráficos no son realmente accesibles para realizar análisis automatizados y/o estadísticos. Son datos ya procesados.

Los volúmenes de información “cruda” son inconsumibles para los seres humanos. Por lo tanto los centralizadores de la información no deberían ser los únicos entes con acceso a esa información para ser analizada de manera profesional y semi-automatizada.

100 xls de 100kb tienen mucho menos información y generan más sobre-trabajo, que un archivo csv de 10000kb. Esto agiganta la brecha de acceso a la info por parte de los desarrolladores de software y desalienta el hackeo.

¿Para qué liberar la información?

Para brindar más posibilidades, criterios y medios de evaluación, comunicación y auditoría con los ciudadanos. Y así recíprocamente, ayudar a mejorar la imagen del estado y su relación con los primeros, a través de una clara muestra de buena fe (actitud transparente).

Ante el gobierno y la ocultación de información, presunción de culpabilidad: si el gobierno tiene algo que quiere esconder, es porque algo está haciendo mal. Los ciudadanos pueden ayudar a encontrar qué.

¿Cómo hacerlo?

  • En un primer estadío, proveyendo la data cruda, en formato standard y sobre tecnologías abiertas (como lo hace la Municipalidad de Lima):

    • Data cruda para hacer mas “rico” y “apetecible” el dataset y promulgar la transparencia. Que cada uno se la cocine como quiera.

    • Estándar para que cualquiera tenga un marco de referencia de cómo está estructurada e idealmente, cómo y con qué herramientas se puede consumir la información.

    • Sobre tecnologías abiertas porque si la información es pública, debe ser replicable por cualquier persona con el interés y los conocimientos, independientemente de sus posibilidades económicas o preferencias tecnológicas.

A diferencia de los protocolos y tecnologías privativas, creadas en el marco económico de una empresa, los estándares y tecnologías abiertas nacen de manera colaborativa y evolutiva, a partir del trabajo de comunidades heterogéneas de usuarios, expertos y desarrolladores.

  • En un segundo paso, complementando la información con herramientas, tanto para los consumidores definitivos como para los programadores que quieran “jugar un rato” con la información de una manera “lean”.

    • Herramientas infográficas y filtros de búsqueda y navegación.

    • APIs para el consumo de la información sin necesidad de replicación (sin bajarse los datasets).

    • Aplicaciones que utilicen la información publicada para dar un punto de referencia de “qué es lo que se puede hacer” y además promover la cultura ciudadana del opendata.

  • En un tercer estadío, minimizando los procesos y tiempos de liberación. En un escenario ideal, la diponibilidad de la información, debería ser inmediata.

Esto se logra tendiendo a una homogenización de las tecnologías encargadas de la recopilación de la información y las tecnologías encargadas de la publicaciones, tendiendo a cero la cantidad de intermediarios tecnológicos, entre el recopilador de la información y los consumidores.

Como estrategia de fortalecimiento y promoción de la innovación

Está filosofía aplicada de manera transversal tanto al nivel de ciudadanía como al nivel de desarrolladores de tecnología, puede convertirse en vía para fomentar la innovación local, tanto por el estímulo a la diversificación y la experimentación, como reorientando los fondos antes dedicados a licencias, hacia focos locales de promoción del desarrollo tecnológico.

Además la información liberada puede ser la inspiradora y primer sustento para startups ciudadanas.

Como estrategia sostenibleUna filosofía open madura e implantada como línea base, extiende mandatos, intereses pesonales e ideologías políticas.
Los productos open source tienen ciclos de vida más largos y evoluciones más contantes y menos críticas. No dependen exclusivamente de nadie y son de todos (igual que la data)
El peor escenario

Y una vez hecha pública esa información, el peor escenario posible es que no sea utilizada por nadie. Ese escenario es casi idéntico al escenario actual con la diferencia de que el Estado ya habrá hecho su parte... de ahí dependerá de la ciudadania.

 

Etiquetas: