You are browsing the archive for web.

Hackatón de liberación de datos en PDFs

- January 14, 2014 in comunidad, ddj, Evento, hackaton, journalism, okfn, ong, opendata, opengov, pdf, web

El sábado 18 del primer mes de este flamante año, a partir de las 11 horas, la comunidad de datos va a participar de un hackatón de “liberación de PDFs” en GarageLab. Sumados a la convocatoria que realiza Sunlight Foundation el 17, 18 y 19 de Enero en diferentes sedes: (Washington, Chicago, San Francisco, entre otras ciudades). Todos con el objetivos de “Liberar” los sets de datos que están atrapadas en archivos PDF. La invitación esta abierta a programadores, activistas, periodistas y todos los interesados en el trabajo con datos. Llevando a cabo y motivando el encuentro, esta Manuel Aristarán: “Hay una enorme cantidad de información atrapada en archivos PDF. Hay dos razones para eso, como dije en la charla que dí en la MediaParty 2013 de Hacks/Hackers Buenos Aires. La primera es ignorancia; muchos no saben que el PDF un pésimo formato para compartir información. La segunda es pura maldad: extraer datos de archivos de PDF es por lo menos molesto y muchos se aprovechan de eso”. El desarrollador de Tabula, destacó que “Como becario 2013 del programa Knight-Mozilla OpenNews, trabajé bastante con conjuntos de datos en formato PDF. El resultado de ese interés fue Tabula, una herramienta libre para extraer tablas de archivos PDF que generó bastante entusiasmo en la comunidad de periodismo de datos y de datos abiertos”. Captura de pantalla 2014-01-13 a la(s) 23.13.36
Si tenés ganas de pasarte la tarde scrapeando PDFs, o si tenés algún conjunto de datos en PDF que quieras liberar, llená el formulario de inscripción.
Te esperamos!