You are browsing the archive for Dados Abertos.

Belo Horizonte recebe Hackacity em dezembro

Elza Maria Albuquerque - December 6, 2017 in Dados Abertos, Hackacity, Hackacity Belo Horizonte

Belo Horizonte. Foto: Pixabay / Creative Commons CC0.

Entre os dias 8 e 10 de dezembro, a capital de Minas Gerais vai receber o Hackacity Belo Horizonte, no edifício Rainha da Sucata, sede do projeto HUB Minas Digital. O evento é uma maratona de desenvolvimento de soluções tecnológicas para promover melhorias para a cidade. O objetivo é analisar bancos de dados públicos e promover sua utilização no desenvolvimento de soluções que tenham impacto positivo na gestão das cidades. A iniciativa é mundial, com edições na Espanha, Croácia, Portugal, Brasil e Alemanha. A competição conta com a realização da Secretaria de Estado de Desenvolvimento Econômico, Ciência, Tecnologia e Ensino Superior de Minas Gerais (SEDECTES), em parceria com a cidade portuguesa de Porto, e coordenada por Cláudio Nascimento, vice-presidente da Rede, por um time de técnicos, além da equipe do Hub Minas Digital.

Soluções em conjunto

Os participantes são incentivados a criar aplicações que busquem resolver desafios vividos pelos cidadãos. As equipes, após 24 horas de programação, apresentam suas soluções para uma banca avaliadora, formada por jurados de diversas áreas. As equipes vão ser premiadas e seus projetos, após testados, vão ser utilizados pela gestão pública. Lucas Parreiras, analista de sistemas há 11 anos com foco em bancos de dados, é um dos participantes do Hackacity. Ele formou uma equipe para participar de evento. “Tem um tempo que venho acompanhando alguns dados abertos e iniciativas que trabalham com tais dados, como o caso do projeto Serenata de Amor. Por esse motivo, tive interesse de participar do ODI regional junto com a OKBR. Quando vi a notícia que iria ter Hackacity em Belo Horizonte, pensei: preciso participar e conhecer melhor os dados da minha cidade e tentar produzir algum aplicativo que possa beneficiar a população. Assim, convidei dois amigos para montar uma equipe e participar do evento. O principal objetivo é conhecer melhor os dados da nossa cidade e conhecer outras pessoas com interesse em dados abertos e que estejam ligados à tecnologia da informação”, afirma. Lucas diz que é possível que entrem mais duas pessoas no grupo durante o evento (segundo o regulamento, cada equipe deverá ter cinco integrantes). Ele conta que já estão se preparando para o dia. “Um dos integrantes é o João André, que é engenheiro mecânico recém-formado. O outro é Samuel, que é analista de sistemas com foco em desenvolvimento de aplicativos para dispositivos móveis. Além de procurarmos informações sobre o Hackacity, também analisamos alguns datasets disponibilizados pela Prefeitura de Belo Horizonte para podermos vislumbrar alguma solução”, detalha. Com informações do portal SIMI.
Flattr this!

Pesquisa afirma que abertura de dados sobre meio ambiente são insuficientes nos órgãos federais

Elza Maria Albuquerque - December 3, 2017 in Dados Abertos, Destaque, Imaflora, Meio ambiente, pesquisa

No dia 28/11, a pesquisa “Dados abertos em clima, floresta e agricultura”, conduzida pelo Imaflora, foi divulgada no II Encontro Brasileiro de Governo Aberto. Segundo a publicação, os órgãos públicos federais ainda não respondem adequadamente ao cidadão, como previsto na Lei de Acesso à Informação e no Decreto Federal sobre o tema. A pesquisa contou com os apoios da Climate and Land Use Alliance – CLUA, da Open Knowledge Brasil e do Ceweb.Br/NIC.br. O grau de abertura de 15 bases de dados federais, a partir de 10 critérios, relacionados aos temas acima, são considerados fundamentais para compreender a dinâmica do uso do solo, do desmatamento, de emissões de gases de efeito estufa na atmosfera e, por meio das informações extraídas construir melhores políticas públicas e privadas para essas áreas. Entre os temas analisados estão: desmatamento, áreas protegidas, florestas públicas, agropecuária, transporte de madeira e trabalho análogo ao escravo. E entre os critérios de avaliação estão: a disponibilidade online, gratuita , detalhada e atualizada da informação, em diversos formatos, para permitir que os dados divulgados possam ser utilizados para a produção de novos conhecimentos a partir deles, como pesquisas, por exemplo. O problema mais recorrente foi a ausência de licenças que permitam o uso dos dados, encontrado em 71% das bases analisadas, seguido de informações incompletas (64%) e impossibilidade do usuário baixar toda a informação de uma única vez (57%). “A falta de dados disponíveis em sua totalidade foi o principal problema constatado, já que não permite um olhar para o conjunto de informações e seu uso detalhado pela sociedade. Por exemplo, nos casos do Documento de Origem Florestal, Cadastro Ambiental Rural e do Crédito Rural, a abertura completa desses dados ajudaria a saber se os produtos consumidos vieram de áreas de desmatamento e se os recursos públicos foram empregados em atividades que respeitaram os recursos naturais”, diz Renato Morgado, coordenador de políticas públicas do Imaflora e que liderou esse trabalho. Para Morgado, há avanços na transparência dos dados, no Brasil, mas também há muitas falhas a serem corrigidas e aprimoradas. Por isso, conclui a pesquisa com recomendações que possam resultar em uma melhor gestão ambiental para o país e políticas mais eficientes na área. Para conferir a pesquisa, leia o material “Dados abertos em clima, floresta e agricultura” na íntegra. Com informações da IMAFLORA.
Flattr this!

Dados Conectados na Educação Brasileira

Elza Maria Albuquerque - November 25, 2017 in Dados Abertos, educação, escola

Por Williams Alcântara e Thiago Ávila* Em qualquer organização (institucional ou administrativa) há produção de dados que podem, e devem, ser utilizados como um instrumento para avaliar a efetividade das ações adotadas, além de apoiar durante o planejamento de novas ações. Conforme já apresentado aqui, há uma forte tendência de aumento na publicação de dados na web, e dentre estes estão os dados educacionais. Apesar de estarem disponíveis na web em diversos formatos, ainda apresentam dificuldades para atingir ampla utilização quando o objetivo é conectá-los a dados de diferentes fontes. A educação proporciona a formação e o desenvolvimento moral e intelectual de qualquer indivíduo. Ela é fundamental para que uma pessoa desenvolva habilidades de aspectos sociais, culturais e econômicos no convívio em sociedade. Os dados educacionais podem gerar benefícios para: i) o planejamento de metas e objetivos a serem alcançados pela educação, por gestores educacionais; ii) avaliar a efetividade de medidas adotadas no contexto educacional; iii) o desenvolvimento de pesquisas; e iv) propor soluções da indústria que atuam no campo educacional [1]. No Brasil, o Ministério da Educação (MEC), através do Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira (INEP) produz dados educacionais como o Índice de Desenvolvimento da Educação Básica (IDEB), Exame Nacional de Desempenho dos Estudantes (ENADE), Censo Escolar e Censo do Ensino Superior que avaliam a qualidade do ensino e estão publicados na web em formatos como pdf, xls, csv e doc. A análise sob os dados pode oferecer uma percepção do estado atual da educação brasileira e pode auxiliar na tomada de decisão à gestores educacionais. Alcântara [2] pontua que a diversidade de formatos em que os dados são publicados é importante para atender as necessidades de usuários (consumidores) com diferentes habilidades para consumo de dados. Cumpre destacar os recentes avanços na oferta de dados educacionais no Brasil, onde o MEC, disponibiliza dados em vários formatos e que conta também com uma oferta extraoficial destes dados através de uma interface de programação (API) conforme a Figura 1. Complementarmente, o aprimoramento da oferta de dados que possam ser consumidos de forma automatizada é fundamental para o melhor aproveitamento e reuso destes dados para diversas finalidades de natureza governamental, empresarial, acadêmica e para a sociedade em geral. Uma das alternativas encontradas pela comunidade Web para o problema da baixa qualidade de dados e da problemática de distribuição é a utilização de Dados Abertos Conectados (DAC) – são um conjunto de boas práticas para a publicação e consumo de dados abertos. Os princípios de DAC podem ser aplicados a vários contextos como saúde, segurança e educação [1]. Ao aplicar Dados Abertos Conectados em contextos educacionais, é possível: melhorar a qualidade de conteúdos publicados – através do uso de vocabulários que formalizam e descrevem os termos utilizados; melhorar a veracidade das informações através de links para a fonte de dados; e agilizar o processo de recuperação de conteúdo educacional – através da conexão entre repositórios com conteúdo educacional.

Figura 1 – Interface de Programação (API) para acesso aos dados educacionais do INEP

Classificando os dados publicados pelo MEC de acordo com o sistema de classificação proposto por Tim Berners Lee [3], ilustrado na Figura 1, para mensurar a qualidade de publicação de dados conectados, percebemos que são classificados no nível intermediário do sistema, atingindo, no máximo, 3 (três) estrelas. Fica evidente que para alcançar os benefícios gerados por Dados Conectados  é necessário evoluir para o nível de 4 e 5 estrelas, e assim, publicar dados educacionais com alta capacidade de interoperabilidade com outros conjuntos de dados.

Figura 2 – Sistema de Classificação 5-estrelas [3]

Analisando especificamente o uso de Dados Conectados no contexto educacional, Dietze [4] defende que a integração de dados e serviços educacionais são benefícios que podem ser alcançados. Para Vega-Gorgojo et. al [5] as vantagens obtidas são: o reuso de dados, o uso de vocabulários, a conexão com outros conjuntos de dados e a disponibilidade do dado. Apesar dos benefícios e vantagens apresentados, o uso de DC impõe limitações e desafios que ainda precisam ser superados. Este autor apresenta doze dificuldades encontradas ao trabalhar com Dados Abertos Conectados (DAC), dentre estas destacam-se a necessidade de lidar com conjuntos de dados incorretos e incompletos na web, além de que os dados podem apresentar indisponibilidade de acesso e até mesmo ausência de licença [5]. Por outro lado, o trabalho de Alcântara et. al [1] identifica cinco desafios relacionados a DAC considerando o cenário atual dos dados educacionais no Brasil, dentre eles estão a falta de estímulo à publicação de dados educacionais em formato aberto, publicar dados em diferentes formatos e aplicar dados conectados a repositórios educacionais abertos. Há uma diversidade de dados educacionais prontos para evoluir com a aplicação de Dados Conectados. Precisamos disseminar a cultura de publicação e consumo de Dados Conectados.    Até a próxima!!!
  • Thiago Ávila é conselheiro consultivo da Open Knowledge Brasil.
* Estes artigos são oriundos de pesquisas científicas desenvolvidas no Núcleo de Excelência em Tecnologias Sociais (NEES), do Instituto de Computação da Universidade Federal de Alagoas (UFAL) e contam com a contribuição direta dos pesquisadores Dr. Ig Ibert Bittencourt (UFAL), Dr. Seiji Isotani (USP), e Armando Barbosa, Danila Oliveira, Judson Bandeira, Thiago Ávila e Williams Alcântara (UFAL). [1] Bandeira, J., Ávila, T., Alcantara, W., Sobrinho, A., Bittencourt, I. I., & Isotani, S. (2015). Dados abertos conectados para a Educação. Jornada de Atualização em Informática na Educação, 4(1), 47-69. [2] Alcantara, W., Bandeira, J., Barbosa, A., Lima, A., Ávila, T., Bittencourt, I., & Isotani, S. (2015). Desafios no uso de Dados Abertos Conectados na Educação Brasileira. In Anais do DesafiE-4º Workshop de Desafios da Computação Aplicada à Educação. CSBC. [3] Berners-Lee, T. Linked data: Design issues, 2006. http://www.w3.org/DesignIssues/LinkedData.html. [4] Dietze, S., Sanchez-Alonso, S., Ebner, H., Qing Yu, H., Giordano, D., Marenzi, I., & Pereira Nunes, B. (2013). Interlinking educational resources and the web of data: A survey of challenges and approaches. Program, 47(1), 60-91. [5] Vega-Gorgojo, G., Asensio-Pérez, J. I., Gómez-Sánchez, E., Bote-Lorenzo, M. L., Munoz-Cristobal, J. A. & Ruiz-Calleja, A. (2015). A Review of Linked Data Proposals in the Learning Domain. Journal of Universal Computer Science, 21(2), 326-364. Texto publicado no site Thiago Ávila. Ele faz parte da série de artigos Dados abertos conectados.
Flattr this!

Dados Conectados

Elza Maria Albuquerque - November 20, 2017 in dados, Dados Abertos, Destaque, Internet, linked data, W3C

Por Thiago Ávila* Vamos começar este artigo analisando a figura 01, extraída do site DataPortals.org [1], que mostra a ocorrência de catálogos de dados abertos no mundo:

Figura 01 – Distribuição dos catálogos de dados abertos governamentais no mundo [1]

Hummm … 200 catálogos na Europa, 140 na América do Norte, 22 na América do Sul, 23 na África, 21 na Ásia e 15 na Oceania. Tudo bem. E como fazer para responder algumas questões relevantes como:
  • Quais os dados disponíveis sobre ocorrência de doenças no hemisfério sul ?
  • Ou ainda, quais as ocorrências de determinado tipo de crime nestes países ?
  • Quantas escolas foram abertas desde 2008 em cada país que possua um catálogo de dados ?
Como se tratam de catálogos de dados abertos, provavelmente, para tentar responder a pelo menos uma dessas perguntas será preciso acessar os 424 catálogos, buscar em cada um deles o dado desejado, fazer o download de cada conjunto de dado, padronizar o formato de dados, metadados, levar para uma ferramenta de extração, tratamento de carga de dados (ETL), construir uma consulta para depois ter um resultado. Muito esforço, não? E deixando a coisa um pouco mais complexa, se a licença de uso de um conjunto de dados impedir que esse dado seja cruzado com outro dado, ou ainda, se o formato disponibilizado seja proprietário ou um formato de baixa qualidade, como o PDF? Provavelmente você ficará sem responder as suas perguntas. A web que conhecemos atualmente é a web dos documentos onde são priorizados e disponibilizados páginas HTML, arquivos de diversos formatos, como planilhas, documentos de texto, mapas, coordenadas geográficas, animações, conteúdo multimídia, etc. Acontece que os dados, mesmo que estejam disponíveis em formatos abertos, para serem acessíveis primeiro é preciso encontrar o arquivo que armazena os dados, para aí sim, acessar cada dado, pois, em sua maioria são formatos não estruturados e são adequados para facilitar o acesso e leitura para humanos e não são compreensíveis por máquina [2]. Considerando situações corriqueiras como essa, o World Wide Web Consortium – W3C tem desenvolvido muitos esforços para não apenas estabelecer os padrões da internet global, mas para a oferta de dados na Web, como já apresentamos no post anterior. E como seria se pudéssemos acessar diretamente os dados disponíveis na web, mediante consultas a servidores de dados? Consultas que acessem dados de diversas origens, espalhados ao longo do mundo e ainda, obtendo não apenas os dados, mas a semântica relacionada a eles?  Buscando construir esta web dos dados que, dentre outras muitas coisas, resolvem aos problemas corriqueiros do início do artigo que ao longo destes esforços e pesquisas desenvolvidas pelo W3C, Tim Berners-Lee (ele mesmo, o mesmo cara que inventou a Web) propôs um conceito muito promissor que são os Dados Conectados, do termo em inglês, Linked Data [3]. Em definição, Linked Data se resume ao conjunto de boas práticas para a publicação de dados na web. Linked Data define princípios para a publicação e consumo dos dados e os classificam de acordo com sua disponibilidade, acesso, estruturação e conexão [2]. Assim como a web do hipertexto, a web dos dados é construída a partir de documentos na web, porém, diferentemente da web do hipertexto, onde os links são âncoras que relacionam uma página web a outra (ou a um arquivo), na web dos dados, os links são apontados para os dados que são descritos por um framework de recursos, conhecido como RDF (Resource Description Framework). Além disso, cada dado é identificado por um identificador universal – URI (Universal Resource Identifier) e ainda, podem ser acessados mediante uma linguagem de consulta que é o SPARQL (SPARQL Protocol and RDF Query Language). Para um dado ser conectado, ele precisa obedecer aos quatro princípios para publicação [4]:
  1. Use URIs para definir coisas;
  2. Use HTTP URIs para que os dados possam ser encontrados por humanos e agentes na web;
  3. Quando um dado for solicitado através de HTTP URIs, fornecer todas as informações sobre o mesmo, em um formato de dados estruturados utilizando padrões como RDF e SPARQL;
  4. Incluir links para outras fontes de dados relacionados (usando URIs) para que seja possível obter mais informações.
A partir do conceito de Dados Conectados, algumas nações globais já estão considerando este novo paradigma e incentivando a sua produção e oferta. Países como o Reino Unido e os Estados Unidos da América já possuem uma boa oferta de dados em formato RDF nos seus catálogos de dados governamentais. Além disso, grandes projetos em escala global tem crescido a cada ano, como a DBPedia[5], que é a base de dados conectada a partir da Wikipedia ou a LODSpringer[6], que visa ofertar dados conectados sobre artigos, periódicos e conferências científicas editorados pela Springer. Enfim, sobre o Reino Unido já é possível responder a terceira pergunta do início deste artigo “Quantas escolas foram abertas desde 2008 em cada país que possua um catálogo de dados ?”. Basta executar a seguinte consulta SPARQL abaixo: PREFIX sch-ont: <http://education.data.gov.uk/ontology/school#> PREFIX xsd: <http://www.w3.org/2001/XMLSchema#> SELECT ?school ?name ?date ?easting ?northing WHERE { ?school a sch-ont:School; sch-ont:establishmentName ?name; sch-ont:openDate ?date ; sch-ont:easting ?easting ; sch-ont:northing ?northing . FILTER (?date > “2008-01-01″^^xsd:date && ?date < “2009-01-01″^^xsd:date) } Nos próximos artigos, continuaremos apresentando o potencial, casos de uso, vantagens, limitações e muito mais sobre o universo dos Dados Conectados. Até a próxima!!!
  • Thiago Ávila é conselheiro consultivo da Open Knowledge Brasil.
  •  Estes artigos são oriundos de pesquisas científicas desenvolvidas no Núcleo de Excelência em Tecnologias Sociais (NEES), do Instituto de Computação da Universidade Federal de Alagoas (UFAL) e contam com a contribuição direta dos pesquisadores Dr. Ig Ibert Bittencourt (UFAL), Dr. Seiji Isotani (USP), e Armando Barbosa, Danila Oliveira, Judson Bandeira, Thiago Ávila e Williams Alcântara (UFAL).
[1] DataPortals. (2015). A Comprehensive List of Open Data Portals from Around the World. Open Knowledge Foundation. Acesso em: jul. 2015. Disponível em: http://www.dataportals.org [2] Bandeira, Judson; Alcantara; Williams;  Barbosa, Armando; Ávila, Thiago; Oliveira, Danila; Bittencourt, I. & Isotani, S. (2014). Dados Abertos Conectados. Jornada de Atualização em Tecnologia da Informação. Anais do III Simpósio Brasileiro de Tecnologia da Informação – SBTI 2014. [3]Berners-Lee, Tim (2006). Linked Data. W3C. Acesso em: jul. 2015. Disponível em: http://www.w3.org/DesignIssues/LinkedData.html [4] Bizer, Christian; Hheath, Tom; Berners-Lee, Tim (2009). Linked data – the story so far. International Journal On Semantic Web And Information Systems, v. 5, n. 3, p. 1-22. [5] DBPedia – http://www.dbpedia.org [6] Springer Linked Open Data – http://lod.springer.com Texto publicado no site Thiago Ávila. Ele faz parte da série de artigos Dados abertos conectados. Flattr this!

Por que precisamos conectar os dados publicados na Web?

Elza Maria Albuquerque - November 10, 2017 in Dados Abertos, dados abertos governamentais, dados governamentais, Destaque, Economia digital, governo

Por Thiago Ávila* No primeiro artigo desta série, abordamos a problemática da oferta de dados que vem crescendo exponencialmente no âmbito da economia digital, mas com qualidade e poder de reutilização muito baixo. Conforme já explorado, estes dados estão, predominantemente, em formato não estruturado – o que limita sua descrição e reutilização por outras aplicações e pessoas. Além disso, devido à baixa qualidade dos dados disponibilizados, o processo de reutilização tem sido caro [1]. Nesta direção, novas abordagens em torno dos dados foram sendo desenvolvidas ao longo dos anos e atualmente, busca-se o estabelecimento de um conceito de dado que possa ser amplamente utilizado sem restrições de uso e aplicações, de tal maneira que o ciclo de produção de conhecimento possa ser mais rico e aprimorado [2]. O conceito de dados abertos foi estabelecido neste horizonte e consistem de Dados que podem ser utilizados livremente, reutilizados e redistribuído por qualquer pessoa – sujeito apenas, no máximo, com a exigência de atribuir o compartilhamento pela mesma licença [3]. Os dados abertos permitem que pessoas e organizações utilizem informações públicas livremente para gerar aplicativos, fazer análises ou mesmo produtos comercializáveis. Para que um conjunto de dados seja considerado aberto, ele precisa permitir que o cidadão acesse com facilidade e o utilize ou redistribua sem restrições. Ademais, os dados precisam ser facilmente encontrados em um lugar indexado, sem impedimento de leitura por máquinas ou restrições legais [4]. No âmbito governamental, para conceituar o como devem ser os dados abertos governamentais foram estabelecidas três leis, ou seja, as condições para que um determinado dado governamental seja considerado como aberto [5]: – Se o dado não pode ser encontrado e indexado na Web, ele não existe; – Se não estiver aberto e disponível em formato compreensível por máquina, ele não pode ser reaproveitado; e – Se algum dispositivo legal não permitir sua replicação, ele não é útil. Complementarmente, a The Association of Computing Machinery’s publicou uma recomendação para dados governamentais, onde estabeleceu que: “Os dados publicados pelo governo deve ser em formatos e abordagens que promovam a análise e reutilização desses dados.” [6]. Desta forma, o conceito de dados abertos governamentais emergiu como uma forte referência à publicação de dados na web, criando novos canais de comunicação entre governos e seus cidadãos, onde inúmeros portais e catálogos de dados web foram desenvolvidos, em nível continental, como o da União Europeia (reunindo catálogos de 29 países), em nível nacional como o dos E.U.A., do Reino Unido e do Brasil, e ainda em nível local, como o do Estado de Alagoas, ofertando milhares de conjuntos de dados online. Tais iniciativas têm sido bastante impulsionadas em nível global, como o estabelecimento da Parceria para o Governo Aberto (Open Government Partnership) [7] que reúne cerca de 65 países (incluindo o Brasil) em torno do estabelecimento de Governos mais transparentes, participativos e que engajem a sociedade na co-criação e colaboração em torno de soluções de interesse público. Assim, o volume de dados e informações produzido, bem como a atual descentralização destas estruturas de produção impõem desafios cada vez maiores, pois a tomada de decisão precisa ser subsidiada por informações integradas, comumente decorrente do cruzamento de várias bases de dados. Neste contexto, os consumidores de dados visualizam que a oferta de dados atual vastamente espalhada pela web representa um grande inconveniente, pois existe a necessidade de primeiro obter e armazenar estes dados localmente, antes que possam ser utilizados para a produção de informações relevantes [8]. Cumpre ressaltar ainda que, mesmo que a informação do setor público esteja disponível em formato aberto, pode estar publicada de forma caótica. Ademais, a mesma informação pode ser encontrada em diferentes locais da web e ainda, sem haver nenhuma conexão entre tais fontes de informações, apresentando, por exemplo, qual é a informação mais atualizada. Diante desta situação, para que os usuários tenham confiança nos dados disponibilizados eles buscam analisar a sua procedência, dando preferência àqueles que são originários de fontes confiáveis. Por outro lado, estes dados confiáveis são naturalmente disponibilizados por fontes distribuídas, não sendo incomum a ausência de hiperlinks para informações relacionadas, ora armazenadas no mesmo repositório de dados ou não [9]. O desafio presente consiste no fornecimento de meios eficazes para acessar dados das fontes distribuídas, e ainda, estipular mecanismos por meio dos quais eles podem ser conectados e integrados [8]. Outro desafio reside na limitação dos seres humanos em processar e conectar a atual oferta de dados e informações disponíveis, considerando que a internet faz com que a riqueza do conhecimento humano esteja disponível para qualquer pessoa, em qualquer lugar. Mais um desafio reside em como classificar e efetivamente utilizar o crescente volume de informação disponível para a obtenção das respostas necessárias. Uma iniciativa interessante na direção desse desafio foi à proposição, por Tim Berners-Lee de uma escala de maturidade dos dados, conhecida como Esquema das 5 Estrelas dos Dados Abertos[10]. Esta escala foi estabelecida quando da definição do conceito de Dados Conectados, conforme abaixo [2]: 1-Estrela: O dado está disponível na web, em qualquer formato (pdf, png, jpeg); 2-Estrelas: O dado está disponível como sendo legível por máquina e estruturado (uma planilha do Excel); 3-Estrelas: O dado está disponível num formato não-proprietário (uma planilha CSV). 4-Estrelas: O dado é publicado usando os padrões de dados abertos do World Wide Web Consortium, como o (RDF e SPARQL) e possui identificadores universais (URIS); 5-Estrelas: Todos os itens acima se aplicam, além de links para dados de fontes diferentes e utilização de semântica, ou seja, o dado é enriquecido e conectado com outros dados.

Figura 01 – Esquema de maturidade 5 Estrelas dos Dados Abertos [11]

Além dos novos conceitos estabelecidos, desta importante escala de maturidade, do conjunto de esforços que vem sendo desenvolvidos pelo W3C, há uma grande intenção em aprimorar a oferta de dados gerados pela economia digital, afinal, os dados estão bem espalhados em sistemas e catálogos de dados mundo afora e, relembrando o primeiro artigo desta série, 67% da oferta de dados em 2020 poderão ser inúteis para reuso e apoio a construção do conhecimento e subsidiar a tomada de decisão e esta oferta de dados estará cada vez mais distribuída ao redor do globo. Precisamos ou não pensar em como melhorar esta oferta de dados e conectando-a e enriquecendo-a efetivamente? No próximo artigo desta série, apresentaremos uma das perspectivas em desenvolvimento para a melhoria de dados na Web, que são os “Dados Conectados” apresentaremos este conceito e ao longo dos próximos posts, seu potencial, casos e uso, vantagens e limitações. Até a próxima!!!
  • Thiago Ávila é conselheiro consultivo da Open Knowledge Brasil.
  • Estes artigos são oriundos de pesquisas científicas desenvolvidas no Núcleo de Excelência em Tecnologias Sociais (NEES), do Instituto de Computação da Universidade Federal de Alagoas (UFAL) e contam com a contribuição direta dos pesquisadores Dr. Ig Ibert Bittencourt (UFAL), Dr. Seiji Isotani (USP), e Armando Barbosa, Danila Oliveira, Judson Bandeira, Thiago Ávila e Williams Alcântara (UFAL).
[1] Alcantara, Williams; Bandeira, Judson; Barbosa, Armando; Lima, André; Ávila, Thiago; Bittencourt, Ig & Isotani, Seiji. (2015). Desafios no uso de Dados Abertos Conectados na Educação Brasileira. Anais do DesafiE – 4º Workshop de Desafios da Computação Aplicada à Educação. CSBC 2015. Recife: Sociedade Brasileira de Computação. [2] Bandeira, Judson; Alcantara; Williams;  Barbosa, Armando; Ávila, Thiago; Oliveira, Danila; Bittencourt, I. & Isotani, S. (2014). Dados Abertos Conectados. Jornada de Atualização em Tecnologia da Informação. Anais do III Simpósio Brasileiro de Tecnologia da Informação – SBTI 2014. [3] OKFN. Open Data HandBook. Why Open Data ?. Open Knowledge Foundation. Disponível em: http://opendatahandbook.org/guide/en/why-open-data/. Acesso em: jul. 2015 [4] Neves. Otávio Moreira de Castro. Evolução Das Políticas De Governo Aberto No Brasil. Anais do VI Congresso Brasileiro de Gestão Pública – CONSAD. Brasília, Brasil. 2013. Acesso em out. 2014. Disponível em: http://consadnacional.org.br/wp-content/uploads/2013/05/092-EVOLU%C3%87%C3%83O-DAS-POL%C3%8DTICAS-DE-GOVERNO-ABERTO-NO-BRASIL.pdf [5] Eaves, David. (2009). The Three Laws of Open Government Data.  Disponível em Eaves.ca: http://eaves.ca/2009/09/30/three-law-of-open-government-data. Acesso em: jul. 2015 [6] ACM. Association of Computing Machinery. ACM Recommendation On Open Government. 2009. Disponível em: http://www.acm.org/public-policy/open-government [7] OGP. Open Government Partnership. Participating Countries. 2014. Acesso em: jul. 2015. Disponível em: http://www.opengovpartnership.org/countries [8] Heath, T. (2011). Linked Data — Welcome to the Data Network. IEEE Internet Computing archive. Volume 15 Issue 6. Pages 70-73 [9] Galiotou, Eleni and Fragkou, Pavlina (2013). Applying Linked Data Technologies to Greek Open Government Data: A Case Study. Journal of Social and Behavioral Sciences, p 479-486, vol. 73; doi: 10.1016/j.sbspro.2013.02.080. [10]Berners-Lee, Tim (2006). Linked Data. W3C. Acesso em: jul. 2015. Disponível em: http://www.w3.org/DesignIssues/LinkedData.html [11] 5 STARS OPEN DATA… “5 Stars Open Data”. 2012. Acessado em set. 2014. Disponível em: http://5stardata.info/ Texto publicado no site Thiago Ávila. Ele faz parte da série de artigos Dados abertos conectados.
Flattr this!

Por que precisamos conectar os dados publicados na Web?

Elza Maria Albuquerque - November 10, 2017 in Dados Abertos, dados abertos governamentais, dados governamentais, Destaque, Economia digital, governo

Por Thiago Ávila* No primeiro artigo desta série, abordamos a problemática da oferta de dados que vem crescendo exponencialmente no âmbito da economia digital, mas com qualidade e poder de reutilização muito baixo. Conforme já explorado, estes dados estão, predominantemente, em formato não estruturado – o que limita sua descrição e reutilização por outras aplicações e pessoas. Além disso, devido à baixa qualidade dos dados disponibilizados, o processo de reutilização tem sido caro [1]. Nesta direção, novas abordagens em torno dos dados foram sendo desenvolvidas ao longo dos anos e atualmente, busca-se o estabelecimento de um conceito de dado que possa ser amplamente utilizado sem restrições de uso e aplicações, de tal maneira que o ciclo de produção de conhecimento possa ser mais rico e aprimorado [2]. O conceito de dados abertos foi estabelecido neste horizonte e consistem de Dados que podem ser utilizados livremente, reutilizados e redistribuído por qualquer pessoa – sujeito apenas, no máximo, com a exigência de atribuir o compartilhamento pela mesma licença [3]. Os dados abertos permitem que pessoas e organizações utilizem informações públicas livremente para gerar aplicativos, fazer análises ou mesmo produtos comercializáveis. Para que um conjunto de dados seja considerado aberto, ele precisa permitir que o cidadão acesse com facilidade e o utilize ou redistribua sem restrições. Ademais, os dados precisam ser facilmente encontrados em um lugar indexado, sem impedimento de leitura por máquinas ou restrições legais [4]. No âmbito governamental, para conceituar o como devem ser os dados abertos governamentais foram estabelecidas três leis, ou seja, as condições para que um determinado dado governamental seja considerado como aberto [5]: – Se o dado não pode ser encontrado e indexado na Web, ele não existe; – Se não estiver aberto e disponível em formato compreensível por máquina, ele não pode ser reaproveitado; e – Se algum dispositivo legal não permitir sua replicação, ele não é útil. Complementarmente, a The Association of Computing Machinery’s publicou uma recomendação para dados governamentais, onde estabeleceu que: “Os dados publicados pelo governo deve ser em formatos e abordagens que promovam a análise e reutilização desses dados.” [6]. Desta forma, o conceito de dados abertos governamentais emergiu como uma forte referência à publicação de dados na web, criando novos canais de comunicação entre governos e seus cidadãos, onde inúmeros portais e catálogos de dados web foram desenvolvidos, em nível continental, como o da União Europeia (reunindo catálogos de 29 países), em nível nacional como o dos E.U.A., do Reino Unido e do Brasil, e ainda em nível local, como o do Estado de Alagoas, ofertando milhares de conjuntos de dados online. Tais iniciativas têm sido bastante impulsionadas em nível global, como o estabelecimento da Parceria para o Governo Aberto (Open Government Partnership) [7] que reúne cerca de 65 países (incluindo o Brasil) em torno do estabelecimento de Governos mais transparentes, participativos e que engajem a sociedade na co-criação e colaboração em torno de soluções de interesse público. Assim, o volume de dados e informações produzido, bem como a atual descentralização destas estruturas de produção impõem desafios cada vez maiores, pois a tomada de decisão precisa ser subsidiada por informações integradas, comumente decorrente do cruzamento de várias bases de dados. Neste contexto, os consumidores de dados visualizam que a oferta de dados atual vastamente espalhada pela web representa um grande inconveniente, pois existe a necessidade de primeiro obter e armazenar estes dados localmente, antes que possam ser utilizados para a produção de informações relevantes [8]. Cumpre ressaltar ainda que, mesmo que a informação do setor público esteja disponível em formato aberto, pode estar publicada de forma caótica. Ademais, a mesma informação pode ser encontrada em diferentes locais da web e ainda, sem haver nenhuma conexão entre tais fontes de informações, apresentando, por exemplo, qual é a informação mais atualizada. Diante desta situação, para que os usuários tenham confiança nos dados disponibilizados eles buscam analisar a sua procedência, dando preferência àqueles que são originários de fontes confiáveis. Por outro lado, estes dados confiáveis são naturalmente disponibilizados por fontes distribuídas, não sendo incomum a ausência de hiperlinks para informações relacionadas, ora armazenadas no mesmo repositório de dados ou não [9]. O desafio presente consiste no fornecimento de meios eficazes para acessar dados das fontes distribuídas, e ainda, estipular mecanismos por meio dos quais eles podem ser conectados e integrados [8]. Outro desafio reside na limitação dos seres humanos em processar e conectar a atual oferta de dados e informações disponíveis, considerando que a internet faz com que a riqueza do conhecimento humano esteja disponível para qualquer pessoa, em qualquer lugar. Mais um desafio reside em como classificar e efetivamente utilizar o crescente volume de informação disponível para a obtenção das respostas necessárias. Uma iniciativa interessante na direção desse desafio foi à proposição, por Tim Berners-Lee de uma escala de maturidade dos dados, conhecida como Esquema das 5 Estrelas dos Dados Abertos[10]. Esta escala foi estabelecida quando da definição do conceito de Dados Conectados, conforme abaixo [2]: 1-Estrela: O dado está disponível na web, em qualquer formato (pdf, png, jpeg); 2-Estrelas: O dado está disponível como sendo legível por máquina e estruturado (uma planilha do Excel); 3-Estrelas: O dado está disponível num formato não-proprietário (uma planilha CSV). 4-Estrelas: O dado é publicado usando os padrões de dados abertos do World Wide Web Consortium, como o (RDF e SPARQL) e possui identificadores universais (URIS); 5-Estrelas: Todos os itens acima se aplicam, além de links para dados de fontes diferentes e utilização de semântica, ou seja, o dado é enriquecido e conectado com outros dados.

Figura 01 – Esquema de maturidade 5 Estrelas dos Dados Abertos [11]

Além dos novos conceitos estabelecidos, desta importante escala de maturidade, do conjunto de esforços que vem sendo desenvolvidos pelo W3C, há uma grande intenção em aprimorar a oferta de dados gerados pela economia digital, afinal, os dados estão bem espalhados em sistemas e catálogos de dados mundo afora e, relembrando o primeiro artigo desta série, 67% da oferta de dados em 2020 poderão ser inúteis para reuso e apoio a construção do conhecimento e subsidiar a tomada de decisão e esta oferta de dados estará cada vez mais distribuída ao redor do globo. Precisamos ou não pensar em como melhorar esta oferta de dados e conectando-a e enriquecendo-a efetivamente? No próximo artigo desta série, apresentaremos uma das perspectivas em desenvolvimento para a melhoria de dados na Web, que são os “Dados Conectados” apresentaremos este conceito e ao longo dos próximos posts, seu potencial, casos e uso, vantagens e limitações. Até a próxima!!!
  • Thiago Ávila é conselheiro consultivo da Open Knowledge Brasil.
  • Estes artigos são oriundos de pesquisas científicas desenvolvidas no Núcleo de Excelência em Tecnologias Sociais (NEES), do Instituto de Computação da Universidade Federal de Alagoas (UFAL) e contam com a contribuição direta dos pesquisadores Dr. Ig Ibert Bittencourt (UFAL), Dr. Seiji Isotani (USP), e Armando Barbosa, Danila Oliveira, Judson Bandeira, Thiago Ávila e Williams Alcântara (UFAL).
[1] Alcantara, Williams; Bandeira, Judson; Barbosa, Armando; Lima, André; Ávila, Thiago; Bittencourt, Ig & Isotani, Seiji. (2015). Desafios no uso de Dados Abertos Conectados na Educação Brasileira. Anais do DesafiE – 4º Workshop de Desafios da Computação Aplicada à Educação. CSBC 2015. Recife: Sociedade Brasileira de Computação. [2] Bandeira, Judson; Alcantara; Williams;  Barbosa, Armando; Ávila, Thiago; Oliveira, Danila; Bittencourt, I. & Isotani, S. (2014). Dados Abertos Conectados. Jornada de Atualização em Tecnologia da Informação. Anais do III Simpósio Brasileiro de Tecnologia da Informação – SBTI 2014. [3] OKFN. Open Data HandBook. Why Open Data ?. Open Knowledge Foundation. Disponível em: http://opendatahandbook.org/guide/en/why-open-data/. Acesso em: jul. 2015 [4] Neves. Otávio Moreira de Castro. Evolução Das Políticas De Governo Aberto No Brasil. Anais do VI Congresso Brasileiro de Gestão Pública – CONSAD. Brasília, Brasil. 2013. Acesso em out. 2014. Disponível em: http://consadnacional.org.br/wp-content/uploads/2013/05/092-EVOLU%C3%87%C3%83O-DAS-POL%C3%8DTICAS-DE-GOVERNO-ABERTO-NO-BRASIL.pdf [5] Eaves, David. (2009). The Three Laws of Open Government Data.  Disponível em Eaves.ca: http://eaves.ca/2009/09/30/three-law-of-open-government-data. Acesso em: jul. 2015 [6] ACM. Association of Computing Machinery. ACM Recommendation On Open Government. 2009. Disponível em: http://www.acm.org/public-policy/open-government [7] OGP. Open Government Partnership. Participating Countries. 2014. Acesso em: jul. 2015. Disponível em: http://www.opengovpartnership.org/countries [8] Heath, T. (2011). Linked Data — Welcome to the Data Network. IEEE Internet Computing archive. Volume 15 Issue 6. Pages 70-73 [9] Galiotou, Eleni and Fragkou, Pavlina (2013). Applying Linked Data Technologies to Greek Open Government Data: A Case Study. Journal of Social and Behavioral Sciences, p 479-486, vol. 73; doi: 10.1016/j.sbspro.2013.02.080. [10]Berners-Lee, Tim (2006). Linked Data. W3C. Acesso em: jul. 2015. Disponível em: http://www.w3.org/DesignIssues/LinkedData.html [11] 5 STARS OPEN DATA… “5 Stars Open Data”. 2012. Acessado em set. 2014. Disponível em: http://5stardata.info/ Texto publicado no site Thiago Ávila. Ele faz parte da série de artigos Dados abertos conectados.
Flattr this!

OKBR busca estagiário para levantamento do Índice de Dados Abertos (Open Data Index) no Brasil

Elza Maria Albuquerque - November 8, 2017 in Dados Abertos, Destaque, Estágio, índice de dados abertos, Open Data Index

Foto de um braço direito em cima do teclado de um laptop ligado e o braço esquerdo em cima de um caderno.

Pessoa com as mãos em cima do teclado de um laptop ligado. Foto: Pixabay / Creative Commons CC0.

A Open Knowledge Brasil (OKBR) deu início aos trabalhos para o levantamento do Índice de Dados Abertos (Open Data Index) no Brasil. Esse índice é uma iniciativa da sociedade civil que busca realizar o mapeamento do estado dos dados abertos em diversos países (e cidades) ao redor do mundo. No processo, membros de organizações públicas, da sociedade civil e especialistas em dados abertos avaliam a disponibilidade e a acessibilidade dos conjuntos de dados definidos em diversos lugares ao redor do mundo. Suas submissões são revisadas por pares e verificadas por uma equipe local de especialistas e revisores de conjuntos de dados. Para a edição de 2017 do índice, a Open Knowledge Brasil busca um estagiário para contratação imediata. O selecionado irá auxiliar no levantamento e avaliação das bases de dados, no processo de revisão e confecção de relatórios e apresentações com os resultados do índice. Segue abaixo o perfil desejado:
Cursos: Administração, Economia ou áreas afins.
Período: 4º período em diante.
Competências: familiaridade com bases de dados, conhecimento básico de informática (sobretudo Excel), interesse por transparência e dados abertos, boa capacidade analítica e de redação, disposição para pesquisa por meio da internet e por meio de contato com agentes públicos, inglês intermediário.
Duração do estágio: Novembro/17 a Junho/18 (8 meses).
Carga horária semanal: 20h.
Remuneração: R$ 1.000,00 mensais + vale-transporte.
Local de trabalho: Edifício Argentina, Praia de Botafogo, Rio de Janeiro – RJ.
Envie seu currículo para ariel@ok.org.br
Flattr this!

OKBR busca estagiário para levantamento do Índice de Dados Abertos (Open Data Index) no Brasil

Elza Maria Albuquerque - November 8, 2017 in Dados Abertos, Destaque, Estágio, índice de dados abertos, Open Data Index

Foto de um braço direito em cima do teclado de um laptop ligado e o braço esquerdo em cima de um caderno.

Pessoa com as mãos em cima do teclado de um laptop ligado. Foto: Pixabay / Creative Commons CC0.

A Open Knowledge Brasil (OKBR) deu início aos trabalhos para o levantamento do Índice de Dados Abertos (Open Data Index) no Brasil. Esse índice é uma iniciativa da sociedade civil que busca realizar o mapeamento do estado dos dados abertos em diversos países (e cidades) ao redor do mundo. No processo, membros de organizações públicas, da sociedade civil e especialistas em dados abertos avaliam a disponibilidade e a acessibilidade dos conjuntos de dados definidos em diversos lugares ao redor do mundo. Suas submissões são revisadas por pares e verificadas por uma equipe local de especialistas e revisores de conjuntos de dados. Para a edição de 2017 do índice, a Open Knowledge Brasil busca um estagiário para contratação imediata. O selecionado irá auxiliar no levantamento e avaliação das bases de dados, no processo de revisão e confecção de relatórios e apresentações com os resultados do índice. Segue abaixo o perfil desejado:
Cursos: Administração, Economia ou áreas afins.
Período: 4º período em diante.
Competências: familiaridade com bases de dados, conhecimento básico de informática (sobretudo Excel), interesse por transparência e dados abertos, boa capacidade analítica e de redação, disposição para pesquisa por meio da internet e por meio de contato com agentes públicos, inglês intermediário.
Duração do estágio: Novembro/17 a Junho/18 (8 meses).
Carga horária semanal: 20h.
Remuneração: R$ 1.000,00 mensais + vale-transporte.
Local de trabalho: Edifício Argentina, Praia de Botafogo, Rio de Janeiro – RJ.
Envie seu currículo para ariel@ok.org.br
Flattr this!

OKBR participa da 7ª edição do Fórum da Internet no Brasil

Elza Maria Albuquerque - October 29, 2017 in acesso à informação, Dados Abertos, Destaque, Internet

Entre os dias 14 e 17 de novembro, a cidade do Rio de Janeiro vai receber a 7ª edição do Fórum da Internet no Brasil. Neste ano, o tema é “Moldando o seu futuro digital”. A programação do evento conta com workshops sobre inclusão digital, criptografia, privacidade e proteção de dados pessoais, direito ao esquecimento, blockchain, entre outros tópicos. É a primeira vez que o Fórum da Internet constrói sua programação de workshops de maneira colaborativa. Todos eles são compostos por, no mínimo, um representante dos quatro setores envolvidos na governança da Internet (governamental, empresarial, terceiro setor e comunidade científica e tecnológica). No dia 16/11, às 14h, a Open Knowledge Brasil vai participar do workshop “Padrões abertos e acesso à informação: perspectivas e desafios dos dados abertos governamentais”. Os participantes são: Thiago José Tavares Ávila, conselheiro da OKBR e representante da Secretaria de Estado do Planejamento, Gestão e Patrimônio (SEPLAG/AL); Luiz Henrique Leite Portella, do iMaps Intelligence; Ariel Kogan, codiretor da Open Knowledge Brasil, e Christiana Soares de Freitas, Professora do Departamento de Gestão de Políticas Públicas da Universidade de Brasília (UnB). Como moderadora: Ana Julia Possamai, Analista Pesquisadora da Fundação de Economia e Estatística (FEE-RS). O workshop tem o objetivo de discutir os desafios para a publicação, a promoção, o acesso e a reutilização de dados governamentais em formato aberto, como um dos aspectos fundamentais a compor o direito à informação e a sustentar a participação, a colaboração e a inovação governo-sociedade na Era Digital. Desde 2011, o Fórum da Internet no Brasil é promovido anualmente pelo Comitê Gestor da Internet no Brasil (CGI.br). Ele consiste em atividade preparatória para o Fórum de Governança da Internet (IGF). Por meio dele, o CGI.br busca incentivar representantes dos setores que o compõem a acompanharem e opinarem sobre as questões mais relevantes para a consolidação e expansão de uma Internet cada vez mais diversa, universal e inovadora no Brasil e que expresse os princípios da liberdade, dos direitos humanos, da privacidade, tal como apresentados no decálogo de Princípios para a Governança e Uso da Internet.
Flattr this!

Escola de Dados abre inscrições para Conferência de Jornalismo de Dados e Métodos Digitais

Elza Maria Albuquerque - October 24, 2017 in CODA, Coda.Br, Conferência Brasileira de Jornalismo de Dados e Métodos Digitais, Dados Abertos, Destaque, Escola de Dados, Jornalismo de dados, networking

A Escola de Dados abriu as inscrições para a segunda edição da Conferência Brasileira de Jornalismo de Dados e Métodos Digitais (Coda.Br). O evento, realizado em parceria com o Google News Lab, vai acontecer nos dias 25 e 26 de novembro, no campus da FAAP, em São Paulo (SP). O encontro é o primeiro do Brasil com foco em jornalismo de dados. O objetivo é reunir os melhores profissionais do mercado para trocar ensinamentos e experiências sobre a área. A programação traz mais de 30 workshops em oito salas paralelas com treinadores especializados em habilidades e ferramentas de pesquisa e jornalismo guiado por dados. Além disso, terá rodas de debate com jornalistas e pesquisadores nacionais e internacionais sobre responsabilidade algorítmica, machine learning, privacidade, o futuro do jornalismo de dados, entre outros temas. A proposta é que os participantes – iniciantes ou avançados em jornalismo de dados – possam colocar a mão na massa, compartilhar conhecimento, aprender, expandir o networking, refletir e sair do evento prontos para melhorar ou tirar do papel seus projetos guiados por dados. O evento vai trazer referências internacionais em jornalismo de dados – como Mar Cabra, Jonathan Stray, jornalista computacional da Universidade de Columbia com passagens pelas equipes de dados do New York Times e da ProPublica, Momi Peralta, líder do La Nación Data da Argentina, a mais premiada equipe de jornalismo de dados da América Latina, e Jennifer Stark, jornalista computacional da Universidade de Maryland, com publicações em veículos como Washington Post e Vice. Também estarão presentes brasileiros à frente de grandes trabalhos em redações, programadores, pesquisadores e empreendedores da área. O número de vagas é limitado a 250 pessoas. O valor das inscrições é de R$ 250 para profissionais e R$ 180 para estudantes, até 5 de novembro. A partir dessa data, se ainda houver vagas, o valor passa para R$ 325 para profissionais e R$ 220 para estudantes. As inscrições podem ser realizadas no site do evento: coda.escoladedados.org A conferência conta com o apoio da Abraji, do La Nación Data, do Knight Center for Journalism in the Americas e da Python Software Foundation.

A Escola de Dados

A Escola de Dados é uma rede global, presente em mais de 20 países, com a missão de capacitar cidadãos no mundo dos dados, de modo a contribuir com o fortalecimento das democracias. Atua há quatro anos no Brasil com foco na formação de ONGs e jornalistas, ensinando-os a usar dados abertos para estimular o debate bem informado, promover transparência e criar narrativas eficazes para suas agendas. Responsável por dezenas de tutoriais e formações presenciais e online: milhares de pessoas em todo o mundo já aprenderam com a rede a trabalhar com dados abertos.

SERVIÇO

2ª Coda.Br
Data: 25 e 26 de novembro
Valor: R$ 180 (estudante) e R$ 250 (profissional)
Inscrições e mais informações: coda.escoladedados.org
Local: FAAP/São Paulo (Rua Alagoas, 903 – Higienópolis)
Flattr this!