You are browsing the archive for arquivos.

Projeto analisa iniciativas de digitalização de acervos no Brasil

- October 9, 2014 in acervos digitais, arquivos, bibliotecas, Conhecimento Livre, CTS, Destaque, GLAM, museus, Parceiros

No último mês de agosto, o Centro de Tecnologia e Sociedade da FGV (CTS/FGV) iniciou o projeto de pesquisa Acervos Digitais, que pretende desenvolver uma série de levantamentos sobre o estado atual das iniciativas de digitalização de acervos de museus, bibliotecas e arquivos no país, assim como dos principais obstáculos e dificuldades existentes no campo. As primeiras atividades do projeto consistiram em dois workshops realizados no Rio de Janeiro e São Paulo com profissionais do setor de arquivos, museus e bibliotecas, pesquisadores e ativistas do acesso aberto e conhecimento livre.
1200px-Old_book_bindings

Old book bindings” por Tom Murphy VII. Licenciado sob uma licença CC BY-SA 3.0 via Wikimedia Commons.

Durante o primeiro encontro, que ocorreu no dia 2 de setembro, levantaram-se desafios, soluções e oportunidades para o setor no que diz respeito à tecnologia, direito, políticas institucionais, financiamento e padrões, documentações e metadados. Na reunião do dia 1º de outubro, foram trazidas questões novas, como a possibilidade de se pensar em hardware livre para os projetos de digitalização (Evelin Heidel apresentou o DIY Book Scanner), dados sobre logística e custos envolvendo tecnologia de armazenamento e novas perspectivas de colaboração entre as instituições, com destaque para a Rede Memorial, iniciativa de articulação que também promove treinamentos, e o projeto Wikisource, um acervo digital de livros e textos fontes que em domínio público ou livres. Desafios Ao discutir os desafios, os participantes destacaram questões institucionais como a descontinuidade dos projetos de digitalização, o fluxo grande de funcionários não permanentes que participam desses projetos e, em alguns casos, um certo imediatismo que se reflete em uma preocupação com a produção e não com a preservação. Levantou-se também a questão de se saberem as razões pelas quais as instituições pretendem iniciar um trabalho de digitalização, para um dimensionamento do projeto a partir do entendimento responsável dos desafios que isso implica. Discutiu-se, por exemplo, ser impossível pensar em digitalizar todos os materiais que existem e a necessidade de se pensar em seleções e prioridades. Do ponto de vista tecnológico, destacou-se a importância e as vantagens de se utilizar soluções em software livre (SL) com o comprometimento de fomentar ativamente seu desenvolvimento, já que se chamou a atenção também para o fato de que o SL requer um tipo de investimento em manutenção diferente do software proprietário. Desafios jurídicos relacionados às dificuldades de se determinar a situação de uma obra em termos de direitos autorais também foram apresentadas pelos profissionais do setor durante os encontros. A falta de informações sobre sobre autoria e licenciamento no passado, o tratamento adequado para as obras órfãs, ou seja, cujos detentores de direitos são desconhecidos, e a falta de segurança jurídica no processo de digitalização foram alguns dos pontos levantados pelos participantes. O projeto Financiado pela Presidência da Fundação Getulio Vargas (FGV), o projeto Acervos Digitais tem o objetivo de desenvolver levantamentos sobre o estado atual das iniciativas de digitalização de acervos de museus, bibliotecas e arquivos no Brasil. O estudo pretende mapear os principais desafios e oportunidades no campo em relação a políticas públicas e institucionais, tecnologias, bem como padrões a serem adotados. Com foco em acesso aberto, a iniciativa levantará os gargalos jurídicos existentes para a ampla disponibilização de acervos de obras artísticas, científicas e literárias ao público. Além dos workshops, o projeto tem como objetivos:
  • Realizar um mapeamento das iniciativas de digitalização em museus, bibliotecas e arquivos no Brasil, desenvolvendo a etapa nacional da pesquisa internacional OpenGLAM Benchmark Survey, coordenada pela Universidade de Berna e pela Open Knowledge Foundation;
  • Desenvolver, posteriormente, trabalho de campo qualitativo com museus de diferentes regiões, selecionados dentre as instituições participantes da Benchmark Survey e mapeadas nos workshops, para entender suas resistências e os obstáculos legais e técnicos para a digitalização, especialmente aberta, de acervos;
  • Contribuir, com os resultados da etapa nacional da Benchmark Survey para o relatório internacional a ser desenvolvido pela Universidade de Berna e difundir os resultados no Brasil;
  • Desenvolver, no âmbito do projeto Creative Commons, também coordenado pelo CTS/FGV, uma cartilha de utilização das licenças nos arquivos, bibliotecas e museus;
  • Organizar um livro e criar de materiais de referência (técnicos, jurídicos, gerenciais) para coleções abertas, em português.
Como objetivo transversal, o projeto também pretende contribuir para dois debates centrais na agenda legislativa de 2014 e 2015: a reforma da Lei de Direitos Autorais e o Tratado da OMPI de Exceções e Limitações para Acervos, Arquivos e Bibliotecas. Saiba mais Imagem da capa:Dunhuang manuscript digitisation” por International Dunhuang Project. Licenciado sob uma licença CC BY-SA 3.0 via Wikimedia Commons. flattr this!

Além da enciclopédia, Wikimedia também tem uma biblioteca

- October 6, 2014 in acervos, arquivos, biblioteca, Conhecimento Livre, digitalização, domínio público, GLAM, wikimedia, Wikimedia Foundation, WIkipedia, wikisource

* Por Luiz Augusto Pereira Fernandes Algo que muitas pessoas desconhecem ou pouco dão atenção é que a Wikimedia, apesar de comumente associada a seu mais popular projeto (Wikipédia), mantém uma dúzia de iniciativas. Todas elas promovem, dentro de várias especificidades, meios de “cada ser humano compartilhar livremente a soma de todo o conhecimento“. Falarei a seguir um pouco do Wikisource mas, antes, gostaria de retomar um pouco dos anos iniciais da Wikipédia, para em seguida apresentar uma das formas de trabalho atual dentro dos Wikisources com possibilidade de cooperação entre bibliotecas e editores dos projetos Wikimedia.
[[Autor:Alexandre_de_Gusmão]], contendo breves informações biográficas e links para  algumas das obras já disponibilizadas parcialmente pelo Wikisource. O box controle de  autoridade permite o acesso aos principais websites com informações complementares sobre o autor e suas obras, sendo alguns deles gerados a partir de catálogos de bibliotecas.

[[Autor:Alexandre_de_Gusmão]], contendo breves informações biográficas e links para algumas das obras já disponibilizadas parcialmente pelo Wikisource. O box controle de autoridade permite o acesso aos principais websites com informações complementares sobre o autor e suas obras, sendo alguns deles gerados a partir de catálogos de bibliotecas.

Histórico Ainda hoje encontramos alguns termos nas Wikipédias cujos links são vermelhos. É a forma como o software MediaWiki encontra para chamar a atenção de que esse termo ainda não possui uma página própria e que eventual clique resultará num formulário de edição convidando o internauta a escrever sobre ele. No começo da Wikipédia era extremamente comum se deparar com dezenas desses links a cada página. As pessoas os seguiam e tinham as mais diversas reações. Caracteres aleatórios (para ver se era isso mesmo que entenderam, uma enciclopédia lhes chamando para iniciar uma definição), mensagens de desapontamento, infração de direitos autorais ao copiar texto de outro website e, ocasionalmente, linhas iniciais de um futuro verbete promissor eram algumas das reações que as pessoas tinham ao deparar-se com tais links. Nos links para títulos de livros certas vezes acontecia ainda outra coisa: a pessoa sabia onde encontrava a íntegra daquela obra e, ao invés de escrever sobre ela, colava seu conteúdo no espaço de edição. Muitos eram os casos de obras disponíveis em meio digital mas com alguma restrição de direito autoral. Muitos outros eram os casos de obras em domínio público ou sob uma licença livre. Até 2003 todas essas páginas eram marcadas para eliminação ou recicladas em verbetes. Mas, os editores da Wikipédia em inglês tiveram a idéia de reunir o envio das íntegras desses textos em um espaço próprio. O nome inicial era simultaneamente um improviso e um trocadilho: Project Sourceberg. “Source” se referindo à natureza dos materiais enviados (textos-fonte para estudos futuros), “berg” em alusão ao Project Gutenberg, já existente, mas com procedimentos de disponibilização de materiais diferentes dos de se publicar em uma plataforma wiki. Desdobramentos diversos foram ocorrendo ao longo dos anos. De um wiki único a cerca de sessenta wikis divididos por idiomas mais um wiki geral de coordenação e para as línguas que ainda possuem pouco material disponível. Ou, se você preferir, uma rede de bibliotecas em meio wiki, especializadas por idiomas. Comum a essa rede de wiki-bibliotecas, pequenos fatos isolados e repetidos foram ocorrendo. Várias pessoas não conseguiam confiar em um ambiente plenamente editável para consultar uma obra já existente e “finalizada”. Outras, confundiam o Wikisource com a Wikipédia e começavam a tentar corrigir informações datadas ou superadas. Outras, ainda, tentavam alterar erros tipográficos e de pontuação, propositais ou acidentais, dos textos originais. Originais de obras digitalizadas e potencialidades Bibliotecas em diversos locais do mundo têm iniciado ou ampliado seus esforços de digitalização de materiais. Essas digitalizações normalmente são feitas em um esforço simultâneo de preservação das peças originais e de disseminação desses mesmos materiais. As peças mais vulneráveis a danos ou extravios são as obras raras. Existem critérios diversos para que um livro ou outro material possa ser considerado como raro. Mas, como um deles refere-se à antiguidade da obra, muitas vezes existirão livros que são raros e em domínio público por sua antiguidade. Geralmente são as digitalizações desse tipo específico de obras que as bibliotecas disponibilizam de forma irrestrita ao público, já que materiais mais recentes ainda estão sujeitos a direitos autorais. A partir dessa constatação que programadores voluntários desenvolveram uma extensão ao MediaWiki que permite trabalhar com essas digitalizações a partir do Wikisource. É importante notar que, com isso, surgiram oportunidades diversas a três públicos diferentes (editores do Wikisource, bibliotecas e outras instituições que assumem para si a missão de colecionar e preservar materiais e, ainda, editores da Wikipédia). Os três têm a mesma finalidade – a disseminação do conhecimento – e poderão se unir em torno de uma mesma digitalização para atingir esse objetivo.
Tela de edição de uma página específica do livro. À direita, imagem digitalizada da página. À esquerda, box de edição do texto correspondente à página. O link instrumentos de  revisão incluem recursos para aumento ou redução de zoom da imagem exibida, bem  como alternância entre a tela atual de edição ou com a digitalização sendo exibida acima  e a caixa de edição exibida abaixo. Esta tela em específico contém o texto de OCR bruto,  gerado de forma automática ao se seguir um dos links vermelhos ilustrados da tela anterior.

Tela de edição de uma página específica do livro. À direita, imagem digitalizada da página. À esquerda, box de edição do texto correspondente à página. O link instrumentos de revisão incluem recursos para aumento ou redução de zoom da imagem exibida, bem como alternância entre a tela atual de edição ou com a digitalização sendo exibida acima e a caixa de edição exibida abaixo. Esta tela em específico contém o texto de OCR bruto, gerado de forma automática ao se seguir um dos links vermelhos ilustrados da tela anterior.

Há casos bem sucedidos dessa união de interesses e recursos, mas se debruçar neles infelizmente causaria a perda de foco deste texto. Esquematizando brevemente:
  • A biblioteca (ou instituição congênere) preserva o item em seu meio impresso e o digitaliza, com recursos próprios ou através de parcerias que possam ser viabilizadas inclusive com os colaboradores de projetos Wikimedia;
  • Os editores do Wikisource e/ou da Wikipédia poderão ajudar a instituição a definir os direitos autorais de cada um dos itens;
  • Os itens em domínio público poderão ter suas digitalizações hospedadas tanto em servidores da própria instituição, quanto diretamente nos servidores da Wikimedia Foundation. A segunda opção, aliás, poderia significar inclusive considerável redução de custos para programas de digitalização de materiais. Hospedar as digitalizações de forma simultânea em ambos os ambientes seria igualmente possível e viável;
  • A partir da extensão ao MediaWiki, editores do Wikisource são capazes de fazer a conversão das digitalizações e respectivos textos reconhecidos por OCR para hipertexto. A partir do hipertexto, por sua vez, uma outra ferramenta é capaz de transformar esses conteúdos em ePub, que fornecerá uma experiência de leitura em meio digital muito mais adequada do que se fosse pela digitalização bruta em si;
  • Se nós estivermos nos referindo a uma obra que contenha ilustrações, tais como dicionários ou enciclopédias, essas ilustrações poderão ser aproveitadas em diversos verbetes da Wikipédia. O texto de obras de referência, aliás, poderá ser utilizado como base a novos verbetes, cabendo aos editores da Wikipédia realizarem as devidas atualizações de seus dados.
Claro que será possível que editores interessados pelo Wikisource e/ou pela Wikipédia explorem essas potencialidades de forma individual, sem contar com nenhuma espécie de apoio das instituições guardiãs dos livros originais (por, dentre outros fatores, digitalizações brutas de materiais em domínio público serem igualmente de domínio público) mas, todos sairiam ganhando se esses esforços se dessem de forma conjunta. As próprias bibliotecas poderiam, dentre outras coisas, economizar recursos ao digitalizarem apenas itens ainda não disponibilizados por outras instituições, utilizando o Wikisource tanto para controle do que já está em meio digital (inclusive verificando sua qualidade de digitalização, que incluiria a apuração se eventuais lacunas de páginas se devem por falhas já no exemplar impresso ou por erro operacional ao digitalizar). Existirão casos em que uma re-digitalização se justifique por motivos além dos de qualidade (presença de autógrafos ou anotações no exemplar específico), mas a atual duplicação descontrolada de digitalizações não parece ter tais características. Instituições cristalizadas há décadas ou séculos poderão possuir ressalvas em confiar à Wikimedia Foundation, existente há cerca de onze anos, a tutela de seus objetos digitais. Mas, além de onze anos para instituições baseadas em internet ser um tempo considerável, todos os conteúdos de todos os projetos Wikimedia são disponibilizados ao público em conjuntos e formatos voltados especificamente ao espelhamento. Ou seja, mesmo com alguma fatalidade ocorrendo, as perdas poderão ser consideravelmente minimizadas. (*) Luiz Augusto Pereira Fernandes é voluntário nos projetos da Wikimedia Foundation desde 2004 e formando em Biblioteconomia e Ciência da Informação pela Fundação Escola de Sociologia e Política de São Paulo (FESPSP). flattr this!