Perda da memória ou a preservação digital


Lendo a CACM de Outubro de 2016 encontrei este artigo do Vinton G. Cerf sobre a perda da memória digital: “We’re going backward“. Então lembrei de um post que publiquei em 2005 tratando exatamente do mesmo assunto. Com pequenas modificações estou republicando-o a seguir.


Há bastante tempo fui contatado para apresentar um artigo convidado em São Paulo, no Memorial da América do Sul, em uma conferência de uma  Sociedade de História e Computação. Tive algumas dúvidas sobre do que se trataria, afinal eu não sou um especialista em História, nem em história da computação e nunca tinha ouvido falar daquela sociedade. Uns colegas disseram que era para testemunhar… Nada disto, o assunto que esperavam que eu discutisse era modelos de dados temporais. A apresentação e a discussão a seguir foram muito estimulantes pois os participantes estavam interessados na manutenção de estados de conhecimento em diversos pontos no tempo e em consultas do tipo: “o que se sabia sobre o Estado Novo em março de 1945?”. Eu havia trabalhado neste assunto em meu doutorado e orientei uma tese sobre banco de dados temporais. O mais interessante, para mim, foi a descoberta do fenômeno de perda de memória ligado ao armazenamento digital. Naquela época havia pouca evolução nas mídias de armazenamento mas fiquei sabendo que mais de 60% dos dados, na época, do governo americano não eram mais legíveis pois estavam armazenados em fitas de 7 trilhas! Os discos flexíveis de 8” são objetos de museu, hoje vocês já tentaram recuperara aquele arquivo importante em um disquete (o que é isto mesmo?) de 3 ½”? Impossível! Isto é uma terrível perda de memória digital. Estamos vivendo uma incrível situação: cada vez temos mais conteúdos digitais disponíveis e, ao mesmo tempo, estes conteúdos estão se tornando ilegíveis cada vez mais rapidamente. Vejam a situação dos CDs com fotos digitais, os melhores prometem uma duração de cerca de 100 anos, ótimo! mas quem terá, daqui a 100 anos, algum equipamento capaz de lê-los? Uma das atividades daquela Sociedade de História e Computação estava ligada à instalação e manutenção de laboratórios em que antigas máquinas eram mantidas operacionais para permitir a leitura de mídias obsoletas. A ideia não é de fazer um museu mas sim um laboratório equipado com equipamentos antigos e utilizáveis, é possível imaginar o custo desta aventura! Comparem esta situação com, por exemplo, os pergaminhos do Mar Morto ou com os papiros egípcios, de 3.000 a 5.000 anos e ainda legíveis. O assunto foi anotado como interessante, mas ficou armazenado na memória. 

Por outro lado o histórico das páginas Web tem sido mantido, de um lado pelas máquinas de busca que possuem um acervo gigantesco de páginas, mas com acesso restrito às suas máquinas de busca. Ao lado destas fontes há uma série de atividades que procuram preservar a história da Web em um país, região ou sobre um assunto. O acesso a estes dados pode estar limitado por razões de privacidade mas a história está preservada. Um exemplo bem conhecido de arquivamento e de acesso livre é o serviço Internet Archive que provê versões antigas de sites e arquivos disponíveis na Web (vale a pena experimentar suas diversas possibilidades).

Recentemente, com minhas atividades de pesquisa em bibliotecas digitais e em editoração e revisão aberta de artigos na Web, a idéia voltou: como vamos tratar da obsolescência das mídias digitais? Fisicamente a preservação do acervo em papel é missão da Biblioteca Nacional, no Brasil, e da Biblioteca do Congresso, nos USA. Para o acervo digital comecei a estudar o assunto a partir das palavras chave que me recordava daquela antiga conferência, e encontrei material muito interessante. No ano passado a Biblioteca do Congresso Americana e a National Science Fundation lançaram um edital ligado à Digital Information Infrastructure and Preservation Program (NDIIPP) para tratar exatamente deste problema. A missão desta iniciativa é:

Develop a national strategy to collect, archive and preserve the burgeoning amounts of digital content, especially materials that are created only in digital formats, for current and future generations.

Por outro lado as bibliotecas em todo o mundo estão trabalhando sobre o problema de normas para suportar a preservação digital, um tema realmente interessante e de grande atualidade. Do ponto de vista da pesquisa há enormes possibilidades tais como o desenvolvimento de mecanismos de consulta temporal, manipulação de metadados para a indexação deste conteúdo, formas de armazenamento diferencial e muitas outras possibilidades. 

Qual é a situação da preservação digital aqui no Brasil? Nas empresas, nas Universidades? No Governo? Esta consulta nós dá uma idéia sobre a situação. Vamos investir nesta linha de pesquisa?


Logo não vamos programar computadores . Vamos treiná-los como cães.

  

Chocados com o título? Vocês se lembram do computador HAL 900 (HAL 9000 (Heuristically programmed ALgorithmic Computer) do filme “2001 Uma Odisséia no Espaço”? No filme , os astronautas David Bowman e Frank Poole consideram desligar circuitos cognitivos de Hal quando ele parece estranho ao relatar a presença de uma falha na antena de comunicações da nave espacial . Eles tentam esconder o que estão dizendo, mas não sabem que HAL pode ler seus lábios. Diante da perspectiva de desconexão HAL decide matar os astronautas a fim de se proteger e prosseguir executando as suas instruções programadas. Bowman desativa as funções cognitivas do HAL 9000 pela remoção de módulos lógicos; com isso a consciência de HAL se degrada. Quando os circutos de nível cognitivo de HAL são completamente desligados, ele começa a cantar a canção “Daisy Bell” ( na realidade, a primeira música cantada por um computador). A ficção está se tornando realidade.  Leiam este artigo da Wired: Soon We Won’t Program Computers. We’ll Train Them Like Dogs

But whether you like this state of affairs or hate it—whether you’re a member of the coding elite or someone who barely feels competent to futz with the settings on your phone—don’t get used to it. Our machines are starting to speak a different language now, one that even the best coders can’t fully understand.

Memória de 1G, tunel do tempo!

 

 

Imaginem: em 2004 uma memória de i Giga para máquina fotográfica custava apenas 499,99 dólares dos Estados Unidos. Hoje este preço seria US$ 630,30 compensada a inflação.

 

Hoje a menor que se encontra no mercado custaria US$ 12.95, pelo câmbio do dia. Que evolução! Pena que o mesmo não tenha acontecido com os automóveis.

 

 


E se você perder todos os dados?

Nesta manhã a tranquilidade de João da Silva terminou! Pelas 10 horas da manhã, vinte e quatro horas após o grande clarão solar, ele estava se deslocando em seu smart-carro quando começaram a saltar faíscas da linha de alta tensão ao lado da estrada. O sistema de condução automática parou de funcionar e uma trava de emergência, felizmente mecânica, atuou e parou o veículo. Nesta hora tudo parou. A falta de energia foi geral, severas tempestades solares são semelhantes ao choque eletromagnético causado por uma explosão nuclear. Danos reais aos fios e aparelhos eletrônicos ocorreram e, dada a ampla difusão, foram de difícil recuperação. Satélites de comunicação são muito vulneráveis, sem a proteção da atmosfera foram imediatamente queimados. João ficou a pé a 10 quilômetros de sua casa, após uma longa caminhada conseguiu voltar e foi obrigado a arrombar a porta, pois a chave biométrica tinha queimado. Seu fogão com placas de aquecimento eletromagnéticas evidentemente não funcionava e a comida supergelada estava descongelando. João disse adeus ao seu laptop. Disse adeus ao seu ar condicionado. Na verdade, disse adeus à tecnologia elétrica por um longo, muito longo tempo.

Cooperação na pesquisa: uma rede social

 

Tenho recebido muitos convites para participar do ResearchGate e não tinha respondido a nenhum pois pensei que era mais uma destas redes sociais de pequeno interesse. Hoje resolvi dar uma olhada e gostei. Encontrei muitos colegas e pesquisadores considerados no ambiente. O mais interessante é que eles criaram um índice RG index que estimula a cooperação no ambiente e o reconhecimento do pesquisador. A ideia é muito próxima de uma publicação nossa sobre a construção de reputação:Uma Proposta para Editoração, Indexação e Busca de Documentos Científicos em um Processo de Avaliação Aberta“. Como o pessoal no exterior não têm um CV Lattes me parece que estão adotando esta rede social. O ponto principal é a opção pela colaboração; há solicitações de artigos, questões e respostas. Há tempos tenho pensado sobre a colaboração e a competição na pesquisa científica. Estes dias estava lendo as páginas amarela da Revista Veja quando encontrei esta parte da entrevista de uma candidata¸ Fabiola Gianotti, ao Premio Nobel de Física; fiquei emocionado!

Veja: Por ter liderado equipes que somaram mais de 3000 físicos e engenheiros empenhados na descoberta do Higgs, dá-se como certo que a senhora vai ganhar o Prémio Nobel de Física. Analisando friamente, isso é inevitável, não?

Fabiola Gianotti: Sinto-me honrada por ter me tornado a face desta que é uma das descobertas mais importantes dos últimos 100 anos. Mas acho errado que uma só pessoa, ou duas, ou três levem o Nobel por isso. Não acharia certo que o prémio viesse apenas para a minha mão. Se o comitê do Nobel achar apropriado consagrar nossa pesquisa, peço publicamente que os agraciados sejam os times de milhares de cientistas que formularam a teoria, como Peter Higgs, e que a testaram na prática, como as equipes que guiei. O prémio deveria ir para o Cern e para a comunidade em torno dele. Para isso ocorrer, teriam de ser mudadas as atuais regras do Nobel. Mas está na hora das transformações. Hoje, as experiências científicas mais relevantes não são feitas apenas por um ou por alguns indivíduos. Os responsáveis são grupos imensos de intelectuais ultraqualificados, cada um com uma função específica e vital na condução do experimento. Muitos atuaram remotamente, via internet, de diversas partes do mundo. A maneira de fazer ciência mudou muito, e a organização do Nobel deveria refletir isso.

Experimentem, eu comecei recentemente e já apareceram bastante resultados. Depois de algum tempo de uso estou gostando muito do ambiente colaborativo  – link

 

 

Processamento das eleições de 1974

O processamento das eleições estaduais de 1974 foi feito pelo CPD-UFRGS, tendo sido o sistema projetado e desenvolvido pelos alunos do CPGCC (Lúcia, Lisbôa, Liane, Palazzo, Nina) coordenados por Clésio Saraiva dos Santos. Os votos eram em papel e contados manualmente, após as atas das seções eleitorais foram digitadas e agregadas. Todo o backup e processamento era feito com gravações múltiplas em fitas magnéticas!

Eleicoes1974

As três pessoas a esquerda são membros do Tribunal Eleitoral, a seguir Lisboa e Palazzo

O primeiro modem (1973)

 

No Instituto de Física havia um grupo de engenheiros e físicos ligados à área de instrumentação eletrônica que desenvolvia projetos ligados à área de processamento digital de dados. Foram desenvolvidos diversos equipamentos como um espectrômetro de efeito Moessbauer e um analisador multicanal para espectroscopia nuclear, ambos baseados num mini-computador Modelo 2114 da HP.

Tendo em vista que o main-frame da UFRGS, nesta época, o famoso Burroughs 6700, localizado no campus médico, distante em torno de 3km, tanto do Instituto de Física como do Departamento de Engenharia Eletrica, que ficava no fim da Av. Osvaldo Aranha, foi definido em 1973, um projeto no Instituto de Informática, sob a coordenação do Prof. Juergen Rochol, que viabilazasse estender o potencial de computação do B 6700 para estes locais, via terminais remotos, e transmissão de dados por linha telefônica.

Surgiu então o projeto do modem analógico para canal de voz telefônico, que viria a ser fabricado mais tarde pela PARKS Indústria Eletrônica Ltda., sob a sigla comercial de UP 1200 (UP: Universidade e Parks, 1200: a taxa máxima do modem). O modem é considerado o primeiro modem de fabricação nacional (1974), que foi totalmente desenvolvido e produzido no Brasil, através de um esforço conjunto entre a Universidade e uma Indústria genuinamente nacional. O modem foi comercializado durante mais de 3 anos, inclusive para o Sistema Telebrás, após sofrer algumas modificações. O modem na sua versão comercial atendia o padrão V.23 do CCITT, e transmitia em duplex 2×1200 bit/s ou 1200×75 bit/s.

A partir destas idéias, posteriormente, surgiu a Digitel S.A. Indústria Eletrônica. Gilberto Machado fundou com os colegas Jaime Wagner e Francisco Wendt e do professor Juergen Rochol, a empresa em novembro de 1978. Inicialmente, a Digitel fabricou um produto de alta velocidade para curtas distâncias em linhas físicas, que Machado havia projetado nas aulas do professor Juergen. Coincidentemente, o AD9600 transformou-se no líder de vendas da empresa por mais de cinco anos.