A opção de armazenamento de dados em papel

Como programadores, trabalhamos regularmente com codificações de texto. Mas há outro tipo de codificação em ação aqui, que processamos com tanta frequência e rapidez que é invisível para nós e nos esquecemos dela. Estou falando da codificação visual – traduzir os glifos visuais do alfabeto que o senhor está lendo agora. O alfabeto não é diferente de qualquer outra entrada legível por máquina óptica, exceto que as máquinas são nos.

Mas quão eficiente é o alfabeto para codificar informações em uma página? Considere algumas das alternativas: diferentes representações visuais de dados que podem ser impressas em uma página ou exibidas em um monitor:

Cartão perfurado 5081
até 80 caracteres alfanuméricos

codinghorror-5081-punch-card.png

Maxicode
até 93 caracteres alfanuméricos

codinghorror-maxicode.png

Matriz de dados
até 2.335 caracteres alfanuméricos

codinghorror-datamatrix.png

Código QR
até 4.296 caracteres alfanuméricos

codinghorror-qr-code.png

Código Azteca
até 3.067 caracteres alfanuméricos

codinghorror-aztec-code.png

Código de barras colorido de alta capacidade
varia de acordo com o número de cores e a densidade; até 3.500 caracteres por polegada quadrada

codinghorror-microsoft-tag.png

Página impressa
cerca de 10.000 caracteres por página

alice-printed-page.png

O papel, da forma como o usamos normalmente, é criminosamente ineficiente. Há uma tonelada de espaço de armazenamento de dados desperdiçado. É aí que programas como o PaperBack entrar:

O PaperBack é um aplicativo gratuito que permite fazer backup de seus preciosos arquivos em papel comum na forma de bitmaps de grandes dimensões. Se o senhor tiver uma boa impressora a laser com resolução de 600 dpi, poderá salvar até 500.000 bytes de dados não compactados em uma única folha.

O senhor pode se perguntar: por quê? Por que, pelo amor de Deus, eu preciso fazer backups em papel, se há tantas possibilidades alternativas, como CD-R, DVD±R, cartões de memória, cartões flash, discos rígidos, fitas de streaming, unidades ZIP, armazenamento em rede, cartuchos magneto-ópticos e até mesmo disquetes de dupla face de 8 polegadas formatados para DEC PDP-11? A resposta é simples: o senhor não sabe. No entanto, olhando o CD ou a fita magnética, o senhor não consegue saber se os dados são legíveis ou não. O senhor deve inserir a mídia na unidade, se tiver uma, e tentar lê-la.

O papel é diferente. O senhor se lembra dos cartões perfurados? Durante anos, os cartões foram o principal meio de armazenamento do código-fonte. Concordo que programas com mais de 100K eram… inconvenientes, mas apenas programadores de verdade ousavam escrever aplicativos tão grandes. E os cartões usados também eram bons como blocos de anotações. Fitas perfuradas também eram comuns. E mesmo as codificações mais estranhas, como CDC ou EBCDICeram legíveis por humanos (quero dizer, por programadores de verdade).

Obviamente, os bitmaps produzidos pelo PaperBack também são legíveis por humanos (com a pequena ajuda de qualquer microscópio decente). Estou brincando. O que o senhor precisa é de um scanner conectado ao seu PC.

O PaperBack, como muitas das outras codificações visuais listadas acima, inclui provisões para:

  • compressão — para aumentar a quantidade de dados armazenados em uma determinada área.
  • redundância — para o caso de parte da imagem ser danificada ou ficar ilegível.
  • criptografia — para evitar que a imagem possa ser lida por qualquer pessoa, exceto o destinatário pretendido.

paperback-options.png

Claro, ainda é papel, mas o “alfabeto” digital que o senhor está colocando nesse papel é uma forma muito mais sofisticada de armazenar os dados subjacentes do que o texto ASCII tradicional.

Isso tudo pode parecer um pouco fantasioso, já que o alfabeto é tudo com que nós, pobres máquinas humanas, podemos lidar razoavelmente, pelo menos não sem a ajuda de um computador e um scanner. Mas há pelo menos um uso legítimo para esse material, o chave de papel confiável. Existe até mesmo um software para essa finalidade, PaperKey:

O objetivo do papel não é o armazenamento seguro. Há inúmeras maneiras de armazenar algo com segurança. Um backup em papel também não é um substituto para os backups usuais legíveis por máquina (fita, CD-R, DVD-R etc.), mas sim um método de restauração de uma chave caso tudo falhe. A maioria das mídias de armazenamento em uso atualmente não tem uma retenção de dados particularmente boa a longo prazo (medida em anos ou décadas). Se e quando o CD-R e/ou a fita cassete e/ou a chave USB e/ou o disco rígido em que a chave secreta está armazenada se tornarem inutilizáveis, a cópia em papel poderá ser usada para restaurar a chave secreta.

Por outro lado, afirmar que o papel durará 100 anos não é nem um pouco impressionante. O papel de alta qualidade com tinta de boa qualidade dura regularmente centenas de anos, mesmo em condições não ideais.

Outro bônus é que a tinta no papel pode ser lida por humanos. Nem todos os métodos de backup serão legíveis 50 anos depois, portanto, mesmo que o senhor tenha o backup, não poderá comprar facilmente uma unidade para lê-lo. Duvido que isso aconteça tão cedo com o CD-R, pois há muitos deles no mercado, mas o setor de armazenamento está repleto de formas antigas de armazenamento de dados, que já morreram.

Os formatos de codificação de computador e os esquemas de armazenamento de dados vêm e vão. É por isso que grande parte do material de arquivo sobrevive melhor nos formatos mais simples possíveis, como ASCII sem adornos. Dependendo de quais são seus objetivos, uma combinação de codificação digital simples e o bom e velho formato chato, confiável, realmente realmente tecnologia antiga de papel físico ainda pode fazer sentido.