A memória brasileira pode ser perguntada. Mas isso custa créditos de IA.
Cada documento histórico que entra na Legadia passa por uma cadeia de modelos de inteligência artificial — visão computacional para o OCR, embeddings semânticos para a busca, modelos de linguagem para citar e contextualizar trechos. Esse processo tem um custo concreto, em centavos por página, multiplicado por milhares de páginas conforme o acervo cresce. Sua doação é o que mantém esse motor ligado e abre caminho para novas coleções e tecnologias — como o reconhecimento facial em fotografias jornalísticas.
Cada real é um trecho a mais pesquisável.
Não há staff inflado, escritório ou marketing pago. Os recursos vão direto aos custos técnicos que transformam papel digitalizado em pesquisa instantânea.
OCR + visão computacional
Cada página passa por um modelo de IA com visão. Custo aprox.: R$ 0,15 por página.
Embeddings semânticos
Vetores multilíngues permitem buscar por contexto, não apenas palavra-chave.
Reconhecimento facial
Identificação automática de personagens históricos em fotografias — em desenvolvimento.
Contextualização de fatos
A IA cruza acontecimentos entre fontes, datas e personagens para gerar narrativas.
Novas coleções
Jornais cariocas e paulistas da Era Vargas, Bossa Nova, jornais do Império, fotojornalismo.
Hospedagem e banco
Vercel, Neon Postgres e CDN para servir o acervo crescente em alta velocidade.
Modelos top-tier
Quando o pesquisador pede análise profunda, usamos os modelos mais avançados disponíveis.
Manutenção contínua
Correção de OCR, novos índices, integração com Biblioteca Nacional e arquivos públicos.
O que está no ar — e o que está pausado por falta de orçamento.
Transparência total: aqui estão os números reais do banco em produção e o gap que separa o acervo atual da experiência completa que queremos entregar.
1.021 páginas · 23 mil blocos · 100 mil menções
- Em Guarda (1941-1945, 944 páginas) — classificação completa: foto, manchete, legenda, notícia, anúncio, com coordenadas no scan.
- 6 jornais Archive.org — Correio da Manhã, A Noite, Diário de Notícias, Correio Paulistano, Diário da Noite, Folha da Noite, O Estado. Texto OCR + busca semântica funcionando.
- Biblioteca DP — Machado, Alencar, Lobato e outros (1,16 milhão de palavras indexadas).
Os jornais Archive não destacam blocos no scan.
- Quando você abre uma página do A Noite ou Correio da Manhã e clica num bloco, ele não destaca a região no scan — só Em Guarda faz isso.
- O texto está lá e a IA encontra. O que falta é detecção visual de layout (onde está cada matéria, foto, manchete na página).
- Pra destravar: re-processar 278 páginas com Claude Vision (~US$30 one-time) + upgrade do banco Neon Postgres (hoje 484 de 512 MB usados, ~US$20/mês).
Os números são reais e atualizados manualmente. O acervo cresce conforme entram contribuições. A meta de curto prazo é equiparar a experiência de leitura nos jornais Archive ao que já existe na Em Guarda.
Pix — direto, sem taxa.
63.421.394/0001-71Luiz Marcelo Silva dos Santabaia Martins
Qualquer valor é bem-vindo. R$ 10 cobrem o custo de IA de uma página completa. R$ 50 cobrem uma edição inteira de uma revista como a Em Guarda. R$ 500 mantêm a Legadia no ar por um mês.
Pix QR estático não envia confirmação automática. Você preenche um form curto e eu confiro no extrato em até 48h pra te incluir no mural — opcional, doação anônima também é bem-vinda.
Patrocínio cultural — Lei Rouanet, FUNCAP, BNDES.
A Legadia tem perfil compatível com editais culturais brasileiros. Universidades, fundações e empresas com programa de cultura podem patrocinar a digitalização e indexação de acervos específicos — com contrapartida, dedução fiscal e créditos no portal.
Já temos demonstração funcional em produção, código aberto e pipeline replicável. Para conversar sobre patrocínio ou parcerias institucionais:
Por R$ 50, uma edição inteira do Em Guarda vira pesquisa.
Equivalente a 22-55 páginas, todos os personagens e lugares extraídos, todas as fotos catalogadas. Multiplicar isso por milhares depende de pessoas como você.
