Acervo de jornais e revistas históricas do Brasil
Periódicos brasileiros do século XX (1900-1967) em domínio público, digitalizados, submetidos a OCR via inteligência artificial e indexados para busca semântica. Cada edição abre numa grade cronológica de anos e meses, com lista de páginas individuais. O acervo cresce continuamente — coleções em ingestão e novas frentes temáticas planejadas.
Em pesquisa ativa

Cadastrados, aguardando digitalização
Outros jornais já cadastrados no sistema mas ainda sem páginas indexadas. Em uma operação completa, esses títulos seriam processados pelo mesmo pipeline — OCR via Sonnet + embeddings + ingest no Postgres.
O que é o acervo Legadia
Imprensa brasileira do século XX, organizada e pesquisável.
A Legadia é um acervo histórico digital dedicado à imprensa brasileira do século XX (1900-1967) em domínio público. Reunimos jornais e revistas originalmente publicados durante a Era Vargas, Estado Novo, Segunda Guerra Mundial, República Populista e início dos anos 1960 — fontes primárias fundamentais para entender a formação política, cultural e social do Brasil moderno. Cada edição é digitalizada (a partir de scans da Hemeroteca da Biblioteca Nacional e do Internet Archive), processada por OCR via inteligência artificial, fatiada em blocos textuais e indexada para busca semântica.
O diferencial
Você pergunta. A IA encontra o trecho exato.
Em arquivos tradicionais, você precisa adivinhar a palavra exata que o texto usava. Na Legadia, você descreve o que procura em linguagem natural — “tropas brasileiras na Itália em 1944”, “reação dos jornais ao suicídio de Vargas”, “menções a Brizola antes da Legalidade” — e a IA recupera os trechos mais próximos do significado, mesmo quando as palavras na página são diferentes. Cada resultado abre na página original digitalizada, com o trecho destacado.
Como pesquisar no acervo
Quatro formas de explorar a memória brasileira.
Use /buscar e pergunte como falaria com uma pessoa: “quais foram as reações ao Estado Novo?”, “como Em Guarda cobriu a FEB?”.
Veja todas as menções a uma figura específica em /personagens — Vargas, Brizola, Jango, Aranha, e centenas de outros nomes extraídos automaticamente.
Navegue por cidade, estado ou país em /lugares. Coleções temáticas como Rio Grande do Sul agregam narrativa histórica e fontes.
/artistas cataloga escritores, pintores e músicos brasileiros mencionados no acervo. A /biblioteca traz clássicos integrais (Machado, Alencar, Lima Barreto).
Períodos historicamente cobertos
Sete décadas de imprensa brasileira.
Final da política do café-com-leite, oligarquias regionais, anos pré-revolução.
Vargas no poder, fim da República Velha, reformas trabalhistas iniciais.
Ditadura constitucional, censura, alinhamento aos Aliados, FEB na Itália.
Revista da política de boa vizinhança EUA-Brasil, cobertura da guerra.
Eleições diretas, novo Vargas no poder, anos de tensão política.
Brasília, desenvolvimentismo, Legalidade, golpe de 1964.
Fontes primárias
De onde vêm os scans.
Todo o acervo Legadia parte de fontes públicas oficiais. As digitalizações originais são extraídas principalmente de:
- Hemeroteca Digital da Biblioteca Nacional (bndigital.bn.gov.br): maior acervo de periódicos brasileiros digitalizados, com obras em domínio público disponibilizadas pelo governo federal.
- Internet Archive (archive.org): organização sem fins lucrativos com vasto acervo de periódicos sul-americanos e da Segunda Guerra, incluindo a série completa da revista Em Guarda.
- Wikimedia Commons (commons.wikimedia.org): fonte de fotografias históricas, retratos de personagens e reproduções de obras em domínio público.
A camada técnica de OCR, embeddings semânticos, extração de entidades e busca é feita inteiramente pela Legadia usando modelos de inteligência artificial (Anthropic Claude Sonnet para OCR de qualidade arquivística, Voyage AI para embeddings, Postgres + pgvector para indexação vetorial). Veja o método detalhado.
Perguntas frequentes
Sobre o acervo histórico digital Legadia.
O que é um acervo histórico digital?+
Um acervo histórico digital é um conjunto organizado de documentos, periódicos, livros, fotografias ou registros públicos digitalizados e disponibilizados para consulta online. Diferente de um arquivo físico tradicional, um acervo digital permite que pesquisadores, estudantes e curiosos acessem fontes primárias de qualquer lugar — e, quando combinado com inteligência artificial (como a Legadia faz), permite também buscar por significado, e não apenas por palavra exata.
Quais jornais e revistas estão no acervo Legadia?+
A primeira coleção em ar é a revista Em Guarda (1941-1945), publicada pelo OCIAA (Office of Inter-American Affairs) durante a Segunda Guerra Mundial com forte cobertura da FEB e da política de boa vizinhança. Em ingestão estão jornais cariocas, paulistas e gaúchos do mesmo período, incluindo títulos como A Noite, Folha da Manhã e outros da Hemeroteca da Biblioteca Nacional em domínio público.
Que período histórico o acervo cobre?+
O recorte cronológico atual é o século XX brasileiro entre 1900 e 1967, com foco principal no período da Era Vargas (1930-1945) — Revolução de 1930, Estado Novo, Segunda Guerra Mundial e a Força Expedicionária Brasileira — e do segundo governo Vargas, JK e Jango (1951-1964). A escolha do limite superior de 1967 segue a Lei 9.610/1998 sobre domínio público no Brasil.
Como funciona a busca semântica?+
A busca semântica não procura a palavra exata, mas o significado. Por exemplo, pesquisar 'soldados brasileiros na Itália' encontra trechos sobre 'pracinhas da FEB em Monte Castelo' mesmo sem a palavra 'soldado' aparecer. Cada bloco textual extraído via OCR é convertido em embeddings vetoriais (Voyage AI, 1024 dimensões) e indexado em pgvector — assim você pergunta em linguagem natural e a IA retorna os trechos mais próximos do conceito buscado.
Posso usar o conteúdo do acervo Legadia?+
Sim. Todo conteúdo histórico no acervo está em domínio público segundo a Lei brasileira de direitos autorais (Lei 9.610/1998), que estabelece domínio público após 70 anos da morte do autor ou para obras anônimas publicadas há mais de 70 anos. Cite a Legadia como fonte de digitalização e indexação, e a Hemeroteca Digital da Biblioteca Nacional (bndigital.bn.gov.br) ou Internet Archive (archive.org) como fonte primária da edição.