Pular para o conteúdo principal

Plataforma

O PHPB Hub é uma plataforma de consulta acadêmica para coleções históricas do Projeto para a História do Português Brasileiro. A aplicação combina navegação por acervo, leitura de amostras, busca KWIC, análises exploratórias e exportação em formatos reutilizáveis.

Objetivos

ObjetivoComo a plataforma atende
Dar acesso ao acervo publicadoLista coleções e amostras por gênero, estado, século e metadados.
Apoiar consulta linguísticaExecuta concordância KWIC por forma, lema, regex, POS, anotação e semântica demonstrativa.
Facilitar análise exploratóriaCalcula frequências, n-gramas, colocações, séries diacrônicas, comparação e distribuição geográfica.
Preservar rastreabilidadeMantém ligação entre amostra, coleção, documento, metadados e fonte.
Preparar interoperabilidadeExporta dados em JSON, CSV, TSV, CoNLL-U e TEI/XML simplificado.

Escopo funcional

A versão documentada opera como SPA pública. Ela não depende de backend remoto e não realiza autenticação.

ÁreaDisponibilidade públicaObservação
InícioDisponívelMétricas e acesso ao projeto.
Projeto institucionalDisponível/phpb ou /phpb-sc, conforme tenant.
ColeçõesDisponívelFiltros, detalhes e download por coleção.
AmostrasDisponívelLeitura, metadados, tokens e exportação.
BuscaDisponívelKWIC com filtros.
AnáliseDisponívelCálculos demonstrativos no navegador.
ProjetosDisponívelSubcorpora salvos localmente.
RevisãoBloqueada na demo públicaÁrea operacional para conferência manual.
IngestãoBloqueada na demo públicaSimula entrada local de corpus.
ConfiguraçõesBloqueada na demo públicaLista modelos NLP e camadas de anotação.

Tipos de dados

O modelo público trabalha com três unidades principais:

UnidadeDescrição
ColeçãoAgrupamento editorial com gênero, suporte, estado, século, instituição, referência e contagens.
DocumentoArquivo ingerido ou derivado, com metadados, status e vínculo a uma coleção.
AmostraTrecho consultável do corpus, com texto, fonte, metadados, posição, status e contagens.

Limites da versão demonstrativa

  • A API atual é uma camada local em src/lib/demo-api.ts.
  • Tokens, lemas, POS e análise de clíticos são calculados por heurísticas demonstrativas.
  • Edições de amostras, anotações e metadados são salvas apenas no navegador.
  • O modo público desativa operações administrativas.
  • A exportação TEI/XML e CoNLL-U é simplificada para apoiar interoperabilidade inicial.

Relação com o projeto PHPB

A plataforma não substitui a edição filológica nem a forma de citação definida por cada material. Cada coleção permanece vinculada à equipe, fonte e referência editorial correspondente. A aplicação funciona como ponto de entrada para consulta, inspeção e exploração dos dados já disponibilizados.