Plataforma
O PHPB Hub é uma plataforma de consulta acadêmica para coleções históricas do Projeto para a História do Português Brasileiro. A aplicação combina navegação por acervo, leitura de amostras, busca KWIC, análises exploratórias e exportação em formatos reutilizáveis.
Objetivos
| Objetivo | Como a plataforma atende |
|---|---|
| Dar acesso ao acervo publicado | Lista coleções e amostras por gênero, estado, século e metadados. |
| Apoiar consulta linguística | Executa concordância KWIC por forma, lema, regex, POS, anotação e semântica demonstrativa. |
| Facilitar análise exploratória | Calcula frequências, n-gramas, colocações, séries diacrônicas, comparação e distribuição geográfica. |
| Preservar rastreabilidade | Mantém ligação entre amostra, coleção, documento, metadados e fonte. |
| Preparar interoperabilidade | Exporta dados em JSON, CSV, TSV, CoNLL-U e TEI/XML simplificado. |
Escopo funcional
A versão documentada opera como SPA pública. Ela não depende de backend remoto e não realiza autenticação.
| Área | Disponibilidade pública | Observação |
|---|---|---|
| Início | Disponível | Métricas e acesso ao projeto. |
| Projeto institucional | Disponível | /phpb ou /phpb-sc, conforme tenant. |
| Coleções | Disponível | Filtros, detalhes e download por coleção. |
| Amostras | Disponível | Leitura, metadados, tokens e exportação. |
| Busca | Disponível | KWIC com filtros. |
| Análise | Disponível | Cálculos demonstrativos no navegador. |
| Projetos | Disponível | Subcorpora salvos localmente. |
| Revisão | Bloqueada na demo pública | Área operacional para conferência manual. |
| Ingestão | Bloqueada na demo pública | Simula entrada local de corpus. |
| Configurações | Bloqueada na demo pública | Lista modelos NLP e camadas de anotação. |
Tipos de dados
O modelo público trabalha com três unidades principais:
| Unidade | Descrição |
|---|---|
| Coleção | Agrupamento editorial com gênero, suporte, estado, século, instituição, referência e contagens. |
| Documento | Arquivo ingerido ou derivado, com metadados, status e vínculo a uma coleção. |
| Amostra | Trecho consultável do corpus, com texto, fonte, metadados, posição, status e contagens. |
Limites da versão demonstrativa
- A API atual é uma camada local em
src/lib/demo-api.ts. - Tokens, lemas, POS e análise de clíticos são calculados por heurísticas demonstrativas.
- Edições de amostras, anotações e metadados são salvas apenas no navegador.
- O modo público desativa operações administrativas.
- A exportação TEI/XML e CoNLL-U é simplificada para apoiar interoperabilidade inicial.
Relação com o projeto PHPB
A plataforma não substitui a edição filológica nem a forma de citação definida por cada material. Cada coleção permanece vinculada à equipe, fonte e referência editorial correspondente. A aplicação funciona como ponto de entrada para consulta, inspeção e exploração dos dados já disponibilizados.