Pular para o conteúdo principal

Plataforma

O PHPB Lab apoia pesquisas linguísticas que precisam transformar textos brutos em evidências auditáveis. A plataforma combina edição textual, análise NLP, triagem humana, modelagem estatística, visualização e relatório.

Capacidades

CapacidadeDescrição
Ingestão de corpusImporta documentos .txt, gera UIDs e registra metadados.
Preparação textualSegmenta por sentença ou token e aplica normalizações controladas.
Análise linguísticaUsa spaCy para sentenças, POS, dependências, entidades, lemas e métricas.
Classificação de clíticosDetecta ocorrências e classifica próclise, ênclise ou mesóclise.
Supervisão humanaPermite confirmar, descartar e corrigir ocorrências antes da modelagem.
Configuração analíticaDefine variável dependente, independentes, controles, efeitos aleatórios e níveis.
CodificaçãoMaterializa uma matriz por ocorrência confirmada.
TransformaçãoGera dummy variables, label encoding ou TF-IDF.
ModelagemExecuta modelos logísticos e apresenta coeficientes, p-values, AIC e BIC.
VisualizaçãoResume funil, distribuições, tendências, exclusões e efeitos principais.
RelatórioCompila rascunho acadêmico-linguístico a partir de payload sanitizado.

Funcionalidades por frente de trabalho

FrenteFunção
InícioEntrada da aplicação.
EdiçãoWorkbench de sanitização, transcrição, lematização e anotação.
ProduçãoPipeline principal de corpus e estudo variacionista.

Recursos técnicos

  • SPA React/TypeScript com Vite e Tailwind.
  • API FastAPI em Python.
  • spaCy com modelo pt_core_news_lg.
  • OpenAI para análise detalhada e compilação de relatórios.
  • Persistência local do projeto em IndexedDB, com fallback em localStorage.
  • Exportações CSV, JSON, JSONL, dicionário, relatório de exclusão, GoldVarb TXT e PDF via impressão do navegador.

Por que separar Edição e Produção

O workspace Edição prepara texto em um contexto de intervenção manual. O workspace Produção opera um pipeline auditável, orientado a corpus, com funis, estados e transformações sucessivas. A separação evita misturar correção textual com modelagem estatística.

Papel do pesquisador

O PHPB Lab não substitui a decisão metodológica. A interface automatiza passos repetitivos, mas mantém pontos de supervisão para:

  • validar classificações automáticas;
  • corrigir variáveis linguísticas;
  • decidir exclusões;
  • escolher modelos;
  • revisar interpretações geradas no relatório.