Interface de Transformação
Esta página apresenta a interface de Transformação, a etapa da Produção que converte linhas validadas em matriz analítica e artefatos exportáveis. Ela oferece dummy variables, label encoding, TF-IDF, remoção de referência e saídas em CSV, JSON, JSONL, GoldVarb e dicionário.

No contexto do PHPB Lab, Transformação funciona como a camada de engenharia de dados da análise: ela pega a codificação validada e gera formatos adequados para modelagem estatística, auditoria e interoperabilidade. A interface se aplica quando a codificação já está revisada; configure o método de transformação conforme o modelo planejado; use as exportações para arquivamento, conferência externa ou análise complementar.
Resumo técnico
| Aspecto | Referência |
|---|---|
| O que é | Etapa de geração de matriz e exportações analíticas. |
| O que faz | Aplica encodings, vetorização e materializa datasets. |
| Como funciona | Transforma linhas validadas em matriz e previews exportáveis. |
| Aplicação | Preparar entrada para modelos estatísticos e auditoria. |
| Configuração | Escolha dummy variables, label encoding, TF-IDF e remoção de referência. |
| Uso | Gere a matriz, confira o preview, exporte artefatos e avance para Analisar. |
Controles
| Campo ou controle | Função |
|---|---|
| Variáveis Dummy | One-hot encoding por nível categórico. |
| Label Encoding | Codificação numérica por nível. |
| TF-IDF | Vetorização lexical das sentenças validadas. |
| Remover nível de referência | Remove a categoria de referência em dummy variables. |
| Gerar matriz | Materializa a matriz. |
| CSV / JSON | Exporta matriz. |
| Dataframe CSV | Exporta dataset analítico Martins. |
| JSONL auditoria | Exporta ocorrências em JSONL. |
| GoldVarb TXT | Exporta formato textual para GoldVarb. |
| Dicionário | Exporta dicionário de dados. |
| Exclusões | Exporta relatório de exclusões. |
| Analisar | Avança quando há matriz. |
O preview da matriz exibe até 50 linhas.