Interface de Lematização
Esta página apresenta a interface de Lematização, a aba de Edição dedicada a derivar representações lexicais a partir do texto base. Ela reúne controles para classes gramaticais, stopwords, variantes, lemas, radicais, n-gramas, expressões e dicionário.
No contexto do PHPB Lab, a Lematização funciona como uma camada de abstração lexical: transforma formas superficiais em unidades comparáveis e permite observar padrões de frequência antes da análise estatística. A interface se aplica à preparação de vocabulários, inspeção de variantes e geração de listas lexicais; configure classes, frequência mínima e tamanho de n-grama; use as visualizações para decidir se a sequência lexical deve substituir ou complementar o texto em estudo.
Resumo técnico
| Aspecto | Referência |
|---|---|
| O que é | Aba de processamento lexical no workspace Edição. |
| O que faz | Calcula lemas, radicais, n-gramas, expressões e dicionário lexical. |
| Como funciona | Aplica filtros e normalizações sobre o texto base para gerar visualizações lexicais. |
| Aplicação | Exploração lexical, consolidação de variantes e preparação de vocabulário. |
| Configuração | Ajuste classes ativas, stopwords, variantes, lowercase, n-gramas e frequência mínima. |
| Uso | Gere as visualizações, revise frequências e aplique a sequência quando fizer sentido metodológico. |
Elementos
| Elemento | Função |
|---|---|
| Classes ativas | Controla classes consideradas no resumo lexical. |
| Ignorar stopwords | Remove itens funcionais da análise. |
| Consolidar variantes | Agrupa formas semelhantes. |
| Lowercase lemma | Normaliza lemas em minúsculas. |
| N-gram min/max | Define tamanho de n-gramas. |
| Frequência mínima | Filtra itens raros. |
| Incluir n-gramas funcionais | Mantém sequências funcionais quando necessário. |
| Aplicar sequência | Substitui o texto pelo resultado lexical ou radical. |
Visualizações: lemas, n-gramas, expressões, radicais e dicionário.