Pular para o conteúdo principal

Interface de Lematização

Esta página apresenta a interface de Lematização, a aba de Edição dedicada a derivar representações lexicais a partir do texto base. Ela reúne controles para classes gramaticais, stopwords, variantes, lemas, radicais, n-gramas, expressões e dicionário.

No contexto do PHPB Lab, a Lematização funciona como uma camada de abstração lexical: transforma formas superficiais em unidades comparáveis e permite observar padrões de frequência antes da análise estatística. A interface se aplica à preparação de vocabulários, inspeção de variantes e geração de listas lexicais; configure classes, frequência mínima e tamanho de n-grama; use as visualizações para decidir se a sequência lexical deve substituir ou complementar o texto em estudo.

Resumo técnico

AspectoReferência
O que éAba de processamento lexical no workspace Edição.
O que fazCalcula lemas, radicais, n-gramas, expressões e dicionário lexical.
Como funcionaAplica filtros e normalizações sobre o texto base para gerar visualizações lexicais.
AplicaçãoExploração lexical, consolidação de variantes e preparação de vocabulário.
ConfiguraçãoAjuste classes ativas, stopwords, variantes, lowercase, n-gramas e frequência mínima.
UsoGere as visualizações, revise frequências e aplique a sequência quando fizer sentido metodológico.

Elementos

ElementoFunção
Classes ativasControla classes consideradas no resumo lexical.
Ignorar stopwordsRemove itens funcionais da análise.
Consolidar variantesAgrupa formas semelhantes.
Lowercase lemmaNormaliza lemas em minúsculas.
N-gram min/maxDefine tamanho de n-gramas.
Frequência mínimaFiltra itens raros.
Incluir n-gramas funcionaisMantém sequências funcionais quando necessário.
Aplicar sequênciaSubstitui o texto pelo resultado lexical ou radical.

Visualizações: lemas, n-gramas, expressões, radicais e dicionário.