Pular para o conteúdo principal

Primeiro Projeto

Este tutorial cria um primeiro projeto de produção a partir de arquivos .txt e percorre o pipeline até a visualização.

1. Crie o lote em Dados

  1. Abra Produção.
  2. Na aba Dados, preencha Nome do projeto, Descrição, Prefixo do Corpus e Natureza.
  3. Arraste arquivos .txt para a área central ou clique na área de upload.
  4. Selecione um documento na tabela para editar seus metadados no painel direito.
  5. Clique em Prosseguir.

2. Prepare os segmentos

  1. Na aba Preparação, mantenha Segmentação como Sentença para análise sintática.
  2. Mantenha Unicode (NFD -> NFC) ativo.
  3. Ajuste Remover pontuação, Lowercase, Preservar hifenizados e Diálogo por travessão conforme o corpus.
  4. Clique em Preparar.
  5. Revise a tabela de sentenças.
  6. Clique em Etiquetar.

3. Execute a etiquetagem

  1. Na aba Etiquetagem, clique em Etiquetar próximo lote para processar 250 sentenças.
  2. Use Iniciar fila em lotes para continuar automaticamente.
  3. Use os filtros POS para controlar quais classes aparecem na visualização.
  4. Ao concluir, clique em Filtrar.

4. Filtre ocorrências candidatas

  1. Em Filtragem, selecione filtros como classe gramatical, pronomes clíticos, posição do pronome e ambiente sintático.
  2. Clique em Filtrar.
  3. Revise os resultados destacados.
  4. Clique em Classificar.

5. Faça a triagem

  1. Em Triagem, revise cada ocorrência.
  2. Corrija posição do pronome, função do clítico e variáveis linguísticas quando necessário.
  3. Marque Elegível ou Excluir para a validade Martins.
  4. Clique em Confirmar ou Descartar.
  5. Se adequado, use Confirmar pendentes.
  6. Clique em Configurar variáveis.

6. Configure, codifique e transforme

  1. Em Configuração, clique em Aplicar modelo Martins ou crie variáveis manuais.
  2. Confirme variável dependente, independentes, controles e níveis ativos.
  3. Clique em Codificar.
  4. Em Codificação, use Preencher por regras e revise a tabela.
  5. Clique em Confirmar tudo quando a matriz estiver coerente.
  6. Clique em Transformar.
  7. Em Transformação, escolha Variáveis Dummy, Label Encoding ou TF-IDF.
  8. Clique em Gerar matriz e depois em Analisar.

7. Analise e visualize

  1. Em Análise, escolha o modelo.
  2. Clique em Executar análise.
  3. Revise coeficientes, p-values, AIC, BIC e warnings.
  4. Clique em Visualizar.
  5. Em Visualização, leia os gráficos e o funil consolidado.

8. Compile um relatório

  1. Em Visualização, clique em Compilar.
  2. Preencha título, objetivo ou pergunta, hipótese, tom, detalhe e seções.
  3. Clique em Gerar relatório.
  4. Edite as seções geradas.
  5. Use Regenerar seção quando precisar reescrever apenas um bloco.
  6. Clique em Exportar PDF pela impressão.

Resultado esperado

Ao final, o projeto terá documentos importados, sentenças preparadas, etiquetas linguísticas, ocorrências triadas, variáveis codificadas, matriz analítica, resultados de modelo, visualizações e um relatório editável.