✂Divisor de Texto
Carregando...
Divida facilmente dados CSV, arquivos de log, listas e qualquer outro texto pelo delimitador de sua escolha. Filtre e ordene os itens divididos, remova duplicatas, converta em um array JSON ou junte novamente com um delimitador diferente. Todo o processamento ocorre no seu navegador.
Como usar
- 1Inserir texto
Cole ou digite o texto que deseja dividir. Use os botões de exemplo para carregar dados de amostra rapidamente.
- 2Escolher delimitador
Selecione entre nova linha, vírgula, ponto e vírgula, espaço, tabulação ou pipe — ou insira um delimitador personalizado.
- 3Configurar opções
Alterne entre remover espaços (trim), remover itens vazios e remover duplicatas conforme necessário.
- 4Usar os resultados
Navegue pela lista de itens divididos, pesquise para filtrar e ordene. Copie como uma string unificada ou como um array JSON.
Dicas
- 💡Divida uma linha CSV por vírgula para inspecionar rapidamente os valores individuais das colunas.
- 💡Use a remoção de duplicatas para obter uma lista de valores únicos em um clique.
- 💡Copie a saída do array JSON e cole-a diretamente no seu código.
- 💡Use a pesquisa de filtro para encontrar itens que contenham uma palavra-chave específica.
Perguntas frequentes
- Q. Por que dividir texto é importante para LLMs?
- A. LLMs têm uma janela de contexto limitada. Para sistemas RAG, documentos longos devem ser divididos em fragmentos que caibam nessa janela.
- Q. Como escolho o tamanho certo de fragmento?
- A. Tamanhos típicos: 256-1024 tokens. Muito pequeno perde contexto; muito grande mistura informações irrelevantes. Experimente conforme o tipo de documento.
- Q. O que é sobreposição (overlap) e para que serve?
- A. É o número de tokens compartilhados entre fragmentos consecutivos. Evita que informações importantes sejam cortadas no limite e melhora a qualidade de recuperação no RAG.