Codificador e Decodificador de Entidades HTML
Escape caracteres especiais de HTML para que sejam seguros para inserir em páginas web, ou reverter o processo para decodificar referências de entidades de volta ao texto legível. O modo de entidade numérica opcional codifica todos os caracteres não-ASCII para garantir máxima compatibilidade com sistemas legados, clientes de e-mail e codificações de caractere específicas.
O que esta ferramenta faz?
A ferramenta de Entidades HTML fornece conversão bidirecional entre caracteres especiais e suas representações de entidades HTML. A codificação converte caracteres como < > & " em suas formas de entidade (< > & ") para que exibam corretamente em HTML, em vez de serem interpretados como marcação. A decodificação reverte as referências de entidade de volta aos caracteres reais. O modo de entidade numérica opcional (&#[decimal];) codifica todos os caracteres não-ASCII, útil para sistemas que não lidam adequadamente com o UTF-8.
Como funciona
A codificação utiliza uma tabela de mapeamento de caracteres para as cinco entidades essenciais XML/HTML e suas formas nomeadas: & → &, < → <, > → >, " → ", ' → '. Quando o modo numérico está habilitado, os caracteres fora da faixa imprimível ASCII são convertidos em referências de entidade decimal &#NNNN;. A decodificação usa expressões regulares para encontrar padrões de entidade (nomeada: &name; numérica: &#NN; ou &#xNN;) e mapeá-los de volta a caracteres Unicode via tabelas de entidade HTML e parseInt para valores numéricos. Todo o processamento é feito no lado do cliente, sem interação com o servidor.
Recursos
- Codifica < > & " ' em entidades nomeadas
- Entidades numéricas opcionais (&#NN;) para caracteres não-ASCII
- Decodifica entidades nomeadas, decimais e hexadecimais de volta ao texto
- Conversão em tempo real enquanto digita
- Processamento 100% no lado do cliente
- Lida com todos os nomes de entidade padrão HTML4 e HTML5
- Preserva o texto ao copiar entre contextos
Como usar
- 1
Cole seu texto de entrada
Digite texto simples para codificar ou texto HTML escapado com entidades para decodificar. A ferramenta detecta automaticamente o tipo de conteúdo ou você pode alternar os modos manualmente.
- 2
Selecione codificar ou decodificar
Escolha Codificar para tornar o texto seguro para HTML, ou Decodificar para converter entidades de volta a caracteres legíveis.
- 3
Alternar entidades numéricas (codificar)
Habilite entidades numéricas para codificar todos os não-ASCII como &#NNNN; — útil para e-mail ou sistemas legados que podem corromper o UTF-8.
- 4
Copiar resultado
Pegue o texto codificado para o seu código-fonte HTML, ou o texto decodificado para leitura e edição normais.
Casos de uso comuns
Incorporar código em HTML
Codifique < e > em exemplos de código para que sejam exibidos corretamente, em vez de serem interpretados como tags HTML pelos navegadores.
Preparação de conteúdo de e-mail
Use entidades numéricas para o HTML de e-mail para maximizar a compatibilidade com vários clientes de e-mail que lidam com codificação de caracteres de forma inconsistente.
Depuração de conteúdo raspado
Decodifique referências de entidades em conteúdo raspado da web para ver o texto real, ou codifique a entrada do usuário antes de inserir em modelos HTML.
Compatibilidade com sistemas legados
Codifique para entidades numéricas para sistemas que não suportam adequadamente o UTF-8, garantindo que os caracteres sejam exibidos corretamente independentemente das configurações de codificação.
Dicas e boas práticas
- Sempre codifique & para & primeiro na cadeia de processamento — senão, entidades codificadas como < tornariam-se &lt;
- Para a web moderna com charset=utf-8, as entidades nomeadas para < > & " ' são suficientes; entidades numéricas para todos os caracteres geralmente são desnecessárias
- O HTML de e-mail se beneficia de entidades numéricas devido ao tratamento inconsistente do UTF-8 em clientes de e-mail
- As cinco entidades essenciais são: & (&), < (<), > (>), " ("), ' (') — codifique estas para qualquer contexto HTML