Desenvolvedor·CalculaTudo
DesenvolvimentoUnicode
Padrão universal de caracteres — code points, não “fonte”.
Leitura objetiva
NívelFundamental
Aplicado no dia a dia · aparece em 1 ferramenta
Nível básicoFundamental Usado em 1 ferramentaO que é
Unicode atribui número a cada caractere; UTF-8 é a forma mais comum de serializar bytes na web. Problemas de “caractere estranho” costumam ser encoding errado, não falha do Unicode.
Onde isso aparece
JSON
Bancos de dados
Interfaces globais
Como usar no dia a dia
Garantir JSON válido com acentos
Depurar mojibake
Exemplos
- Emoji como sequência de code points
- Normalização de acentos em buscas
Erros comuns
- Assumir que um char JavaScript = um code point (surrogate pairs)
- Misturar Latin-1 com UTF-8
Conceitos conectados
Você provavelmente vai precisar disso também
Este conceito aparece em
Ferramentas onde você pode aplicar o que aprendeu.
Próximo passo para aprender
Base64, query string e Unicode no navegador.
Continue aprendendo
Próximo passo sugerido na sua trilha — sem cadastro, só no seu navegador.
4/4Encoding e URLs
Trilha relacionada: Debug de APIs