DesenvolvedorCalculaTudo

Desenvolvimento

Unicode

Padrão universal de caracteres — code points, não “fonte”.

Leitura objetiva

NívelFundamental

Aplicado no dia a dia · aparece em 1 ferramenta

Nível básicoFundamental Usado em 1 ferramenta

O que é

Unicode atribui número a cada caractere; UTF-8 é a forma mais comum de serializar bytes na web. Problemas de “caractere estranho” costumam ser encoding errado, não falha do Unicode.

Onde isso aparece

JSON

Bancos de dados

Interfaces globais

Como usar no dia a dia

Garantir JSON válido com acentos

Depurar mojibake

Exemplos

  • Emoji como sequência de code points
  • Normalização de acentos em buscas

Erros comuns

  • Assumir que um char JavaScript = um code point (surrogate pairs)
  • Misturar Latin-1 com UTF-8

Conceitos conectados

Você provavelmente vai precisar disso também

Este conceito aparece em

Ferramentas onde você pode aplicar o que aprendeu.

Próximo passo para aprender

Base64, query string e Unicode no navegador.

Continue aprendendo

Próximo passo sugerido na sua trilha — sem cadastro, só no seu navegador.

4/4

Trilha relacionada: Debug de APIs