Como posso saber se os dados na tabela tem codificação incorreta?

votos
0

Eu tenho um par de tabelas que estão definidos para o conjunto de caracteres latin1 mas eu suspeito ter sido sido erroneamente inseridos com alguns valores que são realmente codificados usando UTF-8.

MySQL torna este um pouco mais complicado porque ele silenciosamente converte tudo com base em suas configurações de conexão.

Como posso testar minha hipótese de que existem alguns bytes codificados em UTF-8 em uma coluna latin1 no MySQL?

Publicado 09/01/2009 em 17:22
fonte usuário
Em outras línguas...                            


1 respostas

votos
2

Se você encontrar cordas de 2 bytes que correspondem ao padrão de bits seguinte:

110xxxxx 10xxxxxx

as chances são de que estes são utf-8 caracteres. É possível que eles são 2 consecutivos não-ascii latino-1 caracteres (como 'a' ou algo impublicável), mas isso é improvável.

Respondeu 09/01/2009 em 18:37
fonte usuário

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more