Unix versus Windows prestação de caracteres

votos
0

Eu tenho um arquivo de texto que são apresentados de forma diferente quando abri-lo no FreeBSD versus Windows.

No FreeBSD: Ana · lisis e InvestigaciÃ> n

No Windows: Análisis e Investigación

A representação janelas é obviamente certo. Algumas ideias sobre como obter esse resultado em BSD?

Publicado 05/02/2009 em 19:29
fonte usuário
Em outras línguas...                            


7 respostas


votos
4

O problema é que não é ASCII, mas UTF-8. Você tem que usar outro editor que detecta a codificação corretamente ou convertê-lo em algo que seu editor on freebsb entende.

Respondeu 05/02/2009 em 19:43
fonte usuário

votos
1

Pela maneira como os personagens estão sendo exibidos, eu diria que esse arquivo é UTF-8 unicode codificado. Janelas é reconhecer esta, e exibindo a 'a' e caracteres 'O' correcta, enquanto que o FreeBSD é assumindo que é ISO-8859-1, que resulta em esses caracteres a ser exibida como 2 caracteres separados (devido à codificação UTF-8 utilizando 2 bytes). Você vai ter que dizer FreeBSD que é um arquivo UTF-8, de alguma forma.

Respondeu 05/02/2009 em 19:46
fonte usuário

votos
1

Esta não é puro ASCII. É utf-8. Tente editor FreeBSD com suporte UTF-8 ou alterar locais.

Respondeu 05/02/2009 em 19:35
fonte usuário

votos
0

Não importa qual sistema operacional que você está usando quando você abre o arquivo. O que importa é a aplicação que você usa para abri-lo. No Windows você provavelmente está usando o bloco de notas, que identifica automaticamente a codificação como UTF-8.

O aplicativo que você está usando no FreeBSD, obviamente, não está fazendo isso. Talvez ele simplesmente não pode ler UTF-8 e você precisa usar um aplicativo diferente. Ou talvez você só tem que dizer a ele qual a codificação de usar. detecção automática de codificação de caracteres está longe de ser universal (e muito mais longe de ser perfeito).

Respondeu 06/02/2009 em 03:15
fonte usuário

votos
0

Então, depois de fazer um pouco mais cavando se 1) Abra o arquivo CSV no Excel para Mac e exportá-lo como arquivo CSV e 2), em seguida, abri-lo no textmate, copie o texto e salvá-lo novamente ele funciona.

O resultado: file.csv arquivo é

texto UTF-8 Unicode Inglês, com linhas muito longas

O original é:

on-ISO estendida ASCII-texto em Inglês, com linhas muito longas

Esta solução alternativa não é muito adequado como este processo deve ser automatizado, obrigado pela ajuda até agora.

Respondeu 05/02/2009 em 20:50
fonte usuário

votos
0

Como está o arquivo codificado? Gostaria de tentar re-codificar o arquivo como UTF-16.

Respondeu 05/02/2009 em 19:33
fonte usuário

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more