Convertendo unicode para MySQL e JSON

votos
0

Eu tenho alguns HTML que foi inserido em um banco de dados MySQL de um arquivo CSV, que por sua vez foi exportado a partir de um arquivo de acesso MDB. O arquivo MDB foi exportado como Unicode, e de fato é Unicode. Estou, no entanto incerto como o que codifica a base de dados MySQL tem.

Quando tento eco fora html armazenados em um campo no entanto, não há Unicode. Esta é uma recuperação direta de um dos campos HTML no banco de dados.

http://www.yousendit.com/download/TTZueEVYQzMrV3hMWEE9PQ

Ele diz utf-8na fonte. O código de página real gerada a partir ecoando article_descestá aqui:

http://www.nomorepasting.com/getpaste.php?pasteid=22566

Eu preciso usar este html com JSON, e eu estou querendo saber o que devo fazer. Eu não pode usar quaisquer outros frameworks ou bibliotecas. Devo converter os dados antes de inseri-lo no banco de dados MySQL, ou algo mais?

Publicado 09/12/2008 em 15:25
fonte usuário
Em outras línguas...                            


1 respostas

votos
2

O arquivo mdb foi exportado como Unicode, e de fato é Unocode.

Isso não faz sentido. Um arquivo não pode ser unicode. Ele pode ser codificado com um codificador Unicode-compatíveis, tais como utf-8, ou utf-16 ou utf-8 com BOM ou ..

questões de charset é um problema muito comum, e tem a sua raiz na ignorância. Eu não digo isso para ofendê-lo, mas você realmente precisa saber a diferença entre codepoints (strings) e codificações (bytestreams). Se você não sabe que você está lidando com em todos os momentos ao longo de todo o seu aplicativo, você terá problemas eventualmente. A maldição sobre estas questões é que eles só acontecem em casos extremos, por isso é fácil de supervisionar-los por um longo tempo e quando você finalmente perceber que algo está errado, ele pode ser acionado em uma parte completamente independentes da sua aplicação. Isso torna quase impossível de depuração.

Respondeu 09/12/2008 em 21:58
fonte usuário

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more