PHP et UTF-8

Pour mon projet top – secret – que – si – vous – attendez – quelques – semaines – je – vous – dirais – tout, j’ai besoin d’implémenter un système de traduction. Après avoir lu quelques articles sur les jeux de caractères, j’en suis arrivé à la conclusion que l’idéal est d’utiliser UTF-8. J’ai donc cherché à voir ce que PHP propose dans ce domaine et je dois avouer que je suis perplexe.

Si j’ai bien compris, de manière interne PHP gère les chaines de caractères en ISO-8859-1 et il existe 2 fonctions (utf8_encode et utf8_decode) afin de convertir ces chaines vers et depuis UTF-8. La gestion interne des chaines en Unicode a bien été proposée mais cela reste pour le moment à l’étude.

Il y a quelques chose qui me semble vraiment étrange. Si quelqu’un soumet un formulaire contenant des caractères exotiques et que je dois traiter ce texte en PHP, que vont devenir ces caractères exotiques qui n’existent pas en ISO-88-59-1 ?

Suis-je passé à côté de quelque chose ou la gestion correcte des jeux de caractères avec PHP reste-t-elle un doux rêve ?

Ce contenu a été publié dans PHP. Vous pouvez le mettre en favoris avec ce permalien.

10 réponses à PHP et UTF-8

Les commentaires sont fermés.