|
8.67.1 Introduction
Même si la plupart des langues peuvent être représentées grâce
à un jeu de 128 caractères, il y a d'autres langues qui requièrent
des jeux de caractères bien plus grands. Des méthodes de caractères
multi-octets ont été développées pour résoudre ce type de problème.
Lorsque vous manipulez des chaînes de caractères multi-octets,
pour couper, rechercher ou nettoyer une chaîne, vous devez utiliser deux
octets consécutifs, qui représentent un seul caractère. Si vous n'y prenez
pas garde, vous allez obtenir une chaîne corrompue et invalide, avec
une représentation totalement incompréhensible.
mbstring
fournit les fonctions spécifiques de manipulations
des chaînes multi-octets pour PHP, qui ne supporte que les jeux
mono-octets. De plus,
mbstring
gère la traduction
entre les jeux de caractères disponibles.
mbstring
est aussi connu pour gérer l'Unicode, comme
UTF-8 et UCS-2 ainsi que de nombreux autres jeux mono-octets, même si
mbstring
a été conçu à la base pour les pages
web japonaises.
|