uchardet
Universal Charset Detector
uchardet is an encoding detector library, which takes a sequence of bytes
in an unknown character encoding without any additional information, and
attempts to determine the encoding of the text. Returned encoding names
are iconv-compatible.
uchardet started as a C language binding of the original C++
implementation of the universal charset detection library by Mozilla. It
can now detect more charsets, and more reliably than the original
implementation.
uchardet est une bibliothèque de détection de codage, prenant une séquence
d'octets en entrée, représentant un texte, et tente d'en déterminer le
codage. Le nom du codage retourné est compatible iconv.
uchardet était originellement un binding en C de l'implémentation
originelle en C++ par Mozilla. L'implémentation actuelle peut détecter
plus de codages de caractères que l'originale.
C
C++
Python
Jehan
jehanp