使用python进行utf9编码和解码

在2005年4月1日(也就是愚人节),IEEE的rfc4042文件规定了utf9和utf18这2个所谓的Unicode的高效转换格式。

具体的格式说明,有兴趣的话点击上面的rfc4042链接去观看。

这里介绍github上的utf9项目。

0x01 安装utf9模块

git clone https://github.com/enricobacis/utf9
cd utf9
python setup.py install

0x02 utf9的编码和解码

>>> import utf9
>>> s=utf9.utf9encode(u'pcat')
>>> print repr(s)
"8\x18\xcc'@"
>>> print utf9.utf9decode(s)
pcat

补充一点,若是读取文件,请用open的"rb"模式,若是写入文件,请用"wb"模式。