Python之字符编码相关介绍

发布时间：2020年09月27日 10:40:30 来源：点击量：419

【摘要】Python 字符编码简记可以简单的理解为：1 为了处理英文字符，产生了ASCII码。2 为了处理中文字符，产生了GB2312。3 为了处理各国字符，产

Python 字符编码简记

可以简单的理解为：

1.为了处理英文字符，产生了ASCII码。

2.为了处理中文字符，产生了GB2312。

3.为了处理各国字符，产生了Unicode。

4.为了提高Unicode存储和传输性能，产生了UTF-8，它是Unicode的一种实现形式。

注意：

Python2.x 默认编码是 ASCII

Python3.x 默认编码是 unicode，所以 Python3.x 直接支持中文不需要进行二次处理。

相关推荐：《Python视频教程》

GBK转换成 UTF-8 的流程:

1.通过解码 (decode) 转换成 Unicode

2.通过编码 (encode) 转成成 GBK

乱码是因为系统编码与所提供字符的编码不一致所导致的。所以当我们需要操作系统正确的输出一个字符时，除了要知道该字符的字符编码，也要知道自己系统所使用的字符编码。

Linux 系统大部分使用的是 UTF-8 编码，Windoors 系统使用的编码是 GB2312。

可以通过 chardet 来判断字符的编码

安装步骤：

1. 下载 chardet-3.0.4.tar.gz 
地址：https://pypi.python.org/pypi/chardet/3.0.4#downloads
2. 解压至安装目录
我的电脑为 D:softwarePython2.7Libsite-packageschardet-3.0.4
3. 打开 Windows 命令行窗口进行安装

进入源码目录

使用 python setup.py install 安装

测试

# -*- encoding:utf-8 -*-
import chardet
name = '你好'
print(chardet.detect(name))

运行结果：

在py2中

#-*- coding: UTF-8 -*-

声明这句话就是告诉 python2.7 解释器 (默认ACSII编码方式)解释的 .py 文件声明下面的内容按 utf8 编码，就是编码(编码成字节串最后转成0101的形式让机器去执行)　

分享到：编辑：wangmin

上一篇：python入门基础教程下一篇：Python缩进规则（包含快捷键）

就业培训申请领取

您的姓名

您的电话

意向课程

点击领取

环球青藤

官方QQ群

扫描上方二维码或点击一键加群，免费领取大礼包，加群暗号：青藤。一键加群

Python编程相关文章推荐

Python编程最新文章推荐

免费直播更多

应《中华人民共和国网络安全法》加强实名认证机制要求,同时为更加全面的体验产品服务,烦请您绑定手机号.

预约成功

本直播为付费学员的直播课节

请您购买课程后再预约

我要购买

最新文章

环球青藤移动课堂APP 直播、听课。职达未来！

安卓版

下载

iPhone版

下载

环球青藤官方微信服务平台

刷题看课 APP下载

免费直播一键购课

代报名等人工服务

Python编程热点排行