python怎么识别文件格式
【摘要】python通过第三方库chardet以字节方式读进字节流对象,然后通过detect函数识别进而获取文件的格式。""" 自动识别文本编码格式 """ importch
python通过第三方库chardet以字节方式读进字节流对象,然后通过detect函数识别进而获取文件的格式。
"""
自动识别 文本编码格式
"""
import chardet
def detectCode(path):
with open(path, 'rb') as file:
data = file.read(20000)
dicts = chardet.detect(data)
return dicts["encoding"]
def print_data_1(path):
"""
这种编码通过命令行 file -i 文件名获取编码格式,
通过测试,使用file 命令获取的编码格式不能获取正确的编码数据
:param path:
:return:
"""
with open(path, "r", encoding="iso-8859-1") as f:
i = 0
for line in f:
print(line)
i += 1
if i == 5:
break
f.close()
def print_data_2(path):
print("-------------------------------")
with open(path, "r", encoding="{0}".format(detectCode(path))) as f:
i = 0
for line in f:
b_line = line.encode("utf-8") # 将文件内容转化为utf-8格式
print(chardet.detect(b_line)['encoding']) # 输出转化为内容格式
i += 1
if i == 5:
break
f.close()
if __name__ == '__main__':
path = "test.txt"
print(detectCode(path))
# print_data_1(path)
print_data_2(path)
推荐课程:Python进阶视频教程
上一篇:python入门基础教程
下一篇:Python3读取视频&保存视频
就业培训申请领取
环球青藤
官方QQ群扫描上方二维码或点击一键加群,免费领取大礼包,加群暗号:青藤。 一键加群
最新文章
Python编程各地入口
环球青藤官方微信服务平台
刷题看课 APP下载
免费直播 一键购课
代报名等人工服务
Python编程热点排行