当前位置: 首页 > Python编程 > Python编程实战技能 > Python编程基础入门 > python3如何提取汉字

python3如何提取汉字

发布时间:2020年09月27日 09:32:29 来源: 点击量:399

【摘要】采用正则表达式的方法对字符串进行处理。str1="{我%$是,《速$@ 度 发》中 国、人"相关推荐:《Python教程》(1)提取汉字汉字的范围为”

采用正则表达式的方法对字符串进行处理。

str1 = "{我%$是,《速$@.度发》中 /国、人"

相关推荐:《Python教程》

(1)提取汉字

汉字的范围为”u4e00-u9fa5“,这个是用Unicode表示的。

import re
res1 = ''.join(re.findall('[u4e00-u9fa5]',str1))
print(res1)

输出为:

‘我是速度发中国人’

(2)去除所有符号。采用清理数据,仅保留字母、数字、中文的方法。

import re
res1 = re.sub("[^a-zA-Z0-9u4e00-u9fa5]", '', str1) 
print(res1)

输出为:

‘我是速度发中国人’

分享到: 编辑:wangmin

就业培训申请领取
您的姓名
您的电话
意向课程
点击领取

环球青藤

官方QQ

扫描上方二维码或点击一键加群,免费领取大礼包,加群暗号:青藤。 一键加群

绑定手机号

应《中华人民共和国网络安全法》加强实名认证机制要求,同时为更加全面的体验产品服务,烦请您绑定手机号.

预约成功

本直播为付费学员的直播课节

请您购买课程后再预约

环球青藤移动课堂APP 直播、听课。职达未来!

安卓版

下载

iPhone版

下载
环球青藤官方微信服务平台

刷题看课 APP下载

免费直播 一键购课

代报名等人工服务

课程咨询 学员服务 公众号

扫描关注微信公众号

APP

扫描下载APP

返回顶部