Python中文字符串截取问题


Posted in Python onJune 15, 2015

先来看个例子:

#-*- coding:utf8 -*-
s = u'中文截取'
s.decode('utf8')[0:3].encode('utf8')
# 结果u'中文截取

延伸阅读:

UTF-8中的汉字占用多少字节?
占2个字节的:?
占3个字节的:基本等同于GBK,含21000多个汉字
占4个字节的:中日韩超大字符集里面的汉字,有5万多个
一个UTF-8数字占1个字节
一个UTF-8英文字母占1个字节

在查找 UTF-8 编码资料时发现,很多的帖子说的 UTF-8 编码里,一个汉字占用3个字节,有的还做了个证明,大概是这样的,创建一个没有BOM的UTF-8编码的文本文件,里面保存了几个汉字,然后查看文件的大小。我觉得这样的证明没有一点说服力,因为 UTF-8 是变长的,1-6个字节,少量的汉字检测是不能说明所有的汉字都是的。

后来我又查看了字符映射表-汉语,找到了正确的答案,少数是汉字每个占用3个字节,多数占用4个字节。

以上所述就是本文的全部内容了,希望大家能够喜欢。

Python 相关文章推荐
python实现数值积分的Simpson方法实例分析
Jun 05 Python
深入理解NumPy简明教程---数组1
Dec 17 Python
json跨域调用python的方法详解
Jan 11 Python
Python多线程编程之多线程加锁操作示例
Sep 06 Python
python pyheatmap包绘制热力图
Nov 09 Python
对python字典过滤条件的实例详解
Jan 22 Python
python,Django实现的淘宝客登录功能示例
Jun 12 Python
Python字符串格式化f-string多种功能实现
May 07 Python
pytorch中 gpu与gpu、gpu与cpu 在load时相互转化操作
May 25 Python
Python 如何创建一个简单的REST接口
Jul 30 Python
scrapy结合selenium解析动态页面的实现
Sep 28 Python
Python  lambda匿名函数和三元运算符
Apr 19 Python
python获取mp3文件信息的方法
Jun 15 #Python
python实现批量下载新浪博客的方法
Jun 15 #Python
深入理解Python中各种方法的运作原理
Jun 15 #Python
python字符串编码识别模块chardet简单应用
Jun 15 #Python
Python字符串格式化
Jun 15 #Python
Java中重定向输出流实现用文件记录程序日志
Jun 12 #Python
Python2中的raw_input() 与 input()
Jun 12 #Python
You might like
PHPStorm2020.1永久激活及下载更新至2020(推荐)
2020/09/25 PHP
浅谈JavaScript中运算符的优先级
2015/07/07 Javascript
js文本框走动跑马灯效果代码分享
2015/08/25 Javascript
js实现黑色简易的滑动门网页tab选项卡效果
2015/08/31 Javascript
jQuery Timelinr实现垂直水平时间轴插件(附源码下载)
2016/02/16 Javascript
javascript的列表切换【实现代码】
2016/05/03 Javascript
利用Javascript实现简单的转盘抽奖
2017/02/13 Javascript
nodejs使用express创建一个简单web应用
2017/03/31 NodeJs
JAVA中截取字符串substring用法详解
2017/04/14 Javascript
Vue框架之goods组件开发详解
2018/01/25 Javascript
Angular5中调用第三方js插件的方法
2018/02/26 Javascript
Vue+Element UI+Lumen实现通用表格分页功能
2019/02/02 Javascript
Vue源码学习之关于对Array的数据侦听实现
2019/04/23 Javascript
layui 富文本编辑器和textarea值的相互传递方法
2019/09/18 Javascript
[01:13:51]TNC vs Serenity 2018国际邀请赛小组赛BO2 第二场 8.18
2018/08/19 DOTA
[35:34]Liquid vs Winstrike 2018国际邀请赛小组赛BO2 第一场 8.18
2018/08/19 DOTA
python 将json数据提取转化为txt的方法
2018/10/26 Python
在自动化中用python实现键盘操作的方法详解
2019/07/19 Python
Django实现分页显示效果
2019/10/31 Python
python实现跨excel sheet复制代码实例
2020/03/03 Python
Python 跨.py文件调用自定义函数说明
2020/06/01 Python
Keras loss函数剖析
2020/07/06 Python
iPhoneX安全区域(Safe Area)底部小黑条在微信小程序和H5的屏幕适配
2020/04/08 HTML / CSS
捷克电器和DJ设备网上商店:Electronic-star
2017/07/18 全球购物
香港唯港荟酒店预订:Hotel ICON
2018/03/27 全球购物
DeinDesign德国:设计自己的手机壳
2019/12/14 全球购物
存储过程和sql语句的优缺点
2014/07/02 面试题
商场经理竞聘演讲稿
2014/01/01 职场文书
2014植树节活动总结
2014/03/11 职场文书
科技工作者先进事迹
2014/08/16 职场文书
长城导游词300字
2015/01/30 职场文书
行政诉讼答辩状
2015/05/21 职场文书
离开雷锋的日子观后感
2015/06/09 职场文书
会议室管理制度范本
2015/08/06 职场文书
毕业欢送晚会主持词
2019/06/25 职场文书
Python中的程序流程控制语句
2022/02/24 Python