Python中文字符串截取问题


Posted in Python onJune 15, 2015

先来看个例子:

#-*- coding:utf8 -*-
s = u'中文截取'
s.decode('utf8')[0:3].encode('utf8')
# 结果u'中文截取

延伸阅读:

UTF-8中的汉字占用多少字节?
占2个字节的:?
占3个字节的:基本等同于GBK,含21000多个汉字
占4个字节的:中日韩超大字符集里面的汉字,有5万多个
一个UTF-8数字占1个字节
一个UTF-8英文字母占1个字节

在查找 UTF-8 编码资料时发现,很多的帖子说的 UTF-8 编码里,一个汉字占用3个字节,有的还做了个证明,大概是这样的,创建一个没有BOM的UTF-8编码的文本文件,里面保存了几个汉字,然后查看文件的大小。我觉得这样的证明没有一点说服力,因为 UTF-8 是变长的,1-6个字节,少量的汉字检测是不能说明所有的汉字都是的。

后来我又查看了字符映射表-汉语,找到了正确的答案,少数是汉字每个占用3个字节,多数占用4个字节。

以上所述就是本文的全部内容了,希望大家能够喜欢。

Python 相关文章推荐
Python使用函数默认值实现函数静态变量的方法
Aug 18 Python
Python实现去除代码前行号的方法
Mar 10 Python
Python3.2中Print函数用法实例详解
May 19 Python
Python学习小技巧之列表项的推导式与过滤操作
May 20 Python
使用tensorflow实现AlexNet
Nov 20 Python
Python爬取十篇新闻统计TF-IDF
Jan 03 Python
python爬虫之模拟登陆csdn的实例代码
May 18 Python
详解Django rest_framework实现RESTful API
May 24 Python
Python 异常的捕获、异常的传递与主动抛出异常操作示例
Sep 23 Python
Python通过递归获取目录下指定文件代码实例
Nov 07 Python
Flask处理Web表单的实现方法
Jan 31 Python
Django实现在线无水印抖音视频下载(附源码及地址)
May 06 Python
python获取mp3文件信息的方法
Jun 15 #Python
python实现批量下载新浪博客的方法
Jun 15 #Python
深入理解Python中各种方法的运作原理
Jun 15 #Python
python字符串编码识别模块chardet简单应用
Jun 15 #Python
Python字符串格式化
Jun 15 #Python
Java中重定向输出流实现用文件记录程序日志
Jun 12 #Python
Python2中的raw_input() 与 input()
Jun 12 #Python
You might like
PHP OPCode缓存 APC详细介绍
2010/10/12 PHP
浅谈apache和nginx的rewrite的区别
2013/02/22 PHP
基于ubuntu下nginx+php+mysql安装配置的具体操作步骤
2013/04/28 PHP
php查询mssql出现乱码的解决方法
2014/12/29 PHP
PHP中实现crontab代码分享
2015/03/26 PHP
jquery简单体验
2007/01/10 Javascript
浅析js中2个等号与3个等号的区别
2013/08/06 Javascript
jQuery修改CSS伪元素属性的方法
2014/07/30 Javascript
JavaScript对象反射用法实例
2015/04/17 Javascript
JS实现3D图片旋转展示效果代码
2015/09/22 Javascript
简单实现js间歇或无缝滚动效果
2016/06/29 Javascript
BootStrap网页中代码显示用法详解
2016/10/21 Javascript
layer弹出层 iframe层去掉滚动条的实例代码
2018/08/17 Javascript
如何优雅的在一台vps(云主机)上面部署vue+mongodb+express项目
2019/01/20 Javascript
详解vuex数据传输的两种方式及this.$store undefined的解决办法
2019/08/26 Javascript
使用Layui搭建后台管理界面的操作方法
2019/09/20 Javascript
vue中更改数组中属性,在页面中不生效的解决方法
2019/10/30 Javascript
SpringBoot+Vue 前后端合并部署的配置方法
2020/12/30 Vue.js
使用Python的Treq on Twisted来进行HTTP压力测试
2015/04/16 Python
Python实现判断一个字符串是否包含子串的方法总结
2017/11/21 Python
python实现指定文件夹下的指定文件移动到指定位置
2018/09/17 Python
Python 使用 docopt 解析json参数文件过程讲解
2019/08/13 Python
简单了解python中的与或非运算
2019/09/18 Python
python将邻接矩阵输出成图的实现
2019/11/21 Python
python 实现矩阵按对角线打印
2019/11/29 Python
基于python代码批量处理图片resize
2020/06/04 Python
CSS3.0实现霓虹灯按钮动画特效的示例代码
2021/01/12 HTML / CSS
STAUD官方网站:洛杉矶独有的闲适风格
2019/04/11 全球购物
Aosom西班牙:家具在线商店
2020/06/11 全球购物
高级销售求职信
2014/02/21 职场文书
市级青年文明号申报材料
2014/05/26 职场文书
大专学生求职自荐信
2014/07/06 职场文书
AI:如何训练机器学习的模型
2021/04/16 Python
MySQL sql_mode修改不生效的原因及解决
2021/05/07 MySQL
python实现语音常用度量方法的代码详解
2021/05/25 Python
Python的这些库,你知道多少?
2021/06/09 Python