Python中文字符串截取问题


Posted in Python onJune 15, 2015

先来看个例子:

#-*- coding:utf8 -*-
s = u'中文截取'
s.decode('utf8')[0:3].encode('utf8')
# 结果u'中文截取

延伸阅读:

UTF-8中的汉字占用多少字节?
占2个字节的:?
占3个字节的:基本等同于GBK,含21000多个汉字
占4个字节的:中日韩超大字符集里面的汉字,有5万多个
一个UTF-8数字占1个字节
一个UTF-8英文字母占1个字节

在查找 UTF-8 编码资料时发现,很多的帖子说的 UTF-8 编码里,一个汉字占用3个字节,有的还做了个证明,大概是这样的,创建一个没有BOM的UTF-8编码的文本文件,里面保存了几个汉字,然后查看文件的大小。我觉得这样的证明没有一点说服力,因为 UTF-8 是变长的,1-6个字节,少量的汉字检测是不能说明所有的汉字都是的。

后来我又查看了字符映射表-汉语,找到了正确的答案,少数是汉字每个占用3个字节,多数占用4个字节。

以上所述就是本文的全部内容了,希望大家能够喜欢。

Python 相关文章推荐
Python StringIO模块实现在内存缓冲区中读写数据
Apr 08 Python
Python去除字符串两端空格的方法
May 21 Python
python检索特定内容的文本文件实例
Jun 05 Python
python 对类的成员函数开启线程的方法
Jan 22 Python
python被修饰的函数消失问题解决(基于wraps函数)
Nov 04 Python
windows中安装Python3.8.0的实现方法
Nov 19 Python
python分布式计算dispy的使用详解
Dec 22 Python
Python彻底删除文件夹及其子文件方式
Dec 23 Python
python中有帮助函数吗
Jun 19 Python
如何判断pytorch是否支持GPU加速
Jun 01 Python
Python 阶乘详解
Oct 05 Python
再谈python_tkinter弹出对话框创建
Mar 20 Python
python获取mp3文件信息的方法
Jun 15 #Python
python实现批量下载新浪博客的方法
Jun 15 #Python
深入理解Python中各种方法的运作原理
Jun 15 #Python
python字符串编码识别模块chardet简单应用
Jun 15 #Python
Python字符串格式化
Jun 15 #Python
Java中重定向输出流实现用文件记录程序日志
Jun 12 #Python
Python2中的raw_input() 与 input()
Jun 12 #Python
You might like
Home Coffee Roasting
2021/03/03 咖啡文化
php基础知识:类与对象(5) static
2006/12/13 PHP
深入分析使用mysql_fetch_object()以对象的形式返回查询结果
2013/06/05 PHP
PHP往XML中添加节点的方法
2015/03/12 PHP
php基于mcrypt_encrypt和mcrypt_decrypt实现字符串加密解密的方法
2016/07/12 PHP
php实现解析xml并生成sql语句的方法
2018/02/03 PHP
Laravel框架下载,安装及路由操作图文详解
2019/12/04 PHP
JavaScript中数组的排序、乱序和搜索实现代码
2011/11/30 Javascript
Yii-自定义删除确认弹框(zyd)jquery实现代码
2013/03/04 Javascript
返回上一页并自动刷新的JavaScript代码
2014/02/19 Javascript
jquery实现邮箱自动填充提示功能
2015/11/17 Javascript
Bootstrap实现响应式导航栏效果
2015/12/28 Javascript
在Node.js中使用Javascript Generators详解
2016/05/05 Javascript
javascript实现平滑无缝滚动
2020/08/09 Javascript
基于jQuery解决ios10以上版本缩放问题
2017/11/03 jQuery
使用Node.js写一个代码生成器的方法步骤
2019/05/10 Javascript
uni-app微信小程序登录并使用vuex存储登录状态的思路详解
2019/11/04 Javascript
vue实现从外部修改组件内部的变量的值
2020/07/30 Javascript
python 每天如何定时启动爬虫任务(实现方法分享)
2018/05/21 Python
Python DataFrame.groupby()聚合函数,分组级运算
2018/09/18 Python
用什么库写 Python 命令行程序(示例代码详解)
2020/02/20 Python
最新PyCharm从安装到PyCharm永久激活再到PyCharm官方中文汉化详细教程
2020/11/17 Python
【HTML5】Canvas绘制简单图片教程
2016/05/13 HTML / CSS
匈牙利最大的健身制造商和销售商:inSPORTline
2018/10/30 全球购物
英国排名第一的餐具品牌:Denby Pottery
2019/11/01 全球购物
什么是静态路由?什么是动态路由?各自的特点是什么?
2015/09/16 面试题
中学教师实习自我鉴定
2013/09/28 职场文书
保安队长职务说明书
2014/02/23 职场文书
《姥姥的剪纸》教学反思
2014/02/25 职场文书
校优秀毕业生主要事迹
2014/05/26 职场文书
护士实习求职信
2014/06/22 职场文书
公务员个人考察材料
2014/12/23 职场文书
网络安全倡议书(3篇)
2019/09/18 职场文书
Java数据结构之链表相关知识总结
2021/06/18 Java/Android
总结python多进程multiprocessing的相关知识
2021/06/29 Python
JavaScript parseInt0.0000005打印5原理解析
2022/07/23 Javascript