Python中文字符串截取问题


Posted in Python onJune 15, 2015

先来看个例子:

#-*- coding:utf8 -*-
s = u'中文截取'
s.decode('utf8')[0:3].encode('utf8')
# 结果u'中文截取

延伸阅读:

UTF-8中的汉字占用多少字节?
占2个字节的:?
占3个字节的:基本等同于GBK,含21000多个汉字
占4个字节的:中日韩超大字符集里面的汉字,有5万多个
一个UTF-8数字占1个字节
一个UTF-8英文字母占1个字节

在查找 UTF-8 编码资料时发现,很多的帖子说的 UTF-8 编码里,一个汉字占用3个字节,有的还做了个证明,大概是这样的,创建一个没有BOM的UTF-8编码的文本文件,里面保存了几个汉字,然后查看文件的大小。我觉得这样的证明没有一点说服力,因为 UTF-8 是变长的,1-6个字节,少量的汉字检测是不能说明所有的汉字都是的。

后来我又查看了字符映射表-汉语,找到了正确的答案,少数是汉字每个占用3个字节,多数占用4个字节。

以上所述就是本文的全部内容了,希望大家能够喜欢。

Python 相关文章推荐
python基础教程之python消息摘要算法使用示例
Feb 10 Python
Python深入学习之对象的属性
Aug 31 Python
Python中functools模块的常用函数解析
Jun 30 Python
linux平台使用Python制作BT种子并获取BT种子信息的方法
Jan 20 Python
go和python变量赋值遇到的一个问题
Aug 31 Python
matlab中实现矩阵删除一行或一列的方法
Apr 04 Python
python读取Excel实例详解
Aug 17 Python
Flask实现跨域请求的处理方法
Sep 27 Python
Python正则表达式指南 推荐
Oct 09 Python
Python使用GitPython操作Git版本库的方法
Feb 29 Python
Python 通过正则表达式快速获取电影的下载地址
Aug 17 Python
python Zmail模块简介与使用示例
Dec 19 Python
python获取mp3文件信息的方法
Jun 15 #Python
python实现批量下载新浪博客的方法
Jun 15 #Python
深入理解Python中各种方法的运作原理
Jun 15 #Python
python字符串编码识别模块chardet简单应用
Jun 15 #Python
Python字符串格式化
Jun 15 #Python
Java中重定向输出流实现用文件记录程序日志
Jun 12 #Python
Python2中的raw_input() 与 input()
Jun 12 #Python
You might like
WordPress中获取页面链接和标题的相关PHP函数用法解析
2015/12/17 PHP
PHP版微信小店接口开发实例
2016/11/12 PHP
smarty模板数学运算示例
2016/12/11 PHP
Lumen timezone 时区设置方法(慢了8个小时)
2018/01/20 PHP
推荐dojo学习笔记
2007/03/24 Javascript
Jquery cookie操作代码
2010/03/14 Javascript
jquery禁止回车触发表单提交
2014/12/12 Javascript
Python脚本后台运行的几种方式
2015/03/09 Javascript
JavaScript中使用Object.prototype.toString判断是否为数组
2015/04/01 Javascript
jQuery简单实现仿京东商城的左侧菜单效果代码
2015/09/09 Javascript
教你用javascript实现随机标签云效果_附代码
2016/03/16 Javascript
Node.js与Sails redis组件的使用教程
2017/02/14 Javascript
Bootstrap按钮组实例详解
2017/07/03 Javascript
vue+springboot实现项目的CORS跨域请求
2018/09/05 Javascript
angula中使用iframe点击后不执行变更检测的问题
2020/05/10 Javascript
Json实现传值到后台代码实例
2020/06/30 Javascript
vue 组件之间事件触发($emit)与event Bus($on)的用法说明
2020/07/28 Javascript
[04:07]显微镜下的DOTA2第八期——英雄复活动作
2014/06/24 DOTA
[00:19]CN DOTA NEVER DIE!VG夺冠rOtK接受采访
2019/12/23 DOTA
Python中编写ORM框架的入门指引
2015/04/29 Python
在Django的视图(View)外使用Session的方法
2015/07/23 Python
Python  pip安装lxml出错的问题解决办法
2017/02/10 Python
Python使用django搭建web开发环境
2017/06/09 Python
PyQt4实现下拉菜单可供选择并打印出来
2018/04/20 Python
python实现简易数码时钟
2021/02/19 Python
Python判断字符串是否xx开始或结尾的示例
2019/08/08 Python
Python scrapy增量爬取实例及实现过程解析
2019/12/24 Python
Python实现小黑屋游戏的完整实例
2021/01/06 Python
Python日志打印里logging.getLogger源码分析详解
2021/01/17 Python
CSS3+HTML5+JS 实现一个块的收缩与展开动画效果
2020/11/17 HTML / CSS
动物学专业毕业生求职信
2013/10/11 职场文书
英文版网络工程师求职信
2013/10/28 职场文书
思想汇报格式
2014/01/05 职场文书
简历中的自我评价范文
2014/02/05 职场文书
2015年党风廉政建设责任书
2015/01/29 职场文书
2015年大学班级工作总结
2015/04/28 职场文书