Python中文字符串截取问题


Posted in Python onJune 15, 2015

先来看个例子:

#-*- coding:utf8 -*-
s = u'中文截取'
s.decode('utf8')[0:3].encode('utf8')
# 结果u'中文截取

延伸阅读:

UTF-8中的汉字占用多少字节?
占2个字节的:?
占3个字节的:基本等同于GBK,含21000多个汉字
占4个字节的:中日韩超大字符集里面的汉字,有5万多个
一个UTF-8数字占1个字节
一个UTF-8英文字母占1个字节

在查找 UTF-8 编码资料时发现,很多的帖子说的 UTF-8 编码里,一个汉字占用3个字节,有的还做了个证明,大概是这样的,创建一个没有BOM的UTF-8编码的文本文件,里面保存了几个汉字,然后查看文件的大小。我觉得这样的证明没有一点说服力,因为 UTF-8 是变长的,1-6个字节,少量的汉字检测是不能说明所有的汉字都是的。

后来我又查看了字符映射表-汉语,找到了正确的答案,少数是汉字每个占用3个字节,多数占用4个字节。

以上所述就是本文的全部内容了,希望大家能够喜欢。

Python 相关文章推荐
Python 匹配任意字符(包括换行符)的正则表达式写法
Oct 29 Python
根据DataFrame某一列的值来选择具体的某一行方法
Jul 03 Python
Python操作mongodb数据库的方法详解
Dec 08 Python
在Python中字典根据多项规则排序的方法
Jan 21 Python
python pip源配置,pip配置文件存放位置的方法
Jul 12 Python
python ctypes库2_指定参数类型和返回类型详解
Nov 19 Python
Python字典中的值为列表或字典的构造实例
Dec 16 Python
Python 保存加载mat格式文件的示例代码
Aug 04 Python
python获得命令行输入的参数的两种方式
Nov 02 Python
详解Django关于StreamingHttpResponse与FileResponse文件下载的最优方法
Jan 07 Python
Django中的DateTimeField和DateField实现
Feb 24 Python
利用Python脚本写端口扫描器socket,python-nmap
Jul 23 Python
python获取mp3文件信息的方法
Jun 15 #Python
python实现批量下载新浪博客的方法
Jun 15 #Python
深入理解Python中各种方法的运作原理
Jun 15 #Python
python字符串编码识别模块chardet简单应用
Jun 15 #Python
Python字符串格式化
Jun 15 #Python
Java中重定向输出流实现用文件记录程序日志
Jun 12 #Python
Python2中的raw_input() 与 input()
Jun 12 #Python
You might like
Pain 全世界最小最简单的PHP模板引擎 (普通版)
2011/10/23 PHP
php开启与关闭错误提示适用于没有修改php.ini的权限
2014/10/16 PHP
Yii框架登录流程分析
2014/12/03 PHP
php curl 获取https请求的2种方法
2015/04/27 PHP
PHP call_user_func和call_user_func_array函数的简单理解与应用分析
2019/11/25 PHP
javascript实现多级联动下拉菜单的方法
2015/02/06 Javascript
jQuery子属性过滤选择器用法分析
2015/02/10 Javascript
初步使用bootstrap快速创建页面
2016/03/03 Javascript
IOS中safari下的select下拉菜单文字过长不换行的解决方法
2016/09/26 Javascript
JavaScript组件开发之输入框加候选框
2017/03/10 Javascript
mpvue开发音频类小程序踩坑和建议详解
2019/03/12 Javascript
微信小程序城市选择及搜索功能的方法
2019/03/22 Javascript
解决Vue.js应用回退或刷新界面时提示用户保存修改问题
2019/11/24 Javascript
vue中keep-alive内置组件缓存的实例代码
2020/04/16 Javascript
原生js实现日期选择插件
2020/05/21 Javascript
vue+element table表格实现动态列筛选的示例代码
2021/01/14 Vue.js
Python排序搜索基本算法之堆排序实例详解
2017/12/08 Python
python实现简易版计算器
2020/06/22 Python
Python使用xlwt模块操作Excel的方法详解
2018/03/27 Python
在Pycharm中将pyinstaller加入External Tools的方法
2019/01/16 Python
Python创建数字列表的示例
2019/11/28 Python
pytorch .detach() .detach_() 和 .data用于切断反向传播的实现
2019/12/27 Python
python3 循环读取excel文件并写入json操作
2020/07/14 Python
python 下载文件的几种方法汇总
2021/01/06 Python
Html5大文件断点续传实现方法
2015/12/05 HTML / CSS
canvas简易绘图的实现(海绵宝宝篇)
2018/07/04 HTML / CSS
如何判断一段程序是由C 编译程序还是由C++编译程序编译的
2013/08/04 面试题
优秀团员自我评价范文
2014/04/23 职场文书
推广普通话演讲稿
2014/05/23 职场文书
销售口号大全
2014/06/11 职场文书
2014年教师节国旗下讲话稿
2014/09/10 职场文书
工作失职检讨书(精华篇)
2014/10/15 职场文书
机关保密工作承诺书
2015/05/04 职场文书
普希金诗歌赏析(6首)
2019/08/22 职场文书
详解Python自动化之文件自动化处理
2021/06/21 Python
介绍一下28个JS常用数组方法
2022/05/06 Javascript