Python中文字符串截取问题


Posted in Python onJune 15, 2015

先来看个例子:

#-*- coding:utf8 -*-
s = u'中文截取'
s.decode('utf8')[0:3].encode('utf8')
# 结果u'中文截取

延伸阅读:

UTF-8中的汉字占用多少字节?
占2个字节的:?
占3个字节的:基本等同于GBK,含21000多个汉字
占4个字节的:中日韩超大字符集里面的汉字,有5万多个
一个UTF-8数字占1个字节
一个UTF-8英文字母占1个字节

在查找 UTF-8 编码资料时发现,很多的帖子说的 UTF-8 编码里,一个汉字占用3个字节,有的还做了个证明,大概是这样的,创建一个没有BOM的UTF-8编码的文本文件,里面保存了几个汉字,然后查看文件的大小。我觉得这样的证明没有一点说服力,因为 UTF-8 是变长的,1-6个字节,少量的汉字检测是不能说明所有的汉字都是的。

后来我又查看了字符映射表-汉语,找到了正确的答案,少数是汉字每个占用3个字节,多数占用4个字节。

以上所述就是本文的全部内容了,希望大家能够喜欢。

Python 相关文章推荐
Python3基础之list列表实例解析
Aug 13 Python
Python浅拷贝与深拷贝用法实例
May 09 Python
解决python 输出是省略号的问题
Apr 19 Python
Numpy 将二维图像矩阵转换为一维向量的方法
Jun 05 Python
通过python扫描二维码/条形码并打印数据
Nov 14 Python
TFRecord格式存储数据与队列读取实例
Jan 21 Python
jupyter notebook 实现matplotlib图动态刷新
Apr 22 Python
tensorflow使用CNN分析mnist手写体数字数据集
Jun 17 Python
Python爬虫如何应对Cloudflare邮箱加密
Jun 24 Python
Python+OpenCV图像处理——打印图片属性、设置存储路径、调用摄像头
Oct 22 Python
python实现发送QQ邮件(可加附件)
Dec 23 Python
全网最详细的PyCharm+Anaconda的安装过程图解
Jan 25 Python
python获取mp3文件信息的方法
Jun 15 #Python
python实现批量下载新浪博客的方法
Jun 15 #Python
深入理解Python中各种方法的运作原理
Jun 15 #Python
python字符串编码识别模块chardet简单应用
Jun 15 #Python
Python字符串格式化
Jun 15 #Python
Java中重定向输出流实现用文件记录程序日志
Jun 12 #Python
Python2中的raw_input() 与 input()
Jun 12 #Python
You might like
聊天室php&mysql(二)
2006/10/09 PHP
php中memcache 基本操作实例
2015/05/17 PHP
ThinkPHP中session函数详解
2016/09/14 PHP
php自定义函数实现统计中文字符串长度的方法小结
2017/04/15 PHP
phpStudy中升级MySQL版本到5.7.17的方法步骤
2017/08/03 PHP
Yii2.0实现的批量更新及批量插入功能示例
2019/01/29 PHP
document.open() 与 document.write()的区别
2007/08/13 Javascript
编写跨浏览器的javascript代码必备[js多浏览器兼容写法]
2008/10/29 Javascript
jQuery 常见学习网站与参考书
2009/11/09 Javascript
javascript基础第一章 JavaScript与用户端
2010/07/22 Javascript
JS 获取滚动条高度示例代码
2013/10/24 Javascript
Javascript 鼠标移动上去 滑块跟随效果代码分享
2013/11/23 Javascript
document.write的几点使用心得
2014/05/14 Javascript
jQuery对JSON数据进行排序输出的方法
2015/06/24 Javascript
基于AngularJS实现页面滚动到底自动加载数据的功能
2015/10/16 Javascript
实例详解JavaScript中setTimeout函数的执行顺序
2017/07/12 Javascript
微信小程序实现滴滴导航tab切换效果
2018/07/24 Javascript
详解vue组件中使用路由方法
2019/02/12 Javascript
layer.open回调获取弹出层参数的实现方法
2019/09/10 Javascript
Servlet返回的数据js解析2种方法
2019/12/12 Javascript
深入了解Vue3模板编译原理
2020/11/19 Vue.js
python复制文件到指定目录的实例
2018/04/27 Python
Python从入门到精通之环境搭建教程图解
2019/09/26 Python
python pyinstaller打包exe报错的解决方法
2019/11/02 Python
解决python 找不到module的问题
2020/02/12 Python
python matplotlib imshow热图坐标替换/映射实例
2020/03/14 Python
django中嵌套的try-except实例
2020/05/21 Python
scrapy与selenium结合爬取数据(爬取动态网站)的示例代码
2020/09/28 Python
HTML5之SVG 2D入门1—SVG(可缩放矢量图形)概述
2013/01/30 HTML / CSS
大四学生思想汇报
2014/01/13 职场文书
音乐器材管理制度
2014/01/31 职场文书
校园学雷锋活动月总结
2014/03/09 职场文书
减负增效提质方案
2014/05/23 职场文书
在职证明格式样本
2015/06/15 职场文书
一文读懂navicat for mysql基础知识
2021/05/31 MySQL
光之国的四大叛徒:第一贝利亚导致宇宙毁灭,赛文奥特曼在榜
2022/03/18 日漫