Python中文字符串截取问题


Posted in Python onJune 15, 2015

先来看个例子:

#-*- coding:utf8 -*-
s = u'中文截取'
s.decode('utf8')[0:3].encode('utf8')
# 结果u'中文截取

延伸阅读:

UTF-8中的汉字占用多少字节?
占2个字节的:?
占3个字节的:基本等同于GBK,含21000多个汉字
占4个字节的:中日韩超大字符集里面的汉字,有5万多个
一个UTF-8数字占1个字节
一个UTF-8英文字母占1个字节

在查找 UTF-8 编码资料时发现,很多的帖子说的 UTF-8 编码里,一个汉字占用3个字节,有的还做了个证明,大概是这样的,创建一个没有BOM的UTF-8编码的文本文件,里面保存了几个汉字,然后查看文件的大小。我觉得这样的证明没有一点说服力,因为 UTF-8 是变长的,1-6个字节,少量的汉字检测是不能说明所有的汉字都是的。

后来我又查看了字符映射表-汉语,找到了正确的答案,少数是汉字每个占用3个字节,多数占用4个字节。

以上所述就是本文的全部内容了,希望大家能够喜欢。

Python 相关文章推荐
复制粘贴功能的Python程序
Apr 04 Python
python使用socket连接远程服务器的方法
Apr 29 Python
微信跳一跳python辅助脚本(总结)
Jan 11 Python
python如何爬取个性签名
Jun 19 Python
python库lxml在linux和WIN系统下的安装
Jun 24 Python
Python设计模式之外观模式实例详解
Jan 17 Python
python按行读取文件并找出其中指定字符串
Aug 08 Python
Python Request爬取seo.chinaz.com百度权重网站的查询结果过程解析
Aug 13 Python
Windows下python3安装tkinter的问题及解决方法
Jan 06 Python
在主流系统之上安装Pygame的方法
May 20 Python
python3环境搭建过程(利用Anaconda+pycharm)完整版
Aug 19 Python
分享一枚pycharm激活码适用所有pycharm版本我的pycharm2020.2.3激活成功
Nov 20 Python
python获取mp3文件信息的方法
Jun 15 #Python
python实现批量下载新浪博客的方法
Jun 15 #Python
深入理解Python中各种方法的运作原理
Jun 15 #Python
python字符串编码识别模块chardet简单应用
Jun 15 #Python
Python字符串格式化
Jun 15 #Python
Java中重定向输出流实现用文件记录程序日志
Jun 12 #Python
Python2中的raw_input() 与 input()
Jun 12 #Python
You might like
PHP 字符串分割和比较
2009/10/06 PHP
PHP flock 文件锁详细介绍
2012/12/29 PHP
PHP获取栏目的所有子级和孙级栏目的ID号示例
2014/04/01 PHP
PHP中使用xmlreader读取xml数据示例
2014/12/29 PHP
PHP文件缓存类实现代码
2015/10/26 PHP
thinkPHP微信分享接口JSSDK用法实例
2017/07/07 PHP
php实现数组中出现次数超过一半的数字的统计方法
2018/10/14 PHP
JavaScript中的Location地址对象
2008/01/16 Javascript
jQuery 可以拖动的div实现代码 脚本之家修正版
2009/06/26 Javascript
jquery绑定事件不生效的解决方法
2014/02/11 Javascript
浅谈javascript运算符——条件,逗号,赋值,()和void运算符
2016/07/15 Javascript
jQuery+CSS实现简单切换菜单示例
2016/07/27 Javascript
JS实现DIV高度自适应窗口示例
2017/02/16 Javascript
JS二叉树的简单实现方法示例
2017/04/05 Javascript
原生JS实现层叠轮播图
2017/05/17 Javascript
原生javascript实现的全屏滚动功能示例
2017/09/19 Javascript
React操作真实DOM实现动态吸底部的示例
2017/10/23 Javascript
Bootstrap 模态框多次显示后台提交多次BUG的解决方法
2017/12/26 Javascript
bootstrap模态框关闭后清除模态框的数据方法
2018/08/10 Javascript
详解Vue template 如何支持多个根结点
2020/02/10 Javascript
Vue列表循环从指定下标开始的多种解决方案
2020/04/08 Javascript
JavaScript检测是否开启了控制台(F12调试工具)
2020/10/02 Javascript
Python机器学习logistic回归代码解析
2018/01/17 Python
Django model 中设置联合约束和联合索引的方法
2019/08/06 Python
numpy 返回函数的上三角矩阵实例
2019/11/25 Python
Python PyPDF2模块安装使用解析
2020/01/19 Python
Python使用Pyqt5实现简易浏览器(最新版本测试过)
2020/04/27 Python
Scrapy 配置动态代理IP的实现
2020/09/28 Python
关于Python不换行输出和不换行输出end=““不显示的问题(亲测已解决)
2020/10/27 Python
python3列表删除大量重复元素remove()方法的问题详解
2021/01/04 Python
CSS3截取字符串实例代码【推荐】
2018/06/07 HTML / CSS
css3弹性盒子flex实现三栏布局的实现
2020/11/12 HTML / CSS
Bloomingdale’s阿联酋:选购奢华时尚、美容及更多
2020/09/22 全球购物
护士自我鉴定
2013/10/23 职场文书
房务中心文员岗位职责
2014/04/16 职场文书
伦敦奥运会口号
2014/06/13 职场文书