Python入门之后再看点什么好?


Posted in Python onMarch 05, 2018

不止一次在微信、知乎有读者朋友跑过来问:看完了基础书,甚至看两遍了,但自己写的时候还是没思路,我该怎么办?

编程在我看来就是一门手艺活,绝不是简单通过看书就能学会的,跟学游泳、学车、学钢琴一个道理,没别的,掌握了最基本的理论之后就是干,只有通过大量的练习、实战才能掌握编程这门技能,之后再回过来头来继续深入理论

这个问题在知识星球也同样被问,于是在那里我们设了每日一题的专题,每周会出三道题给大家,做完之后要求提交到 GitHub,我会统一对代码进行 review。这些题一般都是出自于一些真实应用场景,通过这种方式来提高编程水平。

下面这道题我们在星球中的第三题,在你往下翻之前,不妨梳理下你的编程思路。

题目:

统计一个文件中每个单词出现的次数,列出出现频率最多的5个单词。

前言:

这道题在实际应用场景中使用比较广泛,记得哪里看到说李笑来就利用他的编程技能出版过一本背单词的畅销书,统计历年来四六级、托福考试中出现的高频词汇,学生根据词频来记单词,这种方式深受大家喜欢。这就是一个把编程技能用来解决实际问题的典型场景。

所以,哪怕你不是程序员,如果能掌握编程技能的话,也能给你的工作带来极大的便利。

另外,在做数据分析时,那些词云效果本质上都是基于词频统计来控制字体的大小,如果你能熟练运用Python中的知识来解决问题的话,那说明你真正入门Python了。

分析:

本题主要考察以下几个方面的知识点:

1、如何正确读写文件

在 Python 中读写文件可以使用内置函数open(),而 open 函数在python2 和 python3 中有一定的区别,比如 Python 中可以指定读写文件的编码格式,而 Python 则不可以,为了同时兼容2和3,我们通常会使用io模块下面的 open 函数,大家可以查文档搞清楚它们之间的区别,培养主动学习能力和查资料的习惯。

另外一点是读写文件完成之后是需要关闭文件描述符的,除了可以使用 try...except...finally的语法之后,我们还可以使用更优雅的 with … as 的语法来自动关闭文件。

2、如何对数据进行排序

sorted函数是一个使用频率很高的内置函数,它的用法也很强大,因为它可以通过指定参数 key 来进行自定义排序,也就意味着你不仅可以对数字排序、对字母排序、还可以对列表、字典、自定义的对象进行排序,你只需要要告诉 sorted 函数的排序规则是什么,比如一个people对象,我既可以根据年龄排序也可以根据身高体重来排序,所以这个函数时非常灵活的,另外,对于列表对象有自带的 sort 方法,如果能区分清楚 list.sort 与 sorted 之间区别那说明你已经能灵活运用了。

 3、匿名函数的使用

刚说了sorted函数可以指定一个参数来控制排序的规则,这个参数可以是一个函数,这种场景往往匿名函数,就是我们常说的lambda函数显得很应景。

4、字典类型的运用

做词频统计,用字典无疑是最合适的数据类型,单词作为字典的key, 单词出现的次数作为字典的 value,很方便地就记录好了每个单词的频率,字典很像我们的电话本,每个名字关联一个电话号码。另外,字典最大的特点就是它的查询速度会非常快。理想情况下时间复杂度为O(1),我是说理想情况,如果你想深入了解字典的话,建议看看这篇文章。Python中提供了丰富的数据结构,要懂得根据应用场景正确选择合适的数据类型

5、正则表达式的运用

处理文本、字符串,正则表达式简直是神器,无论是做数据爬虫还是表单验证使用非常广泛,当然,正则表达式并不是 Python 特有的东西,所有编程语言都支持,我们除了学习正则表达式的基本规则之外就是Python中的re模块提供的各种函数了,只有熟悉了API 我们才能运用到实际场景中去。关于正则表达式推荐一篇文章:Python正则表达式操作指南

以上5点,每个点都可以整理出一篇文章出来

实现:

分析完之后,我们实现起来其实是非常快的。所以我们在拿到一个需求的时候,首先肯定是把需求弄清楚,想想大概可以用哪些技术来实现,随后才是动手写代码,其实我们在工作上,真正写代码的时间还不到一半。

# -*- coding:utf-8 -*-
import io
import re

class Counter:
 def __init__(self, path):
 """
 :param path: 文件路径
 """
 self.mapping = dict()
 with io.open(path, encoding="utf-8") as f:
 data = f.read()
 words = [s.lower() for s in re.findall("\w+", data)]
 for word in words:
 self.mapping[word] = self.mapping.get(word, 0) + 1

 def most_common(self, n):
 assert n > 0, "n should be large than 0"
 return sorted(self.mapping.items(), key=lambda item: item[1], reverse=True)[:n]

if __name__ == '__main__':
 most_common_5 = Counter("importthis.txt").most_common(5)
 for item in most_common_5:
 print(item)
#注:这里的文件是以Python之禅的19条格言保存到文本中进行统计的。

打印结果:

('is', 10)
('better', 8)
('than', 8)
('the', 6)
('to', 5)

总结

当然,实现方法不是唯一的。比如Python模块本身就提供了一个collections.Counter的类,它继承自dict类,就是用于做统计的,细心的你可能发现了,我实现的这个Counter和collections下面那个Counter很像,其实这就是造轮子,造轮子可以锻炼我们的编程思维,当然在工作上有现成的东西就没必要自己造轮子了,除非你有信心做得更好。你也可以思考假如Python没有提供Counter这个工具,你该怎么做。

另外,该模块还提供一个有序的字典对象 OrderedDict,使用它可以免去我们手动排序的操作。对于上面提及的知识点你是否都了然于心了,如果回答是的话,恭喜你,我想你应该掌握差不多了,进阶吧,如果你还有很多不清楚的地方,那么需要你更多的总结、练习。

来源:python之禅

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python天气预报采集器实现代码(网页爬虫)
Oct 07 Python
Python的Django中将文件上传至七牛云存储的代码分享
Jun 03 Python
Python 比较两个数组的元素的异同方法
Aug 17 Python
Windows系统下多版本pip的共存问题详解
Oct 10 Python
Python实现曲线点抽稀算法的示例
Oct 12 Python
利用numpy和pandas处理csv文件中的时间方法
Apr 19 Python
python+selenium打印当前页面的titl和url方法
Jun 22 Python
Python实现的json文件读取及中文乱码显示问题解决方法
Aug 06 Python
tensorflow 重置/清除计算图的实现
Jan 19 Python
pytorch判断是否cuda 判断变量类型方式
Jun 23 Python
Python Django搭建文件下载服务器的实现
May 10 Python
python 如何将两个实数矩阵合并为一个复数矩阵
May 19 Python
Python 装饰器实现DRY(不重复代码)原则
Mar 05 #Python
Tensorflow实现卷积神经网络用于人脸关键点识别
Mar 05 #Python
python入门教程 python入门神图一张
Mar 05 #Python
详解TensorFlow在windows上安装与简单示例
Mar 05 #Python
python 中if else 语句的作用及示例代码
Mar 05 #Python
运用TensorFlow进行简单实现线性回归、梯度下降示例
Mar 05 #Python
tf.truncated_normal与tf.random_normal的详细用法
Mar 05 #Python
You might like
用php来改写404错误页让你的页面更友好
2013/01/24 PHP
laravel 解决多库下的DB::transaction()事务失效问题
2019/10/21 PHP
JavaScript根据数据生成百分比图和柱状图的实例代码
2013/07/14 Javascript
js兼容的placeholder属性详解
2013/08/18 Javascript
Javascript中克隆一个数组的实现代码
2013/12/06 Javascript
在myeclipse中如何加入jquery代码提示功能
2014/06/03 Javascript
一个css与js结合的下拉菜单支持主流浏览器
2014/10/08 Javascript
js实现iPhone界面风格的单选框和复选框按钮实例
2015/08/18 Javascript
基于jQuery通过jQuery.form.js插件实现异步上传
2015/12/13 Javascript
jquery判断复选框选中状态以及区分attr和prop
2015/12/18 Javascript
关于TypeScript中import JSON的正确姿势详解
2017/07/25 Javascript
使用node.js对音视频文件加密的实例代码
2017/08/30 Javascript
详解如何实现一个简单的Node.js脚手架
2017/12/04 Javascript
jquery+css3实现熊猫tv导航代码分享
2018/02/12 jQuery
vue实现自定义日期组件功能的实例代码
2018/11/06 Javascript
微信小程序 swiper 组件遇到的问题及解决方法
2019/05/26 Javascript
[03:54]DOTA2英雄梦之声_第06期_昆卡
2014/06/23 DOTA
[54:45]2018DOTA2亚洲邀请赛 4.1 小组赛 A组 Optic vs OG
2018/04/02 DOTA
[01:11:21]DOTA2-DPC中国联赛 正赛 Phoenix vs CDEC BO3 第三场 3月7日
2021/03/11 DOTA
Python中文件遍历的两种方法
2014/06/16 Python
Python multiprocessing.Manager介绍和实例(进程间共享数据)
2014/11/21 Python
import的本质解析
2017/10/30 Python
Python3.6简单反射操作示例
2018/06/14 Python
python 实现简单的FTP程序
2019/12/27 Python
python 实现ping测试延迟的两种方法
2020/12/10 Python
突破canvas语法限制 让他支持链式语法
2012/12/24 HTML / CSS
HTML5之SVG 2D入门1—SVG(可缩放矢量图形)概述
2013/01/30 HTML / CSS
宏碁西班牙官网:Acer西班牙
2021/01/08 全球购物
日语专业个人的求职信
2013/12/03 职场文书
办理信用卡工作证明
2014/01/11 职场文书
创业计划书模版
2014/02/05 职场文书
教师开学感言
2014/02/14 职场文书
双方协议书
2014/04/22 职场文书
爱我中华教学反思
2014/04/28 职场文书
2014年高数考试作弊检讨书
2014/12/14 职场文书
Python如何利用pandas读取csv数据并绘图
2022/07/07 Python