python获取豆瓣电影简介代码分享


Posted in Python onJanuary 16, 2014
#!/usr/bin/env python
#coding:utf-8
import re,sys
import urllib
from bs4 import BeautifulSoup
global r_url
def hq_url():
    so_url = "http://movie.douban.com/subject_search?search_text="
    data = urllib.urlopen(so_url+gjz).read()
    r = re.findall(r'<a class="nbg" href=(.*?) onclick',data)
    r_url = re.sub('"','',r[0])
    ymdata = urllib.urlopen(r_url).read()
    soup = BeautifulSoup(ymdata)
    wz = soup('span',{'property':'v:summary'})
    title = re.findall(r'name="title" value="(.*?)"',ymdata)
    zy = re.findall(r'name="desc" value="(.*?)"',ymdata)
    imdb = re.findall(r':</span> <a href="(.*?)" target=',ymdata)
    shijian = re.findall(r'<span property="v:runtime" content="109">(.*?)</span>',ymdata)
    print u"IMDB电影网链接"
    print imdb
    print u"豆瓣电影链接"
    print  r_url
    print '*'*70
    print title[0]
 print zy[0]
    print "电影简介"
    print '*'*70
    print wz
if __name__=='__main__':
    gjz=raw_input("请输入电影名:  ").strip()
    hq_url()
Python 相关文章推荐
在Python中使用SimpleParse模块进行解析的教程
Apr 11 Python
Python实现控制台中的进度条功能代码
Dec 22 Python
Python实现检测文件MD5值的方法示例
Apr 11 Python
python opencv实现旋转矩形框裁减功能
Jul 25 Python
Python subprocess库的使用详解
Oct 26 Python
对python For 循环的三种遍历方式解析
Feb 01 Python
Python数据报表之Excel操作模块用法分析
Mar 11 Python
python如何解析配置文件并应用到项目中
Jun 27 Python
Python中的sys.stdout.write实现打印刷新功能
Feb 21 Python
python如何调用百度识图api
Sep 29 Python
基于PyQT5制作一个桌面摸鱼工具
Feb 15 Python
python在package下继续嵌套一个package
Apr 14 Python
linux系统使用python获取cpu信息脚本分享
Jan 15 #Python
linux系统使用python监测系统负载脚本分享
Jan 15 #Python
linux系统使用python获取内存使用信息脚本分享
Jan 15 #Python
linux系统使用python监测网络接口获取网络的输入输出
Jan 15 #Python
linux系统使用python监控apache服务器进程脚本分享
Jan 15 #Python
Python获取当前时间的方法
Jan 14 #Python
Python生成随机数的方法
Jan 14 #Python
You might like
php的正则处理函数总结分析
2008/06/20 PHP
php中mysql模块部分功能的简单封装
2011/09/30 PHP
PHP5函数小全(分享)
2013/06/06 PHP
PHP数据库操作之基于Mysqli的数据库操作类库
2014/04/19 PHP
php自动载入类用法实例分析
2016/06/24 PHP
PHP中ID设置自增后不连续的原因分析及解决办法
2016/08/21 PHP
PHP获取访问页面HTTP状态码的实现代码
2016/11/03 PHP
JS给Array添加是否包含字符串的简单方法
2016/10/29 Javascript
如何提高javascript加载速度
2016/12/26 Javascript
vue高德地图之玩转周边
2017/06/16 Javascript
前端主流框架vue学习笔记第一篇
2017/07/26 Javascript
浅谈vuex之mutation和action的基本使用
2017/08/29 Javascript
vue中SPA单页面应用程序详解
2017/11/07 Javascript
Vue+ElementUI实现表单动态渲染、可视化配置的方法
2018/03/07 Javascript
JavaScript 常见的继承方式汇总
2020/09/17 Javascript
js+for循环实现字符串自动转义的代码(把后面的字符替换前面的字符)
2020/12/24 Javascript
[01:03:00]DOTA2上海特级锦标赛A组败者赛 EHOME VS CDEC第一局
2016/02/25 DOTA
[01:03:37]Secret vs VGJ.S Supermajor小组赛C组 BO3 第二场 6.3
2018/06/04 DOTA
python中关于日期时间处理的问答集锦
2013/03/08 Python
C#返回当前系统所有可用驱动器符号的方法
2015/04/18 Python
python中实现延时回调普通函数示例代码
2017/09/08 Python
http请求 request失败自动重新尝试代码示例
2018/01/25 Python
基于Python Numpy的数组array和矩阵matrix详解
2018/04/04 Python
django 实现电子支付功能的示例代码
2018/07/25 Python
Python 调用 Outlook 发送邮件过程解析
2019/08/08 Python
sklearn+python:线性回归案例
2020/02/24 Python
PyPDF2读取PDF文件内容保存到本地TXT实例
2020/05/12 Python
Python+Xlwings 删除Excel的行和列
2020/12/19 Python
美国在线纱线商店:Darn Good Yarn
2019/03/20 全球购物
生物技术毕业生自荐信
2013/10/23 职场文书
《三峡》教学反思
2014/03/01 职场文书
央视元宵晚会主持串词
2014/03/25 职场文书
展览会邀请函
2015/02/02 职场文书
2016廉洁从政心得体会
2016/01/19 职场文书
python源码剖析之PyObject详解
2021/05/18 Python
Python装饰器的练习题
2021/11/23 Python