博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
极客学院文本爬虫实战
阅读量:6230 次
发布时间:2019-06-21

本文共 280 字,大约阅读时间需要 1 分钟。

hot3.png

# -*- coding: utf-8 -*-import reimport requestsimport time# 读取源代码文档f = file("wenben.txt",'r')html = f.read()f.close()# 匹配图片网址pic_url = re.findall('
  1. wenben.txt为包括图片标签的html代码

  2. 遍历并保存。open('pic\\'+str(time.time())+'.png','wb') 保存在pic目录之下

转载于:https://my.oschina.net/houzhong/blog/625361

你可能感兴趣的文章
简单的新浪微博OAuth认证实现
查看>>
Mybatis表关联一对多
查看>>
Spring_Aop基于配置文件
查看>>
R cannot be resolved的几种可能 R not generated
查看>>
随机快速排序
查看>>
linux下创建用户、用户组及赋予sudoer权限
查看>>
简述Hibernate配置连接池
查看>>
路径1
查看>>
poj 2492 A Bug's Life (并查集)
查看>>
自定义Loader
查看>>
IOS 给UILabel字体加一个带颜色的边框
查看>>
查看电脑硬件信息dos命令
查看>>
2010年Java高新技术A(5)类加载器和代理
查看>>
每天学点GDB 10
查看>>
ASP.NET MVC 实现多模版的方法
查看>>
Android利用Mediapalyer播放本地资源文件声音
查看>>
MongoDB高级查询用法大全
查看>>
代码整洁之道-第4章-注释-读书笔记
查看>>
单例模式——防止序列化、反序列化以及反射攻击
查看>>
[SequenceFile_1] Hadoop 序列文件
查看>>