Python语言爬虫：爬取网站视频-职坐标

海同科技，欢迎您！

就业

学习

资料

IT知识库

编程语言

站

热门城市全国站>

其他省市

快速购买

15692118659

热门课程

IT学院

职坐标首页 IT知识库编程语言 Python

选择在海同提升： 30 天 1530 名，今日申请 53 人 IT技术咨询 >>

Python语言爬虫：爬取网站视频

小标 2019-01-17 来源：阅读 888 评论 0

摘要：本文主要向大家介绍了Python语言爬虫：爬取网站视频，通过具体的内容向大家展示，希望对大家学习Python语言有所帮助。

本文主要向大家介绍了Python语言爬虫：爬取网站视频，通过具体的内容向大家展示，希望对大家学习Python语言有所帮助。

新建一个py文件，代码如下：

#!/usr/bin/python

# -*- coding: UTF-8 -*-

import urllib,re,requests

import sys

reload(sys)

sys.setdefaultencoding('utf-8')

url_name = [] #url name

def get():

#获取源码

hd = {"User-Agent":"Mozilla/5.0 (Windows NT 6.3; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36"}

url = '//www.budejie.com/video/'

html = requests.get(url,headers=hd).text

url_content = re.compile(r'(<div class="j-r-list-c">.*?</div>.*?</div>)',re.S) #编译

url_contents = re.findall(url_content,html) #匹配

for i in url_contents:

#匹配视频

url_reg = r'data-mp4="(.*?)"' #视频地址

url_items = re.findall(url_reg,i)

#print url_items

if url_items: #判断视频是否存在

name_reg = re.compile(r'<a href="/detail-.{8}?.html">(.*?)</a>',re.S)

name_items = re.findall(name_reg,i)

#print name_items[0]

for i,k in zip(name_items,url_items):

url_name.append([i,k])

print i,k

for i in url_name: #i[1]=url i[0]=name

urllib.urlretrieve(i[1],'video\\%s.mp4' % (i[0].decode('utf-8')))

if __name__ == "__main__":

get()

在 py 文件下新建一个 video 文件夹，执行后结果如下：

在 video 文件夹可以看到下载好的视频

注意报错：

UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-9: ordinal not in range(128)

解决：

import sys
reload(sys)

sys.setdefaultencoding('utf-8')

本文由职坐标整理并发布，希望对同学们学习Python有所帮助，更多内容请关注职坐标编程语言Python频道！

编程入门教程想学软件编程最好的编程语言

本文由 @小标发布于职坐标。未经许可，禁止转载。

喜欢 | 0

不喜欢 | 0

看完这篇文章有何感觉？已经有0人表态，0%的人喜欢快给朋友分享吧~

评论（0）

后参与评论

加入IT交流圈

JAVA工程师交流群 +加入

大数据架构师交流群 +加入

人工智能Python交流群 +加入

WEB/H5前端交流群 +加入

职坐标公众号

编程语言 直通车

索取资料
答疑解惑
技术交流
职业测评
面试技巧
高薪秘笈

海同专业团队更多>>

认证System Analyst，System Architect

程光淼联系TA

精通C、C++等语言、智能芯片开发

热门就业技能更多>>

【零基础】人工智能+Python全栈开发技术

【零基础】人工智能+Python全栈开发技术

人工智能+Python技术风口浪潮

【零基础】JavaEE高级开发技术

【零基础】JavaEE高级开发技术

起薪高，轻松进名企

【零基础】大数据与分布式架构技术

【零基础】大数据与分布式架构技术

培训大数据分布式架构

Python30天热搜词更多>>

您输入的评论内容中包含违禁敏感词

我知道了

助您圆梦职场匹配合适岗位

验证码手机号，获得海同独家IT培训资料

选择就业方向：: 人工智能物联网; 大数据开发/分析; 人工智能Python; Java全栈开发; WEB前端+H5

请输入正确的手机号码

请输入正确的验证码

获取验证码

您今天的短信下发次数太多了，明天再试试吧！

提交

我们会在第一时间安排职业规划师联系您！

您也可以联系我们的职业规划师咨询：

小职老师的微信号：z_zhizuobiao

小职老师的微信号：z_zhizuobiao

版权所有职坐标-IT技术咨询与就业发展一体化服务沪ICP备13042190号-4
上海海同信息科技有限公司 Copyright ©2015 www.zhizuobiao.com，All Rights Reserved.
沪公网安备 31011502005948号

关于我们 │ 法律声明 │ 联系我们

©2015 www.zhizuobiao.com All Rights Reserved