python爬虫:获取豆瓣电影排行榜电影名

这是我的第一个爬虫,仿照CSDN的一位博主文章,并加以改进,能获取到电影名,电影别名.

#coding=utf-8

import sys
import  io 
sys.stdout = io.TextIOWrapper(sys.stdout.buffer, encoding='utf-8')

from bs4 import BeautifulSoup
import requests
req_obj = requests.get('https://movie.douban.com/chart')
bsobj = BeautifulSoup(req_obj.text,'lxml')

div = bsobj.find_all('div',class_='pl2')
for item in div:
    movie_name = item.a.get_text().strip().replace("\n","").replace("\r","").replace("\t","").replace(" ","")
    print(movie_name)

 

 

结果:

绿皮书/绿簿旅友(港)/幸福绿皮书(台)
我们/我们·异(港)
行骗天下:运势篇/信用诈欺师JP:运势篇
风中有朵雨做的云/地狱恋人/地狱情人
比悲伤更悲伤的故事/MoreThanBlue
疾速备战/疾速追杀3/疾速逃亡
驯龙高手3/驯龙记3(港)/驯龙高手3:隐秘的世界
如影随心/可遇可求/Lostinlove
撞死了一只羊/Jinpa
过春天/分隔线/佩佩

上一篇:豆瓣电影top250bs4+requests


下一篇:Zookeeper知识点梳理