php中文网 | cnphp.com

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
查看: 477|回复: 0

python爬取京东商品图片

[复制链接]

2614

主题

2621

帖子

9276

积分

管理员

Rank: 9Rank: 9Rank: 9

UID
1
威望
0
积分
6540
贡献
0
注册时间
2021-4-14
最后登录
2024-4-17
在线时间
665 小时
QQ
发表于 2022-6-16 17:58:30 | 显示全部楼层 |阅读模式
# -*- codeing = utf-8 -*-
# @Time : 2021/11/13 20:21
# @File :JD.py
# @Software : PyCharm
import requests
import re
import os


def main():
    keyword = input("请输入要爬取的内容:")
    page = input("请输入你要爬取页数:")
    makedir("D:JD/"+keyword)
    getImg(keyword, page)


def getImg(keyword, page):
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.141 Safari/537.36'}
    rule = r'<img width="220" height="220" data-img="1" data-lazy-img="(.*?)jpg" />'
    if page.isnumeric:
        page = int(page)
        num = 0
        for i in range(0, page):
            url = "https://search.jd.com/search?keyword=" + keyword + "&qrst=1&wq=" + keyword + "&stock=1&stock=1&cid2=12221&page=" + str(
                2 * i + 1) + "&click=0"
            req = requests.get(url=url, headers=headers)
            html = req.text
            imgUrlList = re.findall(rule, html, re.S | re.M)
            num += 1
            imgNum = 0
            print(imgUrlList)
            for j in imgUrlList:
                imgUrl = "https:" + j + "jpg"
                print(imgUrl)
                imgReq = requests.get(url=imgUrl, headers=headers)
                imgName = "D:JD/" + keyword + "/" + str(num) + "_" + str(imgNum) + ".jpg"
                with open(imgName, "wb") as f:
                    f.write(imgReq.content)
                    f.close()
                num += 1

def makedir(path):
    if os.path.exists(path):
        pass
    else:
        os.mkdir(path)

if __name__ == '__main__':
    main()





上一篇:MATLAB求解混沌系统微分方程组
下一篇:基于opencv的规则图形的识别
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|php中文网 | cnphp.com ( 赣ICP备2021002321号-2 )51LA统计

GMT+8, 2024-4-18 09:01 , Processed in 0.182919 second(s), 36 queries , Gzip On.

Powered by Discuz! X3.4 Licensed

Copyright © 2001-2020, Tencent Cloud.

申明:本站所有资源皆搜集自网络,相关版权归版权持有人所有,如有侵权,请电邮(fiorkn@foxmail.com)告之,本站会尽快删除。

快速回复 返回顶部 返回列表