博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
python爬虫爬取京东、亚马逊商品页面信息
阅读量:2431 次
发布时间:2019-05-10

本文共 450 字,大约阅读时间需要 1 分钟。

利用爬虫获取京东页面上的信息

>>> import requests>>> r=requests.get("https://item.jd.com/7629588.html")>>> r.status_code200>>> r.encoding'gbk'>>> r.text[:1000]

利用爬虫获取亚马逊的商品信息

>>> import requests>>> url="https://www.amazon.cn/gp/product/B01M8L5Z3Y">>> try:	kv={'user-agent':'Mozilla/5.0'}#亚马逊对来源做了审查,我们需要利用requests库的功能模拟浏览器向亚马逊提出请求并且获得信息	r=requests.get(url,headers=kv)	r.raise_for_status()	r.encoding=r.apparent_encoding	print(r.text[1000:2000])except:	print("爬取失败")

转载地址:http://sstmb.baihongyu.com/

你可能感兴趣的文章
基础算法面试题---如何用队列实现栈(1)
查看>>
基础算法面试题---如何用队列实现栈(2)
查看>>
基础算法面试题---如何数组实现栈和队列
查看>>
API接口安全性设计以及各参数的作用
查看>>
《Netty权威指南 第2版》学习笔记(1)---服务端与客户端开发入门
查看>>
《Netty权威指南 第2版》学习笔记(6)--- HTTP协议开发应用
查看>>
链表算法面试题---删除链表中的重复元素II
查看>>
链表算法面试题---合并两个链表
查看>>
链表算法面试题---旋转链表
查看>>
链表算法面试题---交换链表的节点I
查看>>
链表算法面试题---交换链表的节点II
查看>>
链表算法面试题---链表的插入排序
查看>>
链表算法面试题---链表的归并排序
查看>>
链表算法面试题---合并N个有序链表
查看>>
链表算法面试题---分割链表
查看>>
总结、归类---使用二分处理旋转数组的问题
查看>>
分布式常用技术
查看>>
uniapp DES加解密
查看>>
小程序DES加解密
查看>>
Vue 路由 导航守卫(全局守卫、路由独享守卫)
查看>>