共计 1075 个字符,预计需要花费 3 分钟才能阅读完成。
在 Python 爬虫中设置代理 IP 可以通过使用第三方库如 requests 或 urllib 库来实现。以下是一个使用 requests 库设置代理 IP 的示例代码:
import requests
# 设置代理 IP
proxies = {
'http': 'http://IP: 端口',
'https': 'https://IP: 端口',
}
# 发送请求时使用代理 IP
response = requests.get('https://www.example.com', proxies=proxies)
# 打印响应内容
print(response.text)
在上面的代码中,将 IP
和端口
替换为你的代理 IP 和端口号。注意,http
和 https
分别对应 HTTP 和 HTTPS 请求的代理设置。
如果你的代理 IP 需要身份验证,可以在代理 IP 的后面加上用户名和密码,如下所示:
import requests
# 设置代理 IP
proxies = {
'http': 'http:// 用户名: 密码 @IP: 端口',
'https': 'https:// 用户名: 密码 @IP: 端口',
}
# 发送请求时使用代理 IP
response = requests.get('https://www.example.com', proxies=proxies)
# 打印响应内容
print(response.text)
同样,将 用户名
、 密码
、IP
和端口
替换为你的代理 IP 的相关信息。
另外,如果你需要使用多个代理 IP,可以使用代理 IP 池来实现。代理 IP 池是一个存储多个代理 IP 的容器,你可以从中随机选择一个代理 IP 并设置为请求的代理。以下是一个简单的示例代码:
import random
import requests
# 代理 IP 池
proxies = [
'http://IP1: 端口 1',
'http://IP2: 端口 2',
'http://IP3: 端口 3',
]
# 随机选择一个代理 IP
proxy = random.choice(proxies)
# 发送请求时使用代理 IP
response = requests.get('https://www.example.com', proxies={'http': proxy})
# 打印响应内容
print(response.text)
在上面的代码中,proxies
是一个代理 IP 池,你可以在其中添加多个代理 IP。然后,使用 random.choice
函数从代理 IP 池中随机选择一个代理 IP 并设置为请求的代理。注意,这里只设置了 HTTP 请求的代理,如果你需要同时设置 HTTPS 请求的代理,需要在 proxies
中添加对应的代理信息。
丸趣 TV 网 – 提供最优质的资源集合!
正文完