看我如何用定值 Cookie 实现反爬

如何,cookie,实现 · 浏览次数 : 114

小编点评

**摘要:** 本文介绍了如何在 Flask 框架中使用定值 Cookie 实现反爬。通过使用 hashlib 模块对文本进行加密,可以限制爬虫访问特定页面。 **主要内容:** * 使用 `make_response()` 函数创建响应对象,设置 Cookie。 * 使用 `set_cookie()` 方法设置 Cookie 的值、过期时间等属性。 * 使用 `request.cookies` 获取 Cookie 的值。 * 使用 `set_cookie()` 方法删除 Cookie。 * 在生成内容时带简单的排版。 **补充知识点:** * Flask 中可以使用 `render_template()` 函数加载模板,并使用 `make_response()` 创建响应对象将模板渲染出来。 * `request.cookies` 属性用于检查 Cookie 的存在和值。 * `set_cookie()` 方法还可以用于设置多個 cookie。

正文

摘要:本次案例,用定值Cookie实现反爬。

本文分享自华为云社区《我是怎么用一个特殊Cookie,限制住别人的爬虫的》,作者: 梦想橡皮擦 。

Cookie 生成

由于本案例需要用到一个特定的 Cookie ,所以我们需要提前将其生成,你可以直接设置一个固定的字符串,也可以使用 Python 加密模块来加密一段文本,例如本案例加密 梦想橡皮擦。

下面是一个示例代码,展示了如何使用 Python 的 hashlib 模块进行加密:

import hashlib
# 要加密的文本
text = "梦想橡皮擦"
# 使用 sha256 算法进行加密
encrypted_text = hashlib.sha256(text.encode()).hexdigest()
print(encrypted_text)

在这个例子中,我们使用了 hashlib 模块中的 sha256 算法对文本进行加密。这个算法生成了一个长度为 64 位的十六进制哈希值,用于表示加密后的文本。

注意,这个算法只能用于加密文本,而不能用于解密。因此,一旦文本被加密,就无法恢复成原来的文本,即不可逆加密/单项加密。

Python Flask 框架生成 Cookie

在 Python 的 Flask 框架中,可以使用 make_response 函数和 set_cookie 方法来生成一个 Cookie。

例如,下面的代码片段展示了如何在 Flask 中设置一个名为 story 的 Cookie,并将它的值设为前文建立的加密串。

from flask import Flask, make_response
app = Flask(__name__)
@app.route('/')
def index():
    resp = make_response('Setting a cookie')
 encrypted_text = hashlib.sha256(text.encode()).hexdigest()
 resp.set_cookie('story', encrypted_text)
 return resp

在这个例子中,我们使用 make_response() 函数创建了一个响应对象,然后使用 set_cookie() 方法来设置 cookie。最后,我们将响应对象返回给客户端。

注意,上面的代码仅创建了一个简单的 Cookie,它只有名称和值两个部分。你还可以使用其他可选参数来设置 Cookie 的其他属性,例如过期时间、域名等。

接下来为大家在补充一下 make_response() 相关知识。

Flask make_response 加载模板

在 Flask 中,你可以使用 make_response() 函数和模板系统来生成带有模板的响应。

下面是一个示例代码,展示了如何使用 make_response() 函数加载模板:

from flask import Flask, make_response, render_template
app = Flask(__name__)
@app.route('/')
def index():
 # 加载模板并渲染
 rendered_template = render_template('index.html', title='梦想橡皮擦')
 # 使用 make_response 函数创建响应
    resp = make_response(rendered_template)
 return resp

在这个例子中,我们首先使用 Flask 的 render_template() 函数加载并渲染了名为 index.html 的模板。然后我们使用 make_response() 函数创建了一个响应对象,并将渲染后的模板作为响应的内容。最后,我们返回了这个响应对象给客户端。

注意,你需要在 Flask 应用的模板目录中存在名为 index.html 的模板文件,才能正常使用上述代码。

然后我们将该视图函数补充完整,代码在 app/routes.py 文件中。

@app.route('/')
@app.route('/index')
def index():
    item = {
 "msg": "后台传递信息"
 }
 # 访问首页生成一个 Cookie 值,该值用于访问特定页面
 rendered_template = render_template('index.html', title='梦想橡皮擦')
    resp = make_response(rendered_template)
    text = "梦想橡皮擦"
 # 使用 sha256 算法进行加密
 encrypted_text = hashlib.sha256(text.encode()).hexdigest()
 resp.set_cookie('story', encrypted_text)
 return resp

此时当我们访问爬虫训练场首页的时候,就会在 Cookie 中写入一个加密之后的字符串。

通过开发者工具,可以查看到响应头。

最后一步,就是在 Python Flask 框架中判断刚刚的 Cookie 值,如果存在则响应数据,否则返回 403。

Flask 判断指定 cookie 是否存在

在 Python 的 Flask 框架中,你可以使用 request.cookies 属性来判断指定的 Cookie 是否存在。

例如,下面的代码片段展示了如何判断一个名为 story 的 Cookie 是否存在:

from flask import Flask, request
app = Flask(__name__)
@app.route('/')
def index():
 if 'story' in request.cookies:
 # 如果存在 'story' cookie,则执行相应操作
 # ...
 else:
 # 如果不存在 'story' cookie,则执行相应操作
 # ...

将代码补充完整,文件是 app/antispider/index.py。

@antispider.route('/cookie_demo')
def cookie_demo():
 if 'story' in request.cookies:
 # 如果存在 'story' cookie,则执行相应操作
 # ...
 return render_template("antispider/cookie_demo.html")
 else:
 return "没有权限", 403

补充知识点

在 Python 的 Flask 框架中,除了使用 set_cookie() 方法设置 cookie 以外,还有其他几种操作 cookie 的方法。

下面是一些常用的操作 cookie 的方法:

  • 设置 cookie 的值:你可以使用 set_cookie() 方法来设置 cookie 的值。例如:
from flask import Flask, make_response
app = Flask(__name__)
@app.route('/')
def index():
    resp = make_response('Setting a cookie')
 resp.set_cookie('user', 'xiangpica')
 return resp
  • 获取 cookie 的值:你可以使用 request.cookies字典来获取 cookie 的值。例如:
from flask import Flask, request
app = Flask(__name__)
@app.route('/')
def index():
    user = request.cookies.get('user')
 return user
  • 删除 cookie:你可以使用 set_cookie() 方法并将 cookie 的过期时间设为过去的时间来删除 cookie。例如:
from flask import Flask, make_response
app = Flask(__name__)
@app.route('/')
def index():
    resp = make_response('Deleting a cookie')
 resp.set_cookie('user', '', expires=0)
 return resp

 

点击关注,第一时间了解华为云新鲜技术~

与看我如何用定值 Cookie 实现反爬相似的内容:

看我如何用定值 Cookie 实现反爬

摘要:本次案例,用定值Cookie实现反爬。 本文分享自华为云社区《我是怎么用一个特殊Cookie,限制住别人的爬虫的》,作者: 梦想橡皮擦 。 Cookie 生成 由于本案例需要用到一个特定的 Cookie ,所以我们需要提前将其生成,你可以直接设置一个固定的字符串,也可以使用 Python 加密

看我是如何用C#编写一个小于8KB的贪吃蛇游戏的

译者注:这是Michal Strehovský大佬的一篇文章,他目前在微软.NET Runtime团队工作,主要是负责.NET NativeAOT功能的开发。我在前几天看到这篇文章,非常喜欢,虽然它的内容稍微有点过时(还是使用的.NET Core 3.0),不过其中的一些编程技巧和思维方式很受用,特

8KB的C#贪吃蛇游戏热点答疑和.NET7版本

在之前的一篇文章《看我是如何用C#编写一个小于8KB的贪吃蛇游戏》中,介绍了在.NET Core 3.0的环境下如何将贪吃蛇游戏降低到8KB。不过也有很多小伙伴提出了一些疑问和看法,主要是下面这几个方面: .NET Core 3.0可以做到这么小,那么.NET7表现会不会更好? 不敢在生产中用这样的

.NET周报【1月第3期 2023-01-20】

这应该是2023年农历新年前的最后一篇.NET周报,再次预祝大家新年快乐! 国内文章 看我是如何用C#编写一个小于8KB的贪吃蛇游戏的 https://www.cnblogs.com/InCerry/p/building-a-self-contained-game-in-c-under-8-kilo

还在手动发早安吗?教你用java实现每日给女友微信发送早安

摘要:教你如何用java实现每日给女友微信发送早安等微信信息。 本文分享自华为云社区《java实现每日给女友微信发送早安等微信信息》,作者:穆雄雄 。 前言 据说这个功能最近在抖音上很火,我没有抖音,没有看到。 但是我在网上看了,相关案例确实很多,但是大家都是借助于了微信服务号,在我看来,效果很不佳

[转帖]一文解决内核是如何给容器中的进程分配CPU资源的?

https://zhuanlan.zhihu.com/p/615570804 现在很多公司的服务都是跑在容器下,我来问几个容器 CPU 相关的问题,看大家对天天在用的技术是否熟悉。 容器中的核是真的逻辑核吗? Linux 是如何对容器下的进程进行 CPU 限制的,底层是如何工作的? 容器中的 thr

【转帖】Linux开发工具 — readelf、objdump、hexdump

本博文的主要内容是:1)readelf工具查看ELF文件的信息;2)hexdump工具查看这块内存;3)objdump工具对文件进行反汇编。 前一段时间对Linux不熟,所以很多命令不知道。学习C时候需要偶尔看一下汇编用来理解。我喜欢用问题的形式来学习和总结。 1. 如何看一个程序代码变量的存储布局

记一次 .NET 某餐饮小程序 内存暴涨分析

一:背景 1. 讲故事 前些天有位朋友找到我,说他的程序内存异常高,用 vs诊断工具 加载时间又太久,让我帮忙看一下到底咋回事,截图如下: 确实,如果dump文件超过 10G 之后,市面上那些可视化工具分析起来会让你崩溃的,除了时间久之外这些工具大多也不是用懒加载的方式,比如 dotmemory 会

记一次 .NET 某医院门诊软件 卡死分析

一:背景 1. 讲故事 前几天有位朋友找到我,说他们的软件在客户那边卡死了,让我帮忙看下是怎么回事?我就让朋友在程序卡死的时候通过 任务管理器 抓一个 dump 下来,虽然默认抓的是 wow64 ,不过用 soswow64.dll 转还是可以的,参考命令如下: .load C:\soft\soswo

数据分析er看过来,五款工具有你需要的

“我想转行做数据分析,但是我只会用Excel,不会其他的工具,有其他的数据分析工具推荐么?“ “我不会python,那我可以做数据分析吗” 大部分人对数据分析的的第一印象就是Excel,python,其实选择一个工具开始学习是需要花费学习成本的,如果不清楚这款工具能给你带来什么价值,就开始盲目学习,