共计 11272 个字符,预计需要花费 29 分钟才能阅读完成。
这篇文章给大家介绍 Dataset 中 SQLAlchemy 如何使用,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。
Dataset 对于操作 JSON、CSV 文件、NoSQL 非常好用。
import dataset
连接 MySQL 数据库:
db = dataset.connect(mysql://username:password@10.10.10.10/ctf?charset=utf8)
用户名:username,密码:password,数据库地址(地址 + 端口):10.10.10.10,database 名: ctf
连接 SQLite 数据库:
db = dataset.connect(sqlite:///ctf.db)
连接 PostgreSQL 数据库:
db = dataset.connect(postgresql://scott:tiger@localhost:5432/mydatabase)
一定要注意指定字符编码
table = db[city] #(选择 city 表) user = table(name) # 找出表中 name 列属性所有数据 res = db.query(select name from table limit 10) # 如果不需要查看全部数据的话 *** 用 limit,因为全部数据的载入非常非常耗时间 for x in res: print x[name] # 选 name 字段的数据 table.insert(dict(name= John Doe , age=37)) table.insert(dict(name= Jane Doe , age=34, gender= female)) john = table.find_one(name= John Doe)
在数据库中查找是否有同时满足多个条件的数据:table.find_one(属性 1 = 属性值 1, 属性 2 = 属性值 2, hellip;)
注:find_one 速度很慢
插入数据
dataset 会根据输入自动创建表和字段名
table = db[user] # 或者 table = db.get_table(user) table.insert(dict(name= John Doe , age=46, country= China)) table.insert(dict(name= Jane Doe , age=37, country= France , gender= female)) # 主键 id 自动生成
更新数据
table.update(dict(name= John Doe , age=47), [name]) # 第二个参数相当于 sql update 语句中的 where,用来过滤出需要更新的记录
事务操作
事务操作可以简单的使用上下文管理器来实现, 出现异常,将会回滚
with dataset.connect() as tx: tx[ user].insert(dict(name= John Doe , age=46, country= China)) # 相当于: db = dataset.connect() db.begin() try: db[user].insert(dict(name= John Doe , age=46, country= China)) db.commit() except: db.rollback() # 也可以嵌套使用: db = dataset.connect() with db as tx1: tx1[ user].insert(dict(name= John Doe , age=46, country= China)) with db as tx2: tx2[user].insert(dict(name= Jane Doe , age=37, country= France , gender= female))
从表获取数据
users = db[user].all() for user in db[ user]: # print(user[ age]) # chinese_users = user.find(country= China) john = user.find_one(name= John Doe)
获取非重复数据
db[user].distinct(country)
删除记录
table.delete(place= Berlin)
执行 SQL 语句
result = db.query(SELECT country, COUNT(*) c FROM user GROUP BY country ) for row in result: print(row[ country], row[c])
导出数据
result = db[users].all() dataset.freeze(result, format= json , filename= users.json)
JSON
JSON(JavaScript Object Notation) 是一种轻量级的数据交换格式,非常易于人阅读和编写。
import json
json.dumps 将 Python 对象编码成 JSON 字符串
json.loads 将已编码的 JSON 字符串解码为 Python 对象
MySQL 数据库:
分类表 -categories,包括类别 web,reversing,crypto(加解密),mic 等
题目表 -tasks, 包括题目 id,题目名,flag, 分值,文件 地址,题目等级,题目详细描述
flag 表 -flag, 包括题目 id, 用户 id, 得分,时间戳
用户表 -users,包括用户 id, 用户名,密码
题目分类表 -cat_task, 包括题目 id, 题目类别 id
flag 表中每条数据由于是有题目 ID task_id 和用户 ID user_id 来共同确认的,所以采用复合主键:primary key (task_id,user_id)
联合主键和复合主键的区别
python 装饰器
Decorator 通过返回包装对象实现间接调用, 以此插入额外逻辑
https://www.zhihu.com/question/26930016
wraps 本身也是一个装饰器,它能把原函数的元信息拷贝到装饰器函数中,这使得装饰器函数也有和原函数一样的元信息了
from functools import wraps def logged(func): @wraps(func) def with_logging(*args,**kwargs): print func.__name__ + was called return func(*args,**kwargs) return with_logging @logged def f(x): does some math return x + x * x print f.__name__ # prints f print f.__doc__ # prints does some math
web 框架采用 flask
from flask import Flask
引入 Flask 类,Flask 类实现了一个 WSGI(Web Server Gateway Interface)应用
app = Flask(__name__)
app 是 Flask 的实例,它接收包或者模块的名字作为参数,但一般都是传递__name__
@app.route(/) def hello_world(): return Hello World!
使用 app.route 装饰器会将 URL 和执行的视图函数的关系保存到 app.url_map 属性上。处理 URL 和视图函数的关系的程序就是路由,这里的视图函数就是 hello_world
if __name__ == __main__ : app.run(host= 0.0.0.0 ,port=9000)
使用这个判断可以保证当其他文件引用这个文件的时候 (例如 from hello import app) 不会执行这个判断内的代码,也就是不会执行 app.run 函数。
执行 app.run 就可以启动服务了。默认 Flask 只监听虚拟机的本地 127.0.0.1 这个地址,端口为 5000。而我们对虚拟机做的端口转发端口是 9000,所以需要制定 host 和 port 参数,0.0.0.0 表示监听所有地址,这样就可以在本机访问了。
服务器启动后,会调用 werkzeug.serving.run_simple 进入轮询,默认使用单进程单线程的 werkzeug.serving.BaseWSGIServer 处理请求,实际上还是使用标准库 BaseHTTPServer.HTTPServer,通过 select.select 做 0.5 秒的 while TRUE 的事件轮询。当我们访问 http://127.0.0.1:9000/, 通过 app.url_map 找到注册的 / 这个 URL 模式, 就找到了对应的 hello_world 函数执行,返回 hello world!, 状态码为 200。如果访问一个不存在的路径,如访问 http://127.0.0.1:9000/a,Flask 找不到对应的模式,就会向浏览器返回 Not Found,状态码为 404
flask 中 jsonify 的作用
jsonify 的作用实际上就是将我们传入的 json 形式数据序列化成为 json 字符串,作为响应的 body,并且设置响应的 Content-Type 为 application/json,构造出响应返回至客户端
效果等于 json.dumps
jsonify 的 Content-Type 字段值为 application/json
json.dumps 的 Content-Type 字段值为 text/html
修改 flask 中静态文件夹
修改的 flask 默认的 static 文件夹只需要在创建 Flask 实例的时候, 把 static_folder 和 static_url_path 参数设置为空字符串即可。
app = Flask(__name__, static_folder=”, static_url_path=”)
访问的时候用 url_for 函数,res 文件夹和 static 文件夹同一级:
url_for(lsquo;static rsquo;, filename= rsquo;res/favicon.ico rsquo;)
werkzeug
werkzeug 是一个 WSGI 工具包,可以作为一个 Web 框架的底层库。它封装好了很多 Web 框架的东西,例如 Request,Response 等等。Flask 框架就是一 Werkzeug 为基础开发的
generate_password_hash(password)
将用户输入的明文密码加密成密文进行存储
密码加盐哈希函数。用来将明文密码加密,返回加密后的密文,用来进行用户注册
函数定义:
werkzeug.security.generate_password_hash(password, method= pbkdf2:sha1 , salt_length=8)
密文格式:method$salt$hash
password: 明文密码
method: 哈希的方式(需要是 hashlib 库支持的),格式为
pbpdf2: method [:iterations]。参数说明:
method:哈希的方式,一般为 SHA1,
iterations:(可选参数)迭代次数,默认为 1000。
slat_length: 盐值的长度,默认为 8
check_password_hash(hash,password)
验证经过 generate_password_hash 哈希的密码,将明文和密文进行比较, 查看是否一致,用来验证用户登录
函数定义:
werkzeug.security.check_password_hash(pwhash, password)
pwhash: generate_password_hash 生成的哈希字符串
password: 需要验证的明文密码
flask 中的 session
rom flask import session user = db[users].find_one(username=username) session[user_id] = user[id]
由于使用了 session,所以需要设置一个 secret_key 用来做一些模块的 hash
Flask Web Development 中的内容:
SECRET_KEY 配置变量是通用密钥, 可在 Flask 和多个第三方扩展中使用。如其名所示, 加密的强度取决于变量值的机密度。不同的程序要使用不同的密钥, 而且要保证其他人不知道你所用的字符串。
SECRET_KEY 的作用主要是提供一个值做各种 HASH, 是在其加密过程中作为算法的一个参数(salt 或其他)。所以这个值的复杂度也就影响到了数据传输和存储时的复杂度。
flask 变量规则
要给 URL 添加变量部分,你可以把这些特殊的字段标记为 variable_name, 这个部分将会作为命名参数传递到你的函数。规则可以用 converter:variable_name 指定一个可选的转换器
@route(/hello/ name) def index(name): return b Hello {{name}} /b !
数据库查询
对 dataset 的数据查询,使用冒号来为变量传参。
select f.task_id from flags f where f.user_id = :user_id”rsquo;,user_id=session[lsquo;user_id rsquo;])
模板渲染
使用 render_template 方法来渲染模板。将模板名和你想作为关键字的参数传入模板的变量
MySQL
IFNULL(expr1,expr2)
如果 expr1 不是 NULL,IFNULL()返回 expr1,否则它返回 expr2。
IFNULL()返回一个数字或字符串值,取决于它被使用的上下文环境。
max 函数是用来找出记录集中 *** 值的记录
对于 left join,不管 on 后面跟什么条件,左表的数据全部查出来,因此要想过滤需把条件放到 where 后面
对于 inner join,满足 on 后面的条件表的数据才能查出,可以起到过滤作用。也可以把条件放到 where 后面
在使用 left jion 时,on 和 where 条件的区别如下:
on 条件是在生成临时表时使用的条件,它不管 on 中的条件是否为真,都会返回左边表中的记录。
where 条件是在临时表生成好后,再对临时表进行过滤的条件。这时已经没有 left join 的含义 (必须返回左边表的记录) 了,条件不为真的就全部过滤掉。
order by 的用法
使用 order by,一般是用来,依照查询结果的某一列 (或多列) 属性,进行排序(升序:ASC; 降序:DESC; 默认为升序)。
当排序列含空值时:
ASC:排序列为空值的元组 *** 显示。
DESC:排序列为空值的元组 *** 显示。
可以把 null 值看做无穷大
select * from s order by sno desc, sage asc
group by 的用法
group by 按照查询结果集中的某一列(或多列),进行分组,值相等的为一组
1、细化集函数 (count,sum,avg,max,min) 的作用对象:
未对查询结果分组,集函数将作用于整个查询结果。
对查询结果分组后,集函数将分别作用于每个组。
SELECT cno,count(sno) from sc group by cno
2、GROUP BY 子句的作用对象是查询的中间结果表
分组方法:按指定的一列或多列值分组,值相等的为一组。
使用 GROUP BY 子句后,SELECT 子句的列名列表中只能出现分组属性 (比如:sno) 和集函数(比如:count())
select sno,count(cno) from sc group by sno
3、多个列属性进行分组
select cno,grade,count(cno) from sc group by cno,grade
4、使用 HAVING 短语筛选最终输出结果
只有满足 HAVING 短语指定条件的组才输出。
HAVING 短语与 WHERE 子句的区别:作用对象不同。
1、WHERE 子句作用于基表或视图,从中选择满足条件的元组。
2、HAVING 短语作用于组,从中选择满足条件的组
select sno from sc group by sno having count(cno) 3
select sno,count(cno) from sc where grade 60 group by sno having count(cno) 3
MySQL 的左连接、右连接、等值连接
1. 左连接(left join)
select m.columnname hellip; hellip;,n.* columnname hellip;.. from left_table m left join right_table n on m.columnname_join=n.columnname_join and n.columnname=xxx where m.columnname=xxx hellip;..
ON 是连接条件,用于把 2 表中等值的记录连接在一起,但是不影响记录集的数量。若是表 left_table 中的某记录,无法在表 right_table 找到对应的记录,则此记录依然显示在记录集中,只是表 right_table 需要在查询显示的列的值用 NULL 替代;
ON 连接条件中表 n.columnname=xxx 用于控制 right_table 表是否有符合要求的列值还是用 NULL 替换的方式显示在查询列中,不影响记录集的数量;
WHERE 字句控制记录是否符合查询要求,不符合则过滤掉
2. 右连接(right join)
select m.columnname hellip; hellip;,n.* columnname hellip;.. from left_table m right join right_table n on m. columnname_join=n. columnname_join and m. columnname=xxx where n.columnname=xxx hellip;..
3. 等值连接
select m.columnname hellip; hellip;,n.* columnname hellip;.. from left_table m [inner] join right_table n on m. columnname_join=n. columnname_join where m.columnname=xxx hellip;.. and n.columnname=xxx hellip;.
或者
select m.columnname hellip; hellip;,n.* columnname hellip;.. from left_table m , right_table n where m. columnname_join=n. columnname_join and m.columnname=xxx hellip;.. and n.columnname=xxx hellip;.
ON 是连接条件,不再与左连接或右连接的功效一样,除了作为 2 表记录匹配的条件外,还会起到过滤记录的作用,若 left_table 中记录无法在 right_table 中找到对应的记录,则会被过滤掉;
WHERE 字句,不管是涉及表 left_table、表 right_table 上的限制条件,还是涉及 2 表连接的条件,都会对记录集起到过滤作用,把不符合要求的记录刷选掉;
jinja2 获取循环索引
jinja2 获取循环 {% for i in n %} 的索引使用 loop.index
{% for i in names %} tr td {{ loop.index }} /td // 当前是第 x 条 td {{ i.name }} /td /tr {% endfor %}
flask 重定向和错误
可以用 redirect()函数把用户重定向到其它地方。放弃请求并返回错误代码,用 abort()函数。
from flask import abort, redirect, url_for @app.route(/) def index(): return redirect(url_for( login)) @app.route(/login) def login(): abort(401) this_is_never_executed()
默认情况下,错误代码会显示一个黑白的错误页面。如果你要定制错误页面,可以使用 errorhandler()
装饰器:
from flask import render_template @app.errorhandler(404) def page_not_found(error): return render_template(page_not_found.html), 404
注意 render_template()调用之后的 404。这告诉 Flask,该页的错误代码是 404 ,即没有找到。默认为 200,也就是一切正常。
flask CSRF 防护机制
@app.before_request def csrf_protect(): if request.method == POST : token = session.pop( _csrf_token , None) if not token or token != request.form.get(_csrf_token): abort(403) def some_random_string(): return hashlib.sha256(os.urandom(16).hexdigest()) def generate_csrf_token(): if _csrf_token not in session: session[ _csrf_token] = some_random_string() return session[ _csrf_token]
在 flask 的全局变量里面注冊 上面那个生成随机 token 的函数
app.jinja_env.globals[lsquo;csrf_token rsquo;] = generate_csrf_token
在网页的模板是这么引入的
form method=post action= input name=_csrf_token type=hidden value= {{ csrf_token() }}
flask 上下文处理器
Flask 上下文处理器自动向模板的上下文中插入新变量。上下文处理器在模板渲染之前运行,并且可以在模板上下文中插入新值。上下文处理器是一个返回字典的函数,这个字典的键值最终将传入应用中所有模板的上下文:
@app.context_processor def inject_user(): return dict(user=g.user)
上面的上下文处理器使得模板可以使用一个名为 user 值为 g.user 的变量。不过这个例子不是很有意思,因为 g 在模板中本来就是可用的,但它解释了上下文处理器是如何工作的。
变量不仅限于值,上下文处理器也可以使某个函数在模板中可用(由于 Python 允许传递函数):
@app.context_processor def utility_processor(): def format_price(amount, currency=u euro;): return u {0:.2f}{1}.format(amount, currency) return dict(format_price=format_price)
上面的上下文处理器使得 format_price 函数在所有模板中可用:
{{format_price(0.33) }}
日志记录
handler = logging.FileHandler(lsquo;flask.log rsquo;, encoding= rsquo;UTF-8 prime;)
1、请求之前设置 requestId 并记录日志
每个 URL 请求之前,定义 requestId 并绑定到 g
@app.before_request def before_request(): g.requestId = gen_requestId() logger.info(Start Once Access, and this requestId is %s % g.requestId)
2、请求之后添加响应头与记录日志
每次返回数据中,带上响应头,包含 API 版本和本次请求的 requestId,以及允许所有域跨域访问 API, 记录访问日志
@app.after_request def add_header(response): response.headers[X-SaintIC-Media-Type] = saintic.v1 response.headers[X-SaintIC-Request-Id] = g.requestId response.headers[Access-Control-Allow-Origin] = * logger.info(json.dumps({ AccessLog : { status_code : response.status_code, method : request.method, ip : request.headers.get( X-Real-Ip , request.remote_addr), url : request.url, referer : request.headers.get(Referer), agent : request.headers.get(User-Agent), requestId : str(g.requestId), } } )) return response
basicConfig 方法可以满足你在绝大多数场景下的使用需求,但是 basicConfig 有一个很大的缺点。调用 basicConfig 其实是给 root logger 添加了一个 handler(FileHandler),这样当你的程序和别的使用了 logging 的第三方模块一起工作时,会影响第三方模块的 logger 行为。这是由 logger 的继承特性决定的
logging.basicConfig(level=logging.DEBUG, format= %(asctime)s %(levelname)s %(message)s , datefmt= %a, %d %b %Y %H:%M:%S , filename= logs/pro.log , filemode= w ) logging.debug(dddddddddd)
MySQL 字符编码
除了设置数据库的之外,由于 dataset 默认创建数据库和表的字符集不是 utf8, 所以需要自己设置,否则会中文乱码,所以需要修改表的字符集
my.cnf [client] default-character-set=utf8 [mysqld] character-set-server=utf8 collation-server=utf8_general_ci default-storage-engine=INNODB
表的字符集
show create table tasks; alter table tasks convert to character set utf8;
关于 Dataset 中 SQLAlchemy 如何使用就分享到这里了,希望以上内容可以对大家有一定的帮助,可以学到更多知识。如果觉得文章不错,可以把它分享出去让更多的人看到。