Dataset中SQLAlchemy如何使用

167次阅读

共计 11272 个字符，预计需要花费 29 分钟才能阅读完成。

这篇文章给大家介绍 Dataset 中 SQLAlchemy 如何使用，内容非常详细，感兴趣的小伙伴们可以参考借鉴，希望对大家能有所帮助。

Dataset 对于操作 JSON、CSV 文件、NoSQL 非常好用。

import dataset

连接 MySQL 数据库：

db = dataset.connect(mysql://username:password@10.10.10.10/ctf?charset=utf8)

用户名:username，密码:password，数据库地址(地址 + 端口):10.10.10.10，database 名: ctf

连接 SQLite 数据库：

db = dataset.connect(sqlite:///ctf.db)

连接 PostgreSQL 数据库：

db = dataset.connect(postgresql://scott:tiger@localhost:5432/mydatabase)

一定要注意指定字符编码

table = db[city] #（选择 city 表） user = table(name) #  找出表中 name 列属性所有数据  res = db.query(select name from table limit 10) #  如果不需要查看全部数据的话 *** 用 limit，因为全部数据的载入非常非常耗时间  for x in res: print x[name] #  选 name 字段的数据  table.insert(dict(name= John Doe , age=37)) table.insert(dict(name= Jane Doe , age=34, gender= female)) john = table.find_one(name= John Doe)

在数据库中查找是否有同时满足多个条件的数据：table.find_one(属性 1 = 属性值 1, 属性 2 = 属性值 2, hellip;)

注：find_one 速度很慢

插入数据

dataset 会根据输入自动创建表和字段名

table = db[user] #  或者 table = db.get_table(user) table.insert(dict(name= John Doe , age=46, country= China)) table.insert(dict(name= Jane Doe , age=37, country= France , gender= female)) #  主键 id 自动生成

更新数据

table.update(dict(name= John Doe , age=47), [name]) #  第二个参数相当于 sql update 语句中的 where，用来过滤出需要更新的记录

事务操作

事务操作可以简单的使用上下文管理器来实现, 出现异常，将会回滚

with dataset.connect() as tx: tx[ user].insert(dict(name= John Doe , age=46, country= China)) #  相当于： db = dataset.connect() db.begin() try: db[user].insert(dict(name= John Doe , age=46, country= China)) db.commit() except: db.rollback() #  也可以嵌套使用: db = dataset.connect() with db as tx1: tx1[ user].insert(dict(name= John Doe , age=46, country= China)) with db as tx2: tx2[user].insert(dict(name= Jane Doe , age=37, country= France , gender= female))

从表获取数据

users = db[user].all() for user in db[ user]: # print(user[ age]) # chinese_users = user.find(country= China) john = user.find_one(name= John Doe)

获取非重复数据

db[user].distinct(country)

删除记录

table.delete(place= Berlin)

执行 SQL 语句

result = db.query(SELECT country, COUNT(*) c FROM user GROUP BY country ) for row in result: print(row[ country], row[c])

导出数据

result = db[users].all() dataset.freeze(result, format= json , filename= users.json)

JSON

JSON(JavaScript Object Notation) 是一种轻量级的数据交换格式，非常易于人阅读和编写。

import json

json.dumps 将 Python 对象编码成 JSON 字符串

json.loads 将已编码的 JSON 字符串解码为 Python 对象

MySQL 数据库：

分类表 -categories，包括类别 web,reversing，crypto(加解密),mic 等

题目表 -tasks, 包括题目 id，题目名，flag, 分值，文件地址，题目等级，题目详细描述

flag 表 -flag, 包括题目 id, 用户 id, 得分，时间戳

用户表 -users，包括用户 id, 用户名，密码

题目分类表 -cat_task, 包括题目 id, 题目类别 id

flag 表中每条数据由于是有题目 ID task_id 和用户 ID user_id 来共同确认的，所以采用复合主键：primary key (task_id,user_id)

联合主键和复合主键的区别

python 装饰器

Decorator 通过返回包装对象实现间接调用, 以此插入额外逻辑

https://www.zhihu.com/question/26930016

wraps 本身也是一个装饰器，它能把原函数的元信息拷贝到装饰器函数中，这使得装饰器函数也有和原函数一样的元信息了

from functools import wraps def logged(func): @wraps(func) def with_logging(*args,**kwargs): print func.__name__ +  was called  return func(*args,**kwargs) return with_logging @logged def f(x):  does some math  return x + x * x print f.__name__ # prints  f  print f.__doc__ # prints  does some math

web 框架采用 flask

from flask import Flask

引入 Flask 类，Flask 类实现了一个 WSGI(Web Server Gateway Interface)应用

app = Flask(__name__)

app 是 Flask 的实例，它接收包或者模块的名字作为参数，但一般都是传递__name__

@app.route(/) def hello_world(): return  Hello World!

使用 app.route 装饰器会将 URL 和执行的视图函数的关系保存到 app.url_map 属性上。处理 URL 和视图函数的关系的程序就是路由，这里的视图函数就是 hello_world

if __name__ ==  __main__ : app.run(host= 0.0.0.0 ,port=9000)

使用这个判断可以保证当其他文件引用这个文件的时候 (例如 from hello import app) 不会执行这个判断内的代码，也就是不会执行 app.run 函数。

执行 app.run 就可以启动服务了。默认 Flask 只监听虚拟机的本地 127.0.0.1 这个地址，端口为 5000。而我们对虚拟机做的端口转发端口是 9000，所以需要制定 host 和 port 参数，0.0.0.0 表示监听所有地址，这样就可以在本机访问了。

服务器启动后，会调用 werkzeug.serving.run_simple 进入轮询，默认使用单进程单线程的 werkzeug.serving.BaseWSGIServer 处理请求，实际上还是使用标准库 BaseHTTPServer.HTTPServer，通过 select.select 做 0.5 秒的 while TRUE 的事件轮询。当我们访问 http://127.0.0.1:9000/, 通过 app.url_map 找到注册的 / 这个 URL 模式, 就找到了对应的 hello_world 函数执行，返回 hello world!, 状态码为 200。如果访问一个不存在的路径，如访问 http://127.0.0.1:9000/a,Flask 找不到对应的模式，就会向浏览器返回 Not Found，状态码为 404

flask 中 jsonify 的作用

jsonify 的作用实际上就是将我们传入的 json 形式数据序列化成为 json 字符串，作为响应的 body，并且设置响应的 Content-Type 为 application/json，构造出响应返回至客户端

效果等于 json.dumps

jsonify 的 Content-Type 字段值为 application/json

json.dumps 的 Content-Type 字段值为 text/html

修改 flask 中静态文件夹

修改的 flask 默认的 static 文件夹只需要在创建 Flask 实例的时候, 把 static_folder 和 static_url_path 参数设置为空字符串即可。

app = Flask(__name__, static_folder=”, static_url_path=”)

访问的时候用 url_for 函数，res 文件夹和 static 文件夹同一级：

url_for(lsquo;static rsquo;, filename= rsquo;res/favicon.ico rsquo;)

werkzeug

werkzeug 是一个 WSGI 工具包，可以作为一个 Web 框架的底层库。它封装好了很多 Web 框架的东西，例如 Request，Response 等等。Flask 框架就是一 Werkzeug 为基础开发的

generate_password_hash(password)

将用户输入的明文密码加密成密文进行存储

密码加盐哈希函数。用来将明文密码加密，返回加密后的密文，用来进行用户注册

函数定义：

werkzeug.security.generate_password_hash(password, method= pbkdf2:sha1 , salt_length=8)

密文格式：method$salt$hash

password: 明文密码

method: 哈希的方式(需要是 hashlib 库支持的)，格式为

pbpdf2: method [:iterations]。参数说明：

method：哈希的方式，一般为 SHA1，

iterations：(可选参数)迭代次数，默认为 1000。

slat_length: 盐值的长度，默认为 8

check_password_hash(hash,password)

验证经过 generate_password_hash 哈希的密码，将明文和密文进行比较, 查看是否一致，用来验证用户登录

函数定义：

werkzeug.security.check_password_hash(pwhash, password)

pwhash: generate_password_hash 生成的哈希字符串

password: 需要验证的明文密码

flask 中的 session

rom flask import session user = db[users].find_one(username=username) session[user_id] = user[id]

由于使用了 session，所以需要设置一个 secret_key 用来做一些模块的 hash

Flask Web Development 中的内容:

SECRET_KEY 配置变量是通用密钥, 可在 Flask 和多个第三方扩展中使用。如其名所示, 加密的强度取决于变量值的机密度。不同的程序要使用不同的密钥, 而且要保证其他人不知道你所用的字符串。

SECRET_KEY 的作用主要是提供一个值做各种 HASH, 是在其加密过程中作为算法的一个参数(salt 或其他)。所以这个值的复杂度也就影响到了数据传输和存储时的复杂度。

flask 变量规则

要给 URL 添加变量部分，你可以把这些特殊的字段标记为 variable_name，这个部分将会作为命名参数传递到你的函数。规则可以用 converter:variable_name 指定一个可选的转换器

@route(/hello/ name) def index(name): return  b Hello {{name}} /b !

数据库查询

对 dataset 的数据查询，使用冒号来为变量传参。

select f.task_id from flags f where f.user_id = :user_id”rsquo;,user_id=session[lsquo;user_id rsquo;])

模板渲染

使用 render_template 方法来渲染模板。将模板名和你想作为关键字的参数传入模板的变量

MySQL

IFNULL(expr1,expr2)

如果 expr1 不是 NULL，IFNULL()返回 expr1，否则它返回 expr2。

IFNULL()返回一个数字或字符串值，取决于它被使用的上下文环境。

max 函数是用来找出记录集中 *** 值的记录

对于 left join，不管 on 后面跟什么条件，左表的数据全部查出来，因此要想过滤需把条件放到 where 后面

对于 inner join，满足 on 后面的条件表的数据才能查出，可以起到过滤作用。也可以把条件放到 where 后面

在使用 left jion 时，on 和 where 条件的区别如下：

on 条件是在生成临时表时使用的条件，它不管 on 中的条件是否为真，都会返回左边表中的记录。

where 条件是在临时表生成好后，再对临时表进行过滤的条件。这时已经没有 left join 的含义 (必须返回左边表的记录) 了，条件不为真的就全部过滤掉。

order by 的用法

使用 order by，一般是用来，依照查询结果的某一列 (或多列) 属性，进行排序(升序：ASC; 降序：DESC; 默认为升序)。

当排序列含空值时：

ASC：排序列为空值的元组 *** 显示。

DESC：排序列为空值的元组 *** 显示。

可以把 null 值看做无穷大

select * from s order by sno desc, sage asc

group by 的用法

group by 按照查询结果集中的某一列(或多列)，进行分组，值相等的为一组

1、细化集函数 (count，sum，avg，max，min) 的作用对象：

未对查询结果分组，集函数将作用于整个查询结果。

对查询结果分组后，集函数将分别作用于每个组。

SELECT cno,count(sno) from sc group by cno

2、GROUP BY 子句的作用对象是查询的中间结果表

分组方法：按指定的一列或多列值分组，值相等的为一组。

使用 GROUP BY 子句后，SELECT 子句的列名列表中只能出现分组属性 (比如：sno) 和集函数(比如：count())

select sno,count(cno) from sc group by sno

3、多个列属性进行分组

select cno,grade,count(cno) from sc group by cno,grade

4、使用 HAVING 短语筛选最终输出结果

只有满足 HAVING 短语指定条件的组才输出。

HAVING 短语与 WHERE 子句的区别：作用对象不同。

1、WHERE 子句作用于基表或视图，从中选择满足条件的元组。

2、HAVING 短语作用于组，从中选择满足条件的组

select sno from sc group by sno having count(cno) 3

select sno,count(cno) from sc where grade 60 group by sno having count(cno) 3

MySQL 的左连接、右连接、等值连接

1. 左连接(left join)

select m.columnname hellip; hellip;,n.* columnname hellip;.. from left_table m left join right_table n on m.columnname_join=n.columnname_join and n.columnname=xxx where m.columnname=xxx hellip;..

ON 是连接条件，用于把 2 表中等值的记录连接在一起，但是不影响记录集的数量。若是表 left_table 中的某记录，无法在表 right_table 找到对应的记录，则此记录依然显示在记录集中，只是表 right_table 需要在查询显示的列的值用 NULL 替代;

ON 连接条件中表 n.columnname=xxx 用于控制 right_table 表是否有符合要求的列值还是用 NULL 替换的方式显示在查询列中，不影响记录集的数量;

WHERE 字句控制记录是否符合查询要求，不符合则过滤掉

2. 右连接(right join)

select m.columnname hellip; hellip;,n.* columnname hellip;.. from left_table m right join right_table n on m. columnname_join=n. columnname_join and m. columnname=xxx where n.columnname=xxx hellip;..

3. 等值连接

select m.columnname hellip; hellip;,n.* columnname hellip;.. from left_table m [inner] join right_table n on m. columnname_join=n. columnname_join where m.columnname=xxx hellip;.. and n.columnname=xxx hellip;.

或者

select m.columnname hellip; hellip;,n.* columnname hellip;.. from left_table m , right_table n where m. columnname_join=n. columnname_join and m.columnname=xxx hellip;.. and n.columnname=xxx hellip;.

ON 是连接条件，不再与左连接或右连接的功效一样，除了作为 2 表记录匹配的条件外，还会起到过滤记录的作用，若 left_table 中记录无法在 right_table 中找到对应的记录，则会被过滤掉;

WHERE 字句，不管是涉及表 left_table、表 right_table 上的限制条件，还是涉及 2 表连接的条件，都会对记录集起到过滤作用，把不符合要求的记录刷选掉;

jinja2 获取循环索引

jinja2 获取循环 {% for i in n %} 的索引使用 loop.index

{% for i in names %}  tr   td {{ loop.index }} /td  // 当前是第 x 条   td {{ i.name }} /td   /tr  {% endfor %}

flask 重定向和错误

可以用 redirect()函数把用户重定向到其它地方。放弃请求并返回错误代码，用 abort()函数。

from flask import abort, redirect, url_for @app.route(/) def index(): return redirect(url_for( login)) @app.route(/login) def login(): abort(401) this_is_never_executed()

默认情况下，错误代码会显示一个黑白的错误页面。如果你要定制错误页面，可以使用 errorhandler()

装饰器:

from flask import render_template @app.errorhandler(404) def page_not_found(error): return render_template(page_not_found.html), 404

注意 render_template()调用之后的 404。这告诉 Flask，该页的错误代码是 404 ，即没有找到。默认为 200，也就是一切正常。

flask CSRF 防护机制

@app.before_request def csrf_protect(): if request.method ==  POST : token = session.pop( _csrf_token , None) if not token or token != request.form.get(_csrf_token): abort(403) def some_random_string(): return hashlib.sha256(os.urandom(16).hexdigest()) def generate_csrf_token(): if  _csrf_token  not in session: session[ _csrf_token] = some_random_string() return session[ _csrf_token]

在 flask 的全局变量里面注冊上面那个生成随机 token 的函数

app.jinja_env.globals[lsquo;csrf_token rsquo;] = generate_csrf_token

在网页的模板是这么引入的

form method=post action=   input name=_csrf_token type=hidden value= {{ csrf_token() }}

flask 上下文处理器

Flask 上下文处理器自动向模板的上下文中插入新变量。上下文处理器在模板渲染之前运行，并且可以在模板上下文中插入新值。上下文处理器是一个返回字典的函数，这个字典的键值最终将传入应用中所有模板的上下文:

@app.context_processor def inject_user(): return dict(user=g.user)

上面的上下文处理器使得模板可以使用一个名为 user 值为 g.user 的变量。不过这个例子不是很有意思，因为 g 在模板中本来就是可用的，但它解释了上下文处理器是如何工作的。

变量不仅限于值，上下文处理器也可以使某个函数在模板中可用(由于 Python 允许传递函数):

@app.context_processor def utility_processor(): def format_price(amount, currency=u euro;): return u {0:.2f}{1}.format(amount, currency) return dict(format_price=format_price)

上面的上下文处理器使得 format_price 函数在所有模板中可用:

日志记录

handler = logging.FileHandler(lsquo;flask.log rsquo;, encoding= rsquo;UTF-8 prime;)

1、请求之前设置 requestId 并记录日志

每个 URL 请求之前，定义 requestId 并绑定到 g

@app.before_request def before_request(): g.requestId = gen_requestId() logger.info(Start Once Access, and this requestId is %s  % g.requestId)

2、请求之后添加响应头与记录日志

每次返回数据中，带上响应头，包含 API 版本和本次请求的 requestId，以及允许所有域跨域访问 API, 记录访问日志

@app.after_request def add_header(response): response.headers[X-SaintIC-Media-Type] =  saintic.v1  response.headers[X-SaintIC-Request-Id] = g.requestId response.headers[Access-Control-Allow-Origin] =  *  logger.info(json.dumps({  AccessLog : {  status_code : response.status_code,  method : request.method,  ip : request.headers.get( X-Real-Ip , request.remote_addr),  url : request.url,  referer : request.headers.get(Referer),  agent : request.headers.get(User-Agent),  requestId : str(g.requestId), } } )) return response

basicConfig 方法可以满足你在绝大多数场景下的使用需求，但是 basicConfig 有一个很大的缺点。调用 basicConfig 其实是给 root logger 添加了一个 handler(FileHandler)，这样当你的程序和别的使用了 logging 的第三方模块一起工作时，会影响第三方模块的 logger 行为。这是由 logger 的继承特性决定的

logging.basicConfig(level=logging.DEBUG, format= %(asctime)s %(levelname)s %(message)s , datefmt= %a, %d %b %Y %H:%M:%S , filename= logs/pro.log , filemode= w ) logging.debug(dddddddddd)

MySQL 字符编码

除了设置数据库的之外，由于 dataset 默认创建数据库和表的字符集不是 utf8, 所以需要自己设置，否则会中文乱码，所以需要修改表的字符集

my.cnf [client] default-character-set=utf8 [mysqld] character-set-server=utf8 collation-server=utf8_general_ci default-storage-engine=INNODB

表的字符集

show create table tasks; alter table tasks convert to character set utf8;

关于 Dataset 中 SQLAlchemy 如何使用就分享到这里了，希望以上内容可以对大家有一定的帮助，可以学到更多知识。如果觉得文章不错，可以把它分享出去让更多的人看到。

正文完

发表至：数据库

2023-08-03

转载说明：除特殊说明外本站除技术相关以外文章皆由网络搜集发布，转载请注明出处。

如何安装与使用mysql5.7.21

mysql与navicat建立连接出现1251错误的解决方法

如何在Linux上安装MariaDB

MySQL中事务和锁的示例分析

MySQL中怎么实现索引和锁