共计 1992 个字符,预计需要花费 5 分钟才能阅读完成。
本篇内容主要讲解“怎么让 Jupyter 支持 SQL 处理”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让丸趣 TV 小编来带大家学习“怎么让 Jupyter 支持 SQL 处理”吧!
现在用 Jupyter 进行数据处理,对数据工作者来说已经不是一个新鲜事情了。然而如何将大量数据导入却是一个比较棘手的事情。大家都知道关系数据库是数据存储的最重要的载体,那么对数据库的支持是 Jupyter 数据科学界一个迫切的需求。
此前 Jupyter 曾发布过一个内核 xeus-sqlite 允许用户直接从 notebook 进行 SQLite 查询。日前 Jupyter 新发布了一个新的项目 xeus-sql,这是对 xeus-sqlite 的扩展,是 Jupyter 的通用数据库访问工具,使用它可以在绝大多数的关系数据库上进行 SQL 查询。
数据库支持
xeus-sql 支持市面上的绝大多数数据,包括:
MySQL
PostgreSQL 的
SQLite3
DB2
Oracle
Firebird
以及支持 ODBC 驱动程序的任何数据库。
为了提供所有这些集成,xeus-sql 依赖 SOCI 库作为项目的主干。SOCI 在统一的 C ++ API 之后抽象所有不同的数据库连接和查询详细信息。xeus-sql 使用 SOCI 和 xeus 将 SQL 功能公开给 Jupyter。
安装
为确保安装正常进行,最好 xeus 在一个全新的 conda 环境中安装。xeus-sql 还需要使用 miniconda 安装,完整的 anaconda 可能会产生冲突。最安全的用法是创建一个以 xeus-sqlminiconda 安装命名的环境:
conda create -n xeus-sql conda activate xeus-sql
从 conda 安装
Conda forge 提供了 MySQL,PostgreSQL 和 SQLite 的打包版本,可以使用 conda 或 mamba 轻松安装它们一键安装,使用 conda 软件包管理器安装 xeus-sql:
conda install xeus-sql jupyterlab -c conda-forge
或者使用 mamba:
mamba install xeus-sql jupyterlab -c conda-forge
或者可以分别安装:
mamba install xeus-sql soci-mysql -c conda-forge mamba install xeus-sql soci-postgresql -c conda-forge mamba install xeus-sql soci-mysql -c conda-forge
不同的 SQL 后端之间存在一些差异,可以参考 xeus-sql 详细文档和示例学习。
使用方法
要连接 MySQ,需要首先安装 xeus-sql 和 soci-mysql,然后用 LOAD 加载连接数据库:
%LOAD mysql db=dbname user=user1 password= Password123#@!
上面 db 数据库名称,user 为连库用户名,password 为用户密码。
连接成功就可以执行数据库命令和 SQL 语句,比如:
show databases; SELECT * FROM test INSERT INTO example VALUES (2, Core) SELECT * FROM example INSERT INTO example VALUES (3, Table)
其他数据库后端也类似:
firebird:
%LOAD firebird service=firebird.fdb user=SYSDBA
postgresql:
%LOAD postgresql dbname=newdvdrental
可视化查询
对于熟悉可视化 SQL 表和查询结果的表形式的用户,Jupyter 的丰富显示系统提供了根据使用的应用程序将它们显示为丰富文本显示还是纯文本显示的选项。
除了显示带有表的查询之外,在还可以直接在 Notebook 中根据查询结果轻松创建 Vega-Lite 图形:
Vega-Lite 是一个功能强大的库可以使用 xeus-sql 从关系数据中创建许多不同的可视化文件。
为了支持此功能,xeus-sql 依赖于 xvega(vega 的 C ++ 后端) 和定制的 Jupyter 魔术来绘制通过 xvega-bindings 实用程序库中实现的微型语言。除了使用迷你语言之外,还可以直接提供可视化的 JSON 规范。
总结
xeus-sql 的推出,让 Jupyter 如虎添翼,可以非常方便数据工作者进行数据处理和可视化。同时对于传统 dba 和数据库用户可以使用 Jupyter 作为一个便捷的数据库客户端。
到此,相信大家对“怎么让 Jupyter 支持 SQL 处理”有了更深的了解,不妨来实际操作一番吧!这里是丸趣 TV 网站,更多相关内容可以进入相关频道进行查询,关注我们,继续学习!