怎么理解PostgreSQL12 COPY和bulkloading有什么特性

62次阅读
没有评论

共计 2015 个字符,预计需要花费 6 分钟才能阅读完成。

本篇内容主要讲解“怎么理解 PostgreSQL12 COPY 和 bulkloading 有什么特性”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让丸趣 TV 小编来带大家学习“怎么理解 PostgreSQL12 COPY 和 bulkloading 有什么特性”吧!

业务是否依赖 COPY 命令加载数据?PostgreSQL12 提供了一个新特性,大大加快了加载速度。

COPY:Loading and unloading data as fast as possible

细看 PostgreSQL12 的 COPY 语法,发现有两处变动:

1)\h 会有手册文档链接

2)COPY 支持 WHERE 条件

下面是完整语法:

db12=# \h COPY
Command: COPY
Description: copy data between a file and a table
Syntax:
COPY table_name [ ( column_name [, ...] ) ]
 FROM {  filename  | PROGRAM  command  | STDIN }
 [ [ WITH ] ( option [, ...] ) ]
 [ WHERE condition ]
COPY { table_name [ ( column_name [, ...] ) ] | ( query ) }
 TO {  filename  | PROGRAM  command  | STDOUT }
 [ [ WITH ] ( option [, ...] ) ]
where option can be one of:
 FORMAT format_name
 FREEZE [ boolean ]
 DELIMITER  delimiter_character 
 NULL  null_string 
 HEADER [ boolean ]
 QUOTE  quote_character 
 ESCAPE  escape_character 
 FORCE_QUOTE { ( column_name [, ...] ) | * }
 FORCE_NOT_NULL ( column_name [, ...] )
 FORCE_NULL ( column_name [, ...] )
 ENCODING  encoding_name 
URL: https://www.postgresql.org/docs/12/sql-copy.html

虽然添加文档链接功能带来便利,但是 WHERE 过滤功能更加有用。这个功能的目的是什么?当前,COPY 只能导入整个文件。但是某些场景下会有问题:很多场景下,人们只想加载数据的一个子集,并且在导出前必须编写大量代码进行过滤。

COPY…WHERE:  导入时过滤

PostgreSQL 通过该条件可以轻松地进行过滤。下面讲述一个简单的例子:

db12=# CREATE TABLE t_demo AS
 SELECT * FROM generate_series(1, 1000) AS id;
SELECT 1000

首先先插入 1000 行数据,然后导出到一个文件:

db12=# COPY t_demo TO  /tmp/file.txt 
COPY 1000

最后,再重新导入数据:

db12=# CREATE TABLE t_import (x int);
CREATE TABLE
db12=# COPY t_import FROM  /tmp/file.txt  WHERE x   5;
COPY 4
db12=# SELECT * FROM t_import;
 x
 1
 2
 3
 4
(4 rows)

如上说是,过滤数据非常简单直接。需要注意,导出列是“id”,导入列是“x”。文件文件不知道导入表的表结构 — 需要确保过滤导入表的列名。

其他特性

COPY 可以将数据发送到 UNIX pipe,还可以从 pipe 中读取数据。如下所示:

db12=# COPY t_demo TO PROGRAM  gzip -c   /tmp/file.txt.gz 
COPY 1000
db12=# COPY t_import FROM PROGRAM  gunzip -c /tmp/file.txt.gz 
 WHERE x BETWEEN 100 AND 103;
COPY 4
db12=# SELECT * FROM t_import WHERE x  = 100;
 x 
-----
 100
 101
 102
 103
(4 rows)

某些场景下,不止想将数据导出。上面场景,我们想导出数据时将数据压缩;导入时将数据解压并过滤。如上所示,这种方法非常简单。

到此,相信大家对“怎么理解 PostgreSQL12 COPY 和 bulkloading 有什么特性”有了更深的了解,不妨来实际操作一番吧!这里是丸趣 TV 网站,更多相关内容可以进入相关频道进行查询,关注我们,继续学习!

正文完
 
丸趣
版权声明:本站原创文章,由 丸趣 2023-07-24发表,共计2015字。
转载说明:除特殊说明外本站除技术相关以外文章皆由网络搜集发布,转载请注明出处。
评论(没有评论)