Mysql数据迁徙方法工具的示例分析

161次阅读

共计 3946 个字符，预计需要花费 10 分钟才能阅读完成。

这篇文章给大家分享的是有关 Mysql 数据迁徙方法工具的示例分析的内容。丸趣 TV 小编觉得挺实用的，因此分享给大家做个参考，一起跟随丸趣 TV 小编过来看看吧。

数据迁徙是每个后端都会遇到的工作之一，本文介绍了一些常见的数据迁徙方法与工具

mysqldump：数据结构不变的数据迁徙

导出数据

mysqldump -u root -p DATABASE_NAME table_name   dump.sql

恢复数据

mysql -u root -p DATABESE_NAME   dump.sql

或者连接 mysql 客户端

mysql  source dump.sql

使用 pymysql 连接数据库

可以直接用用户名密码连接的数据库

class GeneralConnector:
 def __init__(self, config, return_dic=False):
 self.return_dic = return_dic
 self.config = config
 def __enter__(self):
 self.conn = pymysql.connect(**self.config, port=3306)
 if self.return_dic:
 #  一行数据会变成一个字典
 self.cursor = self.conn.cursor(pymysql.cursors.DictCursor)
 else:
 self.cursor = self.conn.cursor()
 return self.cursor
 def __exit__(self, *args):
 self.cursor.close()
 self.conn.commit()
 self.conn.close()

使用：

# local_db = {
#  user :  root ,
#  passwd :  ,
#  host :  127.0.0.1 ,
#  db :  local_db 
# }
with GeneralConnector(const.local_db, return_dic=True) as cursor:
 cursor.execute(SELECT `col1`, `col2` FROM test;)
 return cursor.fetchall()

连接处于需要 SSH 连接的服务器的数据库

class SSHConnector:
 def __init__(self, server, config, return_dic=False):
 self.return_dic=return_dic
 self.server = server
 self.config = config
 def __enter__(self):
 self.conn = pymysql.connect(**self.config, port=self.server.local_bind_port)
 if self.return_dic:
 #  一行数据会变成一个字典
 self.cursor = self.conn.cursor(pymysql.cursors.DictCursor)
 else:
 self.cursor = self.conn.cursor()
 return self.cursor
 def __exit__(self, *args):
 self.cursor.close()
 self.conn.commit()
 self.conn.close()

使用：

# SERVER = SSHTunnelForwarder(# (remote_host, ssh_port),
# ssh_username=USERNAME,
# ssh_pkey=SSH_KEY,
# ssh_private_key_password=SSH_KEY_PASSWD,
# remote_bind_address=(127.0.0.1 , 3306) # mysql 服务位置
# )
# server_db = {
#  user :  root ,
#  passwd :  ,
#  host :  127.0.0.1 ,
#  db :  server_db 
# }
#  创建一个隧道将服务端的 mysql 绑定到本地 3306 端口
with const.SERVER as server:
 with SSHConnector(server, const.server_db) as cursor:
 cursor.execute(show tables;)
 data = cursor.fetchall()
 print(data)

cursor 的各种操作

1.cursor.execute(sql_statement)

执行一条 sql 语句

2.cursor.fetchall()

获取 cursor 的所有结果，常跟在 select 语句后使用

3.cursor.fetchone()

获取 cursor 的第一条结果

4.cursor.lastrowid

最后一条数据的 id

5.cursor.executemany(insert_statement, data_list)

批量插入一批数据，如

with const.SERVER as server:
 with connector.Connector(server, const.db_1) as cursor:
 cursor.execute(select * from preference)
 preferences = cursor.fetchall()
 with connector.Connector(server, const.db_2) as cursor:
 cursor.executemany(insert into preference (`id`,`theme`,`user_id`) values (%s,%s,%s) ,preferences)

从 cursor 获取 list 类型的结果

cursor.execute(SELECT `name` FROM user;)

直接使用 fetchall()，只能得到 tuple 包裹的数据

cursor.fetchall()
# ((Jack ,), (Ben))

现在希望得到一个 list 结果集，做到像 Django 中 flat=True 那样的效果

有两种方法

列表解析式 (list comprehension)

name_list = [x[0] for x in cursor.fetchall()]

这个方法的缺点在于会先使用 fetchall() 将结果集读到内存，再做列表转换，并不高效。

itertools 工具

name_list = list(itertools.chain.from_iterable(cursor))

推荐使用这个方式，第一它不会将所有结果 fetch 到内存中，第二使用 itertools 生成列表比列表解析式要快

如何在数据迁徙中使用 Django 的 model

需要拷贝 Django 的 settings 文件，删掉不需要的配置，并设置好迁徙目标数据库

需要拷贝用到此 model 的文件

需要在 settings.INSTALLED_APPS 中引入 models.py 文件所在的目录

在迁徙脚本头部启动 Django

import os
import django
import sys
sys.path.append(os.path.dirname(os.path.dirname(os.path.abspath(__file__))))
os.environ.setdefault(DJANGO_SETTINGS_MODULE ,  translate.settings)
django.setup()

通过 SSH 隧道的本地转发实现 Django 连接远程数据库

创建一个 ssh 隧道，将远程数据库映射到本地端口

ssh -L local_port:localhost: remote mysql port   username @ remote host

ssh 连接进行时，可以通过访问本地端口来访问远程数据库

在 Django 的 settings 中配置数据库

DATABASES = {
  default : {
  ENGINE :  django.db.backends.mysql ,
  NAME : db_name,
  USER : remote_mysql_user, #  远程数据库账号密码
  PASSWORD : remote_mysql_password,
  HOST :  localhost ,
  PORT : local_port, #  远程数据库映射到本地的端口
  OPTIONS : {init_command :  SET default_storage_engine=INNODB;}
 }
}

至此，在使用 Django 的 model 时，将通过 ssh 隧道访问远程数据库

注意事项

事先了解迁徙数据量，并且取 5%~10% 的数据测试迁徙速度

由测试数据预估总迁徙用时，如果总迁徙用时大于一小时，一定要把迁徙脚本放到服务器运行，这样迁徙过程不易中断，且服务器性能远比个人电脑更优

尽量使用批量插入减少写数据库的次数，使用 cursor.executemany 或者 Django 的 bulk_create

迁徙过程要写好 log，这样能够知道数据迁徙到了哪一步，如意外终端也能找到断点继续运行

创建时间字段加上 auto_add_now 会自动记录数据的创建时间，在插入数据的时候对这个字段赋值无效

感谢各位的阅读！关于“Mysql 数据迁徙方法工具的示例分析”这篇文章就分享到这里了，希望以上内容可以对大家有一定的帮助，让大家可以学到更多知识，如果觉得文章不错，可以把它分享出去让更多的人看到吧！

正文完

_ __ a ab al

发表至：数据库

2023-08-04

转载说明：除特殊说明外本站除技术相关以外文章皆由网络搜集发布，转载请注明出处。

PLSQL developer12汉化的示例分析

mysql语句中有哪些查询技巧

SQLServer中merge函数如何使用

Oracle性能问题排查自动化脚本怎么写

如何修复Mac brew安装mongodb报 Error: No available formula with the name ‘mongodb’ 问题