Mysql数据迁徙方法工具的示例分析

52次阅读
没有评论

共计 3946 个字符,预计需要花费 10 分钟才能阅读完成。

这篇文章给大家分享的是有关 Mysql 数据迁徙方法工具的示例分析的内容。丸趣 TV 小编觉得挺实用的,因此分享给大家做个参考,一起跟随丸趣 TV 小编过来看看吧。

数据迁徙是每个后端都会遇到的工作之一,本文介绍了一些常见的数据迁徙方法与工具

mysqldump:数据结构不变的数据迁徙

导出数据

mysqldump -u root -p DATABASE_NAME table_name   dump.sql

恢复数据

mysql -u root -p DATABESE_NAME   dump.sql

或者连接 mysql 客户端

mysql  source dump.sql

使用 pymysql 连接数据库

可以直接用用户名密码连接的数据库

class GeneralConnector:
 def __init__(self, config, return_dic=False):
 self.return_dic = return_dic
 self.config = config
 def __enter__(self):
 self.conn = pymysql.connect(**self.config, port=3306)
 if self.return_dic:
 #  一行数据会变成一个字典
 self.cursor = self.conn.cursor(pymysql.cursors.DictCursor)
 else:
 self.cursor = self.conn.cursor()
 return self.cursor
 def __exit__(self, *args):
 self.cursor.close()
 self.conn.commit()
 self.conn.close()

使用:

# local_db = {
#  user :  root ,
#  passwd :  ,
#  host :  127.0.0.1 ,
#  db :  local_db 
# }
with GeneralConnector(const.local_db, return_dic=True) as cursor:
 cursor.execute(SELECT `col1`, `col2` FROM test;)
 return cursor.fetchall()

连接处于需要 SSH 连接的服务器的数据库

class SSHConnector:
 def __init__(self, server, config, return_dic=False):
 self.return_dic=return_dic
 self.server = server
 self.config = config
 def __enter__(self):
 self.conn = pymysql.connect(**self.config, port=self.server.local_bind_port)
 if self.return_dic:
 #  一行数据会变成一个字典
 self.cursor = self.conn.cursor(pymysql.cursors.DictCursor)
 else:
 self.cursor = self.conn.cursor()
 return self.cursor
 def __exit__(self, *args):
 self.cursor.close()
 self.conn.commit()
 self.conn.close()

使用:

# SERVER = SSHTunnelForwarder(# (remote_host, ssh_port),
# ssh_username=USERNAME,
# ssh_pkey=SSH_KEY,
# ssh_private_key_password=SSH_KEY_PASSWD,
# remote_bind_address=(127.0.0.1 , 3306) # mysql 服务位置
# )
# server_db = {
#  user :  root ,
#  passwd :  ,
#  host :  127.0.0.1 ,
#  db :  server_db 
# }
#  创建一个隧道将服务端的 mysql 绑定到本地 3306 端口
with const.SERVER as server:
 with SSHConnector(server, const.server_db) as cursor:
 cursor.execute(show tables;)
 data = cursor.fetchall()
 print(data)

cursor 的各种操作

1.cursor.execute(sql_statement)

执行一条 sql 语句

2.cursor.fetchall()

获取 cursor 的所有结果,常跟在 select 语句后使用

3.cursor.fetchone()

获取 cursor 的第一条结果

4.cursor.lastrowid

最后一条数据的 id

5.cursor.executemany(insert_statement, data_list)

批量插入一批数据,如

with const.SERVER as server:
 with connector.Connector(server, const.db_1) as cursor:
 cursor.execute(select * from preference)
 preferences = cursor.fetchall()
 with connector.Connector(server, const.db_2) as cursor:
 cursor.executemany(insert into preference (`id`,`theme`,`user_id`) values (%s,%s,%s) ,preferences)

从 cursor 获取 list 类型的结果

cursor.execute(SELECT `name` FROM user;)

直接使用 fetchall(),只能得到 tuple 包裹的数据

cursor.fetchall()
# ((Jack ,), (Ben))

现在希望得到一个 list 结果集,做到像 Django 中 flat=True 那样的效果

有两种方法

列表解析式 (list comprehension)

name_list = [x[0] for x in cursor.fetchall()]

这个方法的缺点在于会先使用 fetchall() 将结果集读到内存,再做列表转换,并不高效。

itertools 工具

name_list = list(itertools.chain.from_iterable(cursor))

推荐使用这个方式,第一它不会将所有结果 fetch 到内存中,第二使用 itertools 生成列表比列表解析式要快

如何在数据迁徙中使用 Django 的 model

需要拷贝 Django 的 settings 文件,删掉不需要的配置,并设置好迁徙目标数据库

需要拷贝用到此 model 的文件

需要在 settings.INSTALLED_APPS 中引入 models.py 文件所在的目录

在迁徙脚本头部启动 Django

import os
import django
import sys
sys.path.append(os.path.dirname(os.path.dirname(os.path.abspath(__file__))))
os.environ.setdefault(DJANGO_SETTINGS_MODULE ,  translate.settings)
django.setup()

通过 SSH 隧道的本地转发实现 Django 连接远程数据库

创建一个 ssh 隧道,将远程数据库映射到本地端口

ssh -L local_port:localhost: remote mysql port   username @ remote host

ssh 连接进行时,可以通过访问本地端口来访问远程数据库

在 Django 的 settings 中配置数据库

DATABASES = {
  default : {
  ENGINE :  django.db.backends.mysql ,
  NAME : db_name,
  USER : remote_mysql_user, #  远程数据库账号密码
  PASSWORD : remote_mysql_password,
  HOST :  localhost ,
  PORT : local_port, #  远程数据库映射到本地的端口
  OPTIONS : {init_command :  SET default_storage_engine=INNODB;}
 }
}

至此,在使用 Django 的 model 时,将通过 ssh 隧道访问远程数据库

注意事项

事先了解迁徙数据量,并且取 5%~10% 的数据测试迁徙速度

由测试数据预估总迁徙用时,如果总迁徙用时大于一小时,一定要把迁徙脚本放到服务器运行,这样迁徙过程不易中断,且服务器性能远比个人电脑更优

尽量使用批量插入减少写数据库的次数,使用 cursor.executemany 或者 Django 的 bulk_create

迁徙过程要写好 log,这样能够知道数据迁徙到了哪一步,如意外终端也能找到断点继续运行

创建时间字段加上 auto_add_now 会自动记录数据的创建时间,在插入数据的时候对这个字段赋值无效

感谢各位的阅读!关于“Mysql 数据迁徙方法工具的示例分析”这篇文章就分享到这里了,希望以上内容可以对大家有一定的帮助,让大家可以学到更多知识,如果觉得文章不错,可以把它分享出去让更多的人看到吧!

正文完
 
丸趣
版权声明:本站原创文章,由 丸趣 2023-08-04发表,共计3946字。
转载说明:除特殊说明外本站除技术相关以外文章皆由网络搜集发布,转载请注明出处。
评论(没有评论)