Django更换数据库和迁移数据方案

django,更换,数据库,迁移,数据,方案 · 浏览次数 : 611

小编点评

**数据库切换方案** **步骤 1:导出原有数据** * 使用 `python manage.py dumpdata` 命令将数据库导出为 JSON 或 XML 文件。 * 将数据库切换到目标数据库 (MySQL 或 PostgreSQL)。 **步骤 2:导入原有数据** * 使用 `python manage.py loaddata` 命令将 JSON 或 XML 文件导入到目标数据库。 **数据库配置** ```python DATABASES = { 'default': db_config['pgsql'], } ``` 其中: * `db_config` 是一个字典,包含数据库配置。 * `default` 是要使用的默认数据库名称。 * `db_config['pgsql']` 是一个字典,包含 PostgreSQL 数据库配置。 **注意** * 如果表之间的约束关系导致数据同步失败,请使用 `--natural-primary` 和 `--natural-foreign` 参数进行数据迁移。 * 使用 `--natural-primary` 将只导出主键,`--natural-foreign` 将导出所有与主键相关的 ForeignKey。 **其他提示** * 使用 `python -Xutf8` 命令在导入数据之前进行编码。 * 使用 `--exclude` 参数确保不导入 `auth.permission` 和 `contenttypes` 数据。 * 使用 `--natural-primary` 和 `--natural-foreign` 参数可以解决 `Duplicate entry` 和 `UnicodeDecodeError` 等错误。 **参考资料** * Django 官方文档:`dumpdata` 和 `loaddata` 命令 *shubhamdipt 的博客文章:数据迁移 * JavaAtPoint 的解决 `UnicodeDecodeError` 错误的文章 * Stack Overflow 的问题:Django dumpdata fails on special characters

正文

前言

双十一光顾着买东西都没怎么写文章,现在笔记里还有十几篇半成品文章没写完…

今天来分享一下 Django 项目切换数据库和迁移数据的方案,网络上找到的文章方法不一,且使用中容易遇到各类报错,本文根据 Django 官方文档和工作中的经验,稳定可靠,在博客中长期更新~

如果你遇到同样的问题,阅读本文应该能得到比较好的解决方案。

基本步骤

Django 默认使用 SQLite 数据库方便开发,同时其 ORM 支持多种数据库,只要安装对应的驱动就行。

切换数据库一般是将开发环境的 SQLite 切换到 MySQL (MariaDB) 或 PostgreSql ,本文只测试了从 SQLite 到 MySQL / PostgreSQL,同理,其他切换路径也是可以的。

数据库的表结构没啥问题,使用 Django 的 migrate 功能就行了

关键在于数据迁移,可以使用 Navicat 之类的数据库工具进行数据同步,但往往会因为表之间的约束关系导致同步失败(要求按特定顺序导入数据)。

所以最好的方法是使用 Django 的 dumpdata 功能,将数据库导出为 json 或 xml 文件,然后切换数据库再导入。

步骤如下:

  • 导出原有数据: python manage.py dumpdata -o db.json
  • 在目标数据库(MySQL / PostgreSql)里创建一个空的库
  • settings.py 里切换到新的数据库
  • 建立新的数据库表结构 python manage.py migrate
  • 导入原有数据: python manage.py loaddata db.json

搞定~

附上几种数据库配置,方便使用

db_config = {
    'sqlite': {
        'ENGINE': 'django.db.backends.sqlite3',
        'NAME': os.path.join(BASE_DIR, 'db.sqlite3'),
        'OPTIONS': {
            'timeout': 20,
        }
    },
    'pgsql': {
        'ENGINE': 'django.db.backends.postgresql',
        'NAME': '数据库名称',
        'USER': '用户名',
        'PASSWORD': '密码',
        'HOST': '数据库服务器地址',
        'PORT': 5432,
    },
    'mysql': {
        'ENGINE': 'django.db.backends.mysql',
        'NAME': '数据库名称',
        'USER': '用户名',
        'PASSWORD': '密码',
        'HOST': '数据库服务器地址',
        'PORT': 3306,
    }
}
# 这里可以方便切换不同数据库
DATABASES = {'default': db_config['pgsql']}

其中:

  • MySQL 需要安装 mysqlclient
  • PostgreSql 需要安装 psycopg2

然后,事情往往没有这么简单和顺利,导出导入的过程中可能会遇到一些问题,请继续看~

导出报错

报错信息

CommandError: Unable to serialize database: 'gbk' codec can't encode character '\u30fb' in position 4: illegal multibyte sequence

原因跟编码有关

解决方法

使用 Python 的 UTF-8 模式导出数据就没问题

用这个命令导出文件

(不导出 auth.permissioncontenttypes ,这俩在 migrate 时会自动生成,这样避免了导入原有数据时冲突)

python -Xutf8 manage.py dumpdata --exclude auth.permission --exclude contenttypes > db.json

或者

python -Xutf8 manage.py dumpdata -o db.json

导入过程出错解决

报错1: Duplicate entry

报错信息

django.db.utils.IntegrityError: Problem installing fixture 'db.json'  Could not load contenttypes.ContentType(pk=15): (1062, "Duplicate entry 'xxx' for key 'django_content_type.django_content_type_app_label_model_76bd3d3b_uniq'")

解决方法一: 重新导出数据

加上这俩参数

  • --natural-primary: Omits the primary key in the serialized data of this object since it can be calculated during deserialization.
  • --natural-foreign: Uses the natural_key() model method to serialize any foreign key and many-to-many relationship to objects of the type that defines the method.

作用是导出的时候去除一些约束,导入时会自动处理,减少导入时因为表之间约束关系的问题

python3 manage.py dumpdata --natural-primary --natural-foreign -o db.json

解决方法二: 删除 content_type 数据

另一种思路,把 migrate 过程产生的初始化数据删了,避免导入时和原有数据冲突

先进入 python shell

python3 manage.py shell

输入以下Python代码执行

from django.contrib.contenttypes.models import ContentType
ContentType.objects.all().delete()

报错2: 编码错误

报错信息

UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xff in position 0: invalid start byte in Django

解决方法一: 使用 Python 的 UTF8 模式(推荐)

在导入命令前面加上 -Xutf8 参数

python -Xutf8 manage.py loaddata db.json

解决方案二: 魔改 Django 代码

能用,但不推荐,实在没办法再来试这个方法

修改文件

lib\site-packages\django\core\serializers\json.py

Deserializer 方法中找到这行代码

stream_or_string = stream_or_string.decode()

改成这样

stream_or_string = stream_or_string.decode('UTF-16')

再进行导入操作

参考资料

与Django更换数据库和迁移数据方案相似的内容:

Django更换数据库和迁移数据方案

前言 双十一光顾着买东西都没怎么写文章,现在笔记里还有十几篇半成品文章没写完… 今天来分享一下 Django 项目切换数据库和迁移数据的方案,网络上找到的文章方法不一,且使用中容易遇到各类报错,本文根据 Django 官方文档和工作中的经验,稳定可靠,在博客中长期更新~ 如果你遇到同样的问题,阅读本

Python Web:Django、Flask和FastAPI框架对比

Django、Flask和FastAPI是Python Web框架中的三个主要代表。这些框架都有着各自的优点和缺点,适合不同类型和规模的应用程序。 1. Django: Django是一个全功能的Web框架,它提供了很多内置的应用程序和工具,使得开发Web应用程序更加容易。Django采用了MTV(

项目完成小结 - Django-React-Docker-Swag部署配置

前言 最近有个项目到一段落,做个小结记录。 内容可能会多次补充,在博客上实时更新哈~ 如果是在公众号阅读这篇文章,可以点击「查看原文」访问最新版本~ 这个项目是前后端分离,后端为了快,依然用我的DjangoStarter框架。前端一开始是小程序,后面突然换成公众号H5的形式,还好我用了Taro,大差

Python web 框架对比:Flask vs Django

哈喽大家好,我是咸鱼 今天我们从几个方面来比较一些现在流行的两个 python web 框架——Flask 和 Django,突出它们的主要特性、优缺点和简单案例 到最后,大家将更好地了解哪个框架更适合自己的特定需求 参考链接:https://djangocentral.com/flask-vs-d

django基础

一、学期准备 安装Django pip install django==5.0.3 , 安装pycharm专业版 二、第一个django项目 命令行方式创建:打开终端,使用命令:django-admin startproject 【项目名称】即可创建。 django-admin startproje

Django性能优化:提升加载速度

title: Django性能优化:提升加载速度 date: 2024/5/20 20:16:28 updated: 2024/5/20 20:16:28 categories: 后端开发 tags: 缓存策略 HTTP请求 DNS查询 CDN分发 前端优化 服务器响应 浏览器缓存 第一章:Djan

深入Django项目实战与最佳实践

title: 深入Django项目实战与最佳实践 date: 2024/5/19 21:41:38 updated: 2024/5/19 21:41:38 categories: 后端开发 tags: Django 基础 项目实战 最佳实践 数据库配置 静态文件 部署 高级特性 第一章:Django

Django测试与持续集成:从入门到精通

title: Django测试与持续集成:从入门到精通 date: 2024/5/18 16:38:41 updated: 2024/5/18 16:38:41 categories: 后端开发 tags: Django 测试 CI/CD 优化 部署 监控 迭代 第1章:Django测试基础 1.1

Django 自定义管理命令:从入门到高级

title: Django 自定义管理命令:从入门到高级 date: 2024/5/16 18:34:29 updated: 2024/5/16 18:34:29 categories: 后端开发 tags: Django 自定义命令 入门教程 高级技巧 命令创建 命令使用 自定义管理 第 1 章

Django信号与扩展:深入理解与实践

title: Django信号与扩展:深入理解与实践 date: 2024/5/15 22:40:52 updated: 2024/5/15 22:40:52 categories: 后端开发 tags: Django 信号 松耦合 观察者 扩展 安全 性能 第一部分:Django信号基础 Djan