5步带你入门GaussDB(DWS)的GDS导入导出

入门,gaussdb,dws,gds,导入,导出 · 浏览次数 : 382

小编点评

**GDS导入示例** **步骤 1:创建导入目标表** ```sql CREATE TABLE tpcds_reasons ( r_reason_sk INTEGER NOT NULL, r_reason_id CHAR(16) NOT NULL, r_reason_desc CHAR(100) ); ``` **步骤 2:创建外表** ```sql DROP TABLE IF EXISTS foreign_tpcds_reasons; CREATE FOREIGN TABLE foreign_tpcds_reasons ( r_reason_sk INTEGER NOT NULL, r_reason_id CHAR(16) NOT NULL, r_reason_desc CHAR(100) ) SERVER gsmpp_server OPTIONS ( LOCATION 'gsfs://127.0.0.1:8780/*', FORMAT 'CSV' , DELIMITER ',' ENCODING 'utf8', HEADER 'false', FILL_MISSING_FIELDS 'true', IGNORE_EXTRA_DATA 'true' ); ``` **步骤 3:启动本地 GDSgds** ``` gds -d /input_data/ -D -p ip:port -H address_string -l log_file -D 注意端口号与外表端口号一致 ``` **步骤 4:执行导入** ```sql INSERT INTO [目标表名] SELECT * FROM [foreign table 表名]; ``` **示例** 假设我们有一张名为 `foreign_tpcds_reasons` 的外表,其包含以下数据: | r_reason_sk | r_reason_id | r_reason_desc | |---|---|---| | 1 | abc123 | 这是测试数据 | 我们可以使用以下 SQL 语句将数据导入到 `tpcds_reasons` 表中: ```sql INSERT INTO tpcds_reasons SELECT * FROM foreign_tpcds_reasons; ``` **结果** 导入完成后,`tpcds_reasons` 表将包含以下数据: | r_reason_sk | r_reason_id | r_reason_desc | |---|---|---| | 1 | abc123 | 这是测试数据 | **注意** * 确保您拥有权限来创建和访问目标表。 * 您可以根据需要修改外表的格式信息,例如字段类型。 * 您可以使用 `DBMS_OUTPUT.PUT_LINE` 等函数以检查导入进度。

正文

摘要:本篇文档为使用GDS导入示例的具体简单步骤和示例。

本文分享自华为云社区《带你快速入门GDS导入导出,玩转PB级数仓GaussDB(DWS)》,作者: yd_220527686。

1、创建导入目标表

CREATE TABLE tpcds_reasons
(
 r_reason_sk integer not null,
 r_reason_id char(16) not null,
 r_reason_desc char(100)
);

2、创建与目标表一致的外表

#外表中配置了数据源格式信息、GDS服务的访问信息,从而GaussDB(DWS)最终可以通过外表将数据服务器上的数据引流进数据库实表中。

DROP TABLE IF EXISTS foreign_tpcds_reasons;
CREATE FOREIGN TABLE foreign_tpcds_reasons
(
 r_reason_sk integer not null,
 r_reason_id char(16) not null,
 r_reason_desc char(100)
)
 SERVER gsmpp_server
 OPTIONS
(
LOCATION 'gsfs://127.0.0.1:8780/*',
FORMAT 'CSV' ,
DELIMITER ',',
ENCODING 'utf8',
HEADER 'false',
FILL_MISSING_FIELDS 'true',
IGNORE_EXTRA_DATA 'true'
);

创建成功后可以使用alter修改表的属性,示例如下:

alter foreign table foreign_tpcds_reasons options(set  quote  '"');

3、启动本地gds

gds -d dir -p ip:port -H address_string -l log_file -D

注意端口号与外表端口号一致,示例如下:

gds -d /input_data/ -D -p 127.0.0.1:8780 -l /CodeHub/gds_log.txt -H 0/0 -t 10 -D

4、执行导入

INSERT INTO [目标表名] SELECT * FROM [foreign table 表名];

出现INSERT 0 3类信息表示数据导入成功,示例如下:

INSERT INTO tpcds_reasons SELECT * FROM foreign_tpcds_reasons;

5、tips

设置\set VERBOSITY verbose可看到导入失败的更多信息,包括gauss-00000类型错误码,SQLSTATE,以及HINT等信息

导入数据类型需与外表的各个参数做对应,比如:FORMAT为csv文件,以空格做字段分割,在外表创建时,DELIMITER需以空格为分割符

本篇文档为使用GDS导入示例的具体简单步骤和示例,如需详细介绍及参数说说明,请参考DWS产品文档。

 

点击关注,第一时间了解华为云新鲜技术~

与5步带你入门GaussDB(DWS)的GDS导入导出相似的内容:

5步带你入门GaussDB(DWS)的GDS导入导出

摘要:本篇文档为使用GDS导入示例的具体简单步骤和示例。 本文分享自华为云社区《带你快速入门GDS导入导出,玩转PB级数仓GaussDB(DWS)》,作者: yd_220527686。 1、创建导入目标表 CREATE TABLE tpcds_reasons ( r_reason_sk intege

ONNX Runtime入门示例:在C#中使用ResNet50v2进行图像识别

ONNX Runtime简介 ONNX Runtime 是一个跨平台的推理和训练机器学习加速器。ONNX 运行时推理可以实现更快的客户体验和更低的成本,支持来自深度学习框架(如 PyTorch 和 TensorFlow/Keras)以及经典机器学习库(如 scikit-learn、LightGBM、

深度解读昇腾CANN多流并行技术,提高硬件资源利用率

GE(Graph Engine)图引擎采用多流并行算法,在满足计算图任务内部依赖关系的前提下,支持高效并发执行计算任务,从而大大提高硬件资源利用率和AI计算效率。

BigCodeBench: 继 HumanEval 之后的新一代代码生成测试基准

HumanEval 是一个用于评估大型语言模型 (LLM) 在代码生成任务中的参考基准,因为它使得对紧凑的函数级代码片段的评估变得容易。然而,关于其在评估 LLM 编程能力方面的有效性越来越多的担忧,主要问题是HumanEval 中的任务太简单,可能不能代表真实世界的编程任务。相比于 HumanEv

Nuxt3 的生命周期和钩子函数(六)

摘要:本文深入解析了Nuxt3框架中的多个核心生命周期钩子和组件注册功能,包括imports:sources、imports:extend、imports:context、imports:dirs、components:dirs及components:extend,通过实例代码指导开发者如何在不同场...

manim边学边做--MathTex

上一篇介绍的SingleStringMathTex主要用来显示只有一行的数学公式,对于复杂的数学公式,可以使用MathTex类。 MathTex类继承自SingleStringMathTex,在其基础之上增加了更多的功能。其实,MathTex是制作数学动画时常用的类,反而SingleStringMa

聚类模型的算法性能评价

一、概述 作为机器学习领域的重要内容之一,聚类模型在许多方面能够发挥举足轻重的作用。所谓聚类,就是通过一定的技术方法将一堆数据样本依照其特性划分为不同的簇类,使得同一个簇内的样本有着更相近的属性。依不同的实现策略,聚类算法有很多种,如基于距离的k-means、基于密度的DBSCAN等。在聚类完成之后

英特尔 Gaudi 加速辅助生成

随着模型规模的增长,生成式人工智能的实现需要大量的推理资源。这不仅增加了每次生成的成本,而且还增加了用于满足此类请求的功耗。因此,文本生成的推理优化对于降低延迟、基础设施成本以及功耗都至关重要,其可以改善用户体验并提高文本生成任务的效率。 辅助解码是一种用于加速文本生成的流行方法。我们在英特尔 Ga

Stirling-PDF 安装和使用教程

PDF (便携式文档格式) 目前已经成为了文档交换和存储的标准。然而,找到一个功能全面、安全可靠、且完全本地化的 PDF 处理工具并不容易。很多在线 PDF 工具存在隐私和安全风险,而桌面软件往往价格昂贵或功能有限。那么,有没有一种解决方案能够兼顾功能强大、安全可靠和经济实惠呢? 今天给大家推荐一款

【VyOS-开源篇-3】- container for vyos 搭建 Halo 博客-vyos-开源篇

title: 【Vyos-开源篇-3】- container for vyos 搭建 Halo 博客 date: 2024-01-17 19:41:31.774 updated: 2024-01-18 17:16:06.788 url: https://yangpin.link/archives/1