与#数据#相关的内容第31页 - PmDaddy

全部分类数据库前端云计算

架构师日记-为什么数据一致性那么难

在现代大型分布式软件系统中，有一个绕不过去的课题，那就是如何保证系统的数据一致性。数据一致性保障为什么难呢？

架构师日记-从数据库发展历程到数据结构设计探析

本文针对数据存储相关名词概念进行了解释，重点介绍了数据库技术的发展史。为了丰富文章的可读性以及实用性，又从数据结构设计层面进行了部分技术实战能力的外延扩展，阐述了拉链表，位运算，环形队列等相关数据结构在软件开发领域的应用，希望本文给你带来收获。

Elasticsearch与Clickhouse数据存储对比

Elasticsearch的查询语句维护成本较高、在聚合计算场景下出现数据不精确等问题。Clickhouse是列式数据库，列式型数据库天然适合OLAP场景，类似SQL语法降低开发和学习成本，采用快速压缩算法节省存储成本，采用向量执行引擎技术大幅缩减计算耗时。所以做此对比，进行Elasticsearch切换至Clickhouse工作。

手牵手带你实现mini-vue

Vue 的双向数据绑定实现原理是什么样的，如果让我们自己去实现一个这样的双向数据绑定要怎么做呢，本文就与大家分享一下 Vue 的绑定原理及其简单实现

一种实现Spring动态数据源切换的方法

## 1 目标不在现有查询代码逻辑上做任何改动，实现dao维度的数据源切换（即表维度） ## 2 使用场景节约bdp的集群资源。接入新的宽表时，通常uat验证后就会停止集群释放资源，在对应的查询服务器uat环境时需要查询的是生产库的表数据（uat库表因为bdp实时任务停止，没有数据落入），只进行

一种读取亿级doris数据库的方法

工作中，常常需要将线上doris同步至集市。读取doris数据同读取常规mysql基本相同。如果数据行小于千万，比较简单的方式直接单节点连接、读取和存储。

TiDB简述及TiKV的数据结构与存储

本文主要从TiDB的各类组件为起点，了解它的基础架构，并重点分析它在存储架构方面的设计，探究其如何组织数据，Table中的每行记录是如何在内存和磁盘中进行存储的。

一种配置化的数据脱敏与反脱敏框架实现

在业务量日益剧增的背景下，大量数据在各种业务活动中产生，数据安全控制一直是治理的重要环节，数据脱敏属于安全控制的范畴。对互联网公司来说，数据安全一直是极为重视和敏感的话题

GPT-4助力数据分析：提升效率与洞察力的未来关键技术

ChatGPT-4作为一种先进的自然语言处理技术，为数据分析带来了革命性的提升，助力企业和组织更高效地挖掘数据价值。本文将探讨ChatGPT-4在数据分析中的应用，以及如何通过该技术提高数据分析的效率和洞察力。

Hutool：一行代码搞定数据脱敏

本文主要介绍了数据脱敏的相关内容，首先介绍了数据脱敏的概念，在此基础上介绍了常用的数据脱敏规则；随后介绍了本文的重点Hutool工具及其使用方法，在此基础上进行了实操，分别演示了使用DesensitizedUtil工具类、配合Jackson通过注解的方式完成数据脱敏；最后，介绍了一些常见的数据脱敏方法，并附上了对应的教程链接供大家参考，本文内容如有不当之处，还请大家批评指正。

Django更换数据库和迁移数据方案

前言双十一光顾着买东西都没怎么写文章，现在笔记里还有十几篇半成品文章没写完… 今天来分享一下 Django 项目切换数据库和迁移数据的方案，网络上找到的文章方法不一，且使用中容易遇到各类报错，本文根据 Django 官方文档和工作中的经验，稳定可靠，在博客中长期更新~ 如果你遇到同样的问题，阅读本

C#移除字符串中的不可见Unicode字符

背景最近发现某个数据采集的系统拿下来的数据，有些字段的JSON被莫名截断了，导致后续数据分析的时候解析JSON失败。类似这样 {"title": "你好或者这样，多了个双引号啥的 {"title":""你好"} 因为数据库是Oracle，起初以为是Oracle这老古董出问题了，结果一番折腾，把

零拷贝技术：减少数据复制和上下文切换，提高网络传输效率（上）

在本次讨论中，我们确实只是提到了DMA技术在文件传输过程中的重要作用，并对零拷贝技术进行了简要介绍。然而，网络传输中存在的问题和优化方法是一个庞大的话题，涉及到诸多方面。因此，我决定将这些问题的详细讨论留到下一篇文章中，以便更全面地探讨网络传输的优化。我希望通过这样的讨论，能够为读者提供有益的信息和思路，感谢大家的阅读和关注，期待在下一篇文章中与大家再次交流和分享关于网络传输的优化问题。

零拷贝技术：减少数据复制和上下文切换，提高网络传输效率（下）

本章节主要讨论了如何通过零拷贝技术来优化文件传输的性能。零拷贝技术主要通过减少用户态和内核态之间的上下文切换次数和数据拷贝次数来提高性能。具体来说，介绍了两种实现零拷贝的方式：mmap + write和sendfile。使用mmap + write可以减少一次数据拷贝过程，而使用sendfile系统调用可以进一步减少系统调用和数据拷贝次数。此外，还介绍了如果网卡支持SG-DMA技术，可以通过DMA将数据直接拷贝到网卡缓冲区，实现真正的零拷贝。通过这些优化方法，可以显著提高文件传输的性能。

网络协议的重要性与应用：理解进程间通信和网络分层结构（下）

这篇文章概括了数据链路层和物理层在网络通信中的作用和功能。数据链路层负责为网络层提供链路级别的传输服务，通过MAC地址标识设备，并在链路上进行数据传输。物理层将数据包转换为电信号，在物理媒介中传输。不同的物理媒介包括双绞铜线、同轴电缆和光纤，它们都被用于实现高效的数据传输和通信。

万字长文详述ClickHouse在京喜达实时数据的探索与实践

在引入ClickHouse过程中经历各种困难，耗费大量精力去探索并一一解决，在这里记录一下希望能够给没有接触过ClickHouse的同学提供一些方向上的指引避免多走弯路，如果文中有错误也希望多包含给出指点，欢迎大家一起讨论ClickHouse相关的话题。本文偏长但全是干货，请预留40~60分钟进行阅读。

MySQL 分表查询

分表是一种数据库分割技术，用于将大表拆分成多个小表，以提高数据库的性能和可管理性。在MySQL中，可以使用多种方法进行分表，例如基于范围、哈希或列表等。下面将详细介绍MySQL如何分表以及分表后如何进行数据查询。基于哈希的分表基于哈希的分表是一种将数据分散到多个子表中的数据库分表策略。这种方法通

一个比 Redis 性能更强的数据库

给大家推荐一个比Redis性能更强的数据：KeyDB KeyDB是Redis的高性能分支，侧重于多线程、内存效率和高吞吐量。除了性能改进外，KeyDB还提供主动复制、闪存和子密钥过期等功能。KeyDB具有MVCC架构，允许您在不阻塞数据库和降低性能的情况下执行密钥和扫描等查询。 KeyDB与Redi

Pandas 加载数据的方法和技巧

哈喽大家好，我是咸鱼相信小伙伴们在学习 python 数据分析的过程中或多或少都会听说或者使用过 pandas pandas 是 python 的一个拓展库，常用于数据分析今天咸鱼将介绍几个关于 pandas 导入数据的方法和技巧 ## 从 URL 获取 csv 数据关于 pandas 导入

【Azure 存储服务】存储在Azure Storage Table中的数据，如何按照条件进行删除呢？

问题描述如何按条件删除 Storage Table 中的数据，如果Table中有大量的条记录需要删除，Java代码如何按条件删除 Table中的数据(Entity)? （通过Azure Storage Explorer工具是可以删除，但是由于数据量太大，人工操作耗时太久，所以需要使用Java代码完

# 热门排行

微软 New Bing AI 申请与使用保姆级教程（免魔法） ChatGPT API使用介绍 ChatGPT开发实战一篇带你了解如何使用纯前端类Excel表格构建现金流量表手把手教你玩转 Excel 数据透视表为什么 C# 可能是最好的第一编程语言 .NET 入门到高级路线提高工作效率的神器：基于前端表格实现Chrome Excel扩展插件 React + Springboot + Quartz，从0实现Excel报表自动化用Echarts实现前端表格引用从属关系可视化