[转帖]看了阿里云云解析DNS,涨见识了

阿里,云云,解析,dns,见识 · 浏览次数 : 0

小编点评

**阿里云DNS的规模和时延要求** 阿里云DNS是全球规模最庞大的分布式DNS系统,拥有27个Region、63个可用区、243个DNS集群,日解析量超过2万亿次。其时延要求极低,十几毫秒即可完成解析请求。 **保障大规模DNS解析服务的高效运维和高可用性** 1. **目标设置:** - 1分钟发现 - 5分钟定位 - 10分钟解决 2. **基础设计:** - 高可用架构,采用多地域、多数据中心部署的集群。 - 对异常进行快速定位和恢复。 - 采用技术手段,如容错和数据备份。 3. **服务异常处理:** - 快速定位并处理解析服务异常。 - 利用数据分析和预警机制,提前发现和处理异常。 - 提供用户友好的故障排除和错误处理渠道。 4. **技术架构:** - DNS集群采用分布式设计,도록容忍故障并提高可用性。 - 利用多种技术,如负载均衡、缓存和动态路由等,提升解析效率。 - 在解析器之间采用快速数据传输协议,如TCP,确保数据传输效率高。 5. **性能优化:** - 优化DNS数据结构,减少查询请求之间的竞争。 - 利用域名路由技术,根据域名优先级进行查询。 - 优化DNS服务器的资源配置,降低响应时间。

正文

https://www.jianshu.com/p/8354e647cf71

 

在学习这篇文章前,只知道DNS就是做域名解析的,查到域名对应的ip就结束了。没成想惊呆了,DNS还有这么大的规模这么低的时延要求。

阿里云DNS是一个复杂的巨型分布式系统。依托云计算丰富的计算和存储资源和技术,阿里云在全球27个Region,63个可用区,部署了243个DNS集群,日解析量超过2万亿次。

云上DNS解析服务十几毫秒的服务延迟波动,都会直接影响其上的业务服务和用户体验。

阿里云提供了全系列一站式的域名解析服务产品,覆盖了公网域名解析、内网域名解析、全球流量调度、移动解析以及专有云的域名解析场景。在云上部署业务的阿里云用户,其运维的核心要素就是DNS解析服务,一旦DNS解析服务出现波动,将会导致自身业务受到影响。特别是游戏和金融行业的企业,对解析服务质量有着极高要求。

作为日均万亿访问量的阿里云DNS,如何保障大规模的DNS解析服务高效运维和高可用?

1) 为了保证业务稳定性建设,阿里巴巴集团提出了“1-5-10”的目标,即1分钟发现,5分钟定位,10分钟解决。目标有了,实现起来却有一定的难度。

2) 为了保障上层服务满足稳定性的目标,DNS系统作为底层基础设施的重要部分,必须满足更高的稳定性要求。在解析服务方面除了要做到高可用的架构设计和部署外,还需对服务异常实现秒级定位和恢复。

同时也认识到稳定的网络基础服务的是业务连续性的基本保障。在数字经济发展需求的驱动下,企业服务的多样性、技术架构的融合性对DNS寻址调度服务提出新的要求。

后面可以了解下DNS的集群实现原理和如何实现服务异常秒级定位和恢复的。

与[转帖]看了阿里云云解析DNS,涨见识了相似的内容:

[转帖]看了阿里云云解析DNS,涨见识了

https://www.jianshu.com/p/8354e647cf71 在学习这篇文章前,只知道DNS就是做域名解析的,查到域名对应的ip就结束了。没成想惊呆了,DNS还有这么大的规模这么低的时延要求。 阿里云DNS是一个复杂的巨型分布式系统。依托云计算丰富的计算和存储资源和技术,阿里云在全球

[转帖]一个故事看懂CPU的TLB

https://www.cnblogs.com/xuanyuan/p/15347054.html Hi,我是CPU一号车间的阿Q,还记得我吗,真是好久不见了~ 我所在的CPU是一个八核CPU,就有八个工作车间,那运行起来速度杠杆的~ 虚拟地址翻译 一大早,我们一号车间MMU(内存管理单元)部门的小黑

[转帖]TIME_WAIT连接过多解决办法

问题起因: 自己开发了一个服务器和客户端,通过短连接的方式来进行通讯,由于过于频繁的创建连接,导致系统连接数量被占用,不能及时释放。看了一下18888,当时吓到了。 现象: 1、外部机器不能正常连接SSH 2、内向外不能够正常的ping通过,域名也不能正常解析。 问题排查: 通过 netstat -

[转帖]Tomcat参数配置

前言 Tomcat是啥子,想必搜索tomcat配置的小伙伴应该无人不晓,无人不知了吧,但是我还是把官网看了一下有句话: Apache Tomcat software powers numerous large-scale, mission-critical web applications acro

[转帖]PostgreSQL任意命令执行漏洞利用(CVE-2019-9193)

https://zhuanlan.zhihu.com/p/143443516 最近没事曰曰内网,偶然发现了一个使用空密码的pg(是的,连爆破都省了)。用navicat连上去看了下几个库都是一些业务测试数据,没什么好收集;不死心,google了一下发现有个比较新的CVE好像可以操作一下~ 漏洞概述 最

[转帖]JVM metaspace outofmemory

https://www.jianshu.com/p/1ca44f94e42f 解决服务器进程退出问题(metaspace溢出) 现象 策划反应服务器进不去,远程看了一下进程消失了(crash) 有时候也会出现能登录,但是无法执行操作(进程还在),无法被正常shutdown 进程根目录下出现了java

【转帖】Lua,LuaJIT,Luarocks的安装与配置-史上最详细【Linux】

目录 一,lunux下lua安装 二,安装luarocks lua包管理工具 三,LuaJIT的安装 既然各位都点开看了,那么Lua语言不用我介绍了吧,LuaJIT是lua的一个Just-In-Time也就是运行时编译器,就是存储热点代码直接转化为二进制,JIT是一个概念,Java 底层也有JIT编

[转帖]JVM参数之-XX:SurvivorRatio

https://www.cnblogs.com/hellxz/p/10841550.html 最近面试过程中遇到一些问JVM参数的,本着没用过去学习的办法看了些博客写得不准确,参考oracle的文档记录一下,争取每天记录一点知识点 -XX:SurvivorRatio=6 ,设置的是Eden区与每一个

[转帖]redis bigkey 删除问题

一、慢操作分析 redis 的慢操作已经有了,如果没有,我们可以自己去 redis 服务器查看历史的慢日志操作,或者有对应的慢操作监控系统也可以发现问题,这里不做展开。 接下来我们就要看一看为什么这么慢。 看了下项目中的实现代码,结合日志一分析,发现是一个 redis bigkey。 一个 redi

[转帖]Docker 常见问题处理技巧

https://zhuanlan.zhihu.com/p/517495884 1、Docker 迁移存储目录 默认情况系统会将 Docker 容器存放在 /var/lib/docker 目录下 [问题起因] 今天通过监控系统,发现公司其中一台服务器的磁盘快慢,随即上去看了下,发现 /var/lib/