高可用系列文章之一 - 概述

可用,系列,文章,之一,概述 · 浏览次数 : 175

小编点评

**高可用性概述** **1.1 可用性 (Availability)** 可用性 (Availability) 是一个系统运行质量的重要指标,衡量的是产品在规定的条件下和规定的时刻或时间区间内处于可执行规定功能状态的能力。可用性计算公式如下: **Availability = MTBF / (MTBF + MTTR)** 其中: * **MTBF** 是平均故障间隔时间,衡量的是系统在正常运行情况下平均时间间隔到故障发生之间的平均时间。 * **MTTR** 是平均故障恢复时间,衡量的是系统在故障发生后平均时间恢复运行所需的时间。 **1.2 高可用性实现方式** 高可用性可以采用两种主要模式: * **故障转移 (Fail-over)**:在计算和网络等相关技术中,故障转移是指在先前活动的应用程序、服务器、系统、硬件组件或网络发生故障或异常终止时,切换到备用服务器、系统或网络。 * **冗余 (Redundant)**:在通常的高可用方案中,这两种模式结合起来使用。其中,主服务器用于处理流量,而备用服务器用于处理流量。如果主服务器发生故障,备用服务器会切换到工作服务器的 IP 地址并恢复服务。 **1.3 高可用性目标** 高可用性定义为一个商定的运行性能水平(通常是正常运行时间)高于正常时间。如果用户不能访问系统,从用户的角度来看,系统是不可用的。 **1.4 目标文章** 本文旨在为制造业的系统提供实用参考,以满足其高可用方案标准。以满足这些要求,文章将提供以下内容: * 高可用性的定义 * 高可用性实现方式 * 目标文章的适用范围及要求

正文

一 概述

可用性是系统运行质量的重要指标.

随着数字化和智能化的进程, 系统的可用性愈发重要。例如,制造业流水线需要高可用性的 MES 系统来保证流水线的正常运转。

本文为高可用相关的技术文档, 从以下几个方面对高可用在制造业的应用和实施进行详细描述。

1.1 可用性(Availability)定义

GB/T3187-97 对可用性的定义:

在要求的外部资源得到保证的前提下,产品在规定的条件下和规定的时刻或时间区间内处于可执行规定功能状态的能力。它是产品可靠性、维修性和维修保障性的综合反映。

可用性计算公式:

Availability = MTBF / (MTBF + MTTR)

关于 Availability 这个计算公式, 通常大家习惯用 N 个 9 来表征系统可用性,如 99.9%(3-nines availability),99.999%(5-nines availability)。

📓 一句话概括:

  • 可用性 ─ 每次访问都能收到非错响应

宕机时间(DownTime):

定义: 机器出现故障的停机时间。这里之所以会提 Downtime,是因为使用每年的宕机时间来衡量系统可用性,更符合直觉,更容易理解.

可用性(Availability)和宕机时间(Downtime)的对应关系:

可用性 宕机时间
90% 36.5 天/年
99% 3.65 天/年
99.9% 8.76 小时/年
99.99% 52 分钟/年
99.999% 5 分钟/年
99.9999% 31 秒/年

1.2 高可用(High Availablility)定义

高可用性定义:

高可用性(HA)是系统的一个特性,它的目标是确保一个商定的运行性能水平(通常是正常运行时间)高于正常时间。

如果用户不能访问系统,从用户的角度来看,系统是不可用的。通常,停机时间指的是系统不可用的时间。

1.3 高可用性实现方式

有两种支持高可用性的模式: 故障转移(fail-over)和冗余(redundant)。在通常的高可用方案中, 这2种是结合起来使用.

故障转移:

🔖 定义:

在计算和网络等相关技术中,故障转移是指在先前活动的应用程序、服务器、系统、硬件组件或网络发生故障或异常终止时,切换到冗余或备用计算机服务器、系统、硬件组件或网络。

故障转移又具有多种实现方式, 其中常用的一种为:

主用到备用切换(Active-passive)

关于主用到备用的故障切换流程是,主用服务器发送周期信号给待机中的备用服务器。如果周期信号中断,备用服务器切换成工作服务器的 IP 地址并恢复服务。

宕机时间取决于备用服务器处于「热」待机状态还是需要从「冷」待机状态进行启动。只有主用服务器处理流量。

主用到备用的故障切换也被称为主从切换。

🔖 知识点:

Web 服务器高可用方案中, NGINX 的高可用方案 - NGINX + Keepalived 高可用 就是典型的主从切换.

且备用 NGINX 服务器出于「热」待机状态.

1.4 目标

本文的目标是:

制造业的系统高可用方案标准提供实用参考. 以满足其:

  1. 对已有的系统进行高可用改造;
  2. 对新系统进行高可用架构要求;

二 适用范围及要求

2.1 适用范围

  1. 对可用性指标有强制要求的系统;
  2. 重要系统(如: MES系统);
  3. 技术架构符合下文技术方案描述的系统;

参考文件

参考文件
Availability - Wikipedia
High Availability - Wikipedia
system-design-primer - GitHub

三人行, 必有我师; 知识共享, 天下为公. 本文由东风微鸣技术博客 EWhisper.cn 编写.

与高可用系列文章之一 - 概述相似的内容:

高可用系列文章之一 - 概述

一 概述 可用性是系统运行质量的重要指标. 随着数字化和智能化的进程, 系统的可用性愈发重要。例如,制造业流水线需要高可用性的 MES 系统来保证流水线的正常运转。 本文为高可用相关的技术文档, 从以下几个方面对高可用在制造业的应用和实施进行详细描述。 1.1 可用性(Availability)定义

高可用系列文章之二 - 传统分层架构技术方案

前文链接 高可用系列文章之一 - 概述 - 东风微鸣技术博客 (ewhisper.cn) 三 技术方案 3.1 概述 单点是系统高可用最大的风险和敌人,应该尽量在系统设计的过程中避免单点。 保障系统的高可用, 方法论上,高可用保证的原则是「集群化」(或 「冗余」), 只有一个单点,该单点宕机所有服务

高可用系列文章之三 - NGINX 高可用实施方案

前文链接 高可用系列文章之一 - 概述 - 东风微鸣技术博客 (ewhisper.cn) 高可用系列文章之二 - 传统分层架构技术方案 - 东风微鸣技术博客 (ewhisper.cn) 四 NGINX 高可用实施方案 高可用的实施, 主要步骤概述如下: NGINX 的安装及基础配置 负载均衡层高可用

高可用系列文章之四 - 总结

前文链接 高可用系列文章之一 - 概述 - 东风微鸣技术博客 (ewhisper.cn) 高可用系列文章之二 - 传统分层架构技术方案 - 东风微鸣技术博客 (ewhisper.cn) 高可用系列文章之三 - NGINX 高可用实施方案 - 东风微鸣技术博客 (ewhisper.cn) 六 总结 高

玩转服务器之网站篇:新手使用WordPress搭建博客和静态网站部署

在之前的玩转服务器系列文章里,我们介绍了如何构建小型的高可用环境、PHP、Python、Java web、docker环境部署,以及Node.js SSR应用,本篇文章主要介绍新手也能快速上手的WordPress博客搭建和静态网站部署的教程

[转帖]浅谈系统稳定性与高可用保障的几种思路

https://segmentfault.com/u/dewujishu 一、前言 高并发、高可用、高性能被称为互联网三高架构,这三者都是工程师和架构师在系统架构设计中必须考虑的因素之一。今天我们就来聊一聊三H中的高可用,也是我们常说的系统稳定性。 本篇文章只聊思路,没有太多的深入细节。阅读全文大概

【618备战巡礼】“三高”之第一高--如何打造高可用系统

我们经常会说互联网“三高”,那什么是三高呢?我们常说的三高,高并发、高可用、高性能,这些技术是构建现代互联网应用程序所必需的。对于京东618备战来说,所有的中台系统服务,无疑都是围绕着三高来展开的。对于一个程序员,或多或少都能说出一些跟三高系统有关的技术点,而我本篇文章的目的,就是帮大家系统的梳理一下三高系统中的第一高:高可用性

[转帖]记一次使用gdb诊断gc问题全过程

https://www.cnblogs.com/codelogs/p/17092141.html 简介# 上次解决了GC长耗时问题后,系统果然平稳了许多,这是之前的文章《GC耗时高,原因竟是服务流量小?》然而,过了一段时间,我检查GC日志时,又发现了一个GC问题,如下:从这个图中可以发现,我们GC有

[转帖] 记一次使用gdb诊断gc问题全过程

记一次使用gdb诊断gc问题全过程 原创:扣钉日记(微信公众号ID:codelogs),欢迎分享,转载请保留出处。 简介# 上次解决了GC长耗时问题后,系统果然平稳了许多,这是之前的文章《GC耗时高,原因竟是服务流量小?》然而,过了一段时间,我检查GC日志时,又发现了一个GC问题,如下:从这个图中可

K3S系列文章-使用AutoK3s在腾讯云上安装高可用K3S集群

开篇 《K3s 系列文章》 《Rancher 系列文章》 方案 在腾讯云上安装 K3S 后续会在这套 K3S 集群上安装 Rancher 方案目标 高可用 3 台master 的 k3s 集群 数据备份 k3s 数据备份到 腾讯云对象存储 cos 尽量复用公有云的能力 ~~Tencent Cloud