如何查看服务器的Raid缓存等配置的情况

如何,查看,服务器,raid,缓存,配置,情况 · 浏览次数 : 719

小编点评

**Adapter Information Summary:** | Field | Value | |---|---| | Version | 007.1912.0000.0000 | | Operating System | Linux 3.10.0-1160.el7.x86_64 | | Controller | 0 | | Status | Success | | Description | None | | Product Name | AVAGO MegaRAID SAS 9361-8i | | Serial Number | SKB3473897SAS | | Address | 500605b011209ab0 | | Interface | PCI-EDevice Interface | | SAS Bus | SAS-12GBus | | Number of Devices | 1 | | Active Devices | 1 | | RAID Level | RAID-1(1+0) | | dmesg Output | ``` **Note:** The output of the `dmesg` command may vary depending on the RAID configuration.

正文

摘要

最近总遇到同一批机器的IO不一样的情况.
感觉可能跟硬件设备和Raid卡的设置不一样有关系.
所以今天学习研究了下storcli的命令.
希望能够进行一些数据的收集.

Storcli简介

storcli 是LSI公司官方提供的Raid卡管理工具,
storcli已经基本代替了megacli,是一款比较简单易用的小工具。
将命令写成一个个的小脚本,会将使用变得更方便。

注意 LSI已经被高通收购了.
这个软件其实非常强大.
飞腾基于百傲的BIOS其实是没有继承raid卡的,可能还需要单独处理呢.

第一步下载

最新的下载路径
https://docs.broadcom.com/docs-and-downloads/raid-controllers/raid-controllers-common-files/007.1912.0000.0000_Unified_StorCLI.zip

# 注意这个路径ESXi只支持6.0.0以上
# 如果是低版本的可以使用如下版本的安装介质
https://docs.broadcom.com/docs-and-downloads/raid-controllers/raid-controllers-common-files/1.20.15_StorCLI.zip
注意文件比较大 里面包含了很多安装介质

Windows与linux都很简单不在复述


ESXi的安装与简单查看

第一步: 打开ESXi主机的ssh服务.
选中物理机->打开配置->软件->安全配置文件->服务->SSH

第二步: 使用工具连接SSH服务上传文件
Storcli\Unified_storcli_all_os\VMware\VMwareOP\vmware-storcli.vib
或者是低版本的
如果版本不对需要先卸载再进行处理. 
esxcli software vib  remove -n vmware-esx-storcli-1.20.15
esxcli software vib install -v /vmware-storcli-007.0606.0000.0000.vib    --no-sig-check

第三步: 安装
esxcli software vib install -v /vmware-esx-storcli-1.20.15.vib  --no-sig-check
# 注意需要增加 no-sig-check 如果是低版本的. 

查看Raid相关配置

# 说明一下 我拿ESXi5.5 做实验死活不行 6.7没问题. 

cd  /opt/lsi/storcli
./storcli /c0 show

结果简单分析:

Virtual Drives = 1

VD LIST :
=======

--------------------------------------------------------------
DG/VD TYPE  State Access Consist Cache Cac sCC      Size Name 
--------------------------------------------------------------
0/0   RAID6 Optl  RW     Yes     RWTD  -   ON  32.743 TB      
--------------------------------------------------------------

VD=Virtual Drive| DG=Drive Group|Rec=Recovery
Cac=CacheCade|OfLn=OffLine|Pdgd=Partially Degraded|Dgrd=Degraded
Optl=Optimal|dflt=Default|
RO=Read Only|RW=Read Write|HD=Hidden|TRANS=TransportReady
B=Blocked|Consist=Consistent|R=Read Ahead Always|NR=No Read Ahead|
WB=WriteBack |AWB=Always WriteBack|
WT=WriteThrough|C=Cached IO|
D=Direct IO|sCC=Scheduled
Check Consistency

简单猜测
DG/VD disk group 0 和 virtual disk 0 
RAID6 raid类型
Optl Optimal最佳.
Access RW 读写.. 
Cache RWTD Write Through and Direct IO
注意这个基本上是性能最差,但是安全性最好的设置. 

磁盘情况

PD LIST :
=======

-------------------------------------------------------------------------------
EID:Slt DID State DG     Size Intf Med SED PI SeSz Model               Sp Type 
-------------------------------------------------------------------------------
23:0     13 Onln   0 3.637 TB SATA HDD N   N  512B ST4000NM000A-2HZ100 U  -    
23:1     16 Onln   0 3.637 TB SATA HDD N   N  512B ST4000NM000A-2HZ100 U  -    
23:2     12 Onln   0 3.637 TB SATA HDD N   N  512B ST4000NM000A-2HZ100 U  -    
23:3     22 Onln   0 3.637 TB SATA HDD N   N  512B ST4000NM000A-2HZ100 U  -    
23:4     14 Onln   0 3.637 TB SATA HDD N   N  512B ST4000NM000A-2HZ100 U  -    
23:5     17 Onln   0 3.637 TB SATA HDD N   N  512B ST4000NM000A-2HZ100 U  -    
23:6     11 Onln   0 3.637 TB SATA HDD N   N  512B ST4000NM000A-2HZ100 U  -    
23:7     19 Onln   0 3.637 TB SATA HDD N   N  512B ST4000NM000A-2HZ100 U  -    
23:8     15 Onln   0 3.637 TB SATA HDD N   N  512B ST4000NM000A-2HZ100 U  -    
23:9     20 Onln   0 3.637 TB SATA HDD N   N  512B ST4000NM000A-2HZ100 U  -    
23:10    18 Onln   0 3.637 TB SATA HDD N   N  512B ST4000NM000A-2HZ100 U  -    
23:11    21 DHS    0 3.637 TB SATA HDD N   N  512B ST4000NM000A-2HZ100 U  -    
-------------------------------------------------------------------------------

EID=Enclosure Device ID|Slt=Slot No|DID=Device ID|DG=DriveGroup

DHS=Dedicated Hot Spare 
# 注意这个是专用热备盘的意思. 

UGood=Unconfigured Good|GHS=Global Hotspare
UBad=Unconfigured Bad|Sntze=Sanitize|Onln=Online|Offln=Offline|Intf=Interface

Med=Media Type|SED=Self Encryptive Drive|PI=Protection Info
SeSz=Sector Size|Sp=Spun|U=Up|D=Down|T=Transition|F=Foreign
UGUnsp=UGood Unsupported|UGShld=UGood shielded|HSPShld=Hotspare shielded
CFShld=Configured shielded|Cpybck=CopyBack|CBShld=Copyback Shielded
UBUnsp=UBad Unsupported|Rbld=Rebuild


Raid卡的设备情况

Generating detailed summary of the adapter, it may take a while to complete.

CLI Version = 007.1912.0000.0000 Nov 23, 2021
Operating system = VMkernel 6.7.0
Controller = 0
Status = Success
Description = None

Product Name = AVAGO MegaRAID SAS 9361-8i
Serial Number = SKB3473897
SAS Address =  500605b011209ab0
PCI Address = 00:3b:00:00
System Time = 12/10/2022 14:22:29
Mfg. Date = 09/06/21
Controller Time = 12/10/2022 14:25:06
FW Package Build = 24.21.0-0132
BIOS Version = 6.36.00.3_4.19.08.00_0x06180203
FW Version = 4.680.00-8527
Driver Name = lsi_mr3
Driver Version = 7.702.13.00
Current Personality = RAID-Mode 
Vendor Id = 0x1000
Device Id = 0x5D
SubVendor Id = 0x1000
SubDevice Id = 0x9361
Host Interface = PCI-E
Device Interface = SAS-12G
Bus Number = 59
Device Number = 0
Function Number = 0
Domain ID = 0
Security Protocol = None
Drive Groups = 1


设备为0个的情况

很多时候使用命令返回置为0 比如:

CLI Version = 007.1912.0000.0000 Nov 23, 2021
Operating system = Linux 3.10.0-1160.el7.x86_64
Status Code = 0
Status = Success
Description = None
Controller Count = 0

此时可以通过简单的命令来查看Raid的情况:
比如本次的为: INSPUR   PM8204-2GB 
Raid级别为: RAID-1(1+0)
dmesg | grep -i raid
结果为:
[    6.442352] smartpqi 0000:17:00.0: RAID IU Timeout enabled
[    6.465150] smartpqi 0000:17:00.0: added 13:1:0:0 4000000000000000 Direct-Access     INSPUR   LOGICAL VOLUME   SSDSmartPathCap+ En+ RAID-1(1+0) 
[    6.477132] smartpqi 0000:17:00.0: added 13:2:0:0 0000000000000000 RAID              INSPUR   PM8204-2GB       
[    6.478346] scsi 13:2:0:0: RAID              INSPUR   PM8204-2GB       4.11 PQ: 0 ANSI: 5

与如何查看服务器的Raid缓存等配置的情况相似的内容:

如何查看服务器的Raid缓存等配置的情况

摘要 最近总遇到同一批机器的IO不一样的情况. 感觉可能跟硬件设备和Raid卡的设置不一样有关系. 所以今天学习研究了下storcli的命令. 希望能够进行一些数据的收集. Storcli简介 storcli 是LSI公司官方提供的Raid卡管理工具, storcli已经基本代替了megacli,是

[转帖]VMware ESXi虚拟化平台驱动查询

虚拟化平台升级或者增加服务器时,如果驱动不在官方兼容性列表中,容易导致未知问题。出现问题后,即使有售后服务,官方也不进行支持。所以在正式上线之前将驱动升级到官方兼容性列表中,显得尤为重要。 本文将介绍在VMware ESXi 6.7 U3版本下,查询网卡,HBA及RAID卡驱动版本,以及去官方查看兼

Linux系统中如何查看磁盘情况

Linux不像windows系统那样方便的图形界面,特别是作为服务器使用的时候,只有命令行可以使用。 我有个云服务器平时用来做一些数据分享用的,最近想看看磁盘和其中文件的占用情况,于是搜索并学习了一些查看磁盘空间信息的命令,命令虽然简单,但对我自己来说还是有些新的东西值得记录。 1. df 首先,登

[转帖]如何在 60秒内优化提升 Linux 性能?只有 2% 的人知道,还不快来学习~

https://bbs.huaweicloud.com/blogs/379243 【摘要】 如何在 60秒内优化提升 Linux 性能?只有 2% 的人知道 当你发现 Linux 服务器上的系统性能问题,在最开始的 1 分钟时间里,你会查看哪些系统指标呢? Netflix 在 AWS 上有着大规模的

[转帖]Nginx报错404,由于请求处理时间过长

问题复现 近期部门内部有一个应用由于数据量过于庞大,或者说sql优化性能问题,导致查询全量数据时老报错nginx404,后来查看浏览器timing信息,发现其竟然时常达到可怕的2分钟十秒,抛去解决sql优化问题,这里从Nginx端的配置来说如何解决这类问题! 存在的问题 服务器处理请求时间过长,导致

[1036]Linux启动时间分析

简述 今天有同事咨询:项目上有台服务器操作系统启动时间较长,如何分析? 果然,好问题都来自实践。 经过查找,对于所有基于systemd的系统,可以使用systemd-analyze来分析系统启动时间。查看man手册,systemd-analyze blame和 systemd-analyze cri

【Azure 事件中心】如何查看Event Hub的生产者或者是消费者端的IP地址呢?

问题描述 哪些客户端 IP 正在向/从Azure Event Hub发送/接收事件?如何来查看Event Hub的生产者端,消费者端的IP地址呢? 问题解答 如果需要查看Event Hub 服务端的日志,可以在Azure门户上开启诊断日志来查看。默认情况下,我们并不能看见Event Hub的生产者,

【Azure 存储服务】如何查看Storage Account的删除记录,有没有接口可以下载近1天删除的Blob文件信息呢?

问题描述 如何查看Storage Account的删除记录,有没有接口可以下载近1天删除的Blob文件信息呢?因为有时候出现误操作删除了某些Blob文件,想通过查看删除日志来定位被删除的文件信息。 问题解答 如果没有启用Storage Account的软删除功能,则没有办法直接查看近期有删除的Blo

[转帖]linux 上进程被随机kill掉,如何监测和查询;谁杀了我的进程;Who sends a SIGKILL to my process mysteriously on ubuntu server

https://www.cnblogs.com/xuyaowen/p/linux-audit.html 今天跑实验,发现进程被随机kill。咨询了服务器上的其他同学,他们说之前也发生过,一直存在。看来可能有可能不是我自己程序的原因,只能自己动手解决了。 在 Who sends a SIGKILL t

docker 修改运行容器环境变量,如何修改容器中的环境变量env使长期有效

@目录前言第一步:查看Docker Root目录第二步:查到容器的长id(container id)第三步:停止容器第四步:编辑修改环境变量env第五步:重载服务的配置文件第六步:重启docker总结 前言 请各大网友尊重本人原创知识分享,谨记本人博客:南国以南i、 提示:以下是本篇文章正文内容,下