首页 (零收费)AIX系统日常维护与故障的解决

(零收费)AIX系统日常维护与故障的解决

举报
开通vip

(零收费)AIX系统日常维护与故障的解决IBMSystems&TechnologyGroup©2006IBMCorporationAIX日常维护与故障的处理*IBMSystems&TechnologyGroup©2003IBMCorporation* 第一章:日常维护部分1、AIX系统管理日常健康检查2、AIX系统日常管理常用操作 第二章:故障处理部分1、硬件故障的定位与排除2、系统故障的处理方法3、HACMP双机系统故障排错 第三章:备份与恢复 第四章:性能监控与优化 概要IBMSystems&Techn...

(零收费)AIX系统日常维护与故障的解决
IBMSystems&TechnologyGroup©2006IBMCorporationAIX日常维护与故障的处理*IBMSystems&TechnologyGroup©2003IBMCorporation* 第一章:日常维护部分1、AIX系统管理日常健康检查2、AIX系统日常管理常用操作 第二章:故障处理部分1、硬件故障的定位与排除2、系统故障的处理方法3、HACMP双机系统故障排错 第三章:备份与恢复 第四章:性能监控与优化 概要IBMSystems&TechnologyGroup©2006IBMCorporation第一章:日常维护部分IBMSystems&TechnologyGroup©2003IBMCorporation*AIX系统的日常维护AIX系统管理日常健康检查与监控*IBMSystems&TechnologyGroup©2003IBMCorporation*AIX系统管理日常健康检查与监控 机房环境检查 电源线的母头是否为左零右火电压值是否为240V 零地电压是否小于1V 温度(摄氏℃) 10℃-40℃ 湿度(%) 8%-80% 查看硬件情况 检查设备故障灯,一般为红色或黄色报警灯常亮。 有没有异常声响,如硬盘、风扇等。 有没有破损的电缆等*IBMSystems&TechnologyGroup©2003IBMCorporation*AIX系统管理日常健康检查与监控 检查文件系统 查看有没有“满”的文件系统。文件系统满可导致系统不能正常工作,尤其是AIX的基本文件系统。如/(根文件系统)满则会导致用户不能登录。 #df-k (查看AIX的基本文件系统)Filesystem1024-blocksFree%UsedIused%IusedMountedon/dev/hd424576145295%259922%//dev/hd26144002806896%2296715%/usr/dev/hd9var8192454045%64932%/var/dev/hd31679361579686%891%/tmp/dev/hd116384533268%140235%/home*IBMSystems&TechnologyGroup©2003IBMCorporation*AIX系统管理日常健康检查与监控 除/usr文件系统,其他文件系统都不应太满,一般不超过80%。 处理方法1:找出(删除)垃圾文件 #du-sk*|sort–rn|head 查找出当前目录下占空间最大的子目录,逐层往下直到找出占空间最大的文件。(要区分哪些目录是文件系统的mountpoint,哪些是文件系统的子目录)删除文件,释放空间。有时删除文件后空间并不马上释放,这是由于你删除的文件正被某个程序打开。只有当这个程序停止后空间才释放,有时甚至需要重起系统。IBMSystems&TechnologyGroup©2003IBMCorporation* 处理方法2:增加文件系统大小 #smittychfs 文件系统可以在任何时候加大,前提是卷组(VG)中有剩余空间。 检查文件系统的完整性 #umountfilesystem_name #fsckfilesystem_name #fsck-yfilesystem_name 注意:文件系统必须先umount,再做检查和修复,否则可导致未知的后果。AIX系统管理日常健康检查与监控*IBMSystems&TechnologyGroup©2003IBMCorporation*AIX系统管理日常健康检查与监控 查看卷组信息 lsvg-lvg_name 有没有"stale"状态的逻辑卷。 用syncvg命令修复。#smittysyncvgLVNAMETYPELPsPPsPVsLVSTATEMOUNTPOINThd5boot122closed/syncdN/Ahd6paging48962open/syncdN/Apaging00paging32642open/syncdN/Ahd8jfslog122open/syncdN/Ahd4jfs122open/syncd/hd2jfs32642open/syncd/usrhd9varjfs5102open/syncd/varhd3jfs482open/syncd/tmphd1jfs122open/syncd/homeIBMSystems&TechnologyGroup©2003IBMCorporation*AIX系统管理日常健康检查与监控 检查内存交换区(pagingspace)使用率 #lsps-s 使用率不要超过70%。 增加交换区,或增加内存。 观察内存大小的命令:lsattr–Elmem0#lsps-sTotalPagingSpacePercentUsed2048MB15%#lsps–aPageSpacePhysicalVolumeVolumeGroupSize%UsedActiveAutoTypehd6hdisk0rootvg2048MB15yesyeslv*IBMSystems&TechnologyGroup©2003IBMCorporation*AIX系统管理日常健康检查与监控 网络检查 netstat-i查看网卡状态 Ierrs/Ipkts和Oerrs/Opkts是否>1%注:Oerrs是指从这个网卡发出去错误包数目的统计Opkts是指从这个网卡发出去的ip包个数的统计。看它们是否>1%应该是指网络质量好坏。 pinghost_name/IPAddress 查看是否通和是否有丢包。 路由表 #netstat-rn 查看路由表是否正确,ping各路由器是否通。 核对主机名 #hostname*IBMSystems&TechnologyGroup©2003IBMCorporation*AIX系统管理日常健康检查与监控 #ifconfig-aen0:flags=4e080863<UP,BROADCAST,NOTRAILERS,RUNNING,SIMPLEX,MULTICAST,GROUPRT,64BIT,PSEG> inet172.40.10.31netmask0xffff0000broadcast172.40.255.255lo0:flags=e08084b<UP,BROADCAST,LOOPBACK,RUNNING,SIMPLEX,MULTICAST,GROUPRT,64BIT> inet127.0.0.1netmask0xff000000broadcast127.255.255.255 inet6::1/0 #ifconfig用法 ifconfigen0inet11.0.0.1up ifconfigen0ns110:02.60.8c.2c.a4.98up (还有很多)*IBMSystems&TechnologyGroup©2003IBMCorporation*AIX系统管理日常健康检查与监控 #lsattr–Elent0authm65536AuthenticationMethodsTruehostnameqtsmsHostNameTruegatewayGatewayTrueroutenet,,0,172.40.10.1RouteTruebootup_optionnoSerialOpticalNetworkInterfaceTruerout6FDDINetworkInterfaceTrueroute属性是否有相应的路由信息。格式为:net,,0,172.16.23.81如果没有缺省路由,执行命令:#chdev–linet0–aroute=0,172.16.23.81其中172.16.23.81为网关如果缺省路由不正确,则先删除路由,再增加缺省路由:#chdev–linet0–adelroute=net,,0,133.16.23.81#chdev–linet0–aroute=0,172.16.23.81*IBMSystems&TechnologyGroup©2003IBMCorporation*AIX系统管理日常健康检查与监控 系统故障记录(errorlog) errdemon进程在系统启动时自动运行 记录包括硬件、软件及其他操作信息 故障记录文件为/var/adm/ras/errlog,可备份下来或拷贝到别的机器上分析 errpt命令的使用(普通用户权限也可使用)*IBMSystems&TechnologyGroup©2003IBMCorporation*AIX系统管理日常健康检查与监控*IBMSystems&TechnologyGroup©2003IBMCorporation*错误日志的目的 在监测到硬件、软件和操作错误时记录相应的信息 用户其他的相关信息被记录下来 报告通过记录产生 用户能够客户化错误信息 当发生某些特定的错误时,系统发出指定信息 可以查询到建议操作*IBMSystems&TechnologyGroup©2003IBMCorporation*通过smit产生错误报告 显示所有的错误报告 #errpt 打印错误报告的 模板 个人简介word模板免费下载关于员工迟到处罚通告模板康奈尔office模板下载康奈尔 笔记本 模板 下载软件方案模板免费下载 #errpt-t 按时间产生报告 #errpt-a-smmddhhmmyy 只报告硬件错误 #errpt-d-H 描述ID为F49E2A17的错误报告 #errpt-a-jF49E2A17*IBMSystems&TechnologyGroup©2003IBMCorporation*报告实例#errpt*IBMSystems&TechnologyGroup©2003IBMCorporation*参数详解 标识‘C’:错误归类 H:硬件 S:软件 O:系统信息已经记录 U:不能确定 标识‘T’:错误类型 PERM(并且C为H):显示系统遇到硬件问题并且无法自动修复 PERD(并且C为H):系统硬件变为不可用并引起一系列错误系统 PERM(并且C为S):显示系统遇到软件问题并且无法自动修复 TEMP(并且C为S):显示系统遇到软件问题并且已经自动修复*Pend:一个设备可用性即将丢失PERF:设备性能严重下降PERM:永久IBMSystems&TechnologyGroup©2003IBMCorporation*磁盘错误的处理 诊断程序 帮助确定问题的严重性 可以格式化磁盘或进行磁盘片的检查 磁盘片的检查 检查在磁盘上的每一个块 报告磁盘全面状况 总结 初级经济法重点总结下载党员个人总结TXt高中句型全总结.doc高中句型全总结.doc理论力学知识点总结pdf 报告 三种应该更换磁盘的情况 噪声很大(Noise) 经常出错 错误严重*IBMSystems&TechnologyGroup©2003IBMCorporation*错误日志的清除 root用户通过手工命令errclear直接清除错误日志 #errclear10 清除10天以前的所有日志 #errclear-dH0 清除所有硬件的错误 #errclear-Ndisk0 删除所有资源组为disk的记录 #errclear-TUNKN0 删除所有类型为unknown的记录 #errclear0 删除所有记录*IBMSystems&TechnologyGroup©2003IBMCorporation*通过errdemon命令管理错误日志 改变错误日志的存放文件 #/usr/lib/errdemon-ifilename 改变文件的大小 #/usr/lib/errdemon-slogsize 改变内存缓冲区的大小 #/usr/lib/errdemon-Bbuffersize*IBMSystems&TechnologyGroup©2003IBMCorporation*AIX系统管理日常健康检查与监控 磁带机 磁带机应定期清洁,每使用30小时或至少每月清洁一次,不要等故障灯亮起后再清洁。 不同类型的带机用要不同的清洗带,不要混用。 用"/usr/lpp/diagnostics/bin/utape-c-drmt0-n"可查看磁带机使用时数。 4mmDDS3磁带机可读写DDS2,但对DDS1只能读。*IBMSystems&TechnologyGroup©2003IBMCorporation*AIX系统的日常维护AIX系统日常管理常用操作*IBMSystems&TechnologyGroup©2003IBMCorporation*AIX系统日常管理常用操作 查看机器上有几条内存及容量的方法: #lscfg-vp|grepSize       Size........................256       Size........................256       Size........................256       Size........................256#lscfg-vp|grepDIMM|wc-l      4   P570上每个ProcessorCard上有8个DDRmemoryDIMMslots,所以可以通过lscfg-vp|grepProcessor看有几个ProcessorCard,如下所示,有4个ProcssorCard,共应该有32个slots。*IBMSystems&TechnologyGroup©2003IBMCorporation*AIX系统日常管理常用操作 #lscfg-vp|grep Processor  ModelImplementation:MultipleProcessor,PCIbus proc0           U0.1-P1-C1    Processor proc1           U0.1-P1-C1    Processor proc2           U0.1-P1-C2    Processor proc3           U0.1-P1-C2    Processor proc4           U0.1-P1-C4    Processor proc5           U0.1-P1-C4    Processor proc6           U0.1-P1-C3    Processor proc7           U0.1-P1-C3    Processor 然后再看使用了多少个Slots:数其中的memory-module的数量就可以了。 #lscfg-vp|grep-pmemory Name: memory-controller   Model: IBM,Outrigger,Rev-id4   Node: memory-controller@7000000000000   PhysicalLocation:U0.1-P1-C1  Name: memory-controller   Model: IBM,Outrigger,Rev-id4   Node: memory-controller@7000000000010   PhysicalLocation:U0.1-P1-C2IBMSystems&TechnologyGroup©2003IBMCorporation*AIX系统日常管理常用操作 查看每个硬盘(PV)的容量方法:Bootinfo–shdisk*查看HBA卡的产品数据(VPD)信息 #lscfg-vlfcs0 fcs0U787B.001.DNW7603-P1-C4-T1FCAdapter PartNumber.................03N6441 ECLevel....................A SerialNumber...............1B549045A3 Manufacturer................001B FeatureCode/MarketingID...280B FRUNumber..................03N6441 DeviceSpecific.(ZM)........3 NetworkAddress.............10000000C94CD380*IBMSystems&TechnologyGroup©2003IBMCorporation*AIX系统日常管理常用操作 系统备份 除每日进行正常的用户数据备份外,建议定期进行系统备份。 备份前先停止业务系统软件和HACMP软件的运行。其他无关的用户退出,停止无关的操作。 系统备份只备份ROOTVG,除系统基本的5个文件系统外,其他ROOTVG上已mount上的文件系统也会被备份。 用smittymksysb命令进行系统备份,备份前先清掉root的密码。 每当系统作变更(安装新软件、补丁程序等)前后,都需要做系统备份。*IBMSystems&TechnologyGroup©2003IBMCorporation*AIX系统日常管理常用操作BackUptheSystem*BackupDEVICEorFILE[/dev/rmt0]+/CreateMAPfiles?no+EXCLUDEfiles?no+Listfilesastheyarebackedup?no+Generatenew/image.datafile?yes+EXPAND/tmpifneeded?yes+Disablesoftwarepackingofbackup?no+[MORE...2]F1=HelpF2=RefreshF3=CancelF4=ListEsc+5=ResetEsc+6=CommandEsc+7=EditEsc+8=ImageEsc+9=ShellEsc+0=ExitEnter=Do位置:/etc/exclude.rootvg*IBMSystems&TechnologyGroup©2003IBMCorporation*AIX系统日常管理常用操作 检查系统备份带是否有效 用备份带启动机器,但不要进行安装,我们只是验证系统备份带是否能用于启动。出现以下菜单后,关机即可。 WelcometoBaseOperatingSystem InstallationandMaintenance TypethenumberofyourchoiceandpressEnter. >>> 1StartInstallationNowwithDefaultSettings 2Change/ShowInstallationSettingsandInstall 3StartMaintenanceModeforSystemRecovery 88Help? 99PreviousMenu*IBMSystems&TechnologyGroup©2003IBMCorporation*AIX系统日常管理常用操作 #smittylsmksysb ; 检查系统备份带的内容。 系统备份不是万能的。备份最好有两份。 用户数据备份 文件系统可用tar命令。 数据库可用数据库的备份方式备。 逻辑卷(LV)可用dd命令。 smittysavevg用户卷组备份 只备份mount起的文件系统。 注意:不备份逻辑卷(裸设备)。*IBMSystems&TechnologyGroup©2003IBMCorporation*AIX系统日常管理常用操作 镜像(rootvg) extendvgrootvghdisk1将hdisk1加入到rootvg中 mirrorvg-c2rootvg在rootvg中使两块盘做一个镜像 bosboot-ad/dev/hdisk1将新加的硬盘加到引导列表里,否则第二块盘无法引导系统。 bosboot-ad/dev/hdisk2 bootlist-mnormalhdisk0hdisk1cd0设置启动顺序依次是hdisk0hdisk1光驱*IBMSystems&TechnologyGroup©2003IBMCorporation*AIX系统日常管理常用操作 拆镜像(rootvg) lsvg–Mrootvg;检查有效的pv,确认hdisk1坏 unmirrorvgrootvghdisk1 bosboot–a–d/dev/hdisk0 bootlist–mnormalhdisk0cd0 mkboot–c–d/dev/hdisk1*IBMSystems&TechnologyGroup©2003IBMCorporation*AIX系统日常管理常用操作 HACMP的操作 启动:smittyclstart 停止:smittyclstop 启动/停止过程可以查看/tmp/hacmp.out文件:#tail–f/tmp/hacmp.out 检查Cluster是否运行正常 Cluster进程是否运行:#lssrc–gcluster,至少两个进程,且为active。 IP地址是否获取:#netstat–i,看bootIP是否变为serviceip。 VG是否varyon:#lsvg–o 文件系统是否mount:#mount 应用进程是否启动:#ps–ef|grepapp_name*IBMSystems&TechnologyGroup©2003IBMCorporation*AIX系统日常管理常用操作 HACMP相关日志 /usr/es/adm/cluster.log; 以事件为单位的纪录 /tmp/hacmp.out; 详细记录 /usr/sbin/cluster/history/cluster.mmdd; 历史纪录*IBMSystems&TechnologyGroup©2006IBMCorporation第二章:故障处理部分IBMSystems&TechnologyGroup©2003IBMCorporation*故障处理部分 弄清楚系统发生了什么问题 系统现在能做什么?不能做什么? 故障什么时候发生的? 有没有做平时不同的操作? 故障有没有规律?定时还是不定时?发生的频率有多高? 是一台机器出现故障还是多台机器故障?故障现象是否相同? 最近有没有做改动?如安装了新的硬件、软件,改变了系统的一些设置(如HACMP配置)等。IBMSystems&TechnologyGroup©2003IBMCorporation*故障处理部分 收集故障信息对于判断、诊断故障原因,修复系统非常重要。 系统故障记录(errorlog) errdemon进程在系统启动时自动运行 记录包括硬件、软件及其他操作信息 故障记录文件为/var/adm/ras/errlog,可备份下来或拷贝到别的机器上分析 errpt命令的使用(普通用户权限也可使用)*IBMSystems&TechnologyGroup©2003IBMCorporation*故障处理部分 控制面板上的LED代码 8位代码,通常系统故障灯会同时亮起。某些机型还会同时显示故障设备位置代码。(注:S85正常启动过程中有合法的8位代码。) 4位代码,通常是Exxx。 3位代码,通常为0yyy,只看后3位。 8位和4位代码可查看系统服务手册(ServiceGuide)。 3位代码可查看系统诊断手册(DiagnosticInformationforMultipleBusSystem)。*IBMSystems&TechnologyGroup©2003IBMCorporation*故障处理部分 其他用于收集系统信息的命令 lsdev-C 系统设备信息 #lsdev-Ccdisk hdisk0Available00-06-00-2,04.5GB16BitSCSIDiskDrive hdisk1Available00-06-00-1,04.5GB16BitSCSIDiskDrive hdisk2Defined 00-06-00-4,016BitSCSIDiskDrive lspv 查看物理卷信息 #lspv hdisk00007821160af3d76rootvg hdisk1000782117f571294rootvg hdisk20000000045c45bdedatavg lsvg 查看卷组信息*IBMSystems&TechnologyGroup©2003IBMCorporation*故障处理部分*IBMSystems&TechnologyGroup©2003IBMCorporation*故障处理部分*IBMSystems&TechnologyGroup©2003IBMCorporation*故障处理部分*IBMSystems&TechnologyGroup©2003IBMCorporation*故障处理部分 系统不能正常启动可能由多种原因引起,硬件或软件。 观察系统的启动过程。 设备的故障灯是否亮起。 异常的声音,如硬盘的怪声。 注意LED上显示的代码,这是故障分析最重要的信息。 主控台上最后显示的信息也很重要,必须记录下来。*IBMSystems&TechnologyGroup©2003IBMCorporation*系统的启动顺序*IBMSystems&TechnologyGroup©2003IBMCorporation*故障处理部分 系统停在Stage1,可能为电源、系统板、CPU、内存等硬件故障。记录故障代码通知IBM工程师。 系统停在Stage2,可能是启动顺序表(bootlist)损坏或I/O子系统故障。可尝试进入SMS菜单检查启动顺序表,并修改。 若在选择bootlist时没有硬盘设备可选或显示的硬盘信息不正确则可能是硬盘故障。 若根本没有SCSI设备可选则链路有问题。 系统停在Stage3,可能是硬盘数据损坏,系统设置文件出错,或I/O子系统故障。*IBMSystems&TechnologyGroup©2003IBMCorporation*故障处理部分 发生在系统启动的第三阶段(Stage3),可能是: 文件系统损坏 文件系统日志(jfslog)损坏 rootvg中有坏硬盘 修复方法 用系统光盘或系统备份带启动(必须与硬盘中的操作系统版本一致) 启动后选择选项3 "StartMaintenanceModeforSystemRecovery" >"AccessaRootVolumeGroup" >"Accessthisvolumegroupandstartashell beforemountingthefilesystems"*IBMSystems&TechnologyGroup©2003IBMCorporation*故障处理部分 格式化文件系统日志(jfslog) #/usr/sbin/logform/dev/hd8 检查修复文件系统 #fsck-y/dev/hd1 (/home文件系统) #fsck-y/dev/hd2 (/usr文件系统) #fsck-y/dev/hd3 (/tmp文件系统) #fsck-y/dev/hd4 (/文件系统) #fsck-y/dev/hd9var (/var文件系统) ...... 用exit命令退出,文件系统会自动mount起来。 重建bootimage #lslv-mhd5 找出bootimage所在的硬盘,如hdisk0 #bosboot-ad/dev/hdisk0 #bootlist-mnormal/dev/hdisk0重建启动顺序表。*IBMSystems&TechnologyGroup©2003IBMCorporation*故障处理部分 重启动系统 #shutdown-Fr 如上述步骤不奏效 用系统备份带恢复系统。 如备份带不能恢复,用诊断光盘(DiagnosticCDROM)检查是否坏硬盘。 通知IBM工程师。*IBMSystems&TechnologyGroup©2003IBMCorporation* CDE运行时不要更改网络参数(如:主机名和IP地址)更改网卡设置,请先退出CDE图形环境,选择命令行方式登录,在字符界面下更改。 如CDE已经挂死 远程telnet登录 找出所有dt有关的进程用kill命令杀掉 #ps-ef|grepdt ...... #killPID 检查当前主机名 #hostname uname-a tscf50*IBMSystems&TechnologyGroup©2003IBMCorporation* 查看主机名是否对应有效的IP地址 #netstat-i|greptscf50 tr0*15009.185.40tscf5050604902824700 更改主机名或IP地址,使主机名与当前有效的IP地址存在对应关系。 #smittytcpip 重新启动CDE界面 #/etc/rc.dt HACMP环境下可把主机名alias到127.0.0.1上 #cat/etc/hosts 127.0.0.1loopbacklocalhosttscf50#loopback(lo0)name/addressbvg*IBMSystems&TechnologyGroup©2003IBMCorporation* 发生在系统崩溃时,AIX会做dump(系统内存的快照)。 此时机器会显示闪动的888102xxx0cx代码: 0c9 系统dump进行中。0c9状态可能会维持超过2分钟, 不要关电和按reset,等待dump做完。 0c0 dump成功完成,这时可以断电重起。 0c2 手动启动dump功能 0c4 dump设备空间不足,只有部分信息保存下来 0c5 不明原因导致dump失败mostlyhdiskorsysplanererrorIBMSystems&TechnologyGroup©2003IBMCorporation* 一般dump是由于软件出错引起,机器通常可以重启。重启时可能提示用户插入磁带拷贝dump文件,不要选择退出,这样会丢失重要的故障信息。IBMSystems&TechnologyGroup©2003IBMCorporation* dump打包 #snap-a-o/dev/rmt# 或 #snap-a-c 把/tmp/ibmsupt目录做成一个压缩文件snap.tar.Z如果/tmp文件系统空间不够,可用-ddirectory参数指定别的目录代替/tmp/ibmsupt #smittydumpIBMSystems&TechnologyGroup©2003IBMCorporation* 运行故障诊断程序(Diagnostic),对系统硬件进行检查和诊断。 当发现有硬件故障时应立即使用diag #diag >选高级诊断(AdvanceDiagnostic) >选问题诊断(ProblemDetermination)或 选系统检查(SystemVerification) (选PD会对系统错误记录进行分析) diag运行后会给出SRN代码,故障设备名称及百分比,地址代码等。IBMSystems&TechnologyGroup©2003IBMCorporation* concurrent模式 多用户模式下(系统正常运行时)运行硬盘上的诊断程序。如果可能尽量使用该模式(但不要在应用程序运行时使用)。 #diag 运行该命令需要root权限 DiagnosticCDROM 用诊断光盘启动,通常在硬盘无法启动时使用。IBMSystems&TechnologyGroup©2003IBMCorporation*IBMSystems&TechnologyGroup©2003IBMCorporation*IBMSystems&TechnologyGroup©2006IBMCorporation第三章 备份恢复IBMSystems&TechnologyGroup©2003IBMCorporation*mksysb*IBMSystems&TechnologyGroup©2003IBMCorporation*磁带中的内容*当进行完备份以后,备份磁带就可以直接用作恢复和启动操作系统,那么为什么可以直接用来进行操作系统的安装呢?我们在admin里面介绍了,系统启动的时候需要的内容,image.data,bosinst.data,这两个文件占有很重要的地位,那么在磁带中一定包含着两个文件,下面我们看看磁带中的存储方式:首先第一个部分,bosbootimage:存放启动信息的列表其次第二个部分,mkinsttape.image:这个部分用来存放磁带可以用来安装的信息,其中包括安装文件,备份的信息文件,磁带的块大小等第三个部分,TOC镜像,用来做状态的记录的文件最后一个部分,那就是最重要的操作系统rootvg里面的所有数据了。IBMSystems&TechnologyGroup©2003IBMCorporation*验证系统备份 验证系统备份的方法 第一个验证的方法就是: 用备份磁带恢复到另一个测试的系统中,如果可以的话,那么这种方法是最好的恢复操作系统的方法 第二个验证的方法就是: 可以分两步: 1数据验证,方法如下: tctl–f/dev/rmt0rewind restore–S4–Tqvf/dev/rmt0.1〉/tmp/mksysb.log 通过查看log文件可以看到磁带中的数据信息是否正确 2启动验证,方法如下: 为了证明磁带可以完成操作系统启动,需要按照安装操作系统的步骤进行重新启动的操作,然后进入磁带安装界面,看看是否能够出现相应 的提示信息(注意查看bosinst.data中的prompt信息要是yes) *第一个验证的方法就是:用备份磁带恢复到另一个测试的系统中,如果可以的话,那么这种方法是最好的恢复操作系统的方法第二个验证的方法就是:可以分两步:1数据验证,方法如下:tctl–f/dev/rmt0rewindrestore–S4–Tqvf/dev/rmt0.1〉/tmp/mksysb.log通过查看log文件可以看到磁带中的数据信息是否正确2启动验证,方法如下:为了证明磁带可以完成操作系统启动,需要按照安装操作系统的步骤进行重新启动的操作,然后进入磁带安装界面,看看是否能够出现相应的提示信息(注意查看bosinst.data中的prompt信息要是yes)IBMSystems&TechnologyGroup©2003IBMCorporation*磁带安装的恢复*磁带安装的恢复前面的步骤都和安装操作系统一样,上面显示的部分是后面不同的部分,也是我们需要了解的部分IBMSystems&TechnologyGroup©2003IBMCorporation*续*IBMSystems&TechnologyGroup©2003IBMCorporation*如何备份非rootvg*介绍完rootvg以后,接下来介绍关于用户自定义的卷组的备份和恢复,首先来介绍备份:smittysavevg(注意区别系统的mksysb)这个界面基本上和mksysb是一样的IBMSystems&TechnologyGroup©2003IBMCorporation*Savevg的恢复*和savevg相对应的恢复命令就是restvg,这两个命令是一对备份和恢复非rootvg的命令。学员一定要记住。恢复的命令非常简单就按照上面介绍的方法进行就可以了,在这里就不做介绍了,只做简单的 说明 关于失联党员情况说明岗位说明总经理岗位说明书会计岗位说明书行政主管岗位说明书 。IBMSystems&TechnologyGroup©2003IBMCorporation*linux和unix下常用解压和压缩命令: --------------------------------------------- .tar 解包:tarxvfFileName.tar 打包:tarcvfFileName.tarDirName(注:tar是打包,不是压缩!) --------------------------------------------- .gz 解压1:gunzipFileName.gz 解压2:gzip-dFileName.gz 压缩:gzipFileName.tar.gz 解压:tarzxvfFileName.tar.gz 压缩:tarzcvfFileName.tar.gzDirNameIBMSystems&TechnologyGroup©2003IBMCorporation*linux和unix下常用解压和压缩命令: .Z 解压:uncompressFileName.Z 压缩:compressFileName.tar.Z 解压:tarZxvfFileName.tar.Z 压缩:tarZcvfFileName.tar.ZDirName --------------------------------------------- .tgz 解压:tarzxvfFileName.tgz 解压:tarzxvfFileName.tar.tgz 压缩:tarzcvfFileName.tar.tgzFileName --------------------------------------------- .zip 解压:unzipFileName.zip 压缩:zipFileName.zipDirNameIBMSystems&TechnologyGroup©2006IBMCorporation第四章性能监测和优化IBMSystems&TechnologyGroup©2003IBMCorporation*本章目的 通过AIX 标准 excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载 命令研究系统中CPU,内存和I/O瓶颈 了解AIX相关的AIX命令 使用PDT产生系统状况的报告 使用perfpmr工具 调整内核参数*IBMSystems&TechnologyGroup©2003IBMCorporation*PerformanceTools #nice #renice #ps #sar #vmstat #iostat #tprof #svmon #filemon PDT(PerformanceDiagnosticTool) perfpmr(PerformanceProblemManagementReport)*用户需要安装bos.perf.tools,bos.sysmgt.trace,bos.perf.perfstat,perfagent.toolsIBMSystems&TechnologyGroup©2003IBMCorporation*性能分析 流程 快递问题件怎么处理流程河南自建厂房流程下载关于规范招聘需求审批流程制作流程表下载邮件下载流程设计 图CPU瓶颈?内存瓶颈?I/O瓶颈?网络瓶颈?vmstatpslspssvmonvmstatsarnicepsiostatlslvfilemonfileplaceMoretestnetstatnfsstatnfsonoifconfignetpmonYYYYNNNNIBMSystems&TechnologyGroup©2003IBMCorporation*命令ps #ps-ef E选项:列出所有的用户进程 l选项:列出优先级信息 #psaux 查看所有进程占用CPU,内存,时间 #ps-moThREAD TID参数:象PID一样是Thread-id BND参数:使用CPU数*IBMSystems&TechnologyGroup©2003IBMCorporation*CPU使用情况(一)#sar110◆当%usr+%sys>80%时,CPU紧张*IBMSystems&TechnologyGroup©2003IBMCorporation*CPU使用情况(二)#sar-q13 系统队列活动情况 runq-sz:averagelengthofrunqueue %runocc:percentageoftimerunqueueoccupied swpq-sz%swpocc:◆当runq-sz大于4时,CPU资源紧张*Runq-sz运行队列中内核线程的平均数,即运行队列的大小%runocc运行队列占用的时间百分率Swpq-sz内核线程等待页面调入的平均数,即交换队列的大小%swpocc交换队列占用时间比率值越小越好,swpocc<5比较好IBMSystems&TechnologyGroup©2003IBMCorporation*sar–a35 查看文件读/写情况 iget/s:每秒调用I节点查找函数的次数 lookuppn/s:每秒调用目录查找函数的次数 dirblk/s:为一个文件调用目录查找函数的次数IBMSystems&TechnologyGroup©2003IBMCorporation*sar–d 块设备活动情况 %busy>50%或avwait>avscrv则需要查看磁盘I/Osar–c 系统调用情况*Avque未完成的请求数量的平均值IBMSystems&TechnologyGroup©2003IBMCorporation*sar–r查看页面调度情况slots:页面空间上空闲页数量cycle/s:每秒页面交换周期数fault/s:每秒页面错误个数odio/s:每秒非磁盘I/O页面调用数IBMSystems&TechnologyGroup©2003IBMCorporation*Paging信息(一)#vmstat13◆当内存资源十分紧张时,将引起paging-stealing和paging-spaceactivity,进而产生I/O问题*R每秒加入运行队列的线程数,b每秒加入等待队列的线程数Pi和po数值大或者1:1说明页面调度过于频繁Fr空闲页数,sr要换出的页数,比值过大则内存使用过量Avm虚拟内存页数fre空闲页数,少于128个空闲页系统不稳定,会自动杀一些进程释放空间IBMSystems&TechnologyGroup©2003IBMCorporation*I/O信息#iostat %tm_actisthepercentoftimethedevicewasactiveovertheperiod Kbpsisthenumberofkilobytespersecondtransferred. tpsisnumberoftransferspersecond*Tmact磁盘处于活动的时间百分比Tps每秒发给磁盘的传送次数IBMSystems&TechnologyGroup©2003IBMCorporation*确定CPU瓶颈 在确定了CPU瓶颈之后,进一步确定程序使用CPU的情况 在AIX中用tprof命令产生报告*IBMSystems&TechnologyGroup©2003IBMCorporation*查看内存整体的使用情况(一)#svmon-G*IBMSystems&TechnologyGroup©2003IBMCorporation*查看内存整体的使用情况(一) Memory size:真正的内存大小 inuse:使用的内存 free:没使用的内存 pin:pinnedmemory的大小*IBMSystems&TechnologyGroup©2003IBMCorporation*调整性能参数 smittychgsys Aio(smittyetherchannel命令调aio经验值范围10~40,一般是数据库I/O接口速度) chps vmo(vmtune)*Chgsys进程数、高水、低水网络MTU:最大传输单元IBMSystems&TechnologyGroup©2006IBMCorporation谢谢!***************Pend:一个设备可用性即将丢失PERF:设备性能严重下降PERM:永久*******************************当
本文档为【(零收费)AIX系统日常维护与故障的解决】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: ¥11.9 已有0 人下载
最新资料
资料动态
专题动态
个人认证用户
黑耀宝石
暂无简介~
格式:ppt
大小:1MB
软件:PowerPoint
页数:0
分类:
上传时间:2019-02-13
浏览量:6