1


System Management Services (SMS) 1.4 ご使用にあたって

この章では、Sun Fire ハイエンドシステム上の System Management Services (SMS) 1.4 に固有の情報として、以下の項目について説明します。


SMS 1.4 で既知の制限事項

この節では、Sun Fire ハイエンドシステムの SMS に関連する既知の制限事項を説明します。


一般的な問題

この節では、Sun Fire ハイエンドシステムの SMS に関連する一般的な問題について説明します。

自動診断および自動回復

SMS 1.4 では、以下の自動診断およびドメイン回復機能がデフォルトで使用可能です。

SMS 1.4 には、特定のハードウェアエラーを分析し、システムとそのドメインの可用性に影響を与えるエラーが発生したコンポーネントを特定する、3 種類の診断エンジン (DE) が組み込まれています。
SMS DE は、ドメイン停止 (dstop) を伴うハードウェアエラーを診断します。
Solaris オペレーティング環境 (Solaris DE とも呼ばれる) では、致命的でないドメインのハードウェアエラーを特定し、そのエラーをシステムコントローラに報告します。
POST DE は、SMS で電源投入時自己診断が実行されているときに発生したハードウェアテスト障害を特定します。
これらの DE では、影響を受けたコンポーネントの診断情報を記録し、コンポーネントの健全性ステータス (CHS) の一部としてこの情報を保持します。
診断エンジンでは、以下の方法により診断情報の報告を行います。
表示されるイベントメッセージには、影響を受けたシステムのシャーシのシリアル番号と、障害やエラーイベントを特定するイベントコードが含まれています。また、これらのイベントメッセージは SMS イベントログにも記録され、このイベントログは showlogs コマンドを実行すると表示できます。
これらのイベントメッセージが表示されたときは、サービス代理店に連絡してください。サービス代理店では、シャーシのシリアル番号とイベントコードを使用して、適切な保守処理を開始します。


注 - 場合によっては、障害が発生したコンポーネントが多様であることから、診断エンジンで妥当なイベントコードを割り当てられないことがあります。このような場合は、SF15000-UNKNOWN といったように、イベントコードに UNKNOWN という文字が含まれます。サービス代理店に連絡して、適切な保守処理を開始するよう依頼してください。



手動でプラットフォームやドメインのログを監視しなくても、重大な障害イベントの通知をただちに受信するように、電子メールイベント通知機能を構成することができます。イベントメッセージの場合と同様に、これらの電子メールを受信した場合はサービス代理店に連絡して、適切な保守処理を開始するよう依頼してください。
ドメイン停止 (dstop) に伴ってハードウェアエラーが発生した場合、POST では、影響を受けたコンポーネントの CHS 情報を調べて、障害が発生したコンポーネントをシステムから構成解除します。

これらの機能についての詳細は、『System Management Services (SMS) 1.4 管理者マニュアル』の「自動診断および自動回復」を参照してください。

SMS 1.4 の新規コマンド

SMS 1.4 で採用された自動診断および自動回復機能に関連して、次のデーモンとコマンドが新たに追加されました。これらのデーモンおよびコマンドについての詳細は、『System Management Services (SMS) 1.4 リファレンスマニュアル』の説明を参照してください。

/opt/SUNWSMS/SMS1.4/lib/smsadmin/testemail

SMS 1.4 で修正されたコマンド

自動診断および自動回復機能の採用による変更を反映して、SMS 1.4 では次のコマンドが更新されました。これらのコマンドについての詳細は、『System Management Services (SMS) 1.4 リファレンスマニュアル』の説明を参照してください。

シャーシのシリアル番号

シャーシのシリアル番号は、Sun Fire ハイエンドシステムを特定する際に使用されます。このシリアル番号によってシステムイベントメッセージに記載されているプラットフォームが特定されるため、サービス代理店では、この番号を利用して、発生したイベントと保守処理を適切なシステムに対応付けます。

シャーシのシリアル番号は、システムシャーシ正面の下部中央付近に貼付されているラベルに印刷されています。SMS 1.4 からは、シャーシのシリアル番号は、サンでの製造時に SMS 1.4 をインストールして出荷するシステム上に自動的に記録されます。シャーシのシリアル番号を表示するには、showplatform -p csn コマンドを実行します。

旧バージョンの SMS から SMS 1.4 にアップグレードするときは、setcsn(1M) コマンドを使用して、Sun Fire ハイエンドシステムのシャーシのシリアル番号を記録してください。シャーシのシリアル番号の設定方法については、『System Management Services (SMS) 1.4 インストールマニュアル』と『System Management Services (SMS) 1.4 リファレンスマニュアル』のsetcsn コマンドの説明を参照してください。

Capacity on Demand (COD)

障害が発生した非 COD CPU を交換する際に、用意されているインスタントアクセス CPU (ヘッドルームとも呼ばれる) を一時的に使用可能にすることができます。この場合、インスタントアクセス CPU は、ホットスペアと見なされます。これは、障害が発生した非 COD CPU の交換時にただちに使用可能なスペアの CPU です。しかし、障害が発生した非 COD CPU を交換した後、『System Management Services (SMS) 1.4 管理者マニュアル』の「Capacity on Demand」に記載されている説明に従って、インスタントアクセス CPU を無効にする必要があります。インスタントアクセス CPU を継続使用する場合は、購入先に連絡して、使用しているインスタントアクセス CPU の COD RTU ライセンスを購入してください。

システムコントローラ (SC) 外部ネットワークの構成

各システムコントローラ (SC) は、その接続先である TCP/IP ネットワークに合わせて構成する必要があります。TCP/IP ネットワークの計画および構成の詳細については、Solaris 9 System Administrator Collection の『Solaris のシステム管理 (資源管理とネットワークサービス)』を参照してください。SMS では、IPv4 と IPv6 両方の構成をサポートしています。

このリリースでは、SC は各 SC の背面板にある RJ45 ジャックでのネットワーク接続をサポートしています。この接続は、各 SC の Solaris ソフトウェアの hme0 および eri1 と対応します。使用する TCP/IP ネットワークに適した情報を使って、各 SC の hme0 または eri1 を構成する必要があります。この構成により、各 SC は個別の IP ホスト名およびアドレスを持ち、外部のネットワークアプリケーションに認識されるようになります。



caution icon

注意 - Sun Fire ハイエンドシステムのマニュアルに記載されている smsconfig の使用例の IP アドレスは、あくまで例に過ぎません。使用するネットワークで有効な IP アドレスについては、必ず『Sun Fire 15K/12K システムサイト計画の手引き』を参照してください。特定の状況のもとでは、無効なネットワーク IP アドレスを使用すると、システムが起動できなくなる場合があります。



各 SC は、相互に排他的な 2 つのモードのうちの 1 つ、すなわちメインモードまたはスペアモードで動作します。メインモードの SC が、コンピュータを制御する SC です。スペアモードの SC は、メイン SC に障害が発生した際に自動的に交代するスペアとして動作します。システムコントローラのうち、どれがメイン SC でどれがスペア SC であるかを確認しておくことは重要です。SC の役割を判別するには、SC にログインしてから以下のコマンドを使用します。

sc0:sms-user:>showfailover -r
MAIN

外部コミュニティーネットワークを構成していない場合は、Sun Management Center、telnet などのアプリケーションには、メインシステムコントローラの適切な IP hostname を指定する必要があります。SC のフェイルオーバーの場合、これらのアプリケーションの再起動では新しいメイン SC の IP アドレスを指定する必要があります。



注 - 一方の SC で smsconfig -m を使ってネットワーク構成に変更を加えた場合には、もう一方の SC にも必ず同じ変更を加えてください。ネットワーク構成が、他方の SC に自動的に反映されることはありません。



システムの BREAK 処理

フェイルオーバーを容易にするために、システムを停止する BREAK 処理が STOP-A から代替の [RETURN] [TILDE] [CONTROL B] に変更されています。



注 - それぞれのキー入力の間には 0.5 秒以上の間隔をおきます。さらに、シーケンス全体は 5 秒以内に入力し終える必要があります。



これは Solaris 8 で導入された新機能で、ハングしているシステムを強制的に停止できるようになり、同時にランダムなキー入力によるシステムの意図せぬ停止も効果的に避けられます。このキーシーケンスが使えるのは、コンソールとして機能しているシリアルデバイスだけです。システム本体に接続されているキーボードでは使えません。

/etc/default/kbd ファイルの以下の行は、デフォルトでコメント解除されています。

KEYBOARD_ABORT=alternate



注 - システムに対して、STOP-A は使用しないでください。システムでフェイルオーバー機能を利用できなくなります。



IPSec の構成

Sun Fire ハイエンドシステムで使用するディスクは、Sun Fire ハイエンドシステムを使用してインストールする必要があります。/etc/inet/inetd.conf に記述されているポリシーは、手動で /etc/inet/ipsecinit.conf にも追加する必要があります。

/etc/inet/inetd.conf から削除するポリシーは、/etc/inet/ipsecinit.conf からも手動で削除する必要があります。

Bug Id 4449848 を参照してください。

smsconnectsc コマンド

smsconnectsc は、遠隔 SC がハングアップして、login では正常にアクセスできない場合に使用するためのコマンドです。smsconnectsc を使用してローカル SC から遠隔コンソールセッションを作成すると、ローカル SC は監視能力と監視機能を失う場合があります。システムの回復という明確な目的でない限り、smsconnectsc使用しないでください

再インストールとアップグレード

以前のバージョンの SMS では、Javatrademark WebStart GUI と pkgadd コマンドを使用して、SMS パッケージを Sun Fire ハイエンド システムにインストールする方法がマニュアルに記載されていました。SMS 1.3 では、smsinstall スクリプトと smsupgrade スクリプトを採用しており、WebStart と pkgadd コマンドを推奨したりマニュアルに記載したりする必要がない程度に、インストールとアップグレード処理が簡略化および合理化されています。SMS の設定は複雑であるため、『System Management Services (SMS) 1.4 インストールマニュアル』に記載されている方法以外では、SMS 1.4 のインストールやアップグレードは行わないでください。他の方法を使うと、正しく設定できなかったり、一部の機能が失われる可能性があります。


SMS のマニュアルについて

この節では、Sun Fire ハイエンドシステムの SMS に関連するマニュアルについて説明します。

パーツ番号

このリリースのソフトウェアマニュアルは、以下の Web サイトで入手できます。

http://www.sun.com/products-n-solutions/hardware/docs/Servers/High-End_Servers/Sun_Fire_15K

マニュアルのファイル名は、パーツ番号と同じです。以下にマニュアル名との対応を示します。

817-4171-10.pdf -- System Management Services (SMS) 1.4 インストールマニュアル
(817-1343-10 と差し替え)

817-4175-10.pdf -- System Management Services (SMS) 1.4 管理者マニュアル
(817-1340-10 と差し替え)

817-4176-10.pdf -- System Management Services (SMS) 1.4 リファレンスマニュアル
(817-1341-10 と差し替え)

817-4183-10.pdf -- System Management Services (SMS) 1.4 ご使用にあたって
(817-1348-10 と差し替え)

817-4178-10.pdf -- Sun Fire ハイエンドシステムソフトウェアの概要
(817-1353-10 と差し替え)

マニュアルの訂正

testemail(1M) のマニュアルページの例 1 と『System Management Services (SMS) 1.4 リファレンスマニュアル』のコマンド説明に、testemail コマンドへのフルパスが記載されていませんでした。正しいコマンド指定は次のとおりです。

sc0:sms-user:>/opt/SUNWSMS/SMS1.4/lib/smsadmin/testemail -c fault.board.ex.l1l2, fault.board.io.l1l2 -dD -i EX7,IO8

BugID 4934058 を参照してください。