1


System Management Services (SMS) の DR の概要

この章では、Sun Fire 15K/12K システムコントローラ (SC) 上の System Management Services (SMS) ソフトウェアの動的再構成 (DR) 機能について説明します。


DR の概要

Sun Fire 15K/12K サーバーの動的再構成機能を使用すると、コンピュータを停止せずに、Solaris オペレーティング環境を実行しているライブドメインのハードウェア構成を変更できます。この DR をホットスワップ機能と組み合わせて使用すれば、サーバーから物理的にボードを取り外したり、追加したりすることも可能です。

DR 操作は、SC からシステム管理サービスコマンド (addboard(1M)、moveboard(1M)、deleteboard(1M)、および rcfgadm(1M) など) を使用して実行できます。



注 - cfgadm(1M) コマンドを使って、SC またはドメインで DR 操作を実行することができます。ドメインで DR を実行する方法については、『Sun Fire 15K/12K Dynamic Reconfiguration ユーザーマニュアル』を参照してください。



自動 DR

自動 DR を使用すると、ユーザーの介入なしに、アプリケーションが自動的に DR 操作を実行できます。この機能は、Reconfiguration Coordination Manager (RCM) とシステムイベント機能 sysevent を含む拡張 DR フレームワークによって実現されています。RCM は、アプリケーションに固有のロード可能モジュールがコールバックを登録できるようにします。これらのコールバックは、DR 操作前の準備タスク、DR 操作中のエラー回復、または DR 操作後のクリーンアップなどの操作を実行します。システムイベントフレームワークでは、アプリケーションはあらかじめシステムイベントを登録しておくことで、これらについて通知を受け取ることができます。自動 DR フレームワークは RCM およびシステムイベント機能を使って、アプリケーションが、資源の構成を解除する前に自動的にそれらを解放したり、新しい資源がドメインに構成されたときに自動的にそれらの資源を獲得できるようにします。

自動 DR フレームワークは、ローカルで (つまり、cfgadm(1M) コマンドを使用してドメインから) 使用することも、SC から使用することもできます。ドメインでローカルに開始された自動 DR 操作はローカル自動 DR と呼ばれ、SC から開始された自動 DR 操作はグローバル自動 DR と呼ばれます。グローバル自動 DR 操作には、あるドメインから別のドメインへのシステムボードの移動、ホットスワップされたボードのドメインへの組み込み、およびドメインからのシステムボードの削除が含まれます。

システムの可用性の向上

DR 機能を使用すると、サーバーを停止せずにシステムボードをホットスワップできます。これは、障害の発生したシステムボードの資源をドメインから解除することで、システムボードをサーバーから切り離せるようにするために使用されます。修理済みボードまたは交換用ボードは、Solaris オペレーティング環境の実行中にドメインに装着できます。DR は、ボードが装着されると、その資源を構成してドメインに組み込みます。DR 機能を使用してシステムボードまたはコンポーネントを追加ないし削除した場合、そのボードまたはコンポーネントは常に既知の構成状態のままになります (システムボードとコンポーネントの構成状態の詳細は、SC 状態モデルを参照してください)。


コンポーネントタイプ

DR を使用すると、以下のコンポーネントを追加または削除できます。

コンポーネント

説明

cpu

個々の CPU

memory

ボード上のすべてのメモリー

pci

すべての入出力デバイス、コントローラ、またはバス



入出力ボードの DR

入出力デバイスのあるシステムボードを追加または削除するときは、注意が必要です。入出力デバイスのあるボードを取り外すには、まずその全デバイスを閉じて、その全ファイルシステムをマウント解除する必要があります。

入出力デバイスのあるボードをドメインから一時的に削除して、入出力デバイスのある他のボードを追加する以前に再び追加する場合、再構成は不要であり実行する必要はありません。この場合、ボードデバイスへのデバイスパスはそのままです。ただし、入出力デバイスのある最初のボードが削除された後で別のボードを追加してから、最初のボードを再度追加した場合は、最初のボード上のデバイスへのパスが変更されるため、再構成が必要です。



注 - ドメイン内の入出力ボードに DR 操作を実行する前に、そのドメインに対して少なくとも 2 つの CPU が使用できることを確認してください。さらに、これらCPU のうち少なくとも 1 つが CPU / メモリーボードに存在しており、どのプロセスにも結合されていないことを確認してください。結合プロセスについては、pbind(1M) マニュアルページを参照してください。



hsPCI+ 入出力ボードでの DR

DRは、hsPCI+ 入出力ボードの動的再構成をサポートしています。各 hsPCI+ 入出力ボードは、XMITS ASIC を 2 つとホットプラグ対応の hsPCI スロットを 4 つ搭載しています。

Golden IOSRAM

ドメイン内のすべての入出力ボードは、いずれも IOSRAM デバイスを 1 つ備えています。ただし、SC とドメインの通信に使用されるのは、一度に 1 つの IOSRAM デバイスだけです。この IOSRAM デバイスは、Golden IOSRAM と呼ばれます。Golden IOSRAM には、SC とドメインの通信に使用される「トンネル」があります。DR では入出力ボードを削除できるため、使用中の Golden IOSRAM を停止して、他の IOSRAM デバイスを Golden IOSRAM にする処理が必要になることがあります。この処理は「トンネルスイッチ」と呼ばれ、使用中の Golden IOSRAM が DR によって構成解除されるたびに実行されます。

通常、ドメインの起動直後には、そのドメイン内で最も小さい番号を割り当てられた入出力ボードが Golden IOSRAM になります。


COD (Capacity on Demand)

COD オプションを使用して、Sun Fire 15K/12K システムに取り付けた COD CPU/メモリーボードに CPU リソースを追加できます。Sun Fire 15K/12K システムは、最小数の標準 (アクティブ) CPU/メモリーボード構成で出荷されますが、標準 CPU/メモリーボードと COD CPU/メモリーボードの両方を混在させて、最大で 18 個まで取り付けることができます。システムの各ドメインには、アクティブな CPU が少なくとも 1 つ必要です。

COD ボードでの DR

DR を使用して、標準の CPU/メモリーボードの場合と同じ方法で、COD ボードをドメインに取り付けたり、取り外したりできます。

該当する RTU (right-to-use) ライセンスを購入してからでないと、COD ボード上の CPU を使用できません。COD RTU ライセンスごとに、COD RTU ライセンスキーを取得できます。このキーにより、単一のシステムの COD ボードで特定の数の CPU を使用できるようになります。DR を使用してドメインに COD ボードを構成する場合は常に、COD ボードの各アクティブ CPU を有効にするのに十分な数の RTU ライセンスが対象のドメインにあることを確認してください。COD ボードを追加する際、対象ドメインに対して十分な RTU ライセンスがない場合、ドメインで有効にできない各 CPU に関するステータスメッセージが表示されます。

COD オプションについての詳細は、『System Management Services (SMS) 1.3 管理者マニュアル』を参照してください。


Sun Fire 15K/12Kドメイン

Sun Fire 15K/12K サーバーは、複数のドメインに分割できます。各ドメインは、ドメインに割り当てられたシステムボードスロットに対応しています。さらに各ドメインは、ハードウェアパーティションに電気的に分離されるため、あるドメインで障害が発生しても、サーバー内の他のドメインには影響しません。

Sun Fire 15K/12K のドメイン構成は、SC に常駐するプラットフォーム構成データベース (PCD) 内のドメイン構成によって決定されます。PCD は、システムボードスロットを複数のドメインに論理的に分割する方法を規定します。ドメイン構成とは、予定のドメイン構成を表します。したがって、構成には空のスロットと生成したスロットを含めることができます。物理ドメインは論理ドメインによって決まります。

特定のドメインで使用可能なスロットの数は、SC 上で維持される使用可能構成要素によって指定されます。スロットをドメインに割り当てるか、またはドメインにすでにスロットが存在しなければ、その状態を変更することはできません。ドメインに割り当てられたスロットはそのドメインには見えますが、他のドメインからは使用できず、また見えません。逆に言えば、スロットを他のドメインに接続して割り当てるには、そのスロットをそのドメインから切り離して割り当て解除しておく必要があります。

論理ドメインとは、ドメインに属する一連のスロットをいいます。物理ドメインとは、物理的に相互接続された一連のボードをいいます。スロットは、物理ドメインの一部にならなくても論理ドメインのメンバーになれます。ドメインが起動したら、システムボードと空のスロットを論理ドメインに割り当てたり、また論理ドメインから割り当て解除したりできます。ただし、オペレーティング環境から要求があるまでは、物理ドメインの一部にすることはできません。どのドメインにも割り当てられないシステムボードまたはスロットは、すべてのドメインで使用できます。プラットフォーム管理者はこれらのボードをドメインに割り当てることができます。ただし、使用可能構成要素を SC に設定して、適切な特権を持つユーザーが使用可能なボードをドメインに割り当てられるようにすることもできます。


Solaris 8 2/02 オペレーティング環境を実行しているドメインでの DR の有効化

Solaris 9 オペレーティング環境は DR の全機能をサポートしていますが、Solaris 8 2/02 は入出力ボードの DRをサポートする Solaris オペレーティング環境の最初のリリースでした。

Solaris 8 2/02 以降のバージョンを実行しているドメインでは、ドメインにパッチと新しいカーネルアップデートをインストールして、システムコントローラ (SC) に System Management Services (SMS) 1.3 ソフトウェアをインストールすれば、DR の全機能を有効にすることができます。

上記ドメインでの DR を有効にする方法についての詳細は、以下の Web サイトを参照してください。

http://www.sun.com/servers/highend/dr_sunfire


DR 管理モデル

使用可能構成要素リストは、ユーザーの名前とグループ識別子に基づいて実行できる管理作業を決定します。各 DR 操作の特権モデルの概要については、第 3 章「SMS DR ユーザーインタフェース」を参照してください。各 SMS コマンドに必要な特権の詳しい説明は、『System Management Services (SMS) 1.3 管理者マニュアル』を参照してください。


SC 上の DR ソフトウェアコンポーネント

Sun Fire 15K/12K システムコントローラ (SC) 上のさまざまなプロセスとデーモンが連携動作して DR 操作を遂行します。使用されるプロセスとデーモンは、DR 操作がどこから実行されるかによって異なります。たとえば、SC から DR 操作を開始した場合は、ドメインから DR 操作を開始した場合よりもさらにいくつかのプロセスとデーモンが使用されて、DR 操作が遂行されます。

ドメイン上に常駐するプロセスとデーモンに関する詳細は、『Sun Fire 15K/12K Dynamic Reconfiguration ユーザーマニュアル』を参照してください。また、SC の SMS ソフトウェアに常駐するプロセスとデーモンに関する詳細は、『System Management Services (SMS) 1.3 管理者マニュアル』を参照してください。


ドメイン構成エージェント (DCA)

ドメイン構成エージェント (DCA) を使用すると、Suntrademark Management Center および SMS などのアプリケーションは、Sun Fire 15K/12K ドメインに対して DR 操作を開始できます。DCA は SC 上で実行されて、SC で実行されるソフトウェアアプリケーションと、ドメイン上のドメイン構成サーバーの間の DR 通信を管理します。Sun Fire 15K/12K システムの各ドメインの SC で、DCA のインスタンスが 1 つ実行されます。DCA についての詳細は、『System Management Services (SMS) 1.3 管理者マニュアル』を参照してください。



注 - inetd.conf ファイルの sun-dr エントリを変更または削除する場合は、ipsecinit.conf ファイルの sun-dr エントリにも同じ変更を行ってください。




プラットフォーム構成デーモン (PCD)

プラットフォーム構成デーモン (PCD) は、PCD データベースを構成するフラットファイルの集りによって Sun Fire 15K/12K システムの構成を管理します。Sun Fire 15K/12K システムの構成へのすべての変更は PCD を通して管理される必要があります。PCD についての詳細は、『System Management Services (SMS) 1.3 管理者マニュアル』を参照してください。


ドメイン X サーバー (DXS)

ドメイン X サーバー (DXS) は、ドメインの SC と DR モジュール (drmach) との通信を管理します。Sun Fire 15K/12K システムの各ドメインの SC で、DXS のインスタンスが 1 つ実行されます。DCX についての詳細は、『System Management Services (SMS) 1.3 管理者マニュアル』を参照してください。