5


DR ドメイン手順

この章では、ドメインで cfgadm(1M) コマンドを使って DR 操作を実行する方法について説明します。また、接続点と、システムボードのステータスを表示する手順についても説明します。


接続点

cfgadm(1M) コマンドを使用するには、まず Sun Fire ハイエンドシステムプラットフォームの接続点の構文を理解する必要があります。接続点には、物理接続点と論理接続点があります。また、ボードスロットには単一接続点、コンポーネントには動的接続点がそれぞれ使用されます。DR ドライバによって作成された接続点には論理パスと物理パスがあります。

システムボードの物理接続点は次の書式で表します。

/devices/pseudo/dr@0:SBx (CPU およびメモリボードの場合)
または
/devices/pseudo/dr@0:IOx (入出力ボードの場合)

ここで、x は拡張ボード番号 (たとえば、Sun Fire 15K システムでは 0〜17、Sun Fire 12K システムでは 0〜8) を示します。

システムボードの論理接続点は次の書式で表します。

SBx (CPU およびメモリーの場合) 
または 
IOx (入出力ボードの場合)

ここで、x はボード番号 (たとえば、Sun Fire 15K システムでは 0〜17、Sun Fire 12K システムでは 0〜8) を示します。

動的接続点は、システムボード上のコンポーネント (CPU およびメモリー) と入出力ボード上の入出力デバイスを指します。接続点は DR ドライバによって作成されます。詳細は、dr(7D) マニュアルページを参照してください。


ボードステータスの表示

cfgadm(1M) コマンドは、ボードとスロットに関する情報を表示します。このコマンドのオプションについては、cfgadm_sbd(1M) マニュアルページを参照してください。

基本的なステータス表示

多くの操作で、システムボード名を指定する必要があります。これらのシステム名を取得するには、次のように入力します。

# cfgadm -a -s "select=class(sbd)"

cfgadm(1M) コマンドは、特定のドメインに割り当てられているボードのみ、または特定のドメインの使用可能構成要素リストに登録されており、他のドメインに割り当てられていないボードのみに関する情報を表示します。

次に典型的な出力を示します。

Ap_Id                Type       Receptacle       Occupant        Condition
SB0                  CPU        connected        configured      ok
SB0::cpu0            cpu        connected        configured      ok
SB0::memory          memory     connected        configured      ok
IO1                  HPCI       connected        configured      ok
IO1::pci0            io         disconnected     unconfigured    failed

詳細ステータス表示

より詳しいステータスレポートを表示するには、cfgadm(1M) コマンドを -v オプション付きで実行します。このオプションを指定すると、情報が詳細モードで出力されます。接続点 ID、受容体と占有装置の状態、およびボードステータスなどの基本的な情報だけでなく、詳細ステータスレポートには、ボードがドメインに構成された日付、ボードのタイプ、活動状態、および物理接続点も含まれます。


ボードの削除

この節では、CPU/メモリーボードおよび入出力ボードを削除するための手順について説明します。


procedure icon  CPU/メモリーボードを削除する

以下の手順を行うには、ドメイン管理者特権が必要です。

1. ドメインにログインします。

2. -l オプションを付けてcfgadm(1M) コマンドを実行し、ボードの接続点を判別します。

3. ボード上のすべての活動を中止します。

適切な Solaris コマンドを使用して、他のCPU およびメモリーボードによるアクセスすべてを停止し、ボードが交換されるまでその使用を禁止する必要があります。

4. ボードに実行中の結合プロセスがないことを確認します。

プロセスが CPU に結合されている場合、ボードはそのプロセスが非結合状態になるまで削除できません。詳細は、pbind(1M) マニュアルページを参照してください。

5. 次に示す 1 つのコマンドで、ボードの構成解除と切り離しを一度に実行します。

# cfgadm -v -c disconnect SBx

ここで、x はボード番号 (たとえば、Sun Fire 15K システムでは 0〜17、Sun Fire 12K システムでは 0〜8) を示します。



注 - ボードは切り離すまで削除しないでください。切り離す前に削除すると、ボードが破損するおそれがあります。




procedure icon  入出力ボードを削除する

入出力ボードを削除するには、まずボードの使用を完全に停止する必要があります。この項では、このプロセスの両フェーズの手順について説明します。この手順を行うには、ドメイン管理者特権が必要です。

1. ドメインにログインします。

2. ボードのステータスを確認します。

# cfgadm -a -s "select=class(sbd)"

3. システムがマルチパスソフトウェアを使用している場合:

a. すべてのボード機能を代替ボードに移動します。

b. すべてのマルチパスデータベースまたは占有領域、あるいはこの両方を削除します。

c. すべての代替パスが機能するまで待機して、次に進みます。

4. ボード常駐パーティションがあるメタデバイスを含めて、ファイルシステムをマウント解除します(例: umount /partition)。



caution icon

注意 - ファイルシステムをマウント解除すると、NFS クライアントシステムに影響する場合があります。



5. ボードに Sun RSM Arraytrademark 2000 コントローラが含まれる場合は、rm6 または rdacutil コマンドを使用してコントローラをオフラインにします。

6. スワップ構成からディスクパーティションを削除します。

7. デバイスまたは raw パーティションを直接開いているプロセスがあれば、該当するプロセスをすべて強制終了するか、それらのプロセスに対してボード上で開いているデバイスを閉じるように指示します。

8. 切り離しが安全ではないデバイスがボード上に存在する場合は、そのデバイスのインスタンスをすべて閉じてから、modunload(1M) を使用してドライバを読み込み解除します。

9. ボードを切り離します。

# cfgadm -v -c disconnect IOx

ここで、x はボード番号 (たとえば、Sun Fire 15K システムでは 0〜17、Sun Fire 12K システムでは 0〜8) を示します。



注 - DR 操作中に cfgadm(1M) コマンドの実行が失敗すると、対象のボードは元の状態に戻りません。dxs または dca のエラーメッセージが、ドメインのログに出力されます。エラーが回復可能であれば、失敗したコマンドを再試行できます。エラーが回復不能な場合、そのボードを使用するには、ドメインの再起動が必要です。




ボードの追加

ボードを取り付ける前に、次の点に注意してください。

  • 欠陥を含むボードや信頼性に問題があると思われるボードは使用しない。そのようなボードは、システムをクラッシュさせる可能性があります。
  • ボードタイプとオプションカードが、DR によってサポートされていなければならない。


注 - DR を使用してドメインへ COD ボードを追加する場合は常に、COD ボード上の各アクティブ CPU を有効にするのに十分な数の COD RTU (right-to-use) ライセンスが対象ドメインにあることを確認してください。COD ボードを追加する際、対象ドメインに対して十分な RTU ライセンスがない場合、ドメインで有効にできない各 CPU に関するエラーメッセージが表示されます。COD オプションの詳細については、『System Management Services (SMS) 管理者マニュアル』を参照してください。




procedure icon  ボードを取り付ける

ドメインからボードを取り付けるには、ボードがすでにドメインに割り当てられているか、使用可能構成要素リストに登録されている必要があります。ボードの割り当て方法、または使用可能構成要素リストの更新方法は、『System Management Services (SMS) 管理者マニュアル』を参照してください。

1. 指定されたボードスロットがボードを受け入れられることを確認します。

# cfgadm -a -s "select=class(sbd)"

状態と条件は、次のいずれかでなければなりません。

  • 受容体の状態--Empty
  • 占有装置の状態--Unconfigured
  • 条件--Unknown

または

  • 受容体の状態--Disconnected
  • 占有装置の状態--Unconfigured
  • 条件--Unknown

2. 次に示す 1 つのコマンドで、ボードの接続と構成を一度に実行します

# cfgadm -v -c configure SBx (CPU/メモリーボードの場合)
または
# cfgadm -v -c configure IOx (入出力ボードの場合)

ここで、x はボード番号 (たとえば、Sun Fire 15K システムでは 0〜17、Sun Fire 12K システムでは 0〜8) を示します。

システムによるボードのテストがしばらくの間実行された後、コンポーネントが構成されたことを示すメッセージがドメインコンソールログに出力されます。接続点および構成された接続点の状態と条件は次のとおりでなければなりません。

  • 受容体の状態--Connected
  • 占有装置の状態--Configured
  • 条件--OK

これでシステムがボード上の使用可能デバイスを認識するため、それらのデバイスを使用できます。



注 - DR 操作中に cfgadm(1M) コマンドの実行が失敗すると、対象のボードは元の状態に戻りません。dxs または dca のエラーメッセージが、ドメインのログに出力されます。エラーが回復可能であれば、失敗したコマンドを再試行できます。エラーが回復不能な場合、そのボードを使用するには、ドメインの再起動が必要です。




cfgadm(1M) を使用した DR - 例

ヘルプの表示

コマンドのヘルプテキストを表示するには、-h オプションを使用します。-h オプションの後ろに接続点 ID を付けると、接続点のハードウェア特定ライブラリに関連したヘルプメッセージ (構文) が表示されます。

表 5-1 ヘルプを表示するコマンド

コマンド

説明

# cfgadm -h

一般的な構文を示します。

# cfgadm -h pci

PCI ホットプラグ特定コマンドを表示します。

# cfgadm -h SB2

システムボード特定コマンドおよびオプションに関連したヘルプを表示します。


冗長メッセージの表示

-v オプションは、DR 操作が進行する際に、詳細なメッセージを表示します。以下に例を示します。

システムボード 2 (SB2) のメモリーボードを冗長オプションを使用して構成する場合は、次のコマンドを使用します。

# cfgadm -v -c configure SB2::memory

システムボード 0 (SB0) のCPU 3 (CPU3) を冗長オプションを使用して構成解除する場合は、次のコマンドを使用します。

# cfgadm -v -c unconfigure SB0::cpu3

ユーザー確認の省略

ある cfgadm コマンドが入力されると (常時メモリーを構成解除するなど) 、コマンドは操作の確認のためにユーザーの応答 (yes、または no) を求めます。たとえば、次のコマンドは常時システムメモリーを搭載するシステムボード 6 (SB6) を構成解除し、ユーザー確認を求めます。

# cfgadm -c unconfigure SB6::memory
System may be temporarily suspended, proceed (yes/no)?

コマンド行で -y または -n オプションを使用して、確認プロンプトを省略できます。-y オプションは自動的に「Yes」で応答し、-n オプションは「No」で応答します。次のコマンドは前のコマンドとまったく同じ操作ですが、-y オプションを使用してユーザー確認を求めないようにしています。

# cfgadm -y -c unconfigure SB6::memory
#

ボード切り離し時の電源制御

ドメインの常時メモリーを搭載するシステムボード 6 (SB6) を構成解除し、ユーザー確認プロンプトに「Yes」で応答し、冗長メッセージを表示するには、次のコマンドを使用します。

# cfgadm -y -v -c disconnect -o unassign,nopoweroff SB6

入出力ボード 12 (IO12) を切り離し、電源供給を停止しても同じドメインに割り振られたままにしておくには、次のコマンドを使用します。

# cfgadm -c disconnect I012

切り離し済みボードの電源制御

システムボード 2 (SB2) に電源を投入するには、次のコマンドを使用します。

# cfgadm -x poweron SB2

システムボード 2 (SB2) の電源を切断するには、次のコマンドを使用します。

# cfgadm -x poweroff SB2

ボードの接続と構成

DR がドメインにボードを構成する際、まずボードを電気的にシステムに接続し、それを connected 状態にします。次に、DR はドメインで稼動するすべてのアプリケーションで完全に使用できるようにシステムボードを構成し、これを configured 状態にします。

DR がドメインからボードを取り外す場合、まず、ドメインで稼動するアプリケーションで使用できないようにシステムボードを構成解除し、これを unconfigured 状態にします。その後、DR はボードをシステムから電気的に切断し、これを disonnected 状態にします。

PCI アダプタカードのホットプラグ操作

入出力ボード上の各ホットプラグスロットは個別に接続、構成、構成解除、および切り離しできます。ホットプラグスロットの各接続点は、スロットとスロットに差し込まれたアダプタカードを識別し、入出力ボードがドメインに構成されたときに作成されます。

入出力ボード 1 のスロット 1 のアダプタをドメインに接続する (ただし、構成はしない) には、次のコマンドを使用します。

# cfgadm -c connect pcisch0:e01b1slot1

入出力ボード 1 のスロット 1 のアダプタをドメインに構成するには、次のコマンドを使用します。

# cfgadm -c configure pcisch0:e01b1slot1

アダプタを引き抜く前に入出力ボード 1 のスロット 1 でアダプタを切り離すには、次のコマンドを使用します。

# cfgadm -c disconnect pcisch13:eo1b1slot1

入出力ボード 1 のスロット 1 のアダプタをドメインから構成解除するには、次のコマンドを使用します。

# cfgadm -c unconfigure pcisch0:e01b1slot1

詳細については、cfgadm_pci(1M) を参照してください。

ボードのテスト

-t オプションによりボードがテストされます。次のコマンドを実行する前に、システムボード 2 (SB2) は切り離し、割り当て、および電源投入される必要があります。次のコマンドには冗長オプションが含まれています。

# cfgadm -vt SB2

ボードは、.postrc ファイルでドメインに指定された診断レベルを使用してテストされます。デフォルトは 16 です。

接続点情報の表示

この項では、接続点に関するシステム情報を表示するために使用するコマンド例を示します。詳細については、cfgadm(1M) マニュアルページを参照してください。

すべての接続点の状態、および条件を一覧表示するには、冗長オプションを使用して次のコマンドを実行します。

# cfgadm -val

入出力ボード 3 のスロット 1 でのアダプタの状態と条件を一覧表示するには、次のコマンドを使用します。

# cfgadm -al pcisch13:e03b1slot1

次のコマンドは、各接続点の論理名、その条件、カレンダ形式と解析可能形式で示したステータス時間、およびその他の情報を一行で表示します。

# cfgadm -s "cols=ap_id:condition:status_time:status_time_p: info"

次のコマンドは、各接続点の論理名と物理 ID を一行で表示します。

# cfgadm -s "cols=ap_id:physid"

次のコマンドは、各接続点の論理名、その受容装置状態、占有状態、占有タイプ、Busy ステータス、およびクラスを一行で表示します。

# cfgadm -s "cols=ap_id:r_state:o_state:type:busy:class"

メモリー構成解除操作の追跡

ドメインの常時メモリーを持つシステムボードを構成解除するとき、次のコマンドはメモリー削除プロセスを追跡します。

# cfgadm -a -s "select=type(memory),cols=ap_id:o_state:info"

常時メモリーを含むボードの検索

ドメインの常時メモリーを持つシステムボードを検索するとき、次のコマンドを使用します。

# cfgadm -val | grep permanent