C H A P I T R E  2

Bugs de SMS 1.4

Ce chapitre contient des informations sur les bugs connus de SMS 1.4. Il se compose comme suit :


Bugs du logiciel SMS 1.4

Cette section résume les principaux bugs et RFE 1.4 qui affectent SMS 1.4. Il ne contient pas tous les bugs et RFE.

L'utilisation de Contrôle-C pour interrompre la séquence de mise sous/hors tension peut causer un vidage d'image mémoire d'ESMD (bug n°4902308)

Interrompre la mise sous/hors tension au moyen de Contrôle-C peut causer un vidage d'image mémoire d'ESMD. ESMD redémarrera automatiquement et la reprise s'effectuera normalement. Les messages relatifs aux pannes de composants (esmd) et au redémarrage seront enregistrés dans le fichier de messages de la plate-forme.

Solution : N'utilisez pas Contrôle-C pendant les opérations de mise sous et hors tension.

L'utilisation de Contrôle-C pour interrompre la séquence de mise sous/hors tension peut causer l'affichage de messages d'erreur inutiles (bug n°4902311)

Interrompre la mise sous/hors tension au moyen de Contrôle-C peut causer l'enregistrement d'erreurs telles que « client monitor failed » sur la plate-forme. Bien que ces messages ne reflètent pas des erreurs réelles et soient sans effet sur le système, ils peuvent alarmer inutilement.

Solution : Soit n'émettez pas de commandes Contrôle-C pendant les opérations de mise sous tension, soit, si vous en émettez, ignorez ces messages d'erreur.

La commande setchs -c est limitée à un composant à la fois (bug n°4925617)

Si vous essayez de changer CHS sur plusieurs composants avec une unique commande setchs, seul le premier de ces composants sera changé. La commande retourne « 0 » pour signaler la réussite de l'opération et ne fournit aucun message d'erreur indiquant que les composants suivants n'ont pas été changés.

Solution : La commande setchs -c est limitée à un composant à la fois.

Affichage d'erreurs de temporisation de la puce ADC en cas de charge importante du SC (bug n°4948686)

Quand le contrôleur système est soumis à une charge importante, le logiciel SMS 1.4 peut rapporter des erreurs de temporisation de calibrage de la puce ADC telles que la suivante :

...NOTICE ExpBoard.cc 122] The ADC chip calibration timeout on EX13

Solution : Ignorez ces messages d'erreur.

Message trompeur pendant la mise hors tension du SC (bug n°4953836)

Quand esmd met hors tension un contrôleur système (SC) pour des raisons liées à l'environnement telles qu'une température élevée ou basse, un message trompeur s'affiche. Ce message indique que le SC va être mis hors tension et supprimé du domaine. Or, les contrôleurs système ne pouvant pas faire partie d'un domaine, ils ne peuvent pas en être supprimés.

Solution : Ignorez ce message.

Augmentation du temps d'initialisation du domaine (bug n°4957596)

Le temps nécessaire pour qu'un châssis Starcat se mette sous tension et que ses domaines affichent une invite Solaris a augmenté de près de 15%.

Solution : Aucune.

Risque de mauvais fonctionnement du basculement sur le SC de réserve (bug n°4963029)

Le basculement risque de ne pas fonctionner correctement sur le SC de réserve quand un centerplane en mauvais état est utilisé.

Solution : Éliminez le problème du centerplane en mauvais état avant d'essayer de réparer le SC de réserve.

Les cartes système à deux processeurs affichent un statut inconnu après une réinitialisation de domaine (bug n°4970240)

Quand les deux processeurs d'une carte système à deux processeurs sont mis en examen à cause d'erreurs corrigeables ECC Solaris et que le domaine est réinitialisé, le « Power State » de la carte système devient UNKNOWN au lieu de rester sur ON. Cela cause l'échec de showchs.

Ce problème ne survient pas avec les cartes système à quatre processeurs.

Solution : Soumettez la carte système à un cycle d'alimentation.

Absence de reprise du domaine en cas de mise hors tension de la carte d'extension dans un domaine en cours d'exécution (bug n°4970726)

Si vous mettez hors tension une carte d'extension dans un domaine en cours d'exécution, dsmd n'assurera pas la reprise du domaine.

Solution : Ne mettez pas hors tension une carte d'extension quand les composants de l'emplacement 0 ou 1 sont utilisés par un domaine en cours d'exécution.

Affichage d'un message d'erreur lors d'une opération DR réussie (bug n°4971396)

Il arrive qu'une opération d'ajout de carte réussie effectuée sur un domaine configuré dans une configuration à emplacement divisé affiche le message suivant :

FAIL Slot SB12: MaxCPU in use in Slot I012, allow_maxcpu_split_ex not set. There is no FRU service action indicated for this failure.

Solution : Utilisez la commande showboards pour vérifier si l'opération a réussi. Si c'est le cas, ignorez le message.

L'opération setkeyswitch semble se bloquer (bug n°4972781)

Si vous exécutez des commandes setkeyswitch sur plusieurs domaines qui partagent des cartes d'extension, vous risquez de voir des messages d'erreur similaires au suivant :

[ ...ERR setKeyswitchLock.cc 124] setkeyswitch process already running: pid=10435

L'opération ne se bloque pas. En fait, chacun des domaines verrouille le matériel partagé de son côté. Quand la première commande setkeyswitch se termine, les commandes setkeyswitch restantes peuvent commencer.

Solution : Aucune.

N'insérez pas de carte système dans une carte d'extension qui est mise hors tension (bug n°4970670)

Si une carte système est insérée dans une carte d'extension mise hors tension, aucun enregistrement d'installation n'est écrit.

Solution : Retirez la carte système, mettez sous tension la carte d'extension et ré-insérez le carte système.


Bugs qui affectent le logiciel SMS 1.4

Cette section résume les bugs les plus importants susceptibles d'affecter le système SMS 1.4. Il ne s'agit toutefois pas d'une liste exhaustive de tous les bugs pouvant affecter le système SMS 1.4.

Reconfiguration manuelle du réseau MAN nécessaire après un changement de l'adresse IP réseau MAN I1 d'un domaine installé (bug n°4484851)

Si des domaines sont déjà installés et que vous changez la configuration du réseau MAN I1 en utilisant smsconfig -m, vous devrez configurer manuellement les informations du réseau MAN sur ces domaines installés.

Solution : Consultez les informations relatives aux domaines non-configurés du
Guide d'installation de System Management Services (SMS) 1.4.

Les scripts Begin/Finish spécifiques de la plate-forme Sun Fire 15K peuvent se bloquer sur les domaines HPCI+ uniquement (bug n°4797577)

La mise à jour 7 de l'environnement d'exploitation Solaris 8 n'inclut pas de prise en charge pour les cartes hsPCI+. Dans les domaines comportant uniquement des cartes hsPCI+, l'installation peut se bloquer après le démarrage des scripts Begin/Finish.

Solution : Appuyez sur Ctrl-C pour interrompre les scripts Begin/Finish. Cela permettra la poursuite de l'installation qui réussira.

Dépassements de temporisation intermittents de I2C (1124) à la réception du statut d'une cassette Hpc3130 (bug n°4785961)

Des dépassements de temporisation intermittents de I2C sont signalés par dxs et frad à la réception du statut d'une cassette Hpc3130 hsPCI. Les conséquences sont minimes et limitées à la consignation de messages d'erreur dans les fichiers journaux de la plate-forme, du domaine et de la console de domaine.

Solution : Aucune.

Une réponse non-mappée à une requête non « cachable » corrompt l'état dans le module AXQ (bug n°4761277)

Si deux domaines partagent une extension et un pilote de périphérique (ou extension OS) sur un domaine, une adresse incorrecte est envoyée à l'espace E/S programmé et les deux domaines peuvent dstop. Cela se produit uniquement avec les extensions OS défectueuses qui s'exécutent en mode privilégié à l'instar des pilotes de périphériques.

Solution : Ne partagez en aucun cas une extension entre un domaine de production et un domaine contenant un logiciel en mode privilégié non testé ou problématique tel que les pilotes de périphériques.

Possibilité d'absence de détection par les serveurs Sun Fire 15K des interruptions d'arrêt des domaines (bug n°4924523)

Si une interruption de type arrêt de domaine (dstop) est détectée par hwad mais pas par dsmd, dsmd signalera une panne de pulsation. Seules les informations de configuration du matériel sont incluses dans le vidage d'image mémoire, et ni les données relatives aux registres du CPU ni celles relatives au domaine (dsmd.dump) ne sont enregistrées. Les fichiers de configuration du matériel rapportent une condition dstop.

Solution : Vous pouvez re-poster le domaine à un niveau supérieur pour révéler la source du problème matériel.

SMS ne démarrera pas en l'absence d'adresse IP (bug n°4929849)

Si le contrôleur système d'un serveur haut de gamme ne peut pas résoudre son propre nom d'hôte, wcapp ne démarrera pas. Résultat, SMS ne démarrera pas non plus. À la place, vous verrez des messages d'erreur wcapp continus dans le journal de la plate-forme. Par exemple :

wcapp[9433:1]: [12300 8753505948023 ERR libWcApp.cc 2227]
Wcapp : java.net.UnknownHostException:

[1312 8753513433994 ERR StartupManager.cc 3021] software component failed: name=wcapp

[1304 8753514591425 NOTICE StartupManager.cc 2740] software component start-up initiated: name=wcapp

wcapp: [NOTICE] /usr/java1.2/lib/ext/jsse.jar, /usr/java1.2/lib/ext/jnet.jar, /usr/java1.2/lib/ext/jcert.jar: optional JSSE jarfiles not all found or not readable by user; running without SSL support


Solution : Assurez-vous que le nom exact de l'hôte du SC (tel que retourné par la commande hostname(1)) et l'adresse IP exacte sont enregistrés dans le fichier /etc/hosts ou le service de noms utilisé quel qu'il soit. Une manière d'enregistrer le nom dans le fichier /etc/hosts consiste à exécuter de nouveau la commande smsconfig et à entrer le nom d'hôte et l'adresse IP qui avaient été utilisés pour le SC dans le Site Planning Guide. Une fois que vous avez vérifié l'exactitude du nom de l'hôte et de l'adresse IP, redémarrez SMS.


Erreurs de la documentation de SMS 1.4

Cette section résume les erreurs qui figurent dans les pages et de manuel et la documentation relatives à SMS 1.4.

Utilisation de suffixes erronés dans l'exemple de mise à jour de SMS de la page de manuel smsupgrade.1m (bug n°4912378)

L'exemple de mise à jour de la page de manuel smsupgrade.1m n'affiche pas les bons suffixes de mise à jour pour les packages de SMS. Tous les packages mis à jour doivent présenter le suffixe .2.

Solution : Lisez à la place le Guide d'installation de SMS 1.4.

Affichage de champs de données incorrects dans la page de manuel pcd.1m (bug n°4918650)

Les descripteurs des données de la plate-forme de la page de manuel pcd.1m et du SMS 1.4 Reference Manual ne sont pas corrects. Pour SMS 1.4, les descripteurs sont de la version 3, et un champ « Chassis Serial Number » (Numéro de série du châssis) a été ajouté aux informations de la plate-forme.

Solution : Aucune.

Inexactitude des informations sur flashupdate dans le Guide d'installation (bug n°4942045)

Le Guide d'installation de SMS 1.4 ne signale pas que deux fichiers flashupdate, nSCCPOST.di et oSCCPOST.di, peuvent seulement être utilisés sur certaines types de contrôleurs système (SC). Chacun de ces fichiers correspond à un matériel bien défini :

En plus, les exemples des pages 23, 38, 52 et 61 montrent une carte CP1500 sur un SC et une carte CP2140 sur l'autre SC, ce qui n'est pas pris en charge.

Solution : Pour connaître le type de votre SC, contrôlez le fichier journal des messages de la plate-forme au démarrage de SMS.

showboards -c fournit des informations erronées sur les cartes WPCI (bug n°4970807)

La commande showboards -c, conçue pour afficher la source d'horloge pour toutes les cartes système, indique par erreur que toutes les cartes WPCI du système sont désactivées. Ce statut incorrect ne s'affiche qu'avec l'option -c.

Solution : Ignorez le statut des cartes WPCI ou exécutez de nouveau la commande showboards sans l'option -c pour vérifier le statut des cartes.