NetApp Metrocluster Switchover FDISC Error mit Cisco MDS Switches

Ich hatte letztens ein kleines Problem… Wir haben in einem Setup einen NetApp MetroCluster mit Cisco MDS SAN Frontend aufgebaut. Eigentlich keine Hexerei, aber der Fehler liegt im Detail.

Im Falle eines Switchovers oder Switchbacks, verloren alle Hosts ihre Pfade und natürlich auch die LUNs, welche auf dem übernommenen Controller terminierten.

Der Fehler war schnell gefunden, die LIFs blieben einfach down.

Wir fanden dann diesen wunderbaren Artikel in der Knowledgebase: https://kb.netapp.com/support/s/article/ka11A0000001UmE/fcp-fcoe-lif-reports-operationally-down

Folgen wir also dem Guide:

network interface show -data-protocol fcp -fields status-admin,status-oper,status-extended



vserver lif status-oper status-extended status-admin
------------------ ---------------------- ----------- --------------- ------------
svm-*******01-mc *******_lif_1 down - up
svm-*******01-mc *******_lif_2 down - up
svm-*******01 *******_lif_1 down FDISC error - ID could not be acquired for this virtual port.
 up
svm-*******01 *******_lif_2 down FDISC error - ID could not be acquired for this virtual port.
 up
4 entries were displayed.

Interessant! Wir probierten herum und fanden schnell einen Workaround: einfach das Interface down und up setzen. Das Funktioniert … Lösung ist das aber keine.

Am MDS wurde auf Version 8.1.1 aktualisiert haben und es dabei offensichtlich ein paar neue Default gibt. Zumindest wird man beim Downgrade darauf hingewiesen:

Checking incompatible configuration(s)
The following configurations on active are incompatible with the system image
1) Service : flogi , Capability : CAP_FEATURE_FLOGI_SCALE_ENABLE
Description : flogi scale enabled on this switch
Capability requirement : STRICT
Enable/Disable command : no flogi scale enable

2) Service : flogi , Capability : CAP_FEATURE_FLOGI_QUIESCE_TIMEOUT
Description : flogi queisce timeout enabled on this switch
Capability requirement : STRICT
Enable/Disable command : flogi quiesce timeout 0



Checking dynamic incompatibilities:
-----------------------------------
No incompatible configurations

Irgendwie springt in diesem Fall diese Option ziemlich ins Auge: CAP_FEATURE_FLOGI_QUIESCE_TIMEOUT

Der Default Wert liegt in diesem Release bei:

show flogi internal info |inc quiesce
 Stats: fs_flogi_quiesce_timerval: 2000

Also schnell einen Versuch starten und mit dem folgenden Befehl auf einer der beiden Fabrics das Timeout wieder auf 0 setzen:

flogi quiesce timeout 0

Anschließend noch einmal einen Switchover/Switchback testen und viola … es funktioniert. 🙂

 

Ich hoffe das hilft jemanden weiter. Wir haben bisher keine Information dazu finden können.

 

 

Liebe Grüße

Falk

 

IT Konferenzen 2017

Ich habe jetzt einmal die Liste der Konferenzen auf 2017 aktualisiert.

Hier also wieder die Liste vom letzten Jahr (Sortierung wertfrei :-))

IT Konferenzen 2017 weiterlesen

Hyperconverged Storages

Hat man bisher stets eine dedizierte Box benötigt, um ein Shared Storage zur Verfügung zu stellen, kommen vermehrt Rack-Server mit lokalen Disks ins Spiel. Genau diese Rackserver bilden untereinander ein „Distributed Storage“ und das ist die Idee hinter Hyperconverged Storages.

Aktuell ist der Markt überschaubar aber trotzdem breit gefächert. Es ist so, dass sich irgendwie je Anwendungsfall eine andere Lösung anbietet. Das liegt daran, dass sich die Lösungen in meinen Augen aktuell in verschiedene Richtungen entwickeln. Irgendwann werden sicher alle die gleichen Features bieten. Zumindest hat man das am traditionellen Storage-Markt beobachten können – inzwischen liefern ja sämtliche Hersteller ein ähnliches Featureset.

Hyperconverged Storages weiterlesen

IT Konferenzen 2016, eine Übersicht.

Das Jahr ist noch jung. Zeit sich mit den IT Konferenzen des Jahres zu beschäftigen.

Ich habe lange überlegt, welchen Banner ich hier verwende. Schlussendlich habe ich mich für den „#Operations„-Banner entschieden. Denn gerade Leute welche in diesem Bereich tätig sind, nehmen wahrscheinlich am meisten von solchen Veranstaltugen mit. Die letzten zwei Jahre durfte ich die EMEA VMworld besuchen und kam immer voller Ideen wieder zurück. Ähnlich ging es auch meinen Kollegen mit der Netapp Insight.

Hier also eine kleine Auswahl (ohne Sortierung) …

IT Konferenzen 2016, eine Übersicht. weiterlesen

Cisco UCS Software Upgrade bringt HTML5

Es ist kein Geheimnis, dass ich mich nicht sonderlich für Java-GUIs erwärmen kann. Desto mehr freut es mich folgenden Satz in den Release Notes des aktuellen UCS-Managers (Version 3.1.1e) zu lesen: Cisco UCS Software Upgrade bringt HTML5 weiterlesen

Sicherheitslücken in Cisco Produkten

Aus aktuellem Anlass informieren wir euch über mehrere Sicherheitslücken in Cisco Netzwerkprodukten. Durch die Sicherheitslücken können Angreifer Zugang zu den Komponenten erhalten und teilweise diese vollständig übernehmen. Cisco definiert das Risiko der Sicherheitslücken mit “kritisch” bzw. “hoch” und empfiehlt dringend die zur Verfügung stehenden Sicherheitsupdates einzuspielen.

Sicherheitslücken in Cisco Produkten weiterlesen