Installera Windows 2000 Cluster Services #5
Förord
Det värsta är över nu. Och om du har kommit så här lång med framgång, så är det högst troligt att Windows 2000 Cluster Service nu är redo att användas. Men eftersom jag litar på en datorinstallation lika långt som jag kan kasta datorn (vilket inte är långt), så är det en mycket bra idé att testa Cluster Service, för att se så att det Verkligen Fungerar Som Det Ska. Den här artikeln kommer att visa på några tester som du kan utföra, för att se så att Cluster Service verkligen gör sitt jobb. Om det skulle vara något problem med ditt Cluster, så kan de här testerna oftast finna dem. Det som dock ligger utanför den här artikeln gränser är att visa vilka problemen är samt hur du kan fixa dem. Om ditt Cluster klarar sig igenom alla dessa tester utan några problem, så är oddsen höga för att det inte komma att åsamka några problem i framtiden heller (fast det kan man ju aldrig garantera).Innehåll
»»
»
»
»
Relaterade artiklar
» Installera Windows 2000 Cluster Services #1» Installera Windows 2000 Cluster Services #2
» Installera Windows 2000 Cluster Services #3
» Installera Windows 2000 Cluster Services #4
Steg 5: Testa och verifiera Windows 2000 Clustering Services
av Brian M. McGee
Test nummer 1: Flytta grupper
Det första testet vi ska göra, är mycket enkelt. Vi ska flytta de aktuella resurserna som skapades då vi installerade Cluster Services (inklusive Clustergruppen och diskgrupper), från den aktiva Clusternoden till den inaktiva Clusternoden.I ditt Cluster så kan de två noderna delas upp i en aktiv nod (den som kontrollerar Clustrets alla resurser) och en inaktiv nod (den som inte någon av Clustrets resurser). Om du är en expert inom Clustering, så märker du att jag har förenklat den här förklaringen, men den räcker gott för det här testet.
Efter att du har installerat Cluster Services på båda noderna i ditt Cluster, så kommer en nod ha kontroll över alla standard Clustergrupper (den aktiva noden) medan den andra noden inte kommer ha blivit tilldelats några Clustergrupper alls (den inaktiva noden). De resurser som enligt standard finns på den aktiva noden, inkluderar det som kallas ”Clustergrupp” och ”diskgrupp”. (Det kan finnas mer än en Diskgrupp, beroende på hur du har konfigurerat din gemensamma diskarray, men i det här exemplet så förutsätter vi att det endast finns en diskgrupp).
Generellt sett så innehåller Clustergruppen följande Clusterresurser:
- Cluster IP-adress (Clustrets virtuella IP-adressen)
- Clusternamnet (Clustrets virtuella namn, vilket används av klienterna för att ansluta till Clustret)
- Disken q: (Själva Quorum disken, behöver inte vara just q: )
Diskgruppen innehåller vanligtvis endast en resurs, och det är den enhetsbeteckning som refererar till den logiska disken i den gemensamma diskarrayen. Om du har fler än en logisk disk i din gemensamma diskarray, så kommer det att skapas en diskgrupp för varje tillgänglig logisk disk.
Nu när vi har klarat av det, så ska vi börja med det första testet, för att se så att Clustret fungerar som det ska. Vårt mål med det här testet är att se om vi manuellt både kan flytta standardresurserna från den aktiva noden till den inaktiva noden, och sedan göra stegen baklänges så att Clustergrupperna kommer tillbaka till sina vanliga platser i den aktiva noden. Så här gör du:
1. Starta Cluster Administrator.
2. I Explorerpanelen till vänster i Cluster Administrator, så öppnar du katalogen ”Groups”. Inuti katalogen bör du se Clustergruppen och Diskgrupperna.
3. Klicka på Clustergruppen för att markera den. I den högra panelen på skärmen kan du då se de resurser som bygger upp gruppen. Notera ägaren (Owner) för gruppen. Det är namnet på den aktiva noden.
4. Grupperna måste flyttas en och en till den andra noden. Först högerklickar du på ”Cluster Group” och väljer ”Move Group”. Så fort du har gjort det så kan du se att statusen ändras från ”Online”, till ”Offline pending”, till ”Offline”, till ”Online pending”, och slutligen till ”Online”. Det sker väldigt snabbt. Notera också att ägaren ändras från namnet på den aktiva noden, till namnet på den inaktiva noden.
5. Gör samma sak för ”Disk Group”.
6. Förutsatt att det inte blev några problem, så ska båda grupperna ha flyttats till den inaktiva noden – som i och med det här, nu har blivit den aktiva noden. När du har flyttat båda grupperna, så kan du gå in i Event Viewer för att se om det genererades några Errormeddelanden. Om allt gick som det ska, så ska det inte finnas några Errormeddelanden.
7. Nu kan du flytta tillbaka grupperna igen, genom att gå igenom punkt 4-6.
Det här är ett väldigt grundläggande test, men det hjälper till att bestämma huruvida Clustret fungerar som det ska eller inte. Följande tester är lite grundligare, och de hjälper dig att rota upp fler potentiella problem.
Test nummer 2: Initiera ett fel
Det här testet är ganska likt ovanstående test, men nu ska vi låtsas att en nod i Clustret har gått ner. Vi ska alltså simulera ett överförande av ansvar mellan noderna. Och det gör du, så här:1. Starta Cluster Administrator.
2. I Explorerpanelen till vänster i Cluster Administrator, så öppnar du katalogen ”Groups”. Inuti katalogen bör du se Clustergruppen och Diskgrupperna.
3. Klicka på Clustergruppen för att markera den. I den högra panelen på skärmen kan du då se de resurser som bygger upp gruppen. Notera ägaren (Owner) för gruppen. Det är namnet på den aktiva noden.
4. Högerklicka nu på resursen ”Cluster IP Address” i den högra panelen av skärmen, och välj ”Initiate Failure”. Det som händer, är att det talar om för Cluster Service att den virtuella IP-adressen har fallerat.
5. Efter att du har gjort det valet, så kan du märka en viss aktivitet under ”State”, men det tar inte lång stund innan resursen har en ”Online” status, märk också att ”Owner” inte har ändrats. Det verkar som om det inte har skett något överförande. Och det är korrekt. Inget överförande har skett. Tro det eller ej, men det här är normalt och kan förväntas. Det blir så här därför att Cluster Service försöker starta om en fallerad resurs upp till tre gånger (antalet kan ändras), innan det egentligen sker ett överförande. Så för att faktiskt kunna initiera ett överförande, så måste du gå igenom de ovanstående fyra stegen upp till fyra gånger, innan det händer något. Och när överförandet sker, så kan du även se att alla resurser i Clustergruppen också överförs.
6. Om du nu klickar på ”Disk Group”, så lär du märka att dina diskresurser inte överfördes. Det är också normalt. Det blev så, därför att en överföring bara kan tvinga beroende resurser att överföras, som en grupp. Och ”Cluster Group”, som vi överförde tidigare, är inte beroende utav ”Disk Group”, därför överfördes inte ”Disk Group”. För att överföra diskgruppen, så högerklickar du på diskresurserna i den högra panelen, och väljer ”Initiate Failure”. Du måste göra den proceduren totalt fyra gånger, innan diskresurserna överförs till den andra noden.
7. Nu när du har gjort det, så är det dags att flytta tillbaka ”Disk Group” och ”Cluster Group” till originalnoden.
Precis som efter förra testet, så bör du kolla i Event Viewer för eventuella Errormeddelanden. Om allting gick bra, så är du redo för nästa test.
Test nummer 3: Stäng av varje nod
Medan de två första testerna utfördes från Cluster Administrator, så kommer de tre följande testerna att vara lite mer realistiska. I det här testet, så måste du först försäkra dig om att alla standardgrupper är lokaliserade på en av de två noderna. Sen stänger du fysiskt ner (tryck på knappen!) den aktiva noden (den primära noden).Om du tittar på Clustergrupperna från Cluster Administrator i den inaktiva noden, så kan du se att när du stänger ner den aktiva noden, så överförs resurserna automatiskt till den andra noden. Efter att du har gjort det, så tittar du i Eventloggen efter eventuella Errormeddelanden.
När du väl har tittat efter eventuella problem, så kan du starta upp den första noden igen (den som du stängde ner), och vänta tills den har bootats klart. Du kan då se, att det inte sker någon överföring tillbaka när du sätter igång den igen. Clusterresurserna kommer att finnas kvar på den andra noden, tills du tvingar dem tillbaka till den första noden.
Nu kan du stänga av noden som för närvarande innehar de aktiva grupperna (den andra noden), och repetera de saker som du gjorde med den första noden. Precis som förut, så kan du använda Cluster Administrator i den första noden, för att se när grupperna överförs till den första noden. Sen kollar du Eventloggen för eventuella problem som kan ha uppstått.
När grupperna väl har förts tillbaka till den första noden, så kan du sätta igång den andra noden igen och vänta tills den har bootat klart.
Det här är ett väldigt bra test för att försäkra sig om att överföringen sker i verkligheten. Om testet inte uppbringade några problem, så är du nu redo för nästa test.
Test nummer 4: Bryt nätverksanslutningen
Det här testet har ett liknande koncept som testet ovan. Det vi vill göra är att tvinga fram ett överförande. Men istället för att simulera ett datorfallerande, så ska vi simulera ett nätverksrelaterat error.Gör så här, att du tar bort nätverkskabeln från det publika nätverkskortet på den nod som har standardresursgrupperna (den första noden). Det kommer att simulera ett fel på den första noden, och det bör ske ett överförande till den andra noden.
Om du tittar på Clustergrupperna från Cluster Administrator i den andra noden, så kan du se att resurserna automatiskt överförs till den andra noden. Kolla sedan Eventloggen för eventuella problem som kan ha uppstått.
När du väl har kollat Eventloggen för eventuella problem, så kan du sätta tillbaka nätverkssladden till den första noden, och sedan ta bort nätverkssladden från det publika nätverkskortet i den andra noden. Precis som förut, så kan du använda Cluster Administrator till att bevaka när grupperna faller tillbaka till den första noden. Kolla sedan Eventloggen för eventuella problem. Och när du har gjort det, så kan du sätta tillbaka nätverkssladden till det publika nätverkskortet på den andra noden.
Om det inte uppstod några problem under det här testet, så är du nu redo för det sista testet.
Test nummer 5: Bryt anslutningen till den gemensamma diskarrayen
Det här testet är designat till att avslöja eventuella problem med den gemensamma hårddiskarrayen. Jag har sett många Cluster som har passerat ovanstående fyra tester felfritt, men som visar på problem vid det här testet, ifall inte den gemensamma diskarrayen är 100 % korrekt konfigurerad. Testet är designat till att simulera vad som skulle hända ifall controller-kortet eller kabeln som ansluter noden till den gemensamma diskarrayen, skulle fallera. Det du gör, är att kopplar bort kabeln från kortet som är anslutet till den gemensamma arrayen, och som finns på den noden som innehåller alla standardresursgrupper (den första noden). Det här kommer att simulera ett fel på den gemensamma diskarrayen, och bör initiera ett överförande till den andra noden.
Om du tittar på Clustergrupperna från Cluster Administrator i den andra noden, så kan du se att resurserna automatiskt har överförts till den andra noden. Kolla sedan Eventloggen för eventuella problem som kan ha uppstått.
När du väl har kollat Eventloggen för eventuella problem, så kan du sätta tillbaka kabeln till den första noden, och sedan ta bort kabeln från det kort som är anslutet till den gemensamma diskarrayen i den andra noden. Precis som förut, så kan du använda Cluster Administrator till att bevaka när grupperna faller tillbaka till den första noden. Kolla sedan Eventloggen för eventuella problem. Och när du har gjort det, så kan du sätta tillbaka kabeln till rätt kort på den andra noden.
Nu när du väl har gjort framgångsrika tester i ditt Cluster, så är du redo att installera SQL Server 7.0 eller 2000 Clustering till ditt Cluster. Och som du kanske kan tänka dig, så tillhör det kapitlet en helt annan artikel.
0 Kommentarer