pellesoft.se

Installera Windows 2000 Cluster Services #5

Postad 2002-10-19 av Susanne Hayat i sektionen ASP.NET, C#, Okategoriserat med 0 Kommentarer | Läst av: 4987, Betyg: 80%

Förord

Det värsta är över nu. Och om du har kommit så här lång med framgång, så är det högst troligt att Windows 2000 Cluster Service nu är redo att användas. Men eftersom jag litar på en datorinstallation lika långt som jag kan kasta datorn (vilket inte är långt), så är det en mycket bra idé att testa Cluster Service, för att se så att det Verkligen Fungerar Som Det Ska. Den här artikeln kommer att visa på några tester som du kan utföra, för att se så att Cluster Service verkligen gör sitt jobb. Om det skulle vara något problem med ditt Cluster, så kan de här testerna oftast finna dem. Det som dock ligger utanför den här artikeln gränser är att visa vilka problemen är samt hur du kan fixa dem. Om ditt Cluster klarar sig igenom alla dessa tester utan några problem, så är oddsen höga för att det inte komma att åsamka några problem i framtiden heller (fast det kan man ju aldrig garantera).

Innehåll

» Test nummer 1: Flytta grupper
» Test nummer 2: Initiera ett fel
» Test nummer 3: Stäng av varje nod
» Test nummer 4: Bryt nätverksanslutningen
» Test nummer 5: Bryt anslutningen till den gemensamma diskarray

Relaterade artiklar

» Installera Windows 2000 Cluster Services #1
» Installera Windows 2000 Cluster Services #2
» Installera Windows 2000 Cluster Services #3
» Installera Windows 2000 Cluster Services #4

Steg 5: Testa och verifiera Windows 2000 Clustering Services

av Brian M. McGee

Test nummer 1: Flytta grupper

Det första testet vi ska göra, är mycket enkelt. Vi ska flytta de aktuella resurserna som skapades då vi installerade Cluster Services (inklusive Clustergruppen och diskgrupper), från den aktiva Clusternoden till den inaktiva Clusternoden.

I ditt Cluster så kan de två noderna delas upp i en aktiv nod (den som kontrollerar Clustrets alla resurser) och en inaktiv nod (den som inte någon av Clustrets resurser). Om du är en expert inom Clustering, så märker du att jag har förenklat den här förklaringen, men den räcker gott för det här testet.

Efter att du har installerat Cluster Services på båda noderna i ditt Cluster, så kommer en nod ha kontroll över alla standard Clustergrupper (den aktiva noden) medan den andra noden inte kommer ha blivit tilldelats några Clustergrupper alls (den inaktiva noden). De resurser som enligt standard finns på den aktiva noden, inkluderar det som kallas ”Clustergrupp” och ”diskgrupp”. (Det kan finnas mer än en Diskgrupp, beroende på hur du har konfigurerat din gemensamma diskarray, men i det här exemplet så förutsätter vi att det endast finns en diskgrupp).

Generellt sett så innehåller Clustergruppen följande Clusterresurser:

Cluster IP-adress (Clustrets virtuella IP-adressen)
Clusternamnet (Clustrets virtuella namn, vilket används av klienterna för att ansluta till Clustret)
Disken q: (Själva Quorum disken, behöver inte vara just q: )

Diskgruppen innehåller vanligtvis endast en resurs, och det är den enhetsbeteckning som refererar till den logiska disken i den gemensamma diskarrayen. Om du har fler än en logisk disk i din gemensamma diskarray, så kommer det att skapas en diskgrupp för varje tillgänglig logisk disk.

Nu när vi har klarat av det, så ska vi börja med det första testet, för att se så att Clustret fungerar som det ska. Vårt mål med det här testet är att se om vi manuellt både kan flytta standardresurserna från den aktiva noden till den inaktiva noden, och sedan göra stegen baklänges så att Clustergrupperna kommer tillbaka till sina vanliga platser i den aktiva noden. Så här gör du:

Det här är ett väldigt grundläggande test, men det hjälper till att bestämma huruvida Clustret fungerar som det ska eller inte. Följande tester är lite grundligare, och de hjälper dig att rota upp fler potentiella problem.

Test nummer 2: Initiera ett fel

Det här testet är ganska likt ovanstående test, men nu ska vi låtsas att en nod i Clustret har gått ner. Vi ska alltså simulera ett överförande av ansvar mellan noderna. Och det gör du, så här:

Precis som efter förra testet, så bör du kolla i Event Viewer för eventuella Errormeddelanden. Om allting gick bra, så är du redo för nästa test.

Test nummer 3: Stäng av varje nod

Medan de två första testerna utfördes från Cluster Administrator, så kommer de tre följande testerna att vara lite mer realistiska. I det här testet, så måste du först försäkra dig om att alla standardgrupper är lokaliserade på en av de två noderna. Sen stänger du fysiskt ner (tryck på knappen!) den aktiva noden (den primära noden).

Om du tittar på Clustergrupperna från Cluster Administrator i den inaktiva noden, så kan du se att när du stänger ner den aktiva noden, så överförs resurserna automatiskt till den andra noden. Efter att du har gjort det, så tittar du i Eventloggen efter eventuella Errormeddelanden.

När du väl har tittat efter eventuella problem, så kan du starta upp den första noden igen (den som du stängde ner), och vänta tills den har bootats klart. Du kan då se, att det inte sker någon överföring tillbaka när du sätter igång den igen. Clusterresurserna kommer att finnas kvar på den andra noden, tills du tvingar dem tillbaka till den första noden.

Nu kan du stänga av noden som för närvarande innehar de aktiva grupperna (den andra noden), och repetera de saker som du gjorde med den första noden. Precis som förut, så kan du använda Cluster Administrator i den första noden, för att se när grupperna överförs till den första noden. Sen kollar du Eventloggen för eventuella problem som kan ha uppstått.

När grupperna väl har förts tillbaka till den första noden, så kan du sätta igång den andra noden igen och vänta tills den har bootat klart.

Det här är ett väldigt bra test för att försäkra sig om att överföringen sker i verkligheten. Om testet inte uppbringade några problem, så är du nu redo för nästa test.

Test nummer 4: Bryt nätverksanslutningen

Det här testet har ett liknande koncept som testet ovan. Det vi vill göra är att tvinga fram ett överförande. Men istället för att simulera ett datorfallerande, så ska vi simulera ett nätverksrelaterat error.

Gör så här, att du tar bort nätverkskabeln från det publika nätverkskortet på den nod som har standardresursgrupperna (den första noden). Det kommer att simulera ett fel på den första noden, och det bör ske ett överförande till den andra noden.

Om du tittar på Clustergrupperna från Cluster Administrator i den andra noden, så kan du se att resurserna automatiskt överförs till den andra noden. Kolla sedan Eventloggen för eventuella problem som kan ha uppstått.

När du väl har kollat Eventloggen för eventuella problem, så kan du sätta tillbaka nätverkssladden till den första noden, och sedan ta bort nätverkssladden från det publika nätverkskortet i den andra noden. Precis som förut, så kan du använda Cluster Administrator till att bevaka när grupperna faller tillbaka till den första noden. Kolla sedan Eventloggen för eventuella problem. Och när du har gjort det, så kan du sätta tillbaka nätverkssladden till det publika nätverkskortet på den andra noden.

Om det inte uppstod några problem under det här testet, så är du nu redo för det sista testet.

Test nummer 5: Bryt anslutningen till den gemensamma diskarrayen

Det här testet är designat till att avslöja eventuella problem med den gemensamma hårddiskarrayen. Jag har sett många Cluster som har passerat ovanstående fyra tester felfritt, men som visar på problem vid det här testet, ifall inte den gemensamma diskarrayen är 100 % korrekt konfigurerad. Testet är designat till att simulera vad som skulle hända ifall controller-kortet eller kabeln som ansluter noden till den gemensamma diskarrayen, skulle fallera.

Det du gör, är att kopplar bort kabeln från kortet som är anslutet till den gemensamma arrayen, och som finns på den noden som innehåller alla standardresursgrupper (den första noden). Det här kommer att simulera ett fel på den gemensamma diskarrayen, och bör initiera ett överförande till den andra noden.

Om du tittar på Clustergrupperna från Cluster Administrator i den andra noden, så kan du se att resurserna automatiskt har överförts till den andra noden. Kolla sedan Eventloggen för eventuella problem som kan ha uppstått.

När du väl har kollat Eventloggen för eventuella problem, så kan du sätta tillbaka kabeln till den första noden, och sedan ta bort kabeln från det kort som är anslutet till den gemensamma diskarrayen i den andra noden. Precis som förut, så kan du använda Cluster Administrator till att bevaka när grupperna faller tillbaka till den första noden. Kolla sedan Eventloggen för eventuella problem. Och när du har gjort det, så kan du sätta tillbaka kabeln till rätt kort på den andra noden.

Nu när du väl har gjort framgångsrika tester i ditt Cluster, så är du redo att installera SQL Server 7.0 eller 2000 Clustering till ditt Cluster. Och som du kanske kan tänka dig, så tillhör det kapitlet en helt annan artikel.

Upp

0 Kommentarer

Skriv en kommentar på artikeln

Ditt betyg på artikeln

UtmärktLäsvärdIntressantMindre braDålig

Kommentar: