Evoluce na PMV: Porovnání verzí
Skočit na navigaci
Skočit na vyhledávání
Řádek 94: | Řádek 94: | ||
* IT pro support v cene = podstatne vylepseny support, 4h response time?, nutno vyzjistit od obchodniku | * IT pro support v cene = podstatne vylepseny support, 4h response time?, nutno vyzjistit od obchodniku | ||
[http://www1.euro.dell.com/content/products/productdetails.aspx/pvaul_md3000i?c=cz&cs=RC1077928&l=cs&s=pad Dell MD3000i site] | [http://www1.euro.dell.com/content/products/productdetails.aspx/pvaul_md3000i?c=cz&cs=RC1077928&l=cs&s=pad Dell MD3000i site] | ||
+ | [http://linux.dell.com/wiki/index.php/Projects/DellRedHatHALinuxCluster/Documentation/Storage/MD3000i Instalace pod linuxem] | ||
= Havarie = | = Havarie = |
Verze z 5. 12. 2008, 21:05
pozn. urceno pro podporu schuzky ohledne serveru na PMV (tj. ne jak to na 100pro bude, ale aby bylo nad cim debatovat) a nasledne kroky zprovoznovani - ve chvili kdy bude vse funkcni se to zdokumentuje (pro havarie a dalsi generace) a zaradi do jiz vyuzivane struktury ve wiki
Obsah
Napojeni
- routovat (ve smyslu bezici quaggy) musi urcite IGWcka, ostatni by nemuselo (vyuziti vlanu a L3 switche jako defaultni brany pro aplikacni servery)
Switche
- L3 switch - routovani v ramci hyperpatere a PMV (Huawei)
- 2x L2 switche - pomoci vlanu svedene jednotlive paterni linky do L3, rozvod v ramci vrchni a spodni strojovny (HP, Huawei)
- ? napojeni aplikacnich serveru (def. routa) pomoci vlanu do L3 switche
Servery
Charon + Hades
- maximalne zastupitelne a redundantni servery pro beh sluzeb v HKFree (virtualni servery)
- admin: Paul + Zitnyp (+ admini jednotlivych virtualu)
- HW: 2x (Intel Quad Core, 8GB RAM, servrove disky do raidu, redundantni zdroj, iLO)
- SW: system debian-like, virtualizace (Xen)
- virtualni servery (resp. sluzby, nektere veci lze prip. sloucit do 1 virtualu; adminy dopsat pozdeji)
- web (www.hkfree.org, wiki)
- homes (clenove - SSH, web)
- DNS (primary domain server)
- SVN (podpora pro dns, podpora pro vyvoj)
- Radius
- LDAP
- IS (docasne - Userdb, ?Money(db+frontend))
- tickets (Request tracker, JIRA, ...)
- VPN (administrace - pridavani uzivatelu, generovani certifikatu; sychronizace s routujicim strojem)
- maily (konta, aliasy, spam, webmail)
- ? mirror - news, webnews, smtp
- ? sosaci - pomoci SNMP, prip. propojeni ip accounting, bandwidth (zrejme z jednotlivych AP, nez z IGW = rozlozeni zateze vs. optimalizace chains?) ziskavat info o rychlosti pripojencu (integrace s IS?)
- vyvoj (moznost spustit server pro vyvoj cehokoli "rozumneho")
- stream (test multicastu, pote asi presun na samostatny server)
- webcams (projekt kamer v HKFree)
- radio (s vyrizeni patricnych licenci)
IGWcka
- maximalne zastupitelne a redundantni servery pro routovani HKFree (VIP) navenek, prehazovani mezi linkami (NFX, zalozni IP konektivita), accounting (Money)
- admin: Kendy + Vojta
- HW: IGW1 (Intel Dual Core, 2GB RAM, servrovy disk, redundatni zdroj, iLO), IGW2 (P4 3GHz, 1GB RAM, servrovy disk)
- SW: Gentoo
- ? VPN (s tim, ze zrizovani uzivatelu pro VPN by mohlo byt administrovano v ramci virtualniho serveru na CH+H, synchronizace, kradeni VIP (a behu openVPN) mezi IGWcky)
Monitor
- monitorovani vypadku (serveru, linek, AP) + oznamovani prislusnym osobam, vytizeni (serveru, linek)
- admin: Paul + Zitnyp + Easy
- HW: P4 3GHz, 2GB RAM, servrovy disk (stare IGW2)
- SW: asi debian-like (virtualizace?)
- nagios, cacti, smokeping, wewimo
- ? vyreseni ochrany proti SNMP-utoku (pevna IP, SNMPv3, ?VPN pro SNMPv1 - RB)
- ? sledovani jednotlivych clenu (spoluprace s IS, sosaci)
GS
- hracsky server (ET - KamenD)
- admin: Kendy
- HW: P4 3GHz, 2GB RAM, servrovy disk (identicke se starym IGW2)
- SW: Gentoo
- ? virtualizace (co hra to server)
VoIP
- ?
- ? (neco Lada)
- server pro ustrednu VoIP (cisla HKFree v ramci NFX)
- HW: ?
Zalohovani
- provadi se ? (nejspis ne)
- zalohovani dulezitych configuraci + dat
- kolik toho bude ?
- zalohovat konfigurace vsech serveru: IGWs (BGP, OSPF, linky), konfigurace CH+H (konfigurace jednotlivych virtualu), Monitor (nagios, cacti, smokeping), GS (ET), VoIP (nastaveni ustredny, uzivatele)
- definovat zivotne dulezita data: data z virtualu (aplikace - wiki, web, db, RT, vpn)
- definovat "nepotrebna" data: homes (+ velka velikost)
- kam s tim: maily, monitor db, svn db
- ? forma (zalohovaci server, zalohovaci NFS disk (MyBook), NAS, SAN, ... spise ne - pasky, cdcka)
UPS
- jak jsme ted na tom (vydrz)
- vyresit dlouhou vydrz
STORAGE
Navrhy:
Dell MD3000i
- iSCSI
- RAID 0,1,10,5
- umoznuje pouzit jak SAS, tak SATA disky
- 2 radice v modu active/active == redundantni architektura
- 2 zdroje
- vsechny komponenty menitelne za chodu
- kazdy radic 2 iSCSI porty(ethernet) == da se pripojit k 2 serverum HA bez switche
- az 15 disku v zakladnim modulu
- daji se pripojit dalsi 2 rozsirujici moduly (do kazdeho dalsich 15 disku)
- relativne easy konfigurace(graf. rozhrani, wizardi)
- funguje pod linuxem, dell garantuje SuSE a RedHat Enterprise(centos?)
- Next bussiness day onsite support
- IT pro support v cene = podstatne vylepseny support, 4h response time?, nutno vyzjistit od obchodniku
Dell MD3000i site Instalace pod linuxem
Havarie
- cilem je predem mit vyresene postupy pro prip. "typicke havarie" (tj. kolik mit zalozniho hw a jaky, prip. jak to "jednodusse" prepojit) a nejlepe z toho udelat prirucku a mit ji nekde dostupne pro nejhorsi (ne ze prijede Kendy z dovolene a vyresi - at se pekne opaluje, my zalatame a po navratu se doresi) - maximalizace postupu typu: bafnu, vymenim, pustim "skript" a jdu od toho (jako pro "blby")
- ? vyresit reseni prip. havarie L3 switche
- koupit druhy a pouzivat ho jako jeden z L2, kdyz L3 vypadne, tak mame ihned nahradu a misto "otupeleho L3" pouzit bezny L2 s vlany
- bafnout volny server (zalozni?) a pomoci vlanu do nej vsechno svest a nahradit tak L3
- ? vyresit havarii L2 switche (trapi nas zrejme jen opticka propojka mezi servrovnami)
- mit k dispozici nahradni L2 switch s optickym portem
- ? nahradni server
- padne 1 z IGW, prip. CH+H = mame druhy
- v pripade dlouhe doby objednani mit k dispozici server, aby se maximalizovala doba kdy je vse redundantni
- jestli nezahrnout nahradni server i do reseni vypadku L3 switche
- ? vykonove naddimenzovat (aby se mohl nasadit kdekoliv (vykonove "stacil") vs. rotace stareho hw (lezici server se nasadi na nejake AP a na PMV se koupi novy) vs. odzkousenost (novy server nemusi byt 100pro OK, mel by, ale nejak odzkouset)
- ? havarie serveru
- ? co vylozene hori (IGW dvojita, CH+H dvojita) - je potreba (vubec) resit ?
- kde rychle sehnat konfiguraci (info - dokumentace)
TO DO
(nemusi se nutne dodrzet poradi)
pripravit podklady pro schuzku- svolat schuzku
- vyresit napojeni
- vyresit havarie
- vyresit zalohovani
- vyresit UPS
- zprovozneni systemu na Monitoru
- zatezove testy na Monitoru
- zprovozneni systemu na novem Charonu
- zatezove testy na novem Charonu
- zprovozneni systemu na novem Hadesovi
- zatezove testy na novem Hadesovi
- sehnat adminy pro sluzby na virtualech
- vytvoreni virtualu
- vytvoreni synchronizaci a redundance
- otestovani (reboot, vypadek jednoho z dvojice serveru)