Evoluce na PMV
Skočit na navigaci
Skočit na vyhledávání
pozn. urceno pro podporu schuzky ohledne serveru na PMV (tj. ne jak to na 100pro bude, ale aby bylo nad cim debatovat) a nasledne kroky zprovoznovani - ve chvili kdy bude vse funkcni se to zdokumentuje (pro havarie a dalsi generace) a zaradi do jiz vyuzivane struktury ve wiki
Obsah
Napojeni
- routovat (ve smyslu bezici quaggy) musi urcite IGWcka, ostatni by nemuselo (vyuziti vlanu a L3 switche jako defaultni brany pro aplikacni servery)
Switche
- L3 switch - routovani v ramci hyperpatere a PMV (Huawei)
- 2x L2 switche - pomoci vlanu svedene jednotlive paterni linky do L3, rozvod v ramci vrchni a spodni strojovny (HP, Huawei)
- ? napojeni aplikacnich serveru (def. routa) pomoci vlanu do L3 switche
Servery
Charon + Hades
- maximalne zastupitelne a redundantni servery pro beh sluzeb v HKFree (virtualni servery)
- admin: Paul + Zitnyp (+ admini jednotlivych virtualu)
- HW: 2x (Intel Quad Core, 8GB RAM, servrove disky do raidu, redundantni zdroj, iLO)
- SW: system debian-like, virtualizace (Xen)
- virtualni servery (resp. sluzby, nektere veci lze prip. sloucit do 1 virtualu; adminy dopsat pozdeji)
- web (www.hkfree.org, wiki)
- homes (clenove - SSH, web)
- DNS (primary domain server)
- SVN (podpora pro dns, podpora pro vyvoj)
- Radius
- LDAP
- IS (docasne - Userdb, ?Money(db+frontend))
- tickets (Request tracker, JIRA, ...)
- VPN (administrace - pridavani uzivatelu, generovani certifikatu; sychronizace s routujicim strojem)
- maily (konta, aliasy, spam, webmail)
- ? mirror - news, webnews, smtp
- ? sosaci - pomoci SNMP, prip. propojeni ip accounting, bandwidth (zrejme z jednotlivych AP, nez z IGW = rozlozeni zateze vs. optimalizace chains?) ziskavat info o rychlosti pripojencu (integrace s IS?)
- vyvoj (moznost spustit server pro vyvoj cehokoli "rozumneho")
- stream (test multicastu, pote asi presun na samostatny server)
- webcams (projekt kamer v HKFree)
- radio (s vyrizeni patricnych licenci)
IGWcka
- maximalne zastupitelne a redundantni servery pro routovani HKFree (VIP) navenek, prehazovani mezi linkami (NFX, zalozni IP konektivita), accounting (Money)
- admin: Kendy + Vojta
- HW: IGW1 (Intel Dual Core, 2GB RAM, servrovy disk, redundatni zdroj, iLO), IGW2 (P4 3GHz, 1GB RAM, servrovy disk)
- SW: Gentoo
- ? VPN (s tim, ze zrizovani uzivatelu pro VPN by mohlo byt administrovano v ramci virtualniho serveru na CH+H, synchronizace, kradeni VIP (a behu openVPN) mezi IGWcky)
Monitor
- monitorovani vypadku (serveru, linek, AP) + oznamovani prislusnym osobam, vytizeni (serveru, linek)
- admin: Paul + Zitnyp + Easy
- HW: P4 3GHz, 2GB RAM, servrovy disk (stare IGW2)
- SW: asi debian-like (virtualizace?)
- nagios, cacti, smokeping, wewimo
- ? vyreseni ochrany proti SNMP-utoku (pevna IP, SNMPv3, ?VPN pro SNMPv1 - RB)
- ? sledovani jednotlivych clenu (spoluprace s IS, sosaci)
GS
- hracsky server (ET - KamenD)
- admin: Kendy
- HW: P4 3GHz, 2GB RAM, servrovy disk (identicke se starym IGW2)
- SW: Gentoo
- ? virtualizace (co hra to server)
VoIP
- ?
- ? (neco Lada)
- server pro ustrednu VoIP (cisla HKFree v ramci NFX)
- HW: ?
Zalohovani
- provadi se ? (nejspis ne)
- zalohovani dulezitych configuraci + dat
- kolik toho bude ?
- zalohovat konfigurace vsech serveru: IGWs (BGP, OSPF, linky), konfigurace CH+H (konfigurace jednotlivych virtualu), Monitor (nagios, cacti, smokeping), GS (ET), VoIP (nastaveni ustredny, uzivatele)
- definovat zivotne dulezita data: data z virtualu (aplikace - wiki, web, db, RT, vpn)
- definovat "nepotrebna" data: homes (+ velka velikost)
- kam s tim: maily, monitor db, svn db
- ? forma (zalohovaci server, zalohovaci NFS disk (MyBook), NAS, SAN, ... spise ne - pasky, cdcka)
UPS
- jak jsme ted na tom (vydrz)
- vyresit dlouhou vydrz
STORAGE
Navrhy:
Dell MD3000i
- iSCSI
- RAID 0,1,10,5
- umoznuje pouzit jak SAS, tak SATA disky
- 2 radice v modu active/active == redundantni architektura
- 2 zdroje
- vsechny komponenty menitelne za chodu
- kazdy radic 2 iSCSI porty(ethernet) == da se pripojit k 2 serverum HA bez switche
- az 15 disku v zakladnim modulu
- daji se pripojit dalsi 2 rozsirujici moduly (do kazdeho dalsich 15 disku)
- relativne easy konfigurace(graf. rozhrani, wizardi)
- funguje pod linuxem, dell garantuje SuSE a RedHat Enterprise(centos?)
- Next bussiness day onsite support
- IT pro support v cene = podstatne vylepseny support, 4h response time?, nutno vyzjistit od obchodniku
Havarie
- cilem je predem mit vyresene postupy pro prip. "typicke havarie" (tj. kolik mit zalozniho hw a jaky, prip. jak to "jednodusse" prepojit) a nejlepe z toho udelat prirucku a mit ji nekde dostupne pro nejhorsi (ne ze prijede Kendy z dovolene a vyresi - at se pekne opaluje, my zalatame a po navratu se doresi) - maximalizace postupu typu: bafnu, vymenim, pustim "skript" a jdu od toho (jako pro "blby")
- ? vyresit reseni prip. havarie L3 switche
- koupit druhy a pouzivat ho jako jeden z L2, kdyz L3 vypadne, tak mame ihned nahradu a misto "otupeleho L3" pouzit bezny L2 s vlany
- bafnout volny server (zalozni?) a pomoci vlanu do nej vsechno svest a nahradit tak L3
- ? vyresit havarii L2 switche (trapi nas zrejme jen opticka propojka mezi servrovnami)
- mit k dispozici nahradni L2 switch s optickym portem
- ? nahradni server
- padne 1 z IGW, prip. CH+H = mame druhy
- v pripade dlouhe doby objednani mit k dispozici server, aby se maximalizovala doba kdy je vse redundantni
- jestli nezahrnout nahradni server i do reseni vypadku L3 switche
- ? vykonove naddimenzovat (aby se mohl nasadit kdekoliv (vykonove "stacil") vs. rotace stareho hw (lezici server se nasadi na nejake AP a na PMV se koupi novy) vs. odzkousenost (novy server nemusi byt 100pro OK, mel by, ale nejak odzkouset)
- ? havarie serveru
- ? co vylozene hori (IGW dvojita, CH+H dvojita) - je potreba (vubec) resit ?
- kde rychle sehnat konfiguraci (info - dokumentace)
TO DO
(nemusi se nutne dodrzet poradi)
pripravit podklady pro schuzku- svolat schuzku
- vyresit napojeni
- vyresit havarie
- vyresit zalohovani
- vyresit UPS
- zprovozneni systemu na Monitoru
- zatezove testy na Monitoru
- zprovozneni systemu na novem Charonu
- zatezove testy na novem Charonu
- zprovozneni systemu na novem Hadesovi
- zatezove testy na novem Hadesovi
- sehnat adminy pro sluzby na virtualech
- vytvoreni virtualu
- vytvoreni synchronizaci a redundance
- otestovani (reboot, vypadek jednoho z dvojice serveru)