Evoluce na PMV: Porovnání verzí

Z HKfree wiki
Skočit na navigaci Skočit na vyhledávání
 
(Není zobrazena jedna mezilehlá verze od stejného uživatele.)
Řádek 93: Řádek 93:
 
* Next bussiness day onsite support
 
* Next bussiness day onsite support
 
* IT pro support v cene = podstatne vylepseny support, 4h response time?, nutno vyzjistit od obchodniku
 
* IT pro support v cene = podstatne vylepseny support, 4h response time?, nutno vyzjistit od obchodniku
[http://www1.euro.dell.com/content/products/productdetails.aspx/pvaul_md3000i?c=cz&cs=RC1077928&l=cs&s=pad Dell MD3000i site]
+
*[http://www1.euro.dell.com/content/products/productdetails.aspx/pvaul_md3000i?c=cz&cs=RC1077928&l=cs&s=pad Dell MD3000i site]
 +
*[http://linux.dell.com/wiki/index.php/Projects/DellRedHatHALinuxCluster/Documentation/Storage/MD3000i Instalace pod linuxem]
  
 
= Havarie =
 
= Havarie =

Aktuální verze z 5. 12. 2008, 21:06

pozn. urceno pro podporu schuzky ohledne serveru na PMV (tj. ne jak to na 100pro bude, ale aby bylo nad cim debatovat) a nasledne kroky zprovoznovani - ve chvili kdy bude vse funkcni se to zdokumentuje (pro havarie a dalsi generace) a zaradi do jiz vyuzivane struktury ve wiki

Napojeni

  • routovat (ve smyslu bezici quaggy) musi urcite IGWcka, ostatni by nemuselo (vyuziti vlanu a L3 switche jako defaultni brany pro aplikacni servery)

Switche

  • L3 switch - routovani v ramci hyperpatere a PMV (Huawei)
  • 2x L2 switche - pomoci vlanu svedene jednotlive paterni linky do L3, rozvod v ramci vrchni a spodni strojovny (HP, Huawei)
  •  ? napojeni aplikacnich serveru (def. routa) pomoci vlanu do L3 switche

Servery

Charon + Hades

  • maximalne zastupitelne a redundantni servery pro beh sluzeb v HKFree (virtualni servery)
  • admin: Paul + Zitnyp (+ admini jednotlivych virtualu)
  • HW: 2x (Intel Quad Core, 8GB RAM, servrove disky do raidu, redundantni zdroj, iLO)
  • SW: system debian-like, virtualizace (Xen)
  • virtualni servery (resp. sluzby, nektere veci lze prip. sloucit do 1 virtualu; adminy dopsat pozdeji)
    • web (www.hkfree.org, wiki)
    • homes (clenove - SSH, web)
    • DNS (primary domain server)
    • SVN (podpora pro dns, podpora pro vyvoj)
    • Radius
    • LDAP
    • IS (docasne - Userdb, ?Money(db+frontend))
    • tickets (Request tracker, JIRA, ...)
    • VPN (administrace - pridavani uzivatelu, generovani certifikatu; sychronizace s routujicim strojem)
    • maily (konta, aliasy, spam, webmail)
    •  ? mirror - news, webnews, smtp
    •  ? sosaci - pomoci SNMP, prip. propojeni ip accounting, bandwidth (zrejme z jednotlivych AP, nez z IGW = rozlozeni zateze vs. optimalizace chains?) ziskavat info o rychlosti pripojencu (integrace s IS?)
    • vyvoj (moznost spustit server pro vyvoj cehokoli "rozumneho")
      • stream (test multicastu, pote asi presun na samostatny server)
      • webcams (projekt kamer v HKFree)
      • radio (s vyrizeni patricnych licenci)

IGWcka

  • maximalne zastupitelne a redundantni servery pro routovani HKFree (VIP) navenek, prehazovani mezi linkami (NFX, zalozni IP konektivita), accounting (Money)
  • admin: Kendy + Vojta
  • HW: IGW1 (Intel Dual Core, 2GB RAM, servrovy disk, redundatni zdroj, iLO), IGW2 (P4 3GHz, 1GB RAM, servrovy disk)
  • SW: Gentoo
  •  ? VPN (s tim, ze zrizovani uzivatelu pro VPN by mohlo byt administrovano v ramci virtualniho serveru na CH+H, synchronizace, kradeni VIP (a behu openVPN) mezi IGWcky)

Monitor

  • monitorovani vypadku (serveru, linek, AP) + oznamovani prislusnym osobam, vytizeni (serveru, linek)
  • admin: Paul + Zitnyp + Easy
  • HW: P4 3GHz, 2GB RAM, servrovy disk (stare IGW2)
  • SW: asi debian-like (virtualizace?)
  • nagios, cacti, smokeping, wewimo
  •  ? vyreseni ochrany proti SNMP-utoku (pevna IP, SNMPv3, ?VPN pro SNMPv1 - RB)
  •  ? sledovani jednotlivych clenu (spoluprace s IS, sosaci)

GS

  • hracsky server (ET - KamenD)
  • admin: Kendy
  • HW: P4 3GHz, 2GB RAM, servrovy disk (identicke se starym IGW2)
  • SW: Gentoo
  •  ? virtualizace (co hra to server)

VoIP

  •  ?
  •  ? (neco Lada)
  • server pro ustrednu VoIP (cisla HKFree v ramci NFX)
  • HW: ?

Zalohovani

  • provadi se ? (nejspis ne)
  • zalohovani dulezitych configuraci + dat
  • kolik toho bude ?
    • zalohovat konfigurace vsech serveru: IGWs (BGP, OSPF, linky), konfigurace CH+H (konfigurace jednotlivych virtualu), Monitor (nagios, cacti, smokeping), GS (ET), VoIP (nastaveni ustredny, uzivatele)
    • definovat zivotne dulezita data: data z virtualu (aplikace - wiki, web, db, RT, vpn)
    • definovat "nepotrebna" data: homes (+ velka velikost)
    • kam s tim: maily, monitor db, svn db
  •  ? forma (zalohovaci server, zalohovaci NFS disk (MyBook), NAS, SAN, ... spise ne - pasky, cdcka)

UPS

  • jak jsme ted na tom (vydrz)
  • vyresit dlouhou vydrz

STORAGE

Navrhy:

Dell MD3000i

  • iSCSI
  • RAID 0,1,10,5
  • umoznuje pouzit jak SAS, tak SATA disky
  • 2 radice v modu active/active == redundantni architektura
  • 2 zdroje
  • vsechny komponenty menitelne za chodu
  • kazdy radic 2 iSCSI porty(ethernet) == da se pripojit k 2 serverum HA bez switche
  • az 15 disku v zakladnim modulu
  • daji se pripojit dalsi 2 rozsirujici moduly (do kazdeho dalsich 15 disku)
  • relativne easy konfigurace(graf. rozhrani, wizardi)
  • funguje pod linuxem, dell garantuje SuSE a RedHat Enterprise(centos?)
  • Next bussiness day onsite support
  • IT pro support v cene = podstatne vylepseny support, 4h response time?, nutno vyzjistit od obchodniku
  • Dell MD3000i site
  • Instalace pod linuxem

Havarie

  • cilem je predem mit vyresene postupy pro prip. "typicke havarie" (tj. kolik mit zalozniho hw a jaky, prip. jak to "jednodusse" prepojit) a nejlepe z toho udelat prirucku a mit ji nekde dostupne pro nejhorsi (ne ze prijede Kendy z dovolene a vyresi - at se pekne opaluje, my zalatame a po navratu se doresi) - maximalizace postupu typu: bafnu, vymenim, pustim "skript" a jdu od toho (jako pro "blby")
  •  ? vyresit reseni prip. havarie L3 switche
    • koupit druhy a pouzivat ho jako jeden z L2, kdyz L3 vypadne, tak mame ihned nahradu a misto "otupeleho L3" pouzit bezny L2 s vlany
    • bafnout volny server (zalozni?) a pomoci vlanu do nej vsechno svest a nahradit tak L3
  •  ? vyresit havarii L2 switche (trapi nas zrejme jen opticka propojka mezi servrovnami)
    • mit k dispozici nahradni L2 switch s optickym portem
  •  ? nahradni server
    • padne 1 z IGW, prip. CH+H = mame druhy
    • v pripade dlouhe doby objednani mit k dispozici server, aby se maximalizovala doba kdy je vse redundantni
    • jestli nezahrnout nahradni server i do reseni vypadku L3 switche
    •  ? vykonove naddimenzovat (aby se mohl nasadit kdekoliv (vykonove "stacil") vs. rotace stareho hw (lezici server se nasadi na nejake AP a na PMV se koupi novy) vs. odzkousenost (novy server nemusi byt 100pro OK, mel by, ale nejak odzkouset)
  •  ? havarie serveru
    •  ? co vylozene hori (IGW dvojita, CH+H dvojita) - je potreba (vubec) resit ?
    • kde rychle sehnat konfiguraci (info - dokumentace)

TO DO

(nemusi se nutne dodrzet poradi)

  • pripravit podklady pro schuzku
  • svolat schuzku
  • vyresit napojeni
  • vyresit havarie
  • vyresit zalohovani
  • vyresit UPS
  • zprovozneni systemu na Monitoru
  • zatezove testy na Monitoru
  • zprovozneni systemu na novem Charonu
  • zatezove testy na novem Charonu
  • zprovozneni systemu na novem Hadesovi
  • zatezove testy na novem Hadesovi
  • sehnat adminy pro sluzby na virtualech
  • vytvoreni virtualu
  • vytvoreni synchronizaci a redundance
  • otestovani (reboot, vypadek jednoho z dvojice serveru)