Cito la canzone del Dirisio (che fine avrà fatto, a proposito?) perché purtroppo ieri il principale server fisico della scuola, dopo che ho iniziato a creare l’ennesima macchina virtuale (siamo a 24, tutte su quel povero ma potente hypervisor), ha avuto una serie di problemi, tutti causati da un bug. Son dovuto intervenire il prima possibile. Con calma e sangue freddo.
Il server, un HP ProLiant DL380p Gen8, ha installato una versione customizzata da HP dell’hypervisor VMware vSphere 5.5 (per la precisione, la build 2068190). E come dicevo, quasi senza motivo, si sono verificati una serie di sintomi. Dapprima, le macchine virtuali si rifiutavano di partire (errore: VMK_NO_MEMORY). SNMP, SSH ed altri servizi si erano bloccati. La ESXi Management Console non mi consentiva di accedere. Molte delle modifiche effettuate dal vSphere Client mi erano negate. L’unica cosa che andavano erano praticamente le VM già accese.
Da una veloce ricerca è saltato fuori questo completo articolo, che in poche righe ha riassunto e linkato le informazioni necessarie.
Purtroppo la soluzione al problema è quella di applicare un aggiornamento e riavviare il server (e tutte le macchine virtuali). Il problema è che questo ProLiant tiene in piedi 2/3 di Mascheroni! Ed un riavvio di quell’affare ci mette più di mezz’ora! (Ed oltre ad essere costato abbastanza, ha anche i bug!). Almeno, dato il suo sostenuto costo, ha un’interfaccia, la iLO, che permette di connettermi alla tastiera ed al monitor del server stesso, in ogni luogo da remoto, anche col server spento.
Questo mi ha permesso di installare l’aggiornamento la sera, da casa, in modo da eliminare il downtime: il wifi, ad esempio, è risultato non funzionante per tutta la notte, ma tanto non credo che nessuno se ne sia accorto. Ma, dato che il server tiene in piedi anche il firewall principale, c’è comunque da stare sempre allerta per questo genere di operazioni (non si tratta di un semplice avanti – avanti – fine, si rischia altrimenti di tagliarsi fuori): ci vuole attenzione ma anche calma e sangue freddo (per poter intervenire in caso di problemi)