GESTIONE
Insieme delle attivita' di
Pianificazione
Installazione
Configurazione
Monitoraggio
Manutenzione
Contabilizzazione
Necessarie per controllare (attivamente e passivamente) e ottimizzare le funzionalita' di una rete ed i servizi da essa forniti.
RETE
TLC: OTN, SDH, PDH, ATM, PSTN, radiomobile, …
Calcolatori: OSI, internet, …
AREE FUNZIONALI DI GESTIONE
ITU M.3400 definisce 5 aree funzionali di gestione:
Performance management
Fault management
Configuration management
Accounting management
Security management
Si fa riferimento alla normativa ITU perche' le prime grandi reti sono state reti TLC, ed e' in questo ambito che si e' affrontato e sistematizzato il tema della gestione.
Performance management
Definizione e verifica degli obiettivi di QOS (Quality Of Service)
(e.g. 99.999% di disponibilita' dei circuiti o secondi errorati nelle reti SDH)
Attivazione di punti di misurazione della QOS
Misurazione, accumulo ed elaborazione dei dati di performance
Raccolta centralizzata dei dati e loro archiviazione
Ma anche
Analisi (tipico delle reti commutate) e previsione del traffico
Valutazione delle prestazioni della rete
Scopi
Verifica del Service Level Agreement (SLA)
(traffico protetto, non-protetto, occasionale nelle reti SDH)
(Ri)configurazione rete per ottimizzazione
Pianificazione evoluzione
Performance management
I parametri misurati dipendono
dalla tecnologia della rete (SDH vs. internet)
dal layer della rete che si considera (fisico vs. trasporto)
Esempi
OTN, SDH, PDH:
tasso di errore, secondi errorati (contatori ES, SeverelyES), mancata disponibilita' del segnale (contatore UAS),
potenza TX/RX di un laser, rapporto segnale/rumore
Rete di calcolatori:
livello di utilizzazione delle risorse, errori, throughput, round-trip delay
collisioni, pacchetti scartati, unicast vs. broadcast
Fault management
Definizione degli obiettivi di robustezza e disponibilita'
Funzioni:
sorveglianza,
correlazione
locale al singolo apparato (per evitare di considerare come fault gli effetti secondari del guasto: e.g. se disconnetto il mio attacco Ethernet cadono le mie connessioni TCP),
sulla rete (e.g. se si interrompe un data link anche nodi non direttamente connessi possono rimanere isolati),
relativamente ai servizi finali,
filtraggio (e.g. filtraggio nel tempo di allarmi fluttuanti)
log,
notifica degli allarmi (a livelli superiori di gestione)
Testing (diagnosi preventiva)
Fault management - reazione al guasto
Trouble administration, ovvero gestione del ciclo di vita di un allarme e della sua storia:
presa in carico dell'allarme
ocalizzazione del guasto,
isolamento del guasto(per ripristinare comunque, se possibile, il servizio)
rimozione del guasto
Guasto:
Non conformita' tra la configurazione reale della rete e la configurazione progettata (e.g. errore di equipaggiamento)
Funzionamento non corretto (e.g. mancanza di segnale in ricezione o LOS)
Quantita' eccessiva di errori (e.g. EBER o excessive bit error rate)
Fault management: requisiti d'utente
SLA definisce obiettivi di robustezza e disponibilita'
Possono essere tollerate interruzioni del servizio ma
L'indisponibilita' deve essere rilevata e notificata al piu' presto
La durata dell'indisponibilita' deve essere verificabile
L'indisponibilita' deve essere contabilizzata
Il ripristino del normale servizio deve essere rilevato e notificato al piu' presto
Le possibili conseguenze di un guasto e dei conseguenti interventi di manutenzione devono essere notificati
e.g. Se e' configurato uno schema di protezione 1:N e si guasta la risorsa J occorre informare gli utenti di tutte le risorse K!=J che non godono piu' di protezione
In Current Problems List Alarm notification Fault management: gestione guasto su apparato SDH F1 F2 defect Consequent action (isolamento guasto) F3: correlazione fault F4: integrazione F5: severity assignment alarm Event Forwarding Discriminator Alarm log Log
Fault management
esempio SDH
Defect = LOS su linea protetta MSP
Defect correlati: RS LOF, MS AIS
F2 autoswitch protezione MSP, inserzione AIS a valle
F3 soppressione dei defect correlati: RS LOF, MS AIS
F4 attesa permanenza SPI LOS per 0.5 sec
F5 assegnazione a SPI LOS severita' minor (linea protetta!)
EFD condizioni di generazione notifica verso sistema di gestione
LOG condizioni di registrazione evento
Time stamping
la marca temporale di un avvenimento e’ una delle chiavi principali di concatenazione con gli altri avvenimenti che capitano in rete
ovviamente, perche’ una marca temporale sia significativa, occorre che
tutti gli apparati marchino la stessa cosa (defect, fault, allarme, notifica: preferibilmente il defect, per evitare ritardi differenziati)
gli orologi di tutti gli apparati siano sincronizzati tra loro (con una precisione garantita)
Deve essere l’applicazione di gestione a mantenere l’allineamento degli orologi
o deve essere l’infrastruttura di rete che mette a disposizione di tutti questo servizio?
E.g. attraverso l’uso del protocollo ntp
Fault management
esempio internet
L'applicazione remota non risponde al mio programma locale
E' un malcomportamento dell'applicazione remota?
L'applicazione remota e' terminata/abortita?
Il sistema remoto e' congestionato? O e' restartato?
L'interfaccia di rete del sistema remoto e' guasta?
L'interfaccia di rete del sistema remoto e' disconnessa?
Un router lungo il path dal sistema locale al sistema remoto e' guasto? O e' congestionato?
Una sottorete lungo il path dal sistema locale al sistema remoto e' guasta? O e' congestionata?
…
Configuration management
Pianificazione della rete
Pianificazione dei link: e.g. dimensionamento
Pianificazione degli apparati: e.g. localizzazione, tipologia ed equipaggiamento
Installazione
Configurazione e inventariazione dell'apparato
Download ( e attivazione, e restart, …) del SW
Pianificazione e negoziazione dei servizi
Provisioning
Network connection management delle reti coinvolte nel servizio, e.g.
path provisioning delle reti permutate
tabelle statiche di instradamento nelle reti commutate (switched)
Equipaggiamento e configurazione del traffico sugli apparati
Inventory
Verso l'auto-configurazione della TLC
c'e' in atto una evoluzione che porta la TLC ad assorbire alcune funzionalita' della TMN, diventando capace di auto-configurarsi e auto-riconfigurarsi come reazione a dei fault
auto-riconoscimento da parte di un apparato delle sue risorse fisiche e delle loro funzionalita'
auto-riconoscimento delle adiacenze sulla rete e, tramite opportuni protocolli di routing, della topologia della rete
auto-switch dei circuiti in base alle richieste del cliente
protocolli di segnalazione interni alla rete, e tra rete e cliente
si passa da una logica di controllo in loop aperto ad una logica di controllo in loop chiuso
si perde in buona parte la possibilita’ (ma anche la necessita’) di avere una diagnostica di non-conformita’ tra configurazione attesa e configurazione reale
Configuration management
esempio Connessione via PSTN ad un provider Internet
modem Rete di accesso PSTN
exchange Rete di trasporto PSTN
exchange Rete di accesso terminal
server provider
HOST
Configuration management
esempio Connessione via PSTN ad un provider Internet
Pianificazione della rete
Dimensionamento del link PSTN - provider
Dimensionamento dei link del provider
Dimensionamento del link provider - backbone
Dimensionamento delle reti trasmissive di accesso e di trasporto
Negoziazione del servizio
Risorse a disposizione dell'utente sull'HOST c/o IP provider
Regola di tariffazione per chiamate verso provider
Regola di ribaltamento del ricavo verso provider
Reti coinvolte
Rete trasmissiva di accesso (e.g. PDH)
PSTN
Rete trasmissiva di trasporto (e.g. SDH, OTN)
Provisioning
Configurazione utente e risorse su HOST del provider IP
Configurazione dei path sulle reti trasmissive
Accounting management
Non si tratta solo di tariffazione, ma anche di traffic engineering:
Attribuire o negare l'accesso alle risorse
Monitorare (e tenere traccia del) l'utilizzo delle risorse da parte dell'utente
limitare l'uso di risorse a quanto contrattato
verificare che l'utente non sprechi risorse
Confrontare l'utilizzo che l'utente fa delle risorse con quanto previsto dal SLA e con la politica di tariffazione concordata
utilizzo del parametro di QoS (priorita') nello scambio di informazioni sulla rete
E' anche un servizio per l'utente
Security management
Prevention (crittografia, autenticazione, firewalls)
Detection (tentativi di effrazione, identificazione)
Containment and recovery
Administration
Gestione delle chiavi di crittografia
Gestione degli utenti e delle password
Monitoring e log degli accessi
Requisiti di sicurezza
Segretezza: l'informazione su un sistema deve essere disponibile solo per chi ne ha diritto
Integrita': la configurazione di un sistema deve essere controllabile solo da chi ne ha diritto
Disponibilita': chi ne ha diritto deve poter avere accesso alle risorse di un sistema
Security management
(si dice che) La mancanza di una gestione della security e' cio' che ha limitato il supporto del provisioning remoto nella gestione di Internet
I problemi di security nella gestione remota delle reti TLC sono di norma risolti attraverso l'utilizzo di reti di gestione fisicamente separate
Inizia comunque a farsi significativa la richiesta di un supporto di qualche livello di security nelle reti di gestione
(e.g. uso di password nel log-in remoto sugli apparati TLC)
ITU Telecommunications Management Network
Problema: esistono reti di TLC di diversa tecnologia e che offrono diversi tipi di servizi.
Come fare a gestirle in modo uniforme ed integrato?
In particolare (piu' modestamente) come e' possibile una gestione uniforme di apparati di costruttori diversi (per uno stesso tipo di tecnologia)?
Risposta: si definiscono le caratteristiche funzionali ed architetturali di una Rete di Gestione (Management Network) capace di farlo
Rete di Gestione: rete di calcolatori, i cui nodi sono capaci di controllare/monitorare i nodi della rete TLC
Rete di Gestione vs. Rete Gestita
Sovrapposizione delle due nel caso di rete di calcolatori
Parziale condivisione dei portanti e dei nodi nel caso delle reti TLC vere e proprie
Rete di Gestione applicazione distribuita di gestione
Comments