Fabric e il Costo dei Punti Ciechi Operativi
Le reti di macchine tipicamente non soffrono di debolezze a causa di crash massicci di più sistemi contemporaneamente. Invece, i problemi iniziano nella parte bassa del sistema e di solito non vengono notati: file di log non monitorati, avvisi che non vengono riconosciuti e segnali di aggiornamento di stato che non vengono aggiornati. Ho imparato questo a mie spese quando un bot di trading notturno si è bloccato a causa del disco VPS riempito di log. Non c'era nulla di malevolo e il sistema si è semplicemente fermato fino a quando qualcuno non l'ha riparato manualmente. Questo tipo di fallimento ci fornisce una verità importante sui sistemi: la responsabilità è divisa e il punto fragile è il punto di passaggio, dove nessuno sta osservando.
Gli stessi problemi esistono con le flotte di robot. Anche se è facile distribuire macchine, il vero lavoro è garantire che ogni robot sia attivamente distribuito, monitorato e riparato. Inoltre, il dispiegamento reale dei robot è suddiviso in turni operativi. Se c'è una struttura inadeguata nei log, autorità poco chiare e manutenzione vaga, piccoli problemi si accumuleranno in grandi fallimenti sistemici. Uno strato operativo indisciplinato in un sistema robotico è simile a un deposito di autobus dove tutti gli autobus sono operativi, ma nessuno viene guidato: tutto è pronto, ma nulla sta realmente accadendo.
La vera sfida per Fabric non è la capacità di automatizzare compiti, ma piuttosto il quadro operativo dei compiti. Ogni compito è così chiaro che può essere eseguito immediatamente da un nuovo arrivato. Operare un sistema può essere sporadico, quindi gli obiettivi devono passare da azioni chiare a azioni più ambigue, “invisibili”. I sistemi di rete manuali non sono durevoli perché uno dei suoi nodi è mancante. Significa che un'unità può essere abbandonata, un operatore può essere assente o un dispositivo può essere rotto, e il sistema continuerà a funzionare senza problemi.
$ROBO #ROBO #Robo @Fabric Foundation