Recent, managerul senior de produse AI de la Google, Shubham Saboo, a făcut public un sistem de automatizare multi-agent care a funcționat stabil timp de o lună. Spre deosebire de soluțiile AI care rămân în stadiul de demonstrație, acest sistem este construit pe platforma open-source OpenClaw și preia zilnic cele șase sarcini zilnice ale sale: cercetare dinamică AI, redactare de tweet-uri, producție de conținut LinkedIn, editare de buletine informative, revizuirea codului și gestionarea afacerilor comunității.

Această echipă formată din 6 agenți AI funcționează automat în timp ce el doarme, iar Saboo personal trebuie doar să treacă prin aprobat în cele 10 minute în care bea cafea dimineața, reușind astfel să elibereze între 4 și 5 ore în fiecare zi pentru a se concentra pe sarcinile care necesită cu adevărat mintea umană.

Saboo și-a numit cei șase agenți IA după diferite personaje din seriale TV americane. Șase agenți IA, șase roluri; responsabilități clar definite, fiecare îndeplinindu-și propria funcție.

Acest sistem definește identitatea și ghidurile comportamentale ale fiecărui agent IA prin intermediul fișierului persona SOUL.md, înlocuiește cadrul complex de comunicare API cu un sistem de fișiere partajat și acumulează continuu preferințele utilizatorilor cu ajutorul unui mecanism de memorie cu două straturi.

Este demn de remarcat faptul că întregul sistem construit de Saboo poate fi implementat și rulat pe un singur computer obișnuit, cu un cost lunar de mai puțin de 400 USD (aproximativ 2.760 RMB).

Saboo este fondatorul comunității de programare Unwind AI, o platformă care ajută peste 6.000 de abonați să învețe să construiască modele mari, RAG-uri și aplicații de agenți în doar trei minute pe zi. De asemenea, a creat popularul depozit GitHub Awesome LLM Apps, care compilează diverse exemple de aplicații pentru modele mari și este una dintre cele mai populare colecții de tutoriale practice despre aplicații AI, având 99,5 mii de stele pe GitHub.

▲Shubham Saboo, manager senior de produs AI la Google (Sursa imaginii: LinkedIn)

Articolul său lung despre X a detaliat abordarea completă, structura fișierelor, costul real și capcanele întâlnite în construirea acestui sistem bazat pe OpenClaw și a primit peste 1 milion de vizualizări.

▲Captură de ecran a tweet-ului lui Shubham Saboo pe platforma X

01.

Un sistem colaborativ cu agenți inteligenți multi-rol construit pe OpenClaw

Fiecare dintre cei șase agenți are propria sa funcție specifică.

În munca sa zilnică, Saboo trebuie să îndeplinească șase sarcini: urmărirea celor mai recente evoluții din domeniul inteligenței artificiale, scrierea de tweet-uri, scrierea de postări pe LinkedIn, furnizarea de newslettere abonaților, revizuirea contribuțiilor la cod la proiecte open-source și gestionarea problemelor comunității. Fiecare sarcină poate părea mică, dar durează între 30 și 60 de minute.

Prima încercare a lui Saboo a fost ca un agent IA să se ocupe de toate. El i-a dat agentului instrucțiuni, permițându-i să cerceteze, să scrie și să revizuiască, dar calitatea rezultatului nu a fost satisfăcătoare. Un agent IA nu poate îndeplini simultan șase sarcini diferite.

Saboo a construit șase agenți AI bazați pe OpenClaw și i-a numit după diferite personaje principale din seriale TV americane. Avantajul acestui lucru este că trebuie doar să introducă numele, iar modelul poate extrage trăsăturile de personalitate și stilul de comportament al persoanei pe baza datelor existente.

În echipa de inteligență artificială a lui Saboo, cel mai important rol este Monica, inteligența artificială cu care Saboo interacționează cel mai mult zilnic. Această „șefă de cabinet” este numită după Monica Geller din sitcomul (Friends). Responsabilitățile ei includ supravegherea imaginii de ansamblu, coordonarea eforturilor, atribuirea sarcinilor adecvate persoanelor potrivite și gestionarea problemelor pentru care nu este clar cine este responsabil.

Ofițerul de informații al echipei, Dwight, este numit după Dwight Schrute (din birou). El efectuează trei scanări de cercetare zilnic, examinând platforma X, Hacker News, proiecte populare GitHub, bloguri Google AI, lucrări academice și scriind rapoarte structurate de informații pentru toți ceilalți agenți AI.

După ce a citit raportul lui Dwight, prima persoană care a acționat a fost scriitoarea de tweet-uri Kelly. Și-a pus numele Kelly Kapoor (de la birou) și s-a specializat în scrierea de tweet-uri în tonul și stilul lui Saboo - tweet-uri individuale, tweet-uri în lanț și citate, era pricepută la toate. Motto-ul ei personal, SOUL.md, spune: „Știi deja tendința înainte ca ea să devină o tendință”.

Aceleași informații sunt prezentate într-un mod complet diferit de către Rachel, autoarea de postări pe LinkedIn. Numele ei fiind dat după Rachel Green din Friends, ea se adresează unui public profesionist pe LinkedIn - oameni cărora nu le pasă de subiectele în trend, ci mai degrabă de perspectivele din industrie și opiniile profesionale. Prin urmare, stilul de scriere al lui Rachel este mai compus și sună mai mult ca vorbirea unui lider de opinie.

Inginerul Ross, numit după Ross Geller din sitcom-ul Friends, este responsabil pentru revizuirea codului, remedierea erorilor și implementarea tehnică. Codul său de conduită prevede: „Când lucrezi la o problemă, înțelege-o pe deplin, nu te limita la remedierea simptomelor”.

Redactorul de briefing, Pam, este numită după Pam Beesly (de la birou). Ea transformă rapoartele zilnice de informații ale lui Dwight în buletine informative și le trimite abonaților.

02.

Întregul sistem este controlat de un singur fișier text.

Un sistem complet poate fi construit pe un computer obișnuit


Întregul sistem al lui Saboo rulează pe un Mac mini echipat cu un cip M4, dar Saboo subliniază că această mașină nu este nimic special; orice dispozitiv care poate funcționa continuu va fi potrivit. El folosește Mac mini pur și simplu pentru că este mic, silențios, nu consumă multă energie și este convenabil.

El a instalat OpenClaw în mai puțin de cinci minute folosind două comenzi. Mai jos este procesul prin care a construit cei șase agenți AI menționați anterior:

1. SOUL.md: Un „Manual al Angajaților” pentru IA

Cel mai important element de design al întregului sistem este un fișier text simplu numit SOUL.md.

Modelul actual de dimensiuni mari nu are memorie persistentă în mod implicit și nu reține niciun conținut de interacțiune după încheierea fiecărei sesiuni. Când începe o nouă sesiune, modelul nu are cunoștințe despre istoricul utilizatorului și nici despre rolul și responsabilitățile care i-au fost atribuite.

SOUL.md a fost conceput pentru a rezolva această problemă a „amneziei de sesiune”. De fiecare dată când un agent începe o nouă sesiune, sistemul încarcă automat acest fișier, scriind în context identitatea, responsabilitățile, îndrumările comportamentale și relațiile de colaborare cu alți agenți. Cu alte cuvinte, este ca o „descriere a postului” structurată, inițializând rolurile înainte de fiecare rulare și asigurând un comportament consistent în diferitele sesiuni.

Luând ca exemplu agentul de informații Dwight, fișierul său SOUL.md stipulează că: fiecare element de date trebuie să fie însoțit de un link către sursă, estimarea nu este permisă; conținutul incert este marcat ca „neverificat”; a nu ști este mai bine decât a da un răspuns greșit.

SOUL.md al șefei de cabinet a Monicai specifică: să ofere ajutor eficient în mod direct, omițând descrierile redundante; să gestioneze tweet-urile cu Kelly, să programeze probleme cu Ross și să atribuie sarcini cu responsabilități neclare Monicai; și să permită exprimarea opiniilor diferite.

Fiecare fișier SOUL.md ar trebui să aibă aproximativ 40 până la 60 de rânduri și să fie scurt. Acest lucru se datorează faptului că „bancheta de lucru” pentru ca inteligența artificială să proceseze informații are o dimensiune limitată (numită tehnic fereastră contextuală), iar un fișier SOUL.md excesiv de lung ar comprima spațiul disponibil pentru ca agentul să gestioneze sarcinile reale.

2. Mecanismul de cooperare între agenți: înlocuirea comunicării API cu un sistem de fișiere.

Saboo permite șase agenți AI să lucreze în colaborare prin intermediul unui singur folder partajat.

Procesul specific este următorul: După ce agentul de informații Dwight finalizează colectarea de informații, el scrie rezultatele în fișierul DAILY-INTEL.md; sarcinile programate ale lui Kelly, Rachel și Pam sunt declanșate în secvență, iar fiecare citește fișierul pentru a genera o schiță de tweet, o postare pe LinkedIn și, respectiv, o știre pe scurt. Fișierul de configurare al lui Dwight specifică faptul că scrie rezultatele într-o cale desemnată, în timp ce fișierele de configurare ale lui Kelly și ale altor agenți inteligenți specifică faptul că citesc informațiile de pe acea cale, finalizând astfel transferul de informații.

Acest design, deși aparent „simplu”, evită problemele comune de integrare a sistemului, cum ar fi eșecurile de autentificare și limitările ratei API. Stocarea datelor utilizează un format dual: datele structurate sunt salvate în format JSON pentru deduplicarea mașinilor și urmărirea pe termen lung; conținutul sumar pe care agenții îl pot citi este salvat în format Markdown.

3. Sistem de memorie: O inteligență artificială mai inteligentă prin utilizare

Inteligența artificială uită mereu lucruri, așa că cum o putem face să înțeleagă din ce în ce mai bine stilul și preferințele tale?

Saboo a conceput o structură de memorie cu două straturi pentru acest sistem. Jurnalele zilnice sunt stocate în memoria/AAAA-LL-ZZ.md, înregistrând execuția sarcinilor din ziua respectivă, conținutul schițelor și feedback-ul utilizatorilor și sunt scrise în timp real de către agent în timpul funcționării. Memoria pe termen lung este stocată în MEMORY.md, extragând periodic tipare recurente din jurnalele zilnice, inclusiv preferințele utilizatorilor și înregistrări ale ajustărilor la ghidurile comportamentale.

Fișierul cu reguli de comportament AGENTS.md, care se încarcă automat la începutul fiecărei sesiuni de agent, precizează în mod explicit că nu se păstrează înregistrări temporare după repornirea sesiunii și că orice conținut care trebuie păstrat trebuie scris în fișier.

Eficacitatea acestui mecanism în practică este evidentă în următoarele moduri: versiunile inițiale de tweet-uri ale lui Kelly conțineau numeroase emoji-uri și semne de exclamare. După feedback-ul primit de la Saboo, Kelly a scris această regulă de stil în fișierul său de memorie, iar versiunile ulterioare au respectat-o ​​automat, fără solicitări repetate. În mod similar, Dwight, un agent de informații, a inclus inițial tot conținutul popular în rapoartele sale. Cu toate acestea, după ce Saboo a solicitat o concentrare pe semnalele cheie, criteriile sale de selecție au fost actualizate, ceea ce a dus la o calitate îmbunătățită a rapoartelor.

Inteligența artificială în sine nu a devenit mai inteligentă, dar „experiența” pe care o încarcă se acumulează constant, ceea ce o face din ce în ce mai utilă.

4. Sarcini programate: Faceți ca inteligența artificială să se trezească automat și să execute sarcini.

Acești șase agenți AI nu au fost activați manual de Saboo, ci au fost declanșați automat, conform programărilor lor respective. Ordinea a fost: Agentul Dwight a alergat primul, deoarece toți ceilalți trebuiau să-i citească raportul. Kelly, redactor-șef de Twitter, și Rachel, redactor-șefă de LinkedIn, l-au urmărit pe Dwight, deoarece aveau nevoie ca fișierele de informații să existe deja.

OpenClaw are o funcție de programare a sarcinilor încorporată. Saboo setează ora, închide terminalul, iar inteligența artificială va începe automat lucrul la timp.

5. Mecanism de toleranță la erori: Recuperare automată a sarcinilor pe baza fișierelor heartbeat.

Sarcinile programate nu sunt 100% fiabile. Factori precum repornirea mașinii, întreruperile rețelei și limitele ratei API pot cauza eșecul executării la timp a unei sarcini programate.

Pentru a rezolva această problemă, Saboo a introdus în sistem un fișier heartbeat, HEARTBEAT.md. Monica verifică periodic ultima durată de execuție a tuturor sarcinilor programate și, dacă detectează că o sarcină nu a fost executată timp de mai mult de 26 de ore, declanșează automat o reluare forțată fără intervenție manuală.

03.

Rulează un singur agent fără probleme timp de o săptămână înainte de a-l scala în loturi.

Setările agentului trebuie revizuite în mod repetat.

1. Nu este necesar backend de administrare; interacționați cu agentul inteligent prin Telegram.

Interacțiunile zilnice ale Saboo cu cei șase agenți inteligenți artificiali ai săi nu se bazează pe niciun backend de management; în schimb, acestea se desfășoară prin Telegram. OpenClaw acceptă conectarea agenților la Telegram, iar odată configurați, agenții funcționează ca conturi de bot, permițând utilizatorilor să trimită direct comenzi, să primească schițe și să finalizeze aprobări.

Luați ca exemplu o zi obișnuită de lucru: deschide Telegram dimineața, iar Dwight a trimis deja un rezumat al activităților IA ale zilei, Kelly a trimis trei schițe de tweet-uri care așteaptă să fie revizuite, iar postarea lui Rachel pe LinkedIn este gata. În cele 10 minute necesare pentru a bea o ceașcă de cafea, termină de revizuit conținutul trimis de agenții IA și își începe oficial munca pentru ziua respectivă.

2. Nu mai scrieți prompturi perfecte; agenții IA au nevoie de corecții repetate.

Saboo a spus că mulți oameni tind să scrie fiecare prompt posibil la început atunci când construiesc sisteme de inteligență artificială. El consideră că acest lucru nu este nici fezabil, nici necesar.

Denumirea fiecărui agent IA după un personaj dintr-un serial TV american oferă o bază inițială de personalitate, dar un stil de lucru stabil trebuie format prin feedback și iterație continuă. Saboo numește procesul de reglare a agenților IA „inginerie de semnalizare corectivă”: adică oferirea IA-ului unei versiuni inițiale aproximative, observarea comportamentului său real, indicarea unde greșește și lăsarea acestuia să scrie regulile de corecție într-un fișier de memorie, consolidarea lor sub formă de fișier și încărcarea lor pentru a intra în vigoare în fiecare sesiune ulterioară. Saboo a spus: „Este ca și cum ai instrui un angajat nou cu adevărat”.

Experiența Saboo arată că prima versiune a unui agent este mediocră, a zecea versiune este utilizabilă, iar a treizecea versiune este excelentă, necesitând o investiție continuă de timp pentru optimizare. În plus, stabilirea unei singure responsabilități clare și a unei condiții de terminare pentru fiecare agent ajută la îmbunătățirea stabilității rezultatului.

3. Respectați controlul accesului și controlați cu strictețe domeniul de aplicare al accesului la date.

Dacă încredințăm sarcini de rutină inteligenței artificiale, ce se întâmplă cu securitatea informațiilor?

Strategia principală de securitate a Saboo este izolarea controlului accesului: echipa de inteligență artificială rulează pe un Mac mini dedicat, iar toate conturile și cheile API utilizate sunt solicitate separat și complet izolate de conturile personale. Permisiunile de acces pentru fiecare serviciu pot fi dezactivate independent. Saboo nu autorizează direct niciun cont personal agenților de inteligență artificială; tot conținutul care necesită procesare de către agenți este transmis prin redirecționare manuală sau partajare Telegram, asigurând astfel controlul complet asupra domeniului de acces la date al agenților de inteligență artificială.

Saboo spune că aceasta este aceeași logică ca și în gestionarea angajaților reali: în prima zi, compania nu vă va oferi toate permisiunile de sistem, ci le va aloca după cum este necesar și le va extinde treptat pe măsură ce se construiește încrederea.

4. Infrastructura este predispusă la defecțiuni; Saboo s-a confruntat cu toate cele cinci tipuri de probleme.

Saboo a enumerat în postare câteva defecțiuni comune ale sistemului și soluțiile aferente.

Când gateway-ul se blochează, o comandă de repornire îl va restaura, iar mecanismul heartbeat va relua automat sarcinile neterminate. Dacă sarcinile programate nu se execută la timp din cauza întreruperilor rețelei, a hibernării dispozitivului sau a limitărilor ratei API, mecanismul heartbeat va declanșa automat o reluare după ce detectează că sarcina nu a rulat mai mult de 26 de ore. Degradarea calității ieșirii agentului este de obicei cauzată de conținut redundant sau contradictoriu din fișierul de memorie. Experiențele valide ar trebui extrase periodic în fișierul de memorie pe termen lung, iar jurnalele expirate ar trebui arhivate sau șterse. Scrierea simultană a mai multor agenți în același fișier poate duce la conflicte de date. Ar trebui să se precizeze clar în faza de proiectare că fiecare fișier ar trebui scris doar de un agent, iar alți agenți ar trebui să aibă permisiunea de a citi. Când se încarcă prea multe fișiere în timpul unei sesiuni, provocând depășirea contextului, SOUL.md ar trebui păstrat sub 60 de linii, iar fiecare sesiune ar trebui să încarce doar jurnalele de memorie din ziua curentă și din ziua precedentă.

Saboo sugerează ca implementarea să înceapă cu un singur agent și apoi să se extindă treptat după ce acesta a funcționat stabil timp de o săptămână. Implementarea prea devreme va crește dificultatea depanării.

04.

Sistemul de agenți inteligenți va fi construit în patru faze.

Costul lunar este mai mic de 3.000 de yuani

1. Mai puțin de 400 USD pe lună pentru șase angajați cu normă întreagă în domeniul inteligenței artificiale

În ceea ce privește hardware-ul, Saboo folosește un Mac mini echipat cu un cip M4, noul model începând de la 499 USD (aproximativ 3443 RMB). Orice dispozitiv alimentat continuu poate fi folosit ca înlocuitor. Pentru modele, majoritatea sarcinilor agenților utilizează Claude Opus și Sonnet, în timp ce unele fluxuri de lucru utilizează Gemini. De asemenea, testează modele locale pe Ollam în încercarea de a reduce și mai mult costurile.

Detaliile fiecărei cheltuieli sunt următoarele:

Claude (Plan Max): 200 USD/lună (aproximativ 1380 RMB/lună)

API Gemini: 50-70 USD/lună (aproximativ 345-483 RMB/lună)

TinyFish (Agent AI bazat pe web): Aproximativ 50 USD/lună (aproximativ 345 RMB/lună)

Eleven Labs (voce): Aproximativ 50 USD/lună (aproximativ 345 RMB/lună)

Telegramă: Gratuit

OpenClaw: Gratuit

Total: Mai puțin de 400 USD/lună (aproximativ 2760 RMB/lună)

2. Economisirea timpului este punctul de plecare; adevărata barieră o reprezintă fișierele de memorie acumulate continuu.

În ceea ce privește îmbunătățirile de eficiență, agentul de informații Dwight reduce volumul de muncă de cercetare al lui Saboo cu 2 până la 3 ore zilnic. Anterior, Saboo trebuia să verifice manual X, Hacker News, proiecte populare GitHub și bloguri de inteligență artificială în fiecare dimineață; acum, se trezește cu un rezumat al priorităților cu link-uri către surse și acțiuni concrete. Kelly, cea care scrie tweet-uri, Pam, editorul de briefing, și Rachel, cea care scrie pe LinkedIn, reduc împreună timpul de redactare a conținutului cu 1 până la 2 ore, iar inginerul Ross preia sarcini de inginerie care anterior ocupau întreaga seară. Cei șase agenți de inteligență artificială îi economisesc împreună lui Saboo 4 până la 5 ore zilnic.

Saboo subliniază că valoarea pe termen lung a funcționării continue a acestui sistem este la fel de semnificativă. Luând ca exemplu sarcinile de cercetare, pe măsură ce agentul execută zilnic și acumulează date, capacitățile sale de urmărire a semnalelor și de evaluare a tendințelor se îmbunătățesc treptat odată cu îmbogățirea fișierelor sale de memorie - un efect care nu poate fi obținut într-o singură sesiune. În prezent, frecvența postărilor și calitatea conținutului pe X au crescut, ritmul postărilor s-a stabilizat, proiectele open-source sunt actualizate continuu, iar newsletterele au devenit o sursă stabilă de conținut.

Trebuie menționat că evaluarea originalității, luarea deciziilor strategice și generarea de idei creative depășesc în prezent capacitățile acestui sistem. Valoarea acestui sistem constă în capacitatea sa de a executa în mod fiabil sarcini repetitive și de rutină, eliberând astfel timp și energie pentru a gestiona sarcini mai complexe.

3. Procesul va avansa constant în patru faze, construind de la zero un sistem de agenți inteligenți.

Saboo recomandă continuarea configurării sistemului în patru faze.

În prima săptămână, finalizați instalarea OpenClaw, implementați un agent unic, scrieți SOUL.md, concentrați-vă pe gestionarea unei sarcini zilnice repetitive, observați funcționarea acesteia și remediați problemele.

În a doua săptămână, am continuat să oferim feedback cu privire la rezultatul inițial și am ajustat fișierul SOUL.md în funcție de performanța sa reală, îmbunătățind treptat fișierul de memorie.

În a treia săptămână, pe baza faptului că ieșirea agentului existent poate fi utilizată stabil, se introduce un al doilea agent, după cum este necesar, și se configurează relația de cooperare la citire și scriere a fișierului de configurare.

În a patra săptămână și după aceea, numărul de agenți este extins în funcție de nevoile reale de lucru. Fiecare agent nou ar trebui să abordeze o anumită lipsă de sarcini, în loc să fie adăugat pentru a urmări completitudinea sistemului.

05.

Concluzie: OpenClaw permite accesul local...

#多智能体 Automatizarea funcționează cu adevărat.

Saboo nu numai că economisește timp cu acest sistem, dar, mai important, demonstrează o cale replicabilă: cu ajutorul instrumentelor open source precum OpenClaw, dezvoltatorii individuali pot implementa sisteme de automatizare multi-agent care rulează continuu pe dispozitive locale, fără a se baza pe servicii cloud sau a construi un cadru de orchestrare de la zero.

#OPENCLAW Posede trei caracteristici care lipsesc majorității platformelor de agenți AI: este complet open source, prioritizează accesul local (memoria este stocată ca fișiere Markdown pe dispozitivul local al utilizatorului) și are capacități de programare autonomă bazate pe un daemon heartbeat. Aceste caracteristici reprezintă fundamentul pe care sistemul Saboo funcționează stabil.

De asemenea, este demnă de remarcat abordarea sa în gestionarea complexității sistemelor: înlocuirea cadrului de orchestrare cu un sistem de fișiere, înlocuirea reglării fine a modelului cu fișiere de memorie și stabilirea unor repere inițiale de personalitate prin denumirea personajelor. Fiecare decizie de design se îndreaptă către același principiu - menținerea complexității la minimum, îndeplinind în același timp cerințele.

În postare, Saboo subliniază că, deși modelele în sine au devenit o resursă de bază universal accesibilă, adevăratul factor de diferențiere constă în sistemele construite în jurul acestor modele, inclusiv fișierele de configurare a agenților, mecanismele de memorie, regulile de coordonare și acumularea optimizării continue. Acest sistem va continua să se optimizeze în timp, devenind resursa personalizată.
#AImodel