Nous Research lancia Hermes Desktop: l’agente AI Hermes arriva su macOS, Windows e Linux
Hermes Desktop è ora disponibile in anteprima pubblica. Nous Research ha rilasciato un’app nativa per macOS, Windows e Linux che dà al suo agente AI open-source Hermes Agent un’interfaccia grafica. Fino ad oggi Hermes si usava solo da terminale o da chat su messaggistica.
La build attuale è Hermes Agent v0.15.2. Il desktop condivide lo stesso core dell’agente: configurazione, API key, sessioni, skill e memoria sono gli stessi del CLI e del gateway. Una sessione avviata sul desktop si riprende da terminale e viceversa, perché lo stato non è duplicato.
Come funziona Hermes Desktop
Hermes non è un copilot legato a un editor: è un agente AI autonomo che pianifica, esegue azioni e osserva i risultati in un ciclo. La nuova interfaccia mostra in tempo reale le risposte in streaming e l’attività dei tool. Un pannello laterale destro permette di vedere anteprime di pagine web, file e output dei tool. Ci sono anche un file browser, input e output vocale e una UI per le impostazioni.
Le installazioni su macOS e Windows usano un installer diretto. Su Linux si parte dal terminale con uno script che include l’opzione --include-desktop.
Il closed learning loop
Nous Research descrive Hermes con un closed learning loop, la caratteristica che lo distingue da un semplice wrapper per chat. Dopo un’operazione complessa, l’agente scrive una skill riutilizzabile. Con l’uso quelle skill si migliorano da sole. La memoria è persistente e curata dall’agente stesso, con promemoria periodici per salvare conoscenza. Il recupero tra sessioni usa FTS5 con riassunto via LLM.
Le skill seguono lo standard aperto agentskills.io.
Connettività, scheduling e sandbox
Il gateway di Hermes gestisce più piattaforme da un punto solo: Telegram, Discord, Slack, WhatsApp, Signal, Email e CLI. Puoi iniziare un compito su una piattaforma e continuarlo su un’altra. Lo scheduling usa linguaggio naturale per report, backup e briefing, eseguiti senza sorveglianza via cron integrato.
La delega crea sotto-agenti isolati con conversazioni e terminali separati. Lo script Python RPC comprime pipeline multi-step in un unico turno a costo zero di contesto. L’esecuzione è in sandbox con cinque backend: locale, Docker, SSH, Singularity e Modal, con isolamento dei namespace per limitare ciò che un processo può vedere o toccare.
Gli strumenti nativi includono: ricerca web, automazione browser, visione, generazione immagini, text-to-speech e ragionamento multi-modello. Hermes si collega anche a tool esterni tramite MCP (Model Context Protocol), lo standard per l’integrazione di strumenti.
Nous Portal e Tool Gateway
Hermes funziona con qualsiasi provider, quindi le API key sono opzionali. Nous Portal le raggruppa in un unico abbonamento. I piani vanno da Free a Ultra, con crediti mensili e accesso a oltre 300 modelli. Il Tool Gateway indirizza diversi strumenti tramite un solo account: ricerca web su Firecrawl, generazione immagini su FAL, text-to-speech su OpenAI e browser cloud su Browser Use.
La licenza è MIT, quindi è possibile auditare il codice, auto-ospitarlo e modificarlo. È ancora in anteprima pubblica, quindi ci si possono aspettare imperfezioni. La memoria autonoma e lo scheduling richiedono attenzione nella revisione. Su Linux il desktop si installa ancora dal terminale, e la vastità delle funzionalità rende la curva di apprendimento ripida per chi inizia.
