SERVICE // 02

Sistemas agentic & automação.

Workflows multi-passo onde um LLM trata do raciocínio, as suas ferramentas tratam das ações, e um humano valida o output. Construímos, documentamos e treinamos a sua equipa para passar a tomar conta.

A PARTIR DE 5 000 € · 3 A 8 SEMANAS · RUNBOOK INCLUÍDO

O que isto é (e o que não é).

É: um sistema que pega num input (ticket, lead, documento, linha de dados), passa-o por um LLM com os seus prompts e ferramentas, produz um rascunho e coloca-o em fila para aprovação humana.

Não é: um chatbot totalmente autónomo que responde sozinho sem revisão. Não entregamos isso - a taxa de erro ainda não é aceitável para a maioria do trabalho de PME.

Âmbito.

  1. Um workflow, do início ao fim.
  2. Biblioteca de prompts (versionada, testável).
  3. Integrações com ferramentas existentes (CRM, helpdesk, docs, e-mail, Slack, Airtable).
  4. Interface de revisão humana - dashboard ou fila dentro da sua ferramenta atual.
  5. Logging e avaliação - ver o que o agente fez, porquê, e se acertou.
  6. Runbook + formação para 2 a 3 pessoas da sua equipa.

Método (como decorre um build).

  1. Semana 1 - Mapeamento de workflow. Sentamo-nos com os humanos que fazem o trabalho hoje. Mapeamos cada ramo e caso limite.
  2. Semana 2 - Design de prompts + ferramentas. Primeiros prompts esboçados, ferramentas ligadas, dez inputs testados.
  3. Semanas 3-4 - Build. Integrações, UI de revisão, logging. Demos diárias.
  4. Semanas 5-6 - Shadow run. O agente corre em paralelo com o humano. Comparação de outputs. Tuning.
  5. Semana 7 - Cut-over. O agente primeiro, o humano revê. O cliente passa a dono.
  6. Semana 8 (opcional) - Formação + entrega de runbook.

Preço.

  • Agente simples - 5 000 €-8 000 €. 3 a 4 semanas.
  • Agente médio - 8 000 €-15 000 €. 4 a 6 semanas.
  • Complexo / multi-agente - 15 000 €+. 6 a 8 semanas. Cotado após scoping.

Tuning contínuo encaixa melhor num retainer Growth (1 990 €/mês) ou Scale (3 990 €/mês).

Humano no loop, por defeito.

As taxas de erro atuais dos LLM em dados de negócio reais vão de 3 a 15 % consoante a tarefa. Para uma PME de 10 pessoas, 5 % de erro em 200 respostas semanais são 10 respostas erradas por semana. Isso é um incêndio.

Cada agente que construímos passa por um humano antes de agir. Desenhamos a UI de revisão para que a aprovação leve segundos, não minutos. Com o tempo, à medida que a precisão medida sobe, pode optar por auto-aprovar certos ramos. É a sua decisão, com dados.

Build de referência: o AISO Orchestrator.

O AISO Orchestrator despacha 17 tipos de agentes em pesquisa, copywriting, desenvolvimento, QA e operações. Stack: Next.js + MongoDB replica set, Server-Sent Events, Agent Messaging MCP, write-back para o Claude Memory, revisão humana em cada decisão não trivial. Ler o build log →