Sistemas agentic & automação.
Workflows multi-passo onde um LLM trata do raciocínio, as suas ferramentas tratam das ações, e um humano valida o output. Construímos, documentamos e treinamos a sua equipa para passar a tomar conta.
A PARTIR DE 5 000 € · 3 A 8 SEMANAS · RUNBOOK INCLUÍDO
O que isto é (e o que não é).
É: um sistema que pega num input (ticket, lead, documento, linha de dados), passa-o por um LLM com os seus prompts e ferramentas, produz um rascunho e coloca-o em fila para aprovação humana.
Não é: um chatbot totalmente autónomo que responde sozinho sem revisão. Não entregamos isso - a taxa de erro ainda não é aceitável para a maioria do trabalho de PME.
Âmbito.
- Um workflow, do início ao fim.
- Biblioteca de prompts (versionada, testável).
- Integrações com ferramentas existentes (CRM, helpdesk, docs, e-mail, Slack, Airtable).
- Interface de revisão humana - dashboard ou fila dentro da sua ferramenta atual.
- Logging e avaliação - ver o que o agente fez, porquê, e se acertou.
- Runbook + formação para 2 a 3 pessoas da sua equipa.
Método (como decorre um build).
- Semana 1 - Mapeamento de workflow. Sentamo-nos com os humanos que fazem o trabalho hoje. Mapeamos cada ramo e caso limite.
- Semana 2 - Design de prompts + ferramentas. Primeiros prompts esboçados, ferramentas ligadas, dez inputs testados.
- Semanas 3-4 - Build. Integrações, UI de revisão, logging. Demos diárias.
- Semanas 5-6 - Shadow run. O agente corre em paralelo com o humano. Comparação de outputs. Tuning.
- Semana 7 - Cut-over. O agente primeiro, o humano revê. O cliente passa a dono.
- Semana 8 (opcional) - Formação + entrega de runbook.
Preço.
- Agente simples - 5 000 €-8 000 €. 3 a 4 semanas.
- Agente médio - 8 000 €-15 000 €. 4 a 6 semanas.
- Complexo / multi-agente - 15 000 €+. 6 a 8 semanas. Cotado após scoping.
Tuning contínuo encaixa melhor num retainer Growth (1 990 €/mês) ou Scale (3 990 €/mês).
Humano no loop, por defeito.
As taxas de erro atuais dos LLM em dados de negócio reais vão de 3 a 15 % consoante a tarefa. Para uma PME de 10 pessoas, 5 % de erro em 200 respostas semanais são 10 respostas erradas por semana. Isso é um incêndio.
Cada agente que construímos passa por um humano antes de agir. Desenhamos a UI de revisão para que a aprovação leve segundos, não minutos. Com o tempo, à medida que a precisão medida sobe, pode optar por auto-aprovar certos ramos. É a sua decisão, com dados.
Build de referência: o AISO Orchestrator.
O AISO Orchestrator despacha 17 tipos de agentes em pesquisa, copywriting, desenvolvimento, QA e operações. Stack: Next.js + MongoDB replica set, Server-Sent Events, Agent Messaging MCP, write-back para o Claude Memory, revisão humana em cada decisão não trivial. Ler o build log →