Een AI-agent laten bouwen in één dag

Een chatbot antwoordt. Een agent plant, roept tools aan en handelt. Bij OneDayBuild bouwen we de werkende versie van die agent in één dag op echte data van jullie, inclusief een eval-loop om te weten of het echt werkt.

Terug naar OneDayBuild

01 / 04

Een agent is geen chatbot

Het verschil zit in wat de agent zelf doet zonder gebruiker. Hieronder de drie eigenschappen die het verschil maken.

Plant in stappen

Krijgt een doel, breekt het op in losse stappen, beslist over de volgende stap op basis van wat eerdere stappen opleverden.

Roept tools aan

Heeft toegang tot specifieke acties in jullie systemen: een klant opzoeken, een mail klaarzetten, een document genereren. Niet de hele API, alleen wat past.

Vraagt mens bij risico

Bij belangrijke acties (mail versturen, betalingen, contracten) stopt de agent en vraagt expliciet bevestiging. Geen black box die zelf besluit.

02 / 04

Welke agent-patronen we vaker bouwen

Niet één model dat alles doet, maar telkens een patroon dat bij de taak past.

Onderzoek-agent

Doorzoekt interne bronnen, normaliseert resultaten, citeert bron. Eén vraag in, controleerbaar antwoord uit.

Workflow-agent

Plant een keten van acties in je product: boekingen, formulieren, status-updates. Approval is een vast onderdeel van de flow.

Co-pilot in je UI

Zit ingebakken in een bestaand product. Stelt voor, suggereert, voert uit bij click. Geen aparte chat-laag, geen losse app.

03 / 04

Wat past in één dag, wat niet

Eén werkdag is genoeg voor een werkende agent op één duidelijke taak. Niet voor een multi-agent-platform.

Past in één dag

Eén centrale taak met heldere input en output.
Twee tot vier tools die de agent mag aanroepen.
Eén of twee gebruikersrollen die de agent bedient.
Een eval-set die we samen maken op de dag.
Mens-in-de-lus stap voor risico-acties.

Past niet in één dag

Een platform van meerdere agents die met elkaar samenwerken.
Productie-paklare schaalbaarheid en monitoring.
Integratie met legacy systemen waar wij geen test-toegang voor hebben.
Eigen LLM trainen of fine-tunen.
Volledige security-audit voor productie.

04 / 04

Eerlijk over wat een agent wel en niet kan

Onze positie: nieuwsgierig, niet bevooroordeeld. We bouwen wat werkt en zeggen het als iets niet werkt.

Hallucinaties bestaan nog steeds. Schonere tools en scherpere prompts halen het percentage omlaag, maar nul wordt het niet. Mens-bij-risico is geen luxe.
Kosten lopen op bij volume. Wat 10 keer per dag draait kost weinig. Wat 10.000 keer per dag draait wel. We laten in het rapport zien waar het duurder model echt waarde toevoegt.
Latency telt. Een agent die 12 seconden denkt voordat hij begint, faalt in UX. Streaming, parallelle tool-calls en slimme caching zijn basis, geen optie.
Niet alles is AI. Soms is een SQL-query en een if-statement gewoon beter. We kiezen AI waar het waarde toevoegt, niet als doel op zich.

05 / 05

Veelgestelde vragen

Mag onze data jullie systemen verlaten?

Bij voorkeur werken we met geanonimiseerde of synthetische data op de dag. Bij gevoelige data kiezen we self-hosted modellen of een lokale eval-loop. Dat bespreken we in de intake voorafgaand aan de dag.

Wat als de agent fouten maakt?

Dat gebeurt. De vraag is alleen waar en hoe vaak. Het eval-rapport laat zien op welke testcases de agent faalt, hoe vaak en wat het patroon is. Op basis daarvan kun je beslissen of de agent productie-rijp is voor jouw use case, en welke acties altijd door een mens bevestigd moeten worden.

Welke stack en modellen gebruiken jullie?

Pragmatisch per taak. Voor reasoning meestal Claude, voor goedkope batch-bewerkingen GPT-mini of vergelijkbaar, lokaal gehost waar dat past. Tool-laag via MCP of function-calls. We laten in het rapport zien welke keuzes we maakten en waarom.

Hoe zit het met security?

We kennen de standaard valkuilen: prompt-injection, data-leak via context, log-bewaring. In één dag bouwen we niet iets dat in productie zonder review zou mogen, maar wel iets dat de bouwblokken voor een veilige productie-versie blootlegt.

Kunnen we de agent zelf hosten na de dag?

Ja. Je krijgt de code, prompts, tools en eval-bestanden mee. Self-hosting kan, je eigen developer kan er verder mee, of we rollen door naar een Appfront-traject voor productie.