Plant in stappen
Krijgt een doel, breekt het op in losse stappen, beslist over de volgende stap op basis van wat eerdere stappen opleverden.
Een chatbot antwoordt. Een agent plant, roept tools aan en handelt. Bij OneDayBuild bouwen we de werkende versie van die agent in één dag op echte data van jullie, inclusief een eval-loop om te weten of het echt werkt.
Het verschil zit in wat de agent zelf doet zonder gebruiker. Hieronder de drie eigenschappen die het verschil maken.
Krijgt een doel, breekt het op in losse stappen, beslist over de volgende stap op basis van wat eerdere stappen opleverden.
Heeft toegang tot specifieke acties in jullie systemen: een klant opzoeken, een mail klaarzetten, een document genereren. Niet de hele API, alleen wat past.
Bij belangrijke acties (mail versturen, betalingen, contracten) stopt de agent en vraagt expliciet bevestiging. Geen black box die zelf besluit.
Niet één model dat alles doet, maar telkens een patroon dat bij de taak past.
Doorzoekt interne bronnen, normaliseert resultaten, citeert bron. Eén vraag in, controleerbaar antwoord uit.
Plant een keten van acties in je product: boekingen, formulieren, status-updates. Approval is een vast onderdeel van de flow.
Zit ingebakken in een bestaand product. Stelt voor, suggereert, voert uit bij click. Geen aparte chat-laag, geen losse app.
Eén werkdag is genoeg voor een werkende agent op één duidelijke taak. Niet voor een multi-agent-platform.
Onze positie: nieuwsgierig, niet bevooroordeeld. We bouwen wat werkt en zeggen het als iets niet werkt.
Bij voorkeur werken we met geanonimiseerde of synthetische data op de dag. Bij gevoelige data kiezen we self-hosted modellen of een lokale eval-loop. Dat bespreken we in de intake voorafgaand aan de dag.
Dat gebeurt. De vraag is alleen waar en hoe vaak. Het eval-rapport laat zien op welke testcases de agent faalt, hoe vaak en wat het patroon is. Op basis daarvan kun je beslissen of de agent productie-rijp is voor jouw use case, en welke acties altijd door een mens bevestigd moeten worden.
Pragmatisch per taak. Voor reasoning meestal Claude, voor goedkope batch-bewerkingen GPT-mini of vergelijkbaar, lokaal gehost waar dat past. Tool-laag via MCP of function-calls. We laten in het rapport zien welke keuzes we maakten en waarom.
We kennen de standaard valkuilen: prompt-injection, data-leak via context, log-bewaring. In één dag bouwen we niet iets dat in productie zonder review zou mogen, maar wel iets dat de bouwblokken voor een veilige productie-versie blootlegt.
Ja. Je krijgt de code, prompts, tools en eval-bestanden mee. Self-hosting kan, je eigen developer kan er verder mee, of we rollen door naar een Appfront-traject voor productie.
Stuur ons je use case in een paar zinnen. We sparren in een korte intake en plannen de dag.
Een korte intake volgt na je inschrijving. Daarna stemmen we scope en datum af.
We nemen contact op om de intake in te plannen.
We gebruiken cookies om je ervaring te verbeteren en het gebruik van de site te meten.