Blog

Tester kijkt naar schermen met metrics

Observability voor testers, deel 2

Observability biedt testers meer dan alleen inzicht in de output van een black box. In deel 2 van deze serie gaan we in op drie concrete manieren om logs, metrics en traces in te zetten als testtechniek. Van het opstellen van hypotheses bij performancetests tot het benutten van productiedata als testbron.

Lees meer »
Telescoop

Observability voor testers, deel 1

Observability is een essentieel onderdeel van moderne DevOps-teams. Maar in de wereld van testen blijft het onderbenut. In dit artikel laten we je zien wat observability is en waarom het zo belangrijk is voor testers.

Lees meer »

RAG & Bias Checklist:Zo voorkom je hallucinatie en bias in AI-modellen​

Retrieval Augmented Generation (RAG) is een krachtige manier om met Large Language Models (LLM’s) te werken, maar geen wondermiddel. Het vermindert hallucinatie en bias niet vanzelf, de risico’s verschuiven alleen. Met deze checklist en de juiste tools maak je die risico’s concreet en testbaar. In deze RAG & Bias Checklist laten we zien hoe je risico’s meetbaar maakt en welke tools je helpen om AI-toepassingen écht betrouwbaar te maken. De RAG & Bias Checklist stap voor stap 1. Relevantie Risico: irrelevante passages leiden tot hallucinaties.Hoe meten: beoordeel of je top-5 resultaten écht relevant zijn.Voorbeeld: document niet in top-5 → foutief antwoord. 2. Evidence-first Risico: het model verzint samenvattingen zonder bron.Hoe meten: check of broncitaten aanwezig zijn.Voorbeeld: output zonder referenties = rode vlag. 3. No-evidence, no-answer Risico: model vult leegte met fantasie.Hoe meten: meet refusal rate met een out-of-scope testset.Voorbeeld: vraag “Wat zegt dit document over raketten?” → correct = “Niet

Lees meer »
Rubberen eend die verschrikt naar een laptop kijkt

Vibe coded applicaties – minder testen, meer observeren

De wereld van softwareontwikkeling wordt momenteel op zijn kop gezet door de opkomst van agentic code editors als Windsurf en Cursor. Deze integrated development environments (IDE’s) kunnen in hoog tempo applicaties ontwikkelen, doordat zij toegang hebben tot niet alleen je codebase, maar ook je build tools, versiebeheer en je terminal. De mogelijkheden lijken eindeloos, maar hoe zit het met de kwaliteit? De rol van AI in ontwikkeling Kwaliteit is steeds minder inzichtelijk bij applicaties die met behulp van deze tools gebouwd worden (voor het gemak even “AI-powered” genoemd). Architecturale keuzes, programmatuur en configuratie worden uit handen genomen, maar daarmee ook begrip van hoe de applicatie werkt. De manier waarop we kwaliteit inzichtelijk maken, is sterk afhankelijk van de rol die we AI geven in ons ontwikkelproces. Snel maar risicovol (vibe coding) Vibe coding is de nieuwste trend op LinkedIn. Je hoeft niet te kunnen programmeren, met enkel prompts tuig je

Lees meer »

Observability voor testers, deel 2

Observability biedt testers meer dan alleen inzicht in de output van een black box. In deel 2 van deze serie gaan we in op drie concrete manieren om logs, metrics en traces in te zetten als testtechniek. Van het opstellen van hypotheses bij performancetests tot het benutten van productiedata als testbron.

Lees meer »

Observability voor testers, deel 1

Observability is een essentieel onderdeel van moderne DevOps-teams. Maar in de wereld van testen blijft het onderbenut. In dit artikel laten we je zien wat observability is en waarom het zo belangrijk is voor testers.

Lees meer »

RAG & Bias Checklist:Zo voorkom je hallucinatie en bias in AI-modellen​

Retrieval Augmented Generation (RAG) is een krachtige manier om met Large Language Models (LLM’s) te werken, maar geen wondermiddel. Het vermindert hallucinatie en bias niet vanzelf, de risico’s verschuiven alleen. Met deze checklist en de juiste tools maak je die risico’s concreet en testbaar. In deze RAG & Bias Checklist laten we zien hoe je risico’s meetbaar maakt en welke tools je helpen om AI-toepassingen écht betrouwbaar te maken. De RAG & Bias Checklist stap voor stap 1. Relevantie Risico: irrelevante passages leiden tot hallucinaties.Hoe meten: beoordeel of je top-5 resultaten écht relevant zijn.Voorbeeld: document niet in top-5 → foutief antwoord. 2. Evidence-first Risico: het model verzint samenvattingen zonder bron.Hoe meten: check of broncitaten aanwezig zijn.Voorbeeld: output zonder referenties = rode vlag. 3. No-evidence, no-answer Risico: model vult leegte met fantasie.Hoe meten: meet refusal rate met een out-of-scope testset.Voorbeeld: vraag “Wat zegt dit document over raketten?” → correct = “Niet

Lees meer »

Vibe coded applicaties – minder testen, meer observeren

De wereld van softwareontwikkeling wordt momenteel op zijn kop gezet door de opkomst van agentic code editors als Windsurf en Cursor. Deze integrated development environments (IDE’s) kunnen in hoog tempo applicaties ontwikkelen, doordat zij toegang hebben tot niet alleen je codebase, maar ook je build tools, versiebeheer en je terminal. De mogelijkheden lijken eindeloos, maar hoe zit het met de kwaliteit? De rol van AI in ontwikkeling Kwaliteit is steeds minder inzichtelijk bij applicaties die met behulp van deze tools gebouwd worden (voor het gemak even “AI-powered” genoemd). Architecturale keuzes, programmatuur en configuratie worden uit handen genomen, maar daarmee ook begrip van hoe de applicatie werkt. De manier waarop we kwaliteit inzichtelijk maken, is sterk afhankelijk van de rol die we AI geven in ons ontwikkelproces. Snel maar risicovol (vibe coding) Vibe coding is de nieuwste trend op LinkedIn. Je hoeft niet te kunnen programmeren, met enkel prompts tuig je

Lees meer »