Als het goed is weet je al dat wanneer je een AI-chatbot (zoals ChatGP of Google Gemini) een vraag stelt, je altijd moet checken of zijn antwoorden wel kloppen. Google heeft nu een percentage kunnen hangen aan hun accuraatheid: hooguit 69% van wat zij zeggen is ook echt waar.

Dit concluderen zij naar aanleiding van onderzoek van alle grote, bekende chatbots van dit moment. De bot die het best uit de bus kwam, was de Gemini Pro 3 met een FACTS score van 68,8. GPT5 staat op de derde plek met een score van 61,8. De Claude 4.5 Opus staat op plek nummer 6 met een score van slechts 51.3.

Deze cijfers zijn schrikbarend laag, maar bevestigen ook iets wat we al langer weten: chatbots hebben de neiging zaken te ‘hallucineren’ (zelf verzinnen) wanneer zij een antwoord op een vraag niet weten. Daarnaast kunnen zij geen onderscheid maken tussen feitelijk juiste bronnen, en bronnen die niet correct zijn.

Een belangrijke verbetering die chatbots de laatste tijd krijgen, is dat ze vaak de bronnen meegeven die ten grondslag lagen voor hun beweringen. En doen ze dit niet uit zichzelf, dan kun je ze er altijd expliciet naar vragen.

Wij adviseren dan ook met klem om deze bronnen altijd na te gaan, om te zien of wat zij zeggen, ook werkelijk klopt.

Je kunt het hele verslag van het onderzoek, inclusief een Top 15 met alle chatbots en hun score, hier inzien.

Nieuw onderzoek Google: wat AI chatbots zeggen klopt slechts voor 69%

Vier ideeën, één keer per maand

Anthropic lanceert Claude Opus 4.7 voor zakelijke gebruikers

Microsoft Copilot voor MKB: onze ervaring na 3 maanden

Goed om te weten: AI gaat 'hallucineren' van PDF's