People

Concept zonder naam

June 20, 2026

Om de twee weken of zo brengt het AI-nieuws een handvol verhalen voort die meer verdienen dan een voorbijscroll. Dit is Studio Hyra's take op degene die nu ertoe doen voor iedereen die met AI bouwt. Week van 19 juni 2026.

Vier verhalen dit keer. Google DeepMind trekt een harde lijn rond zijn eigen agents. Een steeds duidelijker beeld over welke LLM's te vertrouwen zijn in klinisch werk. Een stille maar belangrijke tegenprestatie tegen het vervangen van domeinexperts met modellen. En hardware voor lichaamsscannen die als science fiction klinkt, maar veel dichterbij is.

A steaming mug on a cafe table, backlit by a window.

Google DeepMind vertrouwt zijn eigen agents niet volledig

Google DeepMind is ongewoon openhartig geweest over de risico's van het eigen onderzoek naar AI-agenten. Het lab heeft guardrails ingesteld die opzettelijk beperken wat zijn agenten autonoom kunnen doen, precies omdat de mensen die ze bouwen niet zeker zijn dat de agenten zich zoals bedoeld zullen gedragen in open omgevingen.

Dat verdient een moment van stilstand. DeepMind is niet bepaald bekend als voorzichtige organisatie. Wanneer het team dat de meest capabele agenten ter wereld bouwt zegt dat het oncomfortabel is ze het stuur te geven, dat is geen PR-zet. Het is een eerlijke engineeringbeoordeling.

De praktische consequentie voor iedereen die nu op agenten gebaseerde producten ontwerpt: beperkte agenten zijn geen compromis. Het is de juiste architectuur voor dit moment. Een nauwkeurige, betrouwbare agent die één ding goed doet is nuttiger dan een capabele agent die je niet volledig kunt voorspellen. Het doel is niet maximale autonomie. Het doel is passende autonomie, afgestemd op je werkelijke risicotolerantie en de kwaliteit van je evaluatie-infrastructuur.

Bij Studio Hyra zien we dit regelmatig gebeuren. Klanten komen binnen met een volledig autonome AI-workflow. Ze vertrekken met iets meer ingeperkt, en nuttiger, zodra we in kaart hebben gebracht waar de foutmogelijkheden zitten.

Een nauwkeurige, betrouwbare agent die één ding goed doet is nuttiger dan een capabele agent die je niet volledig kunt voorspellen. Passende autonomie is de designbrief. Niet maximale autonomie.
Max Pinas, Studio Hyra

Welke LLM's werken echt in klinische settings

De medische AI-ruimte groeit snel, en het modellandschap begint zich te stratificeren. Niet alle LLM's presteren gelijk in klinische contexten, en de kloof tussen een model dat algemeen indrukwekkend is en een dat echt bruikbaar is in een diagnose- of triage-situatie is aanzienlijk.

Meerdere recente evaluaties hebben modellen voor algemeen gebruik vergeleken met modellen die fijn-afgesteld zijn of specifiek op medische literatuur en klinische aantekeningen zijn getraind. Het patroon dat steeds weer opdaagt: algemene modellen doen het goed bij feitenopzoeking en gestructureerde Q&A, maar worstelen met het soort probabilistisch redeneren, randgeval-herkenning en onzekerheidscommunicatie dat klinisch werk echt eist.

Modellen zoals Google's Med-PaLM 2 en recentere opvolgers hebben sterkere prestaties laten zien op medische licentiatings-benchmarks in vergelijking met algemene modellen, maar benchmark-prestatie en werkelijke klinische bruikbaarheid zijn nog steeds twee verschillende dingen. De benchmarks worden beter, maar ze zijn niet het werk.

Wat dit betekent voor iedereen die in of nabij gezondheidszorg bouwt: een model kiezen is niet het moeilijke gedeelte. Het moeilijke gedeelte is bepalen hoe goede output eruitziet in je specifieke klinische context, evals bouwen die werkelijk gebruik weerspiegelen, en bepalen waar de output van een model in een menselijke beslissing voedsel geeft versus er een vervangt. Die laatste vraag is geen technische. Het is een bestuursvraag.

De studios en teams die dit goed doen zijn niet degenen met de meest geavanceerde modellen. Het zijn degenen die eerlijk zijn geweest over waar AI-ondersteunde oordeel eindigt en menselijk oordeel moet beginnen.

An empty, dimly lit cafe interior with chairs and tables, viewed from a corner.

Menselijke expertise is niet het vangnet. Het is de basis.

Er wint een tegenstrijdig standpunt terrein in serieuze AI-kringen, en het is één die we bij Studio Hyra al een poosje hebben: in veel domeinen is het vervangen van een menselijke expert met een AI-model helemaal de verkeerde framing.

De nuttiger framing is dit. Wat doet een echte expert werkelijk dat een model niet kan? En hoe ontwerp je een systeem dat de expert precies op die punten in de lus houdt?

Neem juridisch werk. Een senior advocaat doet vooral geen onderzoek. Dat doet een junior. De senior advocaat oefent oordeelsvermogen uit over risico, leest de kamer in, weet wanneer je moet drukken en wanneer je moet toegeven. Een LLM kan de onderzoekslaag dramatisch versnellen. Het kan de oordeelslaag niet dupliceren. De fout is een product bouwen dat beide met hetzelfde model probeert te doen.

Of neem strategiewerk. Een ervaren productstrategist heeft vijftien bedrijven dezelfde fout op Series B zien maken. Die patroonherkenning is stilzwijgende kennis. Het zit niet in enig trainingskorpus. Een model getraind op openbare casestudy's geeft je de schone versie van wat is gebeurd. De strategist geeft je de versie die werkelijk waar is.

Dit betekent niet dat AI geen rol in deskundig werk heeft. Dat heeft het absoluut. Maar de rol is vergroting en versnelling, niet vervanging. En de producten die dit goed doen worden gebouwd door mensen die respect hebben voor het domein, niet alleen enthousiasme voor de technologie.

Een ervaren strategist heeft vijftien bedrijven dezelfde fout op Series B zien maken. Die patroonherkenning is stilzwijgend. Het zit niet in enig trainingskorpus.
Max Pinas, Studio Hyra

Bodyscanners. serieus hardware komt dichter bij echte implementatie

Aan de hardware-kant is er groeiende momentum rond AI-aangedreven full-body scantechnologie. De pitch is overtuigend: snelle, niet-invasieve scans die afwijkingen eerder kunnen markeren dan traditioneel screenen, tegen een fractie van de kosten van een MRI of CT, en zonder stralingsblootstelling.

Meerdere bedrijven zijn nu in verschillende stadia van klinische validatie voor apparaten die verschillende sensing-modaliteiten gebruiken, inclusief millimetergolf, ultrasoundreeksen en fotoacoustische beeldvorming, gecombineerd met AI-modellen die getraind zijn om de output te interpreteren. De ambitie is vroege detectie op populatieschaal.

Dit is één van die gebieden waar de technologiekloof sneller sluit dan de regelgeving en terugbetalingsinfrastructuur kan bijhouden. De hardware werkt goed genoeg in gecontroleerde omgevingen. Het in klinische workflows krijgen, het door betalers laten dekken, het door clinici laten vertrouwen, dat zijn de trage delen.

Voor iedereen die in deze ruimte bouwt, is de designuitdaging niet de scan zelf. Het is de workflow rond de scan. Hoe krijgt een afwijkingsvlag communicatie naar een patiënt zonder onnodige angst te veroorzaken? Hoe verifieert of verwerpt een klinicus snel een voorstel van een model? Wat gebeurt er met de data? Dit zijn product- en designvragen even veel als engineeringvragen.

De studios die het hier goed zullen doen zijn degenen die de technische complexiteit en de menselijke ervaring tegelijkertijd kunnen vasthouden. Dat is niet gebruikelijk.

Blurred street scene with cars and pedestrians, viewed through a rain-streaked window.

Wat je van deze week meeneemt

Vier verhalen, één rode draad. de kloof tussen wat AI kan doen en wat AI mag worden vertrouwd om te doen is nu de belangrijkste designruimte.

DeepMind trekt grenzen rond zijn eigen agenten. Klinische AI raakt het plafond van benchmark-prestatie. Deskundig oordeel blijkt moeilijk in te coderen. Hardware overtreft de workflows die het moeten bevatten. Alle vier zijn hetzelfde verhaal in verschillende domeinen.

De teams die goed bouwen zijn niet degenen met de meest capabele modellen. Het zijn degenen die de scherpere vraag stellen: capabel genoeg voor wat, precies?

Als je op product-, design- of strategieniveau door één van deze vragen heenwerkt, dan zijn we het waard om mee te praten.

Klaar als jij het bent

Momentum begint met een gesprek.

Geen formulieren, geen intake. Gewoon een echt gesprek met de mensen die het werk doen.

Plan een gesprekPlan een gesprek

Concept zonder naam

Google DeepMind vertrouwt zijn eigen agents niet volledig

Welke LLM's werken echt in klinische settings

Menselijke expertise is niet het vangnet. Het is de basis.

Bodyscanners. serieus hardware komt dichter bij echte implementatie

Wat je van deze week meeneemt

Momentum begint met een gesprek.

Concept zonder naam

Google DeepMind vertrouwt zijn eigen agents niet volledig

Welke LLM's werken echt in klinische settings

Menselijke expertise is niet het vangnet. Het is de basis.

Bodyscanners. serieus hardware komt dichter bij echte implementatie

Wat je van deze week meeneemt

Blijf lezen.

Waar AI-modellen echt helpen. waarom 3 procent veel zegt

Één op tien krijgt nieuws van chatbots. Bijna niemand klikt door naar de bron

Momentum begint met een gesprek.

Blijf lezen.

Waar AI-modellen echt helpen. waarom 3 procent veel zegt

Één op tien krijgt nieuws van chatbots. Bijna niemand klikt door naar de bron