De inferentiekosten voor grote taalmodellen zijn in het afgelopen jaar met meer dan de helft gedaald. Je zou verwachten dat AI-budgetten hetzelfde doen. Dat gebeurt niet. De meeste bureaus en product teams geven meer aan AI uit dan een jaar geleden, niet minder. Die kloof verdient aandacht, omdat die je iets nuttigs vertelt over hoe organisaties echt met nieuwe technologie omgaan, versus hoe ze ervan plannen.
Het kernpunt. Goedkopere inferentie betekent niet goedkoper AI. Het betekent meer AI. En meer AI zonder duidelijke architectuur laat je kosten groeien op manieren die een verlaging van de per-token prijs niet oplost.



