Die Inferenzkosten für große Sprachmodelle haben sich in den letzten zwölf Monaten um mehr als die Hälfte reduziert. Man würde erwarten, dass KI-Budgets folgen. Das tun sie nicht. Die meisten Agenturen und Produktteams geben mehr für KI aus als vor einem Jahr, nicht weniger. Diese Lücke lohnt sich genauer anzuschauen, denn sie zeigt etwas Nützliches darüber, wie Organisationen neue Technologie tatsächlich einführen, im Gegensatz zu wie sie planen.
Die Kurzfassung. Billigere Inference bedeutet nicht billigere KI. Es bedeutet mehr KI. Und mehr KI ohne klare Architektur lässt deine Kosten in Wegen explodieren, die eine Preissenkung pro Token nicht behebt.



