Пока рынок обсуждает модели, инфраструктурные команды решают вопросы задержек, стоимости токена и отказоустойчивости.
Ключевой сдвиг — переход от «демо в браузере» к контрактам SLA и постоянным затратам на GPU/TPU.
Регуляторика добавляет слой: где хранятся данные, кто несёт ответственность за выводы модели, как устроен аудит.

