- inicializa Vertex AI uma única vez por processo
- adiciona cache de modelos GenerativeModel por nome
- adiciona cache da conversão de tools para formato Vertex
- executa send_message em asyncio.to_thread para não bloquear o loop async
- adiciona método warmup no LLMService (best effort)
- executa warmup no startup da API FastAPI
- executa warmup no startup do Telegram Satellite
🎯 Resultado esperado:
- menor latência no primeiro request (cold start)
- menor overhead por requisição subsequente
- melhor throughput em cenários concorrentes
- centraliza configuracoes do orquestrador em orchestrator_config.py (TTLs, campos obrigatorios, respostas deterministicas e low-value)
- migra extracao de entidades e intents para o modelo, mantendo no codigo apenas normalizacao/validacao e execucao
- troca heuristicas locais de intencao/roteamento por contratos de intents e roteamento multiassunto via LLM
- melhora observabilidade da extracao com logs para payload vazio/invalido e falhas do extrator
- corrige continuidade de contexto no slot-filling de revisao e normaliza datas relativas (hoje/amanha)
- adiciona fluxos incrementais para criar/cancelar pedido e integra com fila de assuntos
- implementa memoria compartilhada + memoria de trabalho por assunto (estilo nova aba) para reduzir contaminacao entre contextos
- evita interromper fluxo ativo ao receber mensagem com dois assuntos
- enfileira assuntos secundarios e avanca automaticamente apos concluir o atual
- remove metodos legados sem uso no orquestrador (roteamento antigo por regex)
- remove metodo sem uso em UserRepository para reduzir codigo morto
- remove arquivos nao utilizados no modelo atual de hospedagem: app.yaml, cloudbuild.yaml, deploy.sh, setup-gcp.sh, setup-database.sh e .gcloudignore
- remove documentacoes antigas de infraestrutura GCP/Cloud SQL (GUIA_COMPLETO_CONFIGURE_E_DEPLOY.md e CLOUD_SQL_PROXY.md)
- atualiza README para refletir o fluxo vigente em servidor da empresa, removendo referencias a Cloud Run/Cloud Build
- limpa .env.example removendo blocos de configuracao legados de Cloud SQL/Cloud Run
- ajusta comentario legado em app/core/settings.py, mantendo compatibilidade sem vincular a Cloud Run
- preserva configuracoes e orientacoes relacionadas ao Vertex AI
- adiciona coleta incremental de dados (slot filling) por usuario para placa, data/hora, modelo, ano, km e historico de revisao, evitando perda de contexto entre mensagens
- implementa extracao auxiliar por regex para interpretar respostas curtas e completar o payload de revisao sem depender totalmente do modelo
- passa a bloquear conflito global de agenda no mesmo horario (independente de usuario/veiculo) e sugerir proximo horario disponivel
- adiciona confirmacao de sugestao pendente (ex.: "pode") e remarca??o quando o cliente recusa o horario sugerido (incluindo casos com apenas novo horario)
- amplia a tool de agendar revisao com novos campos obrigatorios e calculo de valor estimado da revisao com base em modelo, ano, km e fidelidade de revisoes anteriores
- atualiza schemas e rota mock para refletir o novo contrato de agendamento
- endurece o satelite do Telegram com prevencao de instancia duplicada e descarte de backlog no startup para reduzir respostas repetidas
- Limpeza de comentários e padronização das variáveis em .env
- Atualiza MOCKAROO_BASE_URL para uso do plano gratuito
- Adiciona service-account-key.json ao .gitignore