Roadmap de Optimizacion

Dos tracks paralelos antes de Phase 16

Actualizado: 17 abril 2026
🎯 Plan A: Demo Ready

Preparar staging para el pitch a 50 emprendedores con los 58 docs actuales

Docs procesados 58 / 70
Claims clasificadas 744
Capitulos con datos 13 / 15
Gaps reales 2 (agua/hielo, plagas)
Score REPROBADO (1/7 criticos)

Tareas para Demo Ready

  • Tab Analisis como default
    PR #77 merged. El owner llega directo al view de 3 columnas.
  • Lista de acciones priorizadas en Resumen
    PR #77. Owner ve: contradicciones criticas, gaps, preguntas, solicitudes.
  • Tab Grafo viejo oculto
    PR #77. Solo queda la Analysis view con WebGL.
  • !
    Reingestear 8 docs failed
    Bloqueado por creditos Anthropic. $11 estimado. Una sola corrida.
    Medio impacto — demo funciona con 58
  • Sweep de basket final
    Despues del reingest: correr ops-classify-basket para mover las ~200 claims restantes a capitulos. ~$0.15.
    Bajo impacto — mejora score pero no cambia la historia
  • Preparar script de demo
    Guion de 5 min: subir 3 docs en vivo, mostrar grafo 3D, click en contradiccion, mostrar score con gaps, acciones sugeridas.
    Alto impacto — define la experiencia del pitch
  • Demo con datos frescos (no Demo Restaurante)
    Crear un tenant limpio, subir 5-10 docs de un restaurante real, mostrar el flujo completo end-to-end. Costo: ~$10-15.
    Alto impacto — demuestra que Max funciona de cero, no solo con datos pre-cargados
  • Validar responsive en tablet
    Si el pitch es con laptop/tablet, verificar que el drawer + 2-col layout funcione bien en la pantalla real.
    Bajo impacto — solo si el pitch es en tablet
💰 Plan B: Costo por Doc

Reducir de $1.37/doc a <$0.30/doc para ser viable con 50 clientes

Costo actual / doc $1.37 USD
Costo por empresa (100 docs) $137 USD
Costo 50 clientes x 100 docs $6,850 USD
Target / doc < $0.30 USD

Desglose actual del costo

Sonnet coherence
89%
$1.224
Sonnet claims
14%
$0.186
Sonnet entities
11%
$0.150
Haiku (triage+class)
$0.004
Voyage embeddings
$0.003

Optimizaciones (por impacto)

  • Migrar coherence classifier de Sonnet a Haiku
    El clasificador de pares (contradiccion/confirma/supersede) es el 89% del costo. Haiku puede hacer esta tarea — es clasificacion binaria con contexto corto. Test: correr 100 pares con ambos modelos y comparar accuracy.
    $1.224 → ~$0.04 (97% reduccion)
  • Reducir pares candidatos con pre-filtro semantico
    Antes de enviar pares al LLM, filtrar por similitud de embeddings. Si dos claims tienen cosine < 0.3, no son candidatos a contradiccion. Reduce 240 pares/doc a ~60-80.
    ~3x menos llamadas al LLM
  • Batch claims extraction en menos llamadas
    Actualmente 5 chunks/call. Subir a 10-15 chunks/call (Sonnet tiene 200K context). Reduce calls de ~6 a ~2-3 por doc.
    $0.186 → ~$0.10 (50% reduccion en claims)
  • Prompt caching mas agresivo en entity extraction
    El system prompt del extractor ya cachea al 90%. Revisar si el prompt de coherence tambien puede cachear (los instructions son estaticos, solo los pares cambian).
    ~20-30% reduccion adicional en tokens
  • Evaluar Haiku para entity extraction
    Sonnet extrae entidades hoy. Haiku 3.5 puede ser suficiente para docs estructurados (perfiles de puesto, manuales). Test A/B con 20 docs.
    $0.15 → ~$0.005 si Haiku alcanza 90%+ accuracy
Target despues de optimizaciones
$0.20 - $0.30
por documento (vs $1.37 actual) — 78-85% reduccion

Impacto en el negocio

50 clientes x 100 docs actual $6,850
50 clientes x 100 docs optimizado $1,000 - $1,500
Ahorro mensual (si re-procesan) ~$5,000+

Timeline sugerido

Semana 1
Demo ready: reingest + sweep + guion
Semana 1-2
Costo: Haiku coherence test + pre-filtro semantico
Semana 2-3
Costo: batch claims + cache + eval Haiku entities
Semana 3+
Phase 16: Industry Research Engine

Este dashboard sera parte de papade.agentemax.mx cuando el admin panel se construya (Phase 17). Por ahora vive como archivo local.