Como Funciona Sisteco: Documentacion Tecnica

Arquitectura del motor de scoring de 100 puntos, integracion n8n + Convex, datos del SII, y framework de compliance Ley 21.719. Para ingenieros, CTOs y equipos que evaluan la plataforma.

Video: Arquitectura tecnica de Sisteco en 10 minutos

Seccion 1

Arquitectura General

Sisteco opera como un servicio de automatizacion de ventas B2B (Service-as-a-Software). La arquitectura se organiza en 5 capas independientes que se comunican a traves de eventos y HTTP actions:

Capa 1: Captura de Datos

Responsable de la extraccion de leads desde multiples fuentes. Opera mediante workflows de n8n que se ejecutan en horarios programados o bajo demanda.

  • LinkedIn Scraping: PhantomBuster ($69/mes) ejecuta busquedas de LinkedIn Sales Navigator segun el ICP definido por el cliente. Los resultados se parsean y normalizan en un formato estandar de lead.
  • Web Scraping: Firecrawl extrae informacion de sitios web de empresas objetivo: pagina de equipo, sobre nosotros, stack tecnologico, blog.
  • SII Enrichment: Consulta al Servicio de Impuestos Internos para validar RUT, obtener tamano real de empresa, actividad economica y estado tributario. (Ver seccion 4).
  • Normalizacion: Todos los datos se unifican en un schema de Convex (ver seccion 3) con campos estandar: nombre, empresa, cargo, email, telefono, fuente, fecha de captura, y metadata de enriquecimiento.

Capa 2: Inteligencia y Scoring

El motor de scoring asigna un puntaje de 0 a 100 a cada lead. Usa un modelo de IA (Gemini 2.5 Flash Lite) que evalua dos dimensiones con pesos iguales. (Ver seccion 2 para el detalle completo del algoritmo).

Capa 3: Personalizacion con IA

Cada lead con score >= 40 (NURTURE o superior) pasa por un pipeline de personalizacion:

  • Se lee la web real de la empresa del prospecto con Firecrawl
  • Se extrae contexto relevante: servicios, tamano, industria, noticias recientes
  • Un modelo de lenguaje genera un email personalizado basado en el contexto real — no es una plantilla con campos reemplazados
  • Se genera la secuencia completa de 5 emails con variaciones de asunto y angulo

Capa 4: Orquestacion Multi-Canal

La secuencia de contacto se ejecuta a traves de multiples canales segun el plan del cliente:

  • Email: Resend como proveedor transaccional. Secuencias de 5 emails en 35 dias con envio a las 9 AM CLT.
  • LinkedIn: Solicitudes de conexion y mensajes InMail automatizados via PhantomBuster.
  • WhatsApp Business API: Mensajes directos para leads HOT (add-on).
  • Slack: Alertas internas al equipo del cliente cuando un lead responde.
  • Instagram DM: Para perfiles B2C-adjacent (add-on).

El motor de ruteo decide el canal basado en: score del lead, interacciones previas, canal preferido detectado, y disponibilidad del canal en el plan del cliente.

Capa 5: Analytics y Feedback Loop

Metricas en tiempo real se almacenan en Convex y se presentan en un dashboard multi-tenant:

  • Tasas de apertura, click, respuesta y conversion por campana
  • Heatmap de mejor horario de envio por industria
  • Score distribution y evolucion temporal
  • Pipeline value estimado basado en scores y tasas de conversion historicas

Los datos de respuesta alimentan el modelo de scoring para mejorar las predicciones con el tiempo (feedback loop).

Seccion 2

Motor de Scoring de 100 Puntos

El motor de scoring es el componente central de la inteligencia de Sisteco. Evalua cada lead en una escala de 0 a 100 puntos, distribuidos en dos dimensiones de 50 puntos cada una.

Dimension 1: Perfil del Decisor (0-50 puntos)

Evalua la persona individual como tomador de decision potencial.

1.1 Nivel jerarquico y cargo (0-15 pts)

C-Level (CEO, CTO, CFO, COO): 15 pts. VP/Director: 12 pts. Gerente: 9 pts. Jefe de area: 6 pts. Coordinador/Analista: 3 pts. Sin cargo claro: 0 pts.

Logica: Los niveles mas altos tienen mayor capacidad de decision y presupuesto. En empresas chilenas medianas, la decision de compra para un servicio de automatizacion de ventas tipicamente reside en la gerencia comercial o general.

1.2 Antiguedad en el cargo (0-10 pts)

0-6 meses: 10 pts. 6-12 meses: 8 pts. 1-2 anos: 6 pts. 2-5 anos: 4 pts. 5+ anos: 2 pts.

Logica: Los ejecutivos nuevos en su cargo tienen mayor propension a implementar cambios y justificar nuevas inversiones. Es una senal de timing fuerte.

1.3 Actividad digital (0-10 pts)

Se evalua presencia y actividad en LinkedIn: frecuencia de publicaciones, engagement con contenido de la industria, participacion en grupos relevantes, y completitud del perfil.

Perfil activo + contenido reciente: 10 pts. Perfil completo pero inactivo: 5 pts. Perfil minimo: 2 pts. Sin perfil: 0 pts.

1.4 Match con ICP (0-15 pts)

Compara el perfil del lead con el Ideal Customer Profile definido por el cliente. Evalua: industria, tamano de empresa, cargo objetivo, y ubicacion geografica.

Match completo en 4/4 criterios: 15 pts. 3/4: 11 pts. 2/4: 7 pts. 1/4: 3 pts. 0/4: 0 pts.

Dimension 2: Senales de Empresa (0-50 puntos)

Evalua la empresa como organizacion y su propension a comprar.

2.1 Datos del SII (0-20 pts)

Esta es la ventaja competitiva clave. Consultamos el Servicio de Impuestos Internos de Chile para obtener datos reales:

  • RUT valido y empresa activa: 5 pts (requisito base)
  • Tamano por trabajadores: 50-100: 3 pts, 100-500: 5 pts, 500+: 4 pts (la ventana de 100-500 es nuestro ICP ideal)
  • Actividad economica compatible: Match con industrias objetivo: 5 pts
  • Estado tributario al dia: 5 pts (indicador de salud financiera)

Por que 20 puntos (el peso mas alto): Los datos del SII son los mas confiables disponibles en Chile. A diferencia de LinkedIn o bases de datos privadas, son datos declarados legalmente. Ningun otro proveedor de lead scoring en Chile o el extranjero utiliza esta fuente.

2.2 Senales de crecimiento (0-10 pts)

Detectamos senales de crecimiento a traves de web scraping y monitoreo de fuentes publicas:

  • Contrataciones recientes en LinkedIn (especialmente ventas/marketing): 0-4 pts
  • Expansion (nuevas oficinas, nuevos mercados): 0-3 pts
  • Presencia en noticias positivas (premios, alianzas): 0-3 pts

2.3 Stack tecnologico (0-10 pts)

Analizamos el stack tecnologico de la empresa para evaluar madurez digital:

  • Usa CRM (HubSpot, Pipedrive, Salesforce): 3 pts (indica madurez en ventas)
  • Tiene presencia web profesional: 2 pts
  • Usa herramientas de marketing digital: 3 pts
  • Tiene blog o contenido activo: 2 pts

2.4 Timing (0-10 pts)

Senales de que la empresa esta en un momento propicio para comprar:

  • Cambio reciente de liderazgo (nuevo CEO, VP Sales): 0-4 pts
  • Ronda de financiamiento reciente: 0-3 pts
  • Licitacion publica relevante: 0-3 pts

Clasificacion por Score

HOT (80-100): Alta probabilidad de conversion. El equipo de ventas debe contactar dentro de 24 horas. Se activa alerta inmediata en Slack.

WARM (60-79): Buen prospecto. Se activa secuencia de email personalizada. Follow-up en 1-2 semanas si no hay respuesta.

NURTURE (40-59): Potencial a mediano plazo. Se incluye en campana de contenido y se monitorean cambios de senales.

SKIP (<40): No invertir recursos. La empresa no calza con el ICP, no tiene presupuesto, o la industria es incompatible.

Modelo de IA

El scoring utiliza Gemini 2.5 Flash Lite como modelo de inferencia. La eleccion de este modelo se basa en:

  • Latencia: Flash Lite permite scoring en tiempo real (<2 segundos por lead)
  • Costo: Ordenes de magnitud mas barato que modelos grandes, critico para scoring de alto volumen
  • Contexto: Suficiente ventana de contexto para procesar el perfil del lead + datos de empresa + ICP
  • Consistencia: Resultados reproducibles con mismos inputs, importante para auditar el scoring

El modelo recibe un prompt estructurado con los datos del lead, los pesos definidos, y retorna el puntaje con justificacion por cada dimension. La justificacion se almacena para trazabilidad y cumplimiento de la Ley 21.719.

Seccion 3

Integracion n8n + Convex

n8n: Motor de Workflows

n8n es una plataforma de automatizacion de workflows self-hosted. Sisteco lo ejecuta en Railway para tener control total sobre la infraestructura y los datos.

  • Self-hosted en Railway: Los datos nunca salen de la infraestructura controlada. No depende de n8n Cloud.
  • Workflows como producto: Cada capacidad de Sisteco (prospeccion, scoring, email, etc.) es un workflow de n8n. Los templates son el producto vendible.
  • Catalogo de templates: 11 templates (T1-T11) organizados por plan. Base: LinkedIn + ICP Score + SII. Crecimiento: + Sales Navigator + CRM directo.

Convex: Base de Datos Reactiva

Convex es una base de datos reactiva en la nube que sirve como sistema de registro central para todos los leads, scores, y estado de campanas.

  • Schema tipado: Definido en TypeScript (convex/schema.ts). Cada campo tiene tipo, validacion, y documentacion.
  • Queries reactivas: El dashboard se actualiza en tiempo real cuando un lead cambia de estado. Sin polling.
  • Mutations atómicas: Las escrituras son transaccionales. Un lead nunca queda en estado inconsistente.
  • Actions para side effects: Llamadas a APIs externas (SII, Gemini, Resend) se ejecutan como actions con retry automatico.

Patron de Comunicacion n8n-Convex

n8n se comunica con Convex exclusivamente a traves de HTTP actions en el gateway de Convex. Patron critico:

  • Endpoint: *.convex.site (HTTP actions)
  • Nunca se usa /api/* para HTTP actions desde n8n
  • Autenticacion via token JWT en header Authorization
  • Payloads en JSON con schema validado en ambos lados

Este patron garantiza que n8n y Convex estan desacoplados: si n8n se cae, los datos en Convex estan intactos. Si Convex tiene downtime, n8n encola los requests.

Flujo de Datos Tipico

  1. n8n ejecuta workflow de prospeccion (PhantomBuster + Firecrawl)
  2. Leads normalizados se envian a Convex via HTTP action POST
  3. Convex mutation almacena el lead y dispara un trigger interno
  4. n8n recibe webhook de "nuevo lead" y ejecuta workflow de scoring
  5. Scoring (Gemini Flash Lite) se ejecuta como n8n action
  6. Score + justificacion se guardan en Convex via HTTP action PATCH
  7. Dashboard reactivo muestra el nuevo lead con score en tiempo real
  8. Si score >= 80 (HOT), Convex dispara alerta a Slack via action
Seccion 4

Integracion con el SII (Servicio de Impuestos Internos)

Que datos obtenemos

El SII es la autoridad tributaria de Chile. A traves de consultas a sus portales publicos, Sisteco obtiene:

  • Validacion de RUT: Confirmamos que el RUT existe, esta activo, y corresponde a la empresa declarada
  • Razon social: Nombre legal completo de la empresa
  • Actividad economica: Codigo y descripcion del rubro declarado ante el SII
  • Tamano de empresa: Clasificacion por numero de trabajadores reportados (micro, pequena, mediana, grande)
  • Estado tributario: Si la empresa esta al dia con sus obligaciones o tiene anotaciones
  • Fecha de inicio de actividades: Antiguedad real de la empresa

Por que los datos del SII son superiores

Los datos del SII son declarados legalmente. A diferencia de LinkedIn (auto-reportado), bases de datos privadas (estimaciones), o scraping web (desactualizado), los datos del SII reflejan la realidad fiscal de la empresa:

  • El numero de trabajadores es el reportado para cotizaciones previsionales — no una estimacion
  • La actividad economica es la declarada para efectos tributarios — no una categoria de LinkedIn
  • El estado tributario es un indicador directo de salud financiera que ningun otro lead scoring considera

Ningun competidor internacional (Apollo, ZoomInfo, Instantly, Clay, HubSpot) tiene acceso a estos datos porque son especificos del sistema tributario chileno.

Aspectos legales de la consulta

Todos los datos que Sisteco consulta del SII son de acceso publico a traves de los portales del servicio. No se accede a informacion tributaria privada ni a declaraciones de renta. El proceso cumple con la Ley 21.719 porque:

  • Los datos consultados son publicos y de libre acceso
  • Se procesan bajo la base legal de interes legitimo en contexto B2B
  • Se documentan en el RAT como parte del flujo de enriquecimiento
  • El titular tiene derecho a solicitar la eliminacion de sus datos en cualquier momento
Seccion 5

Framework de Compliance Ley 21.719

La Ley 21.719 de Proteccion de Datos Personales de Chile entra en vigencia en diciembre 2026. Sisteco fue disenado con un framework de compliance que cubre 6 pilares:

Pilar 1: Privacy by Design

La proteccion de datos se incorpora desde el diseno de la arquitectura, no como un parche posterior. Cada nuevo flujo de datos, cada nuevo campo en el schema, y cada nueva integracion pasa por una evaluacion de impacto en privacidad antes de implementarse.

Pilar 2: Base Legal Documentada

Cada tratamiento de datos tiene una base legal clara y documentada:

  • Datos publicos del SII: Interes legitimo (Art. 13 Ley 21.719) — datos de acceso publico para fines de evaluacion comercial
  • Datos de LinkedIn: Interes legitimo + datos manifiestamente publicos (perfiles profesionales publicados por el titular)
  • Email de contacto: Interes legitimo en contexto B2B (comunicacion comercial relevante al cargo del titular)
  • Scoring con IA: Interes legitimo + EIPD realizada + derecho a intervencion humana garantizado

Pilar 3: Registro de Actividades de Tratamiento (RAT)

Sisteco mantiene un RAT completo que documenta para cada flujo de datos:

  • Responsable del tratamiento
  • Finalidad del tratamiento
  • Categorias de datos procesados
  • Base legal aplicable
  • Destinatarios de los datos
  • Transferencias internacionales (si aplica)
  • Plazos de retencion
  • Medidas de seguridad implementadas

Pilar 4: EIPD para Scoring con IA

La Evaluacion de Impacto en Proteccion de Datos (EIPD) es obligatoria cuando se usan decisiones automatizadas que afectan a personas. Nuestra EIPD para el motor de scoring cubre:

  • Descripcion del tratamiento: Que datos se procesan, como se ponderan, que modelo de IA se usa
  • Evaluacion de necesidad y proporcionalidad: Por que necesitamos scoring automatizado y por que cada dato es necesario
  • Evaluacion de riesgos: Riesgos de discriminacion, sesgos del modelo, datos incorrectos
  • Medidas de mitigacion: Justificacion almacenada por cada score, derecho a revision humana, auditoria periodica del modelo
  • Garantia de no discriminacion: El scoring no usa datos sensibles (genero, edad, etnia, religion)

Pilar 5: Derechos ARCO

Sisteco garantiza los derechos ARCO del titular:

  • Acceso: El titular puede solicitar todos sus datos en formato estructurado. Entrega en 24 horas.
  • Rectificacion: El titular puede solicitar correccion de datos incorrectos.
  • Cancelacion: El titular puede solicitar eliminacion completa de sus datos de todos los sistemas.
  • Oposicion: El titular puede oponerse al tratamiento. Se implementa opt-out automatico en cada comunicacion.

Pilar 6: Seguridad Tecnica

Ver seccion 6 para el detalle completo de la arquitectura de seguridad.

Seccion 6

Arquitectura de Seguridad

Autenticacion y Autorizacion

  • Clerk como proveedor de autenticacion: Email + Google OAuth
  • JWT tokens con template "convex" (audience: "convex", incluye org_id)
  • MFA habilitado para cuentas de administrador
  • Sesiones con expiracion y refresh token seguro

Encriptacion

  • En transito: TLS 1.3 en todas las comunicaciones
  • En reposo: Encriptacion AES-256 en Convex (managed)
  • Credenciales: Variables de entorno, nunca en codigo fuente

Headers de Seguridad HTTP

  • X-Content-Type-Options: nosniff
  • X-Frame-Options: DENY
  • X-XSS-Protection: 1; mode=block
  • Referrer-Policy: strict-origin-when-cross-origin
  • Permissions-Policy: camera=(), microphone=(), geolocation=()
  • Content Security Policy con whitelist estricto

Analytics Privados

  • PostHog EU (Frankfurt): Datos de analytics procesados en la UE
  • IP anonimizada por defecto (ip: false)
  • Opt-out de captura por defecto (opt_out_capturing_by_default: true)
  • Session recording con masking de inputs
  • Solo person profiles para usuarios identificados

Infraestructura

  • Vercel: Hosting del frontend con edge functions
  • Convex: Base de datos managed con backups automaticos
  • Railway: n8n self-hosted con aislamiento de red
  • npm audit periodico para dependencias
Seccion 7

Stack Tecnologico Completo

Frontend

  • HTML/CSS/JS (vanilla — sin frameworks)
  • GSAP 3.12.7 (animaciones + ScrollTrigger)
  • Lucide 0.468.0 (iconos)
  • JetBrains Mono + Sharp Grotesk + Source Sans 3 (tipografia)

Backend

  • Node.js (scripts y serverless functions)
  • Convex (base de datos reactiva)
  • Vercel Serverless Functions (API endpoints)

IA y Datos

  • Gemini 2.5 Flash Lite (scoring)
  • PhantomBuster (LinkedIn automation)
  • Firecrawl (web scraping)
  • SII (datos tributarios chilenos)

Automatizacion

  • n8n self-hosted en Railway
  • 11 templates de workflow (T1-T11)
  • Cron jobs para secuencias programadas

Comunicacion

  • Resend (email transaccional)
  • WhatsApp Business API (add-on)
  • Slack (alertas internas)

Pagos y Facturacion

  • dLocal Go (tarjeta internacional)
  • Reveniu (Chile — tarjeta, transferencia)
  • Bsale (DTE / factura electronica)

Auth y Seguridad

  • Clerk (Email + Google OAuth + MFA)
  • JWT con template Convex
  • TLS 1.3 + CSP estricto

Analytics

  • PostHog EU (Frankfurt)
  • Privacy-first: opt-out por defecto
  • IP anonimizada, inputs masked

Prueba la infraestructura

14 dias gratis, sin tarjeta de credito. Ve el scoring en accion con tus propios leads.