Kiba.Fetch
Scraping e document intelligence multi-tenant per dati finanziari.
Il contesto
Estrarre dati strutturati da siti e documenti finanziari (KIID/PRIIP) è ripetitivo, fragile e costoso quando fatto a mano o con script usa-e-getta. L'obiettivo è una piattaforma riutilizzabile, multi-tenant e resiliente ai cambiamenti dei siti.
Cosa abbiamo fatto
Architettura a tre servizi che comunicano via PostgreSQL: control plane in Laravel/Filament (UI, scheduling, gestione template), scraper Python (asyncio) con failover anti-detection, servizio AI Python/FastAPI per OCR ed estrazione da PDF. Coda dei job con polling SKIP LOCKED, storage S3/MinIO, isolamento multi-tenant a livello applicativo e di database.
Risultati
- Fondamenta ed esecuzione dei job di scraping operativi end-to-end
- Isolamento multi-tenant progettato fin dal primo giorno
- Pipeline pensata per ridurre i costi LLM con versioning incrementale dei documenti (in roadmap)
Prodotto interno in sviluppo attivo: auto-repair dei template e billing sono sulla roadmap.
Hai un progetto simile in mente?
Una call iniziale, gratuita, per capire se possiamo aiutarti.
Parliamone