Synthetic Data (o Datos Sintéticos) son datos generados artificialmente por algoritmos que imitan las características de los datos reales y sirven para entrenar, probar o mejorar modelos de Inteligencia Artificial. Suelen utilizarse cuando los datos reales son escasos, caros o sensibles.
Small Data se refiere a conjuntos de datos pequeños, manejables y enfocados en un problema concreto. Son microdatos que pueden analizarse fácilmente con herramientas estándar y sin tecnologías complejas.
Clustering es una técnica de análisis de datos e Inteligencia Artificial que consiste en agrupar elementos similares entre sí en conjuntos denominados clusters.
Fog Computing es un modelo de computación que extiende la computación en la nube (cloud computing) más cerca del borde de la red (edge); es decir, más cerca de los dispositivos que generan y consumen los datos (sensores, cámaras, vehículos, smartphones...) en vez de enviarlos directamente a la nube para su tratamiento.
Scikit-learn es una biblioteca de código abierto diseñada principalmente para el aprendizaje automático (Machine Learning).
Differential Privacy (Privacidad Diferencial) es una técnica avanzada que permite analizar y compartir información estadística de datos sin revelar información personal sensible.
Party Data son los diferentes tipos de datos recopilados por una empresa u organización.
Random Forest (o Bosque Aleatorio) es un algoritmo de aprendizaje automático que se basa en la combinación de conjuntos de árboles de predicción y decisión para llegar a un resultado único.