La IA multimodal es una tecnología capaz de procesar, comprender y generar información combinando simultáneamente diversos formatos como texto, imágenes, audio, video y código.
Ejemplo: Un sistema de control de calidad analiza una foto del producto, el audio del operario describiendo el defecto y el historial de incidencias, y emite un dictamen integrado.
« Volver al diccionario

