¿Podemos predecir la calidad de un vino utilizando algoritmos de aprendizaje y datos de cosecha de uva?

Hay dos conjuntos de datos disponibles en el repositorio de datos de UCI para evaluar la calidad del vino. El primer conjunto de datos dice [1]

Estos datos son el resultado de un análisis químico de vinos cultivados en la misma región en Italia pero derivados de tres cultivares diferentes. El análisis determinó las cantidades de 13 componentes encontrados en cada uno de los tres tipos de vinos.

El segundo conjunto de datos dice [2]

En la referencia anterior, se crearon dos conjuntos de datos, utilizando muestras de vino tinto y blanco. Las entradas incluyen pruebas objetivas (por ejemplo, valores de PH) y la salida se basa en datos sensoriales (mediana de al menos 3 evaluaciones realizadas por expertos en vinos). Cada experto clasificó la calidad del vino entre 0 (muy mal) y 10 (muy excelente). Se aplicaron varios métodos de minería de datos para modelar estos conjuntos de datos bajo un enfoque de regresión. El modelo de máquina de vector de soporte logró los mejores resultados.

Estos conjuntos de datos se han utilizado ampliamente en aplicaciones de aprendizaje automático. Más detalles se pueden encontrar en sus enlaces.

Otras lecturas

http://www3.dsi.uminho.pt/pcorte…

Predecir la calidad del vino utilizando bosques aleatorios

Aprendizaje automático: predicción de calificaciones de calidad del vino basadas en propiedades fisicoquímicas

Notas a pie de página

[1] https://archive.ics.uci.edu/ml/m…

[2] https://archive.ics.uci.edu/ml/m…

Creo que es muy ruidoso: los datos de cosecha no son lo único que explican. Hay todos los detalles de vinificación: química de la uva, flora en las propias uvas, levadura añadida, tiempo de maceración y temperatura, tiempo de remojo, presión de aplastamiento, reacciones secundarias como H2S, nutrientes en la uva, edad del barril, tipo y tiempo en barril , temperatura en la bodega, mezcla, etc. Me imagino que podría modelar todo si realmente quisiera (aunque buena suerte con la flora local), pero es realmente complejo. No sé cuánto más llegarías a la química básica. Sí sé que alguien investigó la espectroscopía de masas después de que se hizo el vino, para predecir las calificaciones de parker y sintonizar en consecuencia, pero esa es una señal más simple.