Cómo encontrar lo que la gente le gusta comer según la edad, la demografía y el salario

La mayoría probaría un algoritmo de agrupamiento llamado K-means. Encontrará muchos ejemplos de esto. En particular, busque tutoriales de aprendizaje automático utilizando el famoso conjunto de datos Iris, y adapte eso a sus datos.

Personalmente, utilizaría Python con sci-kit learn y Jupyter Notebook para desarrollar el código y ejecutar ejemplos. Comenzando con matplotlib para ver los datos de varias maneras.

O descargue R studio y explore los datos con esa herramienta.

Pero ya que solo tiene tres dimensiones, sería útil mirar los datos en un gráfico interactivo en 3D donde puede rotar el gráfico. Dependiendo de la herramienta, puede que necesite convertir países en identificadores numéricos.

O puede jugar con Excel y trazar gráficos de burbujas para ver si sus datos son separables.

También hay Weka. Una búsqueda en Internet debería encontrar eso lo suficientemente fácil. Débil es un conjunto de herramientas de aprendizaje automático.

Una forma fácil de hacerlo sería configurar un modelo de regresión de la forma:

comida ~ edad + salario + país

Encajaría este modelo con sus datos y obtendría estimaciones de coeficientes para cada una de las variables. Luego, puede predecir los alimentos que le gustaría a una persona a partir de su edad, salario y país, ingresando esos valores en el modelo de ajuste.

Esto sería relativamente sencillo de programar en R, aunque el gran tamaño del conjunto de datos podría ser un desafío. Además, dado que su variable dependiente (comida) es categórica, la interpretación no es la más directa. Esto debería ser suficiente para comenzar.