Convenientemente, los usuarios de BeerAdvocate.com informan sobre el tipo de envase del que obtuvieron su cerveza, por lo que puede ver las revisiones de la misma cerveza probada en una botella en lugar de una lata. Por ejemplo, mira los enlaces a continuación. La primera son las revisiones de Red Racer IPA de una lata, la segunda son las revisiones de la misma cerveza servida desde una botella.
http://beeradvocate.com/beer/pro…
http://beeradvocate.com/beer/pro…
En lugar de pasar por estos a mano, escribí un guión rápido que raspa las últimas críticas de varias cervezas, luego se compara la calificación promedio dado que una cerveza era de una botella a la calificación promedio dado que era de una lata. Solo estoy usando las últimas 10 reseñas de cada una, por lo que es probable que haya mucho ruido en estas estimaciones, pero parece que hay alguna evidencia razonable de que, por cualquier razón, las calificaciones de las latas son generalmente más altas que las calificaciones de las botellas . Dejaré que otros especifiquen lo que está sucediendo aquí: anomalía estadística, factores de confusión en juego o el verdadero problema. Tú haces la llamada.
Estas son las clasificaciones promedio de algunas cervezas seleccionadas arbitrariamente:
PBR (botella): 2.97714285714
PBR (lata): 3.46714285714
Budweiser (botella): 2.4725
Budweiser (puede): 2.79875
Fuller’s London Pride (botella): 3.85
Fuller’s London Pride (can): 4.00875
¿Dónde puedo comprar una plantilla para cortar botellas?
¿Cuál es la forma más sexy de abrir una botella?
¿Es más eficiente energéticamente tirar o reciclar botellas plásticas de refresco?
¿La palada de una botella de vino está relacionada con la calidad?
Young’s Double Chocolate Stout (botella): 3.95
Young’s Double Chocolate Stout (nitro-can): 3.9475
Young’s Double Chocolate Stout (lata): 3.97333333333
Red Racer IPA (botella): 4.17857142857
Red Racer IPA (can): 4.173
Fat Tire (botella): 3.28166666667
Fat Tire (lata): 3.64285714286
* Si sabe cómo ejecutar un script de Python desde el shell y desea recopilar más datos o mejorar mi análisis (por ejemplo, agregando barras de error), aquí está el código simple que usé para obtener mis números. Llame la secuencia de comandos dando la URL de la página de BeerAdvocate para el (cerveza, tipo de contenedor) que le interesa. Asegúrese de rodear el argumento entre comillas, y por favor informe lo que descubra.
(Además, si desea formatear mejor las cosas en esta respuesta, sugiera cambios).
import urllib import re import numpy como np import sys url = sys.argv [1] rAvg_re = re.compile ("clase = \" rAvg_norm \ "> / (\ d \. \ d \ d)") running_sum = 0 running_count = 0 f = urllib.urlopen (url) para la línea en f: m = re.findall (rAvg_re, línea) si m no es None y len (m)> 0: print m running_count + = len (m) running_sum + = np.sum ([float (calificación) para calificación en m]) print running_sum / running_count f.close ()