Le ricerche di mercato e i dati (22). Prontuario di Paolo Duranti

Il campione di un Panel

Nel numero precedente abbiamo detto che l’universo che una ricerca intende rappresentare attraverso un panel, tanto più è variegato , tanto più richiederà una dimensione maggiore.

Ma cos’è un campione?

  • E’ una porzione della popolazione che vogliamo rappresentare (l’universo)
  • Deve essere costruito in modo che sia rappresentativo dell’universo stesso (in altre parole, se un certo fenomeno è presente nel 15% del campione, tale % dovrà, a meno di piccoli deviazioni dal valore centrale, essere considerato come presente anche nell’intero universo)
  • Gli individui/famiglie o altro che costituiscono un campione devono essere selezionati in base a precisi e ormai collaudati processi statistici
  • Va ricordato che i dati provenienti da un campione statistico sono stime del fenomeno da rappresentare; come già accennato nel precedente contributo la stima va trattata come tale: si porterà con se delle piccole (o grandi) distorsioni che dovranno sempre ricordarci che il valore generato da una stima può essere diverso dalla stima stessa. L’importante è che la % di variabilità della stima sia compresa in un intorno noto e considerato accettabile

Riprendendo l’esempio del precedente contributo relativo al muro di mattoni, nel momento in cui ci accingiamo a costruire un campione, ricorreremo a strumenti statistici che ci permetteranno di individuare la migliore costruzione possibile del campione compatibilmente con un controllo dei costi e una garanzia di qualità ritenuta accettabile.

Se ci ricordiamo che la variabilità dell’universo è quella che determina maggiormente la dimensione campionaria, dobbiamo introdurre il criterio della “stratificazione”.

La stratificazione permette di individuare caratteristiche dell’unità campionaria (ad esempio un individuo) che permettano di costruire gruppi di individui diversi tra loro ma molto simili all’interno del gruppo stesso.

Per molto tempo, e ancora oggi pur in presenza di tecniche rese possibili dall’ambiente digitale, i criteri utilizzati per segmentare la popolazione sono le variabili socio-demografiche.

Utilizziamo allora la geografia (regioni, comuni etc), l’età, il sesso, la composizione del nucleo familiare di appartenenza, il livello socio-economico e, a seconda dell’universo che si vuole rappresentare, anche altre variabili.

Pertanto il lavoro dello statistico è quello di costruire tanti piccoli campioncini che contengano all’interno individui (o famiglie) simili. Ad esempio: famiglie residenti in Campania, in un comune grande, con 4 componenti, con l’età del capofamiglia compresa tra 35 e 44 anni, di livello socio-economico medio-alto.

Teoricamente più la stratificazione è fine, più identificherà campioncini piccoli ma, dato che ogni singolo campioncino dovrà avere una dimensione statistica sufficiente per fornire una stima buona, il campione totale risultante sarà molto grande. Ancora una volta ritorna il concetto della massima qualità raggiungibile col minimo costo.

Il campione così costruito (ipotizziamo 1000 individui) sarà utilizzato per la raccolta delle informazioni oggetto della ricerca (ad esempio il monitoraggio dell’andamento dei consumi domestici). Nell’esempio appena citato è ovvio che la raccolta delle informazioni sarà continuativa e non “one shot” (come potrebbe essere ad esempio un sondaggio elettorale). Pertanto il campione dovrà essere in grado di fornire (attraverso diverse metodologie di ricerca già citate in precedenza) dei dati in forma continuativa, per cui il campione dovrà essere “stabile”. Quindi gli individui/famiglie in campione rimarranno nel panel per un tempo sufficiente a fornire dei dati di andamento del fenomeno misurato.

Quindi il campione è congelato? Le 1000 famiglie restano sempre le stesse? In realtà non è così; si dice che il campione ha, o meglio, deve avere una rotazione che garantisca la stabilità dei dati forniti insieme alla “freschezza” del campione stesso. Pertanto, la letteratura statistica ci dice che, in base al livello di sollecitazione a cui è sottoposto il campione, questo dovrà ruotare, in altre parole ogni anno una % del campione uscirà dal Panel e una % simile entrerà nel Panel. I motivi legati alla rotazione, oltre ad essere considerata una buona e sana pratica statistica, possono essere ricondotti a 3 ragioni principali:

  • Il livello qualitativo della collaborazione del panelista non è ritenuto sufficiente (quindi dati di non buona qualità)
  • Il panelista può, per ragioni personali, chiedere di uscire dal campione
  • La sua famiglia ha subito un cambiamento importante (ad esempio la nascita di un figlio) e quindi quella famiglia non è più rispondente agli stretti criteri visti prima che permettono la costruzione di piccole celle statistiche composte da soggetti simili)

Per dare un’idea approssimativa ma indicativa del tasso di rotazione medio di un Panel continuativo, possiamo considerare una % intorno al 10-20% annuo.

Ovviamente la sostituzione di un elemento in campione (uscita del “vecchio” ed entrata del “nuovo”) è continuativa nel corso dell’anno in modo da creare il minimo possibile di turbolenze alla struttura del Panel.

Torneremo prossimamente sul tema degli errori di stima e dei controlli finalizzati a mitigare al massimo tali inevitabili fenomeni.

Paolo Duranti
esperto in ricerche di mercato e dati relativi ( trade – consumo – media)
Past Vice Presidente di IAA – International Advertising Association
Consigliere Nazionale del Club del Marketing e della Comunicazione (www.clubmc.it)
pmduranti@gmail.com

#paoloduranti #clubmc #marketingjournal #ricerche #ricerchedimercato #ricercheedati #daniloarlenghi