„Este in parte stiinta si in parte arta.” Presupun ca aceasta evaluare poate fi aplicata in multe domenii, dar in cadrul cercetarii de piata traditionale, poate fi la fel de bine sloganul neoficial pentru analiza segmentarii.

Un proiect de segmentare este de obicei o intreprindere mare pentru o firma, cu scopul de a identifica grupuri unice de consumatori care sa ghideze si sa sprijine deciziile de afaceri. Procesul este lung si are multe etape, de obicei un amestec de tehnici statistice si intuitia practicianului. Aceasta abordare puternic amestecata intre stiinta si arta, aplicata in special analizei in sine, a fost proeminenta cand mi-am inceput cariera acum 20 de ani si este inca. Dar sa fie asa?

Desi nu sunt noi, tehnicile de invatare automata (ML) sunt abordari stiintifice care au castigat recent o actiune semnificativa in cercetarea de piata. Cand sunt aplicate studiilor de segmentare, aceste abordari pot inlocui sistematic dependenta de intuitia cercetatorului. Asta nu inseamna ca oportunitati reale de exprimare artistica nu exista in cercetarea de piata. Reprezentarea grafica a datelor sau crearea de instrumente de sondaj captivante si care provoaca gandirea sunt cateva astfel de exemple. Dar cand vine vorba de analiza segmentarii, exista mai multe cazuri in care procesul este etichetat drept „arta” pur si simplu din comoditate sau, mai sincer, ca o scuza pentru a nu avea o abordare stiintifica mai buna. Si in absenta unei metodologii statistice solide, se face o judecata intuitiva.

Faza initiala a unui proiect de segmentare este, desigur, foarte artistica. Scopul este de a stabili dimensiunile sau temele care ar trebui sa informeze si sa diferentieze segmentele, ceea ce se realizeaza prin intelegerea obiectivelor, scopului si utilizarii preconizate a rezultatelor proiectului. In loc de analiza, aceasta etapa este copt cu discutii, interviuri, interpretarea a ceea ce se stie si dezgroparea a ceea ce este necunoscut. Cercetatorii pot organiza sesiuni de brainstorming, pot efectua interviuri cu partile interesate, pot examina cercetarile anterioare, pot examina valorile cunoscute ale companiei si ale industriei sau pot efectua cercetari calitative. Si dupa determinarea atenta a acestor dimensiuni, sarcina de a capta informatiile necesare poate continua.

Si, trecand la ultima faza, segmentele derivate sunt aduse la viata prin arta. Valorile si valorile medii care descriu fiecare segment sunt transformate in descrieri simple in limba engleza. Personajele care sa reprezinte fiecare segment sunt create pentru ca directorii sa se relationeze si sa inteleaga rapid cum pot ajunge sau nu la acel consumator. Si planurile de actiune sunt distribuite departamentelor companiei cu directii de implementare cu privire la modul de a interactiona cu consumatorii pe baza acelor persoane.

Spre deosebire de capetele din fata si din spate ale segmentarii, care sunt pe buna dreptate artistice, stadiul de mijloc al analizei si al formarii segmentelor este copt pentru metode stiintifice. Cu toate acestea, este posibil ca cercetatorii sa nu profite de toate tehnicile pe care le au la dispozitie, ceea ce ar reduce nevoia de interventie umana si ar duce la rezultate mai bune. Iata cateva exemple specifice din faza de analiza care sunt de obicei etichetate ca artistice:

Eliminarea sau adaugarea de variabile in mod arbitrar la revizuirea rezultatului de segmentare initiala si reluarea analizei pana cand se gaseste o solutie acceptabila.

Alegerea subiectiva a unei singure solutii din mai multe optiuni dupa rularea analizei de mai multe ori prin diferite metode si numar de clustere.

Personalizarea activa a unui algoritm predictiv pentru clasificarea respondentilor din afara (aka instrument de tastare) pentru a se asigura ca asa-numitele segmente de oportunitate au un grad ridicat de acuratete, adesea cu costul sacrificarii acuratetei celorlalte segmente.

In timp ce incercarile de mai sus pot da in cele din urma o solutie acceptabila, sunt sanse ca aceasta sa fie suboptima si cu siguranta ineficienta. Si realitatea este ca abordari stiintifice superioare exista. Odata cu cresterea popularitatii tehnicilor ML, datorita puterii de calcul crescute, accesibilitatii si constientizarii, aceste metode pot si ar trebui sa aiba un rol mai important in procesele analitice. Pentru a demonstra avantajele aplicarii acestor proceduri metodologice, restul acestui articol analizeaza trei faze diferite ale unui proces tipic de segmentare:

  • selectia variabilelor pentru analiza;
  • efectuarea analizei de segmentare; si
  • crearea unui algoritm predictiv pentru tastarea viitorilor respondenti

Selectia variabila

Vechea zicala „Intru gunoi, gunoi afara” nu ar putea fi mai adevarat decat atunci cand este aplicat segmentarii. Variabilele prost alese sau codificate incorect vor distruge orice sansa de a dezvolta rezultate utile. Ceea ce este necesar pentru implementarea cu succes a fost bine documentat: redundanta scazuta sau multicoliniaritate scazuta1, un grad ridicat de discriminare sau variabilitate si variabile care sunt actionabile si reprezinta dimensiunile in jurul carora dorim sa fie construite segmentele. Dupa cum am mentionat, doar aceasta ultima piesa este arta, deoarece necesita o colaborare atenta si o discutie cu clientul pentru a identifica dimensiunile variabile adecvate pentru a fi luate in considerare. Restul, toata stiinta.

Din fericire, nu mai este nevoie sa ghiciti variabile, sa rulati analiza si apoi sa eliminati sau sa includeti iterativ variabile in functie de rezultat (diferentiere scazuta sau segmente unidimensionale). Mai degraba, exista metodologii pentru a discerne atat variabilele unice, cat si cele discriminatorii inainte de segmentare. Doua pachete R populare pentru selectia variabilelor sunt clustvarsel2 pentru variabile continue si pachetul VarSelLCM3 pentru un amestec de tipuri de date continue si categorice. Ambele sunt abordari bazate pe model, utilizand statistici pe criterii de informare, pentru a determina selectia optima a variabilelor. Dupa cum este descris in Figura 2, aceste modele folosesc variabilele de segmentare propuse (dimensiunile definite initial) ca intrare si, dupa specificarea unui prag, scot in mod eficient variabilele ideale pentru a le prelua in analiza.

Metodologia de segmentare

Dupa extragerea riguroasa a unui set de variabile de calitate pentru a continua in analiza, acum nu este momentul sa renuntam la procesul stiintific. Si asa, au trecut vremurile in care rulati mai multe solutii prin tehnici diferite si alegerea solutiei care pur si simplu „citeste” cel mai bine. Sigur, aplicatii diferite vor avea rezultate diferite, dar ar trebui sa valorificam acea realitate, nu sa fim hartuiti de ea. Desi, desigur, nu exista o solutie universala pentru fiecare proiect, metodele de ansamblu sunt o abordare eficienta, potrivita pentru multe aplicatii de segmentare in cercetarea de piata.

Tehnicile de ansamblu sunt populare in ML, avand capacitatea de a fi aplicate la multe metodologii diferite. In ceea ce priveste segmentarea, analiza ansamblului ia ca intrare clasificarile multor solutii de segment. Acestea sunt produse prin diferite proceduri si includ un numar diferit de clustere. (In timp ce exemplul din tabelul 1 prezinta doar trei solutii, in practica acest numar va fi mult mai mare, mai aproape de 40 sau mai mult.) Apoi, ansamblul cauta sa se grupeze pe toate pentru a dezvalui o solutie de consens, una care este mai stabila, mai reproductibila si duce la o precizie mai mare de predictie. Si ca bonus, procesul este, de asemenea, mai eficient, deoarece timpul nu este petrecut cernind multe solutii si incercand sa o alegeti pe cea care se simte cel mai bine. Desi exista mai multe aplicatii, o optiune open-source este pachetul R diceR.4

Instrumente de tastare

Cheia cercetarii de piata se concentreaza in jurul inferentei cauzale, intelegerea „cum” si „de ce” pentru a ghida luarea deciziilor de afaceri. Iar abordarile tehnice descrise pana acum ii pun pe cercetatori in cea mai buna pozitie pentru a obtine aceste perspective cruciale. Dar, ca parte a procesului de analiza a segmentarii, viitorii consumatori trebuie sa fie clasificati in segmentele stabilite pentru a ghida mesajele, vanzarile si interactiunea generala. Prin urmare, scopul principal al instrumentelor de tastare algoritmica este acuratetea predictiei.

Abordarile traditionale ale tastarii respondentilor, cum ar fi analiza discriminanta sau euristica bazata pe reguli, sufera de o lipsa de generalizare, facandu-le nefiabile si inexacte odata ce testati dincolo de setul de date sursa. Si adesea, cercetatorul este lasat sa itereze manual subseturi de variabile pentru a dezvalui o solutie acceptabila. In schimb, tehnicile ML au fost dezvoltate pentru a depasi aceste probleme. Tabelul 2 prezinta un exemplu dintr-o segmentare in industria livrarii instantanee online, comparand acuratetea analizei discriminante cu o tehnica ML numita masina vector suport (SVM). Retineti ca in cinci dintre cele sapte segmente, acuratetea prezicerii segmentului caruia i-au apartinut respondentii care nu au avut parte a crescut cu 10% – 44%, iar acuratetea generala a crescut cu 14%.

De fapt, modele si mai precise ar putea fi dezvoltate prin intermediul algoritmilor ML de invatare profunda care utilizeaza retele neuronale, dar de obicei sunt impracticabile pentru scopurile noastre. Retelele neuronale, desi puternice, nu se preteaza la o aplicatie plug-and-play datorita complexitatii lor. Si instrumentele de tastare sunt doar asta, un instrument livrabil pe care oricine il poate utiliza. Pur si simplu conectati raspunsurile unui nou respondent si rezultatul este o predictie a grupului din care apartin. Deci, in schimb, algoritmii de invatare superficiala, cum ar fi SVM, sunt recomandati, deoarece sunt inca foarte precisi si, de asemenea, functioneaza bine ca instrument livrabil (programat in Excel, de exemplu). Modelele SVM sunt disponibile prin functia svm din pachetul R e10715 sau prin cateva biblioteci Python diferite.

Mai putine presupuneri, mai multa incredere

Va fi intotdeauna nevoie de arta (creativitate si atentie) in profesia de cercetare de piata. Dupa cum sa demonstrat aici, utilizarea stiintelor soft si a expresiei artistice este esentiala pentru brainstorming si comunicare. Dar atunci cand vine vorba de analiza datelor, nu ar trebui sa fie o solutie de rezerva sau prinde totul atunci cand metodele de calitate bazate pe date sunt la dispozitie. In schimb, adoptati ML pentru a profita la maximum de date, permitand stiintei sa joace un rol proeminent in sprijinirea deciziilor si recomandarilor de afaceri derivate. Va exista mai putine presupuneri in proces, mai multa incredere in rezultat si o valoare mai mare oferita clientilor.