13.12.2013 / Antti Ollikainen

Ristiinmyynti on astetta haastavampi taiteenlaji kuin uusmyynti. Miksi? Koska lisää myytäessä on huomioitava myös se, millainen tuote asiakkaalla on jo ennestään. Parhaimmillaan tämä on arvokasta lisäinformaatiota, mutta huonoimmillaan uuden tuotteen myyminen johtaa vanhan tuotteen ostamatta jättämiseen.

Tietenkin jos asetelma on tyyppiä ”Annettuna nämä miljoona tuotteen X ostanutta, etsi todennäköisimmät sata tuhatta tuotteen Y ostajaa”, ei tätä ongelmaa ole. Tällöin ristiinmyynti itse asiassa muistuttaa suuresti uusmyyntiä, koska ei ole mitään epäselvyyttä siitä, mikä olisi optimaalinen myytävä tuote. (Tätä asetelmaa pohditaan blogin jatko-osassa.)

Tässä blogissa ristiinmyyntiä pohditaan yleisellä tasolla eli oletetaan, että mielekkäitä ristiinmyytäviä tuotteita on monta ja yksi haaste on parhaan valinta. Edelleen oletetaan, että voi olla olemassa tilanteita, joissa ei kannata ristiinmyydä ollenkaan ja että ne pitää tunnistaa. Esimerkkinä käytetään lehtimyyntiä, vaikka ristiinmyynnin haaste on toki toimalasta riippumaton. Esimerkkitoimialan tapauksessa karkeimmillaan asiakkaalle, joka on jo tilannut ”jonkin lehden” haluttaisiin myydä ”jokin toinen lehti”. Tämän sijasta haetaan vastausta seuraaviin kysymyksiin:

1) Mitä tuotetta (lehteä) kannattaa ristiinmyydä kullekin asiakkaalle?
2) Kenelle kannattaa ylipäätään ristiinmyydä?
3) Milloin ei kannata ristiinmyydä ollenkaan?

Mitä lehteä kannattaa ristiinmyydä kullekin asiakkaalle?

Aluksi on mietittävä, ovatko asiakkaat niin homogeeninen ryhmä, että on mielekästä tehdä yksi ostoskorianalyysi koko asiakaskunnalle. Jos eivät ole, on asiakkaat ensin ryhmiteltävä asiakasta kuvaavien tekijöiden suhteen vaikkapa kymmeneen ryhmään, jotta ostoskorianalyysi voitaisiin tehdä koko asiakaskuntaa homogeenisempiin asiakasryhmiin. Esimerkiksi ostoskorianalyysin tulokset jenkkiautolehdelle ja sisustuslehdelle vaihtelevat varmasti mm. iän ja sukupuolen mukaan.

Ryhmittelyn jälkeen tehdään ostoskorianalyysi kunkin asiakasryhmän sisällä seuraavasti: olettaen, että asiakas on jo tilannut esimerkiksi naistenlehden A, mikä on

1) Todennäköisyys, että hän tilaa sisustuslehden B (confidence)?
2) Todennäköisyys, että ylipäätään tilataan yhdessä naistenlehti A ja sisustuslehti B (support)?

Jos molemmat luvut ovat suuria, kannattaa tälle asiakkaalle tarjota sisustuslehteä B. Perustelu on seuraava: tällöin sisustuslehdellä B on confidencen valossa hyvät myynnin mahdollisuudet, mutta jo myydyn naistenlehden A tilauksen perumisen vaara on pienehkö, koska tilattu yhdistelmä naistenlehti A + sisustuslehti B on yleinen (eli on korkea support).

Näin menetellen käydään läpi kunkin asiakasryhmän kaikki mahdolliset tuoteparit: annettuna jokin jo tilattu lehti X, mitkä ovat confidence ja support toiselle lehdelle Y. Kullekin asiakkaalle saadaan siis joukko confidence- ja support-lukuja, yksi lukupari per vielä myymätön lehti. Niinpä kullekin asiakkaalle kannattaa myydä sitä lehteä, jonka confidence ja support ovat suurimmat.

Seuraavassa kuviossa on havainnollistuksena viisi ostoskoria. Tuotteet ovat naistenlehti A, sisustuslehti B ja muotilehti C:

Ristiinmyynti0

Oletetaan nyt, että asiakas on jo tilannut naistenlehti A:n. Tällöin confidence sisustuslehdelle B on 60% (=3/5) ja support sille, että tilataan sekä naistenlehti A että sisustuslehti B on 50% (=3/6). Muotilehdelle C molemmat luvut ovat 40% ja 33%. Naistenlehti A:n tilanneelle kannattaa siis tarjota sisustuslehteä B, koska se menee todennäköisemmin kaupaksi kuin muotilehti C, eikä johda niin helposti naistenlehti A:n tilauksen perumiseen kuin muotilehti C:n tarjoaminen.

Oletetaan, että asiakas onkin jo tilannut muotilehden C. Tällöin confidence naistenlehdelle A on 100% ja support naistenlehden A ja muotilehden C yhdistelmälle on 33%. Vastaavat luvut sisustuslehti B:tä tarjottaessa ovat 50% ja 17%. Naistenlehteä A kannattaa siis tarjota, jos asiakas on jo tilannut muotilehden C.

Huomionarvoista on, että tällainen lähestymistapa selviää myös tilanteista, joissa asiakas on jo tilannut useampia lehtiä ja/tai hänelle halutaan tarjota useamman lehden yhdistelmää.

Kenelle kannattaa ylipäätään ristiinmyydä?

Kun jokaiselle asiakkaalle on näin löydetty paras mahdollinen ristiinmyytävä lehti, voidaan kaikki asiakkaat laittaa kyseistä optimilehteä vastaavien confidence ja support-lukujen mukaiseen suuruusjärjestykseen (vaikkapa niiden keskiarvon mukaan). Tämä tarkastelu tehdään joka asiakkaalle yli kaikkien muodostettujen asiakasryhmien.

Ristiinmyyminen kannattaa aloittaa luonnollisesti niistä asiakkaista, joilla optimituotetta vastaavat confidence ja support ovat suurimmat. Mutta ensin on tarkastettava asiakaskohtaisesti, toteutuvatko seuraavan luvun ehdot.

Milloin ei kannata ristiinmyydä?

Seuraavassa kuviossa havainnollistetaan erilaisia polkuja, joihin sisustuslehden B ristiinmyynti (tai myymättä jättäminen) voi johtaa tietyn asiakkaan tapauksessa, kun hän jo tilaa naistenlehteä A. Support- ja confidence-lukuja käytetään karkeina arvioina siitä, mitkä ovat onnistumisen mahdollisuudet kussakin haarassa (Kannattaa huomioida, että jos ostoskorianalyysit on tehty asiakasryhmittäin, ovat tämän asiakkaan confidence- ja support-luvut laskettu hänen omasta asiakasryhmästään).

Ristiinmyynti1

Kuviosta havaitaan, että sisustuslehti B:n ristiinmyyntiä kyseiselle asiakkaalle ei kannata tehdä, jos jokin tai useampi seuraavista ehdoista toteutuu:

1) Confidence (A->B) eli sisustuslehti B:n myynnin todennäköisyys on pieni, kun naistenlehti A on jo myyty.
2) Support(A,B) on pieni eli sisustuslehteä B ja naistenlehteä A ei juuri tilata yhdessä. Tällöin naistenlehti A:n tilauksen perumisen riski on suuri, jos sisustuslehti B myydään.
3) Sisustuslehti B:n myynnin kustannus on suuri.
4) Naistenlehti A:n hinta on suuri verrattuna sisustuslehti B:n hintaan.

Tulokset ovat hyvin intuitiivisia, vaikka käytetyt tunnusluvut ovat hyvin suoraviivaisia.

Lopuksi on todettava, että on olemassa erikoistilanne, jolloin ristiinmyynnillä voidaan tahallisesti tavoitella jo tilatun lehden syrjäyttämistä. Näin kannattaa menetellä silloin, kun jo tilatun lehden perumisriski on joka tapauksessa erittäin suuri ja/tai hinta on matala. Tällöin voi kannattaa yrittää korvata jo tilattu lehti jollain sellaisella tuotteella, jonka perumisriski on matalampi ja hinta korkeampi.

Jatko: Ristiinmyynti silloin kun myytävä tuote on etukäteen tiedossa

Tammikuussa 2014 ilmestyvässä jatkoartikkelissa käydään läpi ristiinmyyntitilanne, jossa myytävä tuote on jo etukäteen päätetty ja/tai jo myytyjä tuotteita on vain muutama tai jopa vain yksi.

-Antti Ollikainen ja Lasse Liukkonen

P.S. Lue myös Ville Niemijärven blogi, jossa ristiinmyynnin sudenkuoppia havainnollistetaan konkreettisten case-esimerkkien kautta.


2.12.2013 / Ville Niemijärvi

avoimet_ovet

Muutimme syksyllä “uuteen” toimistoon, yli 100 vuotta vanhaan entiseen Harmoonitehtaaseen.  Pidämme avoimet ovet ja toimiston avajaiset torstaina 12.12.2013 klo 14-18. Ohjelmassa on tajunnan (ja lompakkosi) räjäyttäviä tuotekehityksemme tuotoksia liiketoiminta-analytiikan, tilastotieteen ja raportoinnin maailmasta. Voit tulla myös juttelemaan louhialaisten kanssa ja kysymään ensi viikon vakion oikea (todennäköisin) rivi.

Tilaisuus on maksuton ja sisältää tarjoilun. Ilmoittauduthan mukaan jotta osaamme varautua riittävällä määrällä kuplajuomaa ja särvintä. Tervetuloa!

Louhian demopajan ja tuotekehityksen esittelyä:

  1. SOME-analytiikka: miten yrityksestäsi tai tuotteistasi puhutaan sosiaalisessa mediassa? Me tiedämme.
  2. QlikView in steroids: näe mitä saa aikaan kun risteytetään QlikView ja analytiikkasovellus R.
  3. QlikView kartalla: QlikViewn ja Google mapsin integrointi. Tule katsomaan miten se tehdään.
  4. Microsoft SQL Server -tietovarastoinnin vallankumous. Uusia tuotteita, joilla säästät itsellesi ja projektitiimille Hawaijin matkan verran rahaa. Tai teet asiakkaan tyytyväiseksi.
  5. SQL Serverin data mining -ominaisuuksien esittely. Näytämme miten ostoskorianalyysit ja asiakasegmentoinnit tehdään Excelistä käsin.
  6. Ennakoiva-analytiikka käytännössä: näe miten tehdään asiakaspoistuma-analyysi (churn) 3 minuutissa RapidMinerilla.
  7. Analytiikkaa tosielämän sovelluksina: esittelyssä tulosvetolaskuri ja asuntolaskuri. Näe mitä ammattimaiset vedonlyöjät ja sijoittajat ovat saaneet aikaan avoimella datalla ja tilastotieteen taidoilla.

Lisätietoa ja ilmoittauminen: Ville Niemijärvi, 050 326 4989, ville.niemijarvi@louhia.fi. Ilmoittautuminen ti 10.12.2013 mennessä.

kuva-8
Toimiston kalustoa, sieltä uusimmasta päästä.

29.11.2013 / Antti Ollikainen

Analytiikan menestyksekkäässä käytössä liiketoiminnan ohjaajana piilee lukuisia haasteita, joista yllättävän harva liittyy itse analytiikan tekniseen toteuttamiseen. Analyyttiselle tekemiselle esitetyt kunnianhimoiset ROI-laskelmat eivät toteudu, koska analytiikkaa hyödyntävien organisaatioiden toiminta ja koordinointi on puutteellisesta. Tässä käydään läpi top 6 isointa sudenkuoppaa karkeassa tärkeysjärjestyksessä. Esimerkkinä käytetään pankkialaa, mutta haasteet ovat toimialasta riippumattomia.

1) Liiketoiminnallinen tavoite puuttuu

Analytiikkaa tehtäessä on aina pidettävä mielessä, mitä liiketoiminnallista tavoitetta ollaan ratkaisemassa. Miksi? Koska tämä tavoite ohjaa kaikkea analyyttistä tekemistä ja ratkaisee viime kädessä sen, miten eteen tulevat pulmatilanteet ratkotaan tai ovatko ne pulmatilanteita ollenkaan. Hyvä liiketoiminnallinen tavoite on

• selkeä; ei vieraita termejä
• yhteisesti sovittu ja hyväksytty.

Jos tätä projektin suunnanosoittajaa ei ole määritelty tai se on tehty liian ylimalkaisesti, on tiedossa lukuisia ongelmia, joihin puhtaasti tilastotieteelliset mittarit eivät voi tuoda vastausta. Tähän kategoriaan kuuluvat mm. loppumattomat kädenväännöt riittävästä ennustetarkkuudesta: jos liiketoiminnallinen tavoite täyttyy, on malli riittävän hyvä. Jos ei liiketoiminnallista tavoitetta ole määritelty, ei kysymykseen voida edes vastata.

Oma ongelmansa on se, että miten projekti voidaan määritellä, jos ei tiedetä mihin kysymykseen sen on määrä vastata? Vastaavasti miten projekti voidaan hyväksyä, jos ei tiedetä mihin kysymykseen se vastasi?

Monesti projektin alussa on hirveä kiusaus päästä tekemään. Projektiryhmän tunnelmat tiivistyvät ajatukseen ”Tehdään nyt vain äkkiä jotain, mitä me tässä odotetaan”. Kuitenkin on hyvä pysähtyä miettimään, että mihin viime kädessä tähdätään: tehdäänkö lopulta parempia päätöksiä, tuleeko myyntiä enemmän, pienenevätkö kustannukset, nouseeko asiakastyytyväisyys… Projektin alussa tähän käytetty aika ja vaiva maksavat itsensä moninkertaisesti takaisin. Ja usein liiketoiminnallisen tavoitteen saavuttaminen tarkoittaa myös tyytyväistä asiakasta.

2) Analytiikan tulokset ovat vajaakäytössä

Hämmästyttävästi analytiikan toiseksi suurin sudenkuoppa ei suinkaan liity itse analytiikkaan vaan se on analytiikan tulosten unohtaminen analyytikon koneelle. Kuitenkin kun hänen työnsä on tehty, on analytiikasta oikeastaan toteutunut vasta kustannuksia. Suurimmat analytiikan hyödyt – tavoitellut säästöt tai lisäansiot – puolestaan toteutuvat kun sen tulokset otetaan yrityksessä laajamittaiseen käyttöön tuotantoympäristössä ja niillä aletaan ohjata yrityksen liiketoimintaa.

Esimerkiksi pankit ennustavat analytiikalla mm. uusien asiakkaidensa riskiä jättää laina lyhentämättä (niin sanottu PD eli probabilty of default –tunnusluku). Tässä tapauksessa pankki ohjaa analytiikalla liiketoimintaansa siten, että se jättää liian riskialttiin lainan myöntämättä tai marginaalia voidaan korottaa kattamaan isompi riski.

3) Mallien osumatarkkuutta ei seurata

Analytiikan sudenkuoppa numero kolme on se, että vaikka analyyttisia malleja olisi otettu ohjaamaan liiketoimintaa, ei seurata miten osuvia mallit ovat –analyyttinen mallihan alkaa vanhentua niin pian kuin se on saatu valmiiksi. Tällöin yritys joutuu arvailemaan asiaa ja esimerkiksi tekemään mallinnuksen määrävälein kalliilla uusiksi, ihan vain varmuuden vuoksi. Toinen jopa huonompi tilanne on se, että käytössä on vanhentuneita epätarkkoja malleja, koska ei ole tietolähdettä, joka asian kertoisi.

Oikeastaan kyseessä on varsin maanläheinen raportointihaaste: verrataan sitä, mitä malli ennusti siihen, mitä oikeasti tapahtui. Pankkipuolella esimerkkinä olisi seurata ja verrata minkä lainojen ennustetaan jäävän lyhentämättä ja mitkä lainat sitten oikeasti jäävät lyhentämättä. Vakiomuotoisilla osumatarkkuuden raporteilla säästytään myös työläiltä ja virhealttiita erilliskyselyiltä kantaan, kun selvitetään manuaalisesti missä mennään.

On jopa mahdollista lähettää automaattihälytys analyytikon sähköpostiin, kun etukäteen asetettu osumatarkkuuden minimiraja alittuu (esim. mainitussa pankkiesimerkissä PD-mallin auc putoaa alle 0,75:n). Näin ideaalissa tilanteessa mallinnusta tehdään juuri silloin kuin tarvitaan eikä yhtään enempää.

Kokonaan oma kysymyksensä on se, että yritys voi käyttää joitakin osumatarkkuuden raportteja oman liiketoimintansa suunnitteluun. Esimerkkimme pankki voi valita missä kohtaa ROC-käyrää se haluaa liiketoimintaansa tehdä: hyväksyäkö iso joukko lainoja sillä riskillä että niistä osa jää lyhentämättä vai valikoidako pienempi joukko pienemmän riskin asiakkaita.

4) Analytiikan historiointi puuttuu

Monesti analytiikkaa harjoittavilta yrityksiltä puuttuu analytiikkamuisti, koska ne eivät talleta mitään mallinnuksen työvaiheita, tuloksia tai aineistoja. Tämä voi johtua siitä, että asian tärkeyttä ei tiedosteta tai siitä, että yrityksellä ei edes ole sellaista analytiikka/BI –kantaa, johon tiedot voisi tallettaa – tai kannasta puuttuvat historioivat rakenteet.

Laajimmillaan (esimerkiksi juuri pankin PD-mallin osalta) voidaan historioida seuraavat analytiikkatekemistä koskevat tiedot:

• Vanhojen mallien historiointi: mitä malleja on ollut käytössä ja milloin? Kuka mallit on tehnyt?
• Vanhojen mallinnusdatojen historiointi: mihin saadut mallit ja tulokset ovat perustuneet?
• Vanhojen pisteytysdatojen historiointi: mitä dataa mallit ovat saaneet inputtina?
• Vanhojen pisteytystulosten historiointi: mitä tuloksia on malleilla saatu?

Ilman näitä tietoja mallinnustyö saattaa kiertää kehää ja pyörää keksitään aina uudestaan –ei havaita, että uudelta tuntuva idea onkin jo ollut käytössä. Asian kuntoon laitto tuo huimasti tehoa mallinnukseen, kun voidaan keskittyä uusien tekniikoiden ideointiin. Ja jos vielä on talletettu kuka mallinsi ja milloin, voi analyytikko kilauttaa kaverille ja kysyä täsmävinkkejä kun tuttu kaverihan on aiemmin päätynyt aivan vastaavaan mallinnustekniikkaan.

5) ETL-prosessit (datan lataus ja muokkaus) ovat synkronoimatta

Jos pankkiesimerkin analyytikko ei koskaan saa koneellensa kulutusluottoja sisältävää dataa, on turha odottaa, että hänen tekemäänsä mallia voitaisiin kovin hyvin kulutusluottoihin soveltaa. Ohjeena voisikin todeta: poimi mallinnukseen käyttämäsi data samoilla säännöillä ja rajauksilla kuin data, johon haluat mallinnuksen tuloksia soveltaa. Neuvo vaikuttaa niin päivänselvältä, että herää luonnostaan kysymys, että miksi se pitää mainita.

Ongelma syntyy siitä, että monesti nämä kaksi datankeruuta on jaettu yrityksissä eri osastoille. Pankkiesimerkissä voi tilanne olla se, että IT-osasto hallinnoi ETL-työkaluilla datavirtaa, johon analyytikon malli olisi tarkoitus upottaa riskiarviota tuottamaan. Analyytikko puolestaan työskentelee liiketoiminnan puolella ja hakee mallinnusdatansa sooloprojektina itse kirjoitetuilla kyselyillä eri kantoihin. Ilman aktiivista koordinointia ja oikein rakennettua analytiikka-arkkitehtuuria nämä eivät kohtaa ja mallinnuksen osumatarkkuus on suotta heikompi kuin olisi mahdollista. Huonoimmillaan jokin erityisryhmä putoaa mallinnusprosessin ulkopuolelle kokonaan. (Koordinointia ei ainakaan edesauta se, että monesti yritykset ovat sälyttäneet analytiikan rasitteet ja kustannukset IT-osastolle kun taas liiketoimintaosasto tuottaa ja näkee aitiopaikalta tekemänsä analytiikan hyödyt.)

6) Hirttäännytään väärään tarkkuusmittariin

Analytiikan osumatarkkuutta voi ja pitääkin arvioida sekä tilastotieteellisin että liiketoiminnallisin mittarein. Joskus yrityksillä iskee kuitenkin rimakauhu kun mallinnus alkaa tulla valmiiksi: jumitutaan vaatimaan analyytikolta jollain tilastotieteellisellä mittarilla arvioituna aina vain tarkempia malleja vaikka jo aikaa sitten on saavutettu liiketoiminnallisesti riittävän hyvä tarkkuustaso. Oikea toimenpide on tällöin mallin välitön tuotantoympäristöön vienti, koska lisätarkkuuden metsästykseen käytetty aika on suoraan pois siitä ajasta, jonka malli voisi tuottaa tulosta osana toistuvia eräajoja.

Päinvastainen tilanne syntyy, kun ihastutaan jonkin yksittäisen tilastotieteellisen mittarin tuomaan positiiviseen tarkkuustietoon, mutta unohdetaan liiketoiminnallinen tavoite, jota varten malli on tehty. Pankkiesimerkin PD-mallinnuksessa voi tulla eteen tilanne, jossa mallin tarkkuus (accuracy) on 95%, mikä normaalisti tarkoittaa huippuluokan osumatarkkuutta. Kuitenkin jos datassa on erittäin vähän lyhentämättä jääneitä lainoja, voi olla että tuo viiden prosentin epätarkkuus syntyy juurikin niiden väärin ennustamisesta. Yksittäisellä tilastotieteellisellä mittarilla tarkasteltuna loistavasti toimiva malli onkin onneton ennustamaan juuri sitä asiaa, joka liiketoimintaa kaikkein eniten kiinnostaa. Tällaisen mallin tuotantoympäristöön vienti on melkoinen virhe; oikea toimenpide on parantaa lyhentämättömien lainojen tunnistusta.

Kuusi ohjetta menestyksekkääseen analytiikkaan

Yhteenvetona voidaan todeta, että jos yrityksesi harjoittaa tai tavoittelee laajamittaista analytiikkaa, jolla ohjataan liiketoimintaa, pidä huoli seuraavista asioista:

1) Määrittele analytiikalle liiketoiminnallinen tavoite.
2) Vie analyyttiset mallit tuotantoympäristöön liiketoimintaa ohjaamaan.
3) Seuraa mallien osumatarkkuutta.
4) Historioi analytiikkatekemisesi.
5) Synkronoi ETL-prosessisi.
6) Seuraa laajasti sekä liiketoiminnallisia että tilastotieteellisiä mallin hyvyyden mittareita.

Näin toimimalla varmistat maksimihyödyt analytiikasta.


27.08.2013 / Ville Niemijärvi

Kuluvan viikon keskiviikkona tulee kuluneeksi 50 vuotta Martin Luther Kingin suuresta ‘I have a Dream’ puheesta. Nyt onkin hyvä paikka miettiä, mitä kukin on itse tehnyt taistelussa maailman vääryyttä vastaan.

Oma puolen vuoden daavidin ja goljatin taisteluni on kohdistunut paikallista uimahallia vastaan, joka soittaa kuntosalillaan hieman vaihdellen radio Novaa, Aaltoa tai Voicea. Toisin sanoen rautaa pumpatessa kunnon rokkenrollin sijaan voimaa pitää imeä Eros Ramazottista, Bryan Adamsista ja Lauri Tähkästä. Olisin vaihtanut kuntosalia heti ensimmäisellä kerralla kun kuulin Roxetten Joyriden tai Toton Afrikan mutta valitettavasti tykkään käydä kuntosalin jälkeen uimassa ja toista sellaista yhdistelmää tarjoavaa puulaakia ei ole kotioveni kupeessa tarjolla.

Olen lähestynyt uimahallin työntekijöitä siivoojista aina ylimpään johtoon saakka, pitänyt protestia kaupunginjohtajan kotiovella ja laittanut palautetta keksityillä nimillä vasemmalla kädellä kirjoittaen, jotta näyttäisi siltä, että tärkeän asian taustalla on oikea kansanliike (niin kuin pitäisikin olla). Pyyntöni on ollut maltillinen, koska Suomen parasta radiokanavaa, Radio Helsinkiä ei saada nettiradiota lukuunottamatta kuulumaan leveysasteillamme, olisin tyytyväinen Radio Cityyn, Bassoradioon tai vaikka Radio Suomeen (Pirkka-Pekka Petelius Luontoillassa on huikea).

Kaupungin uimahalleista vastaava johtaja vastasikin kerran palautteeseeni ja totesi tylysti: “musiikkiasiat ovat mielipiteitä.” 

Eräs työntekijä, jota piinasin palautteellani, sanoi, että “kuntosalilla soivan musiikin pitää kelvata mahdollisimman monelle.”

Eikä pidä. Musiikki on toki makuasia mutta sen pitää maistua nimenomaan kuntosalin kohderyhmälle. Ei kaikelle kansalle. Ei perhevolvo miehille, jotka syövät kananmunansa ylikypsinä ja ottavat ulkomaille omat serlat mukaansa.

Lisäksi musiikin pitää sopia tilanteeseen. Nova toimii varmasti kun olet Lacosten villaneule päällä kynttiläillallisella puolisosi kanssa, Volvo parkkeerattu turvallisen lähiösi autokatokseen ja tenavat peiteltynä unikkokuosiin. Silloin bryan adamsit tai eros ramazottit voi toimia, mutta ei nyt ihmeessä urheiluhallilla sentään.

Miten uimahallini kuntosalin johtajan pitäisi lähestyä tilannetta? Samalla tavalla kuin mikä tahansa yritys voi tutkia analytiikan avulla omaa liiketoimintaansa ja miten muuttuja X vaikuttaa siihen.

1.) Tilastollinen analyysi asiakkaista – etsi oikea hehtaari ja kohdista siihen.

Tutki millainen on asiakaskuntasi jakauma. Montako prosenttia on miehiä ja naisia, mikä on alueellinen jakauma, tulotaso, ikäjakauma jne. Näin saat hehtaarin mihin tähdätä. Jos kuntosalin asiakaskunnasta 80% on 20-35 -vuotiaita miehiä, ei lehtihyllyä kannata täyttää Me Naisilla tai radiosta laittaa Classic FM:ää.

Radio Suomi on Suomen kuunnelluin radiokanava. Mutta jos menet oikealle kuntosalille, on se siinä kohderyhmässä todennäköisesti Radio Rock.

Useat katsastuskonttorit muistuttavat minua autoni katsastuksesta 4kk ennen virallista määräpäivää. Kuka katsastaa autonsa 4kk ennen? Sama tyyppi, joka käyttää henkseitä ja vyötä samalla kertaa? Jos laitamme asiakkaat jakaumaan, havaitsemme, että kenties 5% käyttää autonsa katsastuksessa ensimmäisenä mahdollisena päivänä kun laki sen sallii. Toinen  5% on aina myöhässä. Suuri massa on todennäköisesti jossain 0-2 viikon kohdalla ennen määräpäivää. Siihen mainonta kannattaa keskittää ja saat moninkertaisen konversion (toki analytiikan avulla voimme kohdentaa tämän kullekin asiakkaalle erikseen ja saavuttaa aivan eri tarkkuuden, mutta se on toinen juttu).

2.) Ota tutkimustieto apuusi

Rock-musiikki parantaa suorituskykyä ja siitä on tutkimustulosta asian tueksi (http://yle.fi/uutiset/rokki_parantaa_treenia_ja_tulosta/6768041). Tämähän on itsestään selvä asia mutta kaikki ei aina tiedä itsestäänselvyyksistä (Moni ei esimerkiksi tajua, että Kingston Wallin II on maailman paras levy).

Vähittäiskaupan puolella on tutkittu esimerkiksi sitä, miten pienempi valikoima tuotetta x, tekee ostajan ostopäätöksen helpommaksi ja lisää näin myyntiä ja asiakasuskollisuutta (ks. Harward Business Review 05/2012).

Ihmiset myös ottavat mielummin asioita ilmaiseksi kuin saavat alennusta. Vaikka alennus olisikin heille kannattavampi (Ks. Huffington Post).

Tämänkaltaisen tutkimustiedon soveltaminen tai edes testaaminen omaan liiketoimintaan näppituntuman sijaan ei ole vaikeaa. Parhaimmassa tapauksessa se saattaa muuttaa koko liiketoimintasi suunnan.

3.) Selvitä asian todellinen vaikutus liiketoimintaasi

Miten muuttuja X vaikuttaa myyntiisi? Miten muutos y vaikuttaa asiakaspoistumaan? Analytiikka-algoritmien (esim. regressiomallinnnus) avulla voimme selvittää miten aurinkoinen sää tai hinnan alentaminen vaikuttaa tuotteen myyntiin. Eräässä analyysissa selvitimme, että asiakkaan yhteydenotto asiakaspalveluun nosti asiakaspoistuman todennäköisyyttä 11 kertaiseksi.

Kuntosalin tapauksessa se voisi helposti selvittää kuinka Radio City houkuttelee kävijöitä verrattuna Novaan, samoin kuin vähittäiskauppa voi selvittää miten taustamusiikki vaikuttaa asiakkaiden ostokäyttäytymiseen (iltalukemiseksi Paco Underhill, Why we buy).

“Musiikkiasia” voi olla mielipide mutta myynnin lasku tai asiakaspoistuma ei ole. Tai itseasiassa onhan se. Se on sinun asiakkaasi ilmaisema äärimmäinen mielipide palvelustasi. 

En tiedä mitä on tapahtunut kesän aikana. Onko uimahallin johto vaihtunut, onko kaupunki ottanut tiedon louhinnan ja älykkään johtamisen menetelmät käyttöönsä? Vai onko siivooja kääntänyt viritin nupin toiseen asentoon? Joka tapauksessa viime viikolla saapuessani kuntosalille, sain kunnella koko tunnin Kinksiä, Rollareita, Hendrixiä ja jopa Sex Pistolsia. Taisteluni oli voitettu. Harmi, että Martin Luther Kingin aloittama työ on edelleen pahasti kesken.


19.08.2013 / Lasse Liukkonen

Yhä useammalla tilastotieteen sovellusalalla törmää tilanteeseen, jossa havaintojen määrä on pieni verrattuna muuttujien määrään. Tälläisen tilanteen vastaan tullessa esim. lineaarisen regression sovittaminen ei teoreettisesti ole mahdollista/järkevää (vaikka muuttujat eivät olisikaan korreloituneita) ilman riittävää työkalupakkia. Tilastotieteilijän pakista tulisi löytyä ainakin askeltavat muuttujien valitsijat (ahneet algoritmit), paras muuttujien osajoukko-algoritmi, sekä ennen kaikkea ridge/lasso-regressiomenetelmän soveltamistyökalut.

En ole kuullut ridge/lasso-regressiomenetelmästä, mutta minulla on muut edellä mainitut työkalut, eikö se muka riitä ?

Askeltavat muuttujien valitsijat

Eteenpäin askeltava (eng. Forward-selection)– algoritmi valitsee malliin yhden muuttujan kerrallaan mikäli malli “paranee merkitsevästi” muuttujan lisäämisen johdosta. Eteenpäin askeltava- algoritmi pysähtyy, kun malli alkaa ylisovittumaan. Jos oletamme, että malliin tulee algoritmin johdosta valittua 10 muuttujaa, ei ole takuuta siitä, että juuri tämä 10 muuttujan osajoukko olisi kaikista paras 10 muuttujan kombinaatio mallin rakentamiseen. Tämä on yleinen heikkous ahneissa algoritmeissa, ne eivät yleensä päädy globaalisti optimaaliseen tulokseen.

Taaksepäin askeltava (eng. Backward elimination)– algoritmi alkaa tilanteesta, jossa mallissa on kaikki muuttujat mukana. Algoritmi poistaa tarkasteltavissa olevan muuttujan, mikäli kyseisen muuttujan poistaminen “parantaa/ei heikennä” mallia merkitsevästi (esim. AIC, BIC, aBIC-kriteerit).

Monisuuntainen askellus (eng. Bidirectional elimination) soveltaa sekä eteenpäin, että taaksepäin askeltavaa menetelmää.

Paras muuttujien osajoukko

Parhaan muuttujien osajoukon (eng. Best-subset)- algoritmi perustuu eri muuttujakombinaatioiden läpikäymiseen ja se päätyy aina “parhaaseen” (esim. AIC, BIC, aBIC-kriteerien mielessä) mahdolliseen regressiomalliin. Algoritmin merkittävänä heikkoutena on sen tarvitsema laskenta-aika, joka karkeasti ottaen rajoittaa algoritmin käyttön 30-40 muuttujan tarkasteluihin.

Edellä mainittujen menetelmien tyypillisistä heikkouksista johtuen voi ajautua tilanteeseen, jossa ei ole tyytyväinen muodostuneeseen malliin. Mikäli muuttujia on enemmän kuin havaintoja, eivät edellä mainitut algoritmit pysty toimimaan halutulla tavalla.

Ridge/lasso-regressio (regularisointi) voi olla oikotie onneen.

Ridge-regressio

Ridge-regressio perustuu karkeasti ottaen regressiokertoimien kutistamiseen. Menetelmä kutistaa regressiokertoimia kohti nollaa rankaisemalla “liian suuria” regressiokertoimia. Ridge-regressiokertoimet minimoivat lausekkeen, joka sisältää jäännöksien neliösumman lisäksi termin, josta kertoimien kutistuminen aiheutuu. Tämä lisätermi sisältää oleellisen säätöparametrin (kompleksisuusparametrin) lambda; mitä suurempi lambda on, sitä enemmän kertoimia kutistetaan.

Muuttujien osajoukon valintaan perustuvat algoritmit tuottavat yleensä tulkinnallisemman ja käyttökelpoisemman mallin kuin saturoitumalli, mutta edelleen varianssialtaan suurehkon (kts. ennustevirheen hajoitelma). Ridge-regression sovittaminen oikein valitulla kompleksisuusparametrilla lambda pienentää varianssia yleensä huomattavasti (harhan kustannuksella).

Lasso-regressio

Lasso-regressio on pohjimmiltaan samankaltainen kuin ridge-regressio. Se kutistaa regressiokertoimia kohti nollaa ja tekee samanaikaisesti muuttujien valintaa (johtuu minimoitavat lausekkeen rankaisutermin normista, ns. L1-normi, joka mittaa regressiokertoimien suuruutta vrt. ridgessä L2-normi). Säädettävällä parametrilla lambda on sama tulkinta kuin ridge-regressiossa.

Kuinka valita oikean suuruinen kompleksisuusparametri lambda ? 

Kompleksisuusparametrin valinnassa voi käyttää ristiinvalidointia. Ristiinvalidointi suoritetaan erikseen halutuilla lambdan arvoilla (muodostetaan haluttu gridi lambdan arvoista), jolloin tuloksena saadaan esimerkiksi mallin tuottama keskineliövirhe ja keskineliövirheen validointiväli jokaisella lambdan arvolla erikseen. Valitaan lopulta lambdan arvo, jossa keskineliövirhe on “pieni” ja validointiväli “kapea”. Alhaalla olevassa kuvassa on simulointikokeen opetusdatan ja ristiinvalidoinnin avulla määritelty (optimaalinen) lambdan arvo. Simulointikokeen opetusdatassa oli 150 havaintoa ja 500 muuttujaa; pienimmän keskineliövirheen tuottaa lambdan arvo 1.13675. Kyseisellä lambdan arvolla malliin päätyy 68 selittävää muuttujaa.

lambda

Jotta elämä ei olisi liian helppoa.

Ridge/lasso-regressioilla on myös heikot puolensa, ehkä merkittävin on se, että lasso-regressio valitsee korkeintaan havaintojen määrään muuttujia ennenkuin mallista tulee saturoitu. Lisäksi vahvasti korreloituneiden muuttujien tapauksessa lasso valitsee yleensä yhden muuttujan korreloituneiden muuttujien joukosta ja jättää muut huomiotta. Näiden kahden menetelmän lisäksi on kehitelty myös regularisointi hybridi nimeltään elastinen verkko (eng. Elastic net). Kyseisessä menetelmässä yhdistyy ridgen, sekä lasson rankaisutermit ja näin ollen se sisältää 2 säädettävää kompleksisuusparametria lambda1 ja lambda2 (joissain algoritmeissa käytetään vain yhtä lambdan arvoa, joka määrää toisen lambdan arvon suoraan, esim. lambda ja 1-lambda).

No kuten arvata saattaa on vielä edellä mainittujen menetelmien lisäksi liuta enemmän tai vähemmän samankaltaisia “kikkakakkosia” regression sovittamiseen.

Palatakseen otsikkoon on lienee soveliasta antaa esimerkkejä sovellusaloista, joissa käsitellyn kaltaisia tilanteita ilmenee ja joissa ridge/lasso-regression käyttö on varteenotettava vaihtoehto

  • Biologia, erityisesti genetiikka (Ihmisen perimässä arviolta n. 30 000 geeniä),
  • Lääketiede (Mitattavissa olevia ominaisuuksia paljon),
  • Taloustieteet (Erityisesti korreloituneet muuttujat).

Lineaarisen regression lisäksi ridge/lasso regularisointeja on upotettu esim. logistiseen, multinomiseen ja poisson-regressioon.


7.06.2013 / Ville Niemijärvi

Data mining -yhteisö KDNuggets:in vuosittaisen analytiikka ja tiedon louhinta -ohjelmistojen kyselytutkimuksen voittoon nousi tänä vuonna RapidMiner. Toiseksi erittäin tiukassa kisassa tuli R.  Katso tulokset kokonaisuudessaan täältä.

Louhialla iloitsemme myös tuloksista sillä kärkikaksikko on myös meidän keihäänkärkemme ja ykkösvalintoja toteutettaessa analytiikkahankkeita. Unohtamatta Wekaa/Pentahoa, joka oli nelossijalla.

Hadoop marginaalissa -> Big data ei ole analytiikkaa

Tutkimuksen mukaan vain 14% kyselyyn vastanneista käyttivät ns. big data -työvälineitä kuten Hadoop. Tämä osoittaa, että Hadoopin kaltaiset suurten tietomassojen käsittelyyn erikoistuneet ohjelmistot pysyvät edelleen marginaalissa ja että analytiikkaa/tiedon louhintaa tehdään pienillä ja keskisuurilla datamassoilla.

This suggests that Real Big Data remains isolated among a select group of web giants, government agencies, and similar very large enterprises, and most data analysis is done on “medium” and small data.
KdNuggets.com

Perinteiset BI-välineet eivät sisällä analytiikka/tiedon louhinta ominaisuuksia

Tutkimuksen häntäpäästä löytyy myös perinteisiä BI-, raportointi- ja tiedon visualisointivälineitä kuten Qlikview, Cognos ja SAP. Vaikka nämä ovat kaikki mainioita BI-softia ja täyttävät raportointitarpeet – tutkimus osoittaa, että ne eivät ole analytiikkasoftia eikä niillä pysty tekemään tiedon louhintaa ja tilastollista mallintamista.

Poikkeuksen joukkoon tekee erittäin monipuolinen Microsoft SQL Server, joka tarjoaa myös tiedon louhinta -ominaisuudet ja onkin tänä vuonna sijalla 11.

 


19.03.2013 / Ville Niemijärvi

Jim Collins on tunnettu kirjailija ja tutkija, jonka tunnetuimmat kirjat ovat Hyvästä paras (Good to great) ja Pysy parhaana (Built to last). Collins on tutkinut vuosikausia sitä, miksi toiset yritykset menestyvät ja toiset eivät.

“Tutkimusmetodimme perustuu vastakohtien hyödyntämiseen. Tutkimme yrityksiä, joista tuli erinomaisia, ja yrityksiä, joista sellaisia ei tullut, ja kysymme, miten ne eroavat toisistaan?”
– Parhaasta pohjalle vai vahvana eteenpäin. 2009.

Me Louhialla käytämme samaa menettelytapaa tehdessämme asiakkaillemme esimerkiksi myymälöiden bechmarkkausta. Haastattelujen ja vuosien tutkimustyön sijaan me hyödynnämme tilastollista mallintamista ja tiedon louhinnan menetelmiä – toisin sanoen edistynyttä analytiikaa.

Jos yrityksessä on paljon myymälöitä ja heidän aktiviteeteista ja suorituskyvystä on kertynyt dataa vaikka vain parin vuoden ajalta, voimme segmentoida myymälät noiden lukujen perusteella. Ensiksi myymälät ryhmitellään menestyksen mukaan esimerkiksi kolmeen ryhmään: menestyjiin, keskinkertaisiin ja huonoihin (luokkia voi olla enemmänkin). Menestymisen mittarit sovitaan yhdessä asiakkaan kanssa. Myynti, kate, keskiostos, asiakastyytyväisyys, myynnin kehitys, kierto, hävikin määrä…

Tämän jälkeen päätämme mitä aktiviteetteja haluamme seurata. Edellä jo luetellut mittarit ovat yleisiä.  Aktiviteettien lisäksi myös staattiset/rakenteelliset tiedot myymälöistä on kiinnostavia: myymälöiden alueellinen sijainti, alueellinen ostovoima, tuotevalikoiman koko, myyntineliöt, henkilöstön määrä, aukioloajat, etäisyys kilpailijoihin, alueelliset mainoskampanjat…

Kun seurattavat muuttujat on päätetty (usein niitä testataan ja iteroidaan), otamme tiedon louhinnan työkalupakin käyttöön, esimerkiksi regressioanalyysin. Sen avulla voimme selvittää, mitä yhteisiä piirteitä ja aktiviteetteja löytyy menestyvien myymälöiden taustalta. Jos otamme 20 muuttujaa tarkasteluun, voi olla että menestymisen takaa paljastuu vain 2-3 todella relevanttia tekijää, joita yrityksen pitää alkaa seuraamaan tarkemmin ja joihin voimme vaikuttaa.

Myymälöiden benchmarkkauksen tuloksena saamme listan tekijöistä, joita yrityksen tulee vahvistaa heikommin menestyvissä myymälöissä ja näin parantaa niiden suorituskykyä. Tämä tieto on myös ensiarvoisen tärkeää myymälöiden henkilökunnan ja myyjien koulutuksessa.

Analytiikan avulla voimme selvittää syyt menestymisen taustalla – ja viedä tuo oppi heikommin menestyville. Näin teemme keskinkertaisista hyviä.


19.02.2013 / Louhia

Tai mitä yhteistä niillä pitäisi olla?

Erilaisia CRM-sovelluksia on olemassa pilvin pimein ja joka lähtöön. Suurin osa on varusteltu sähköposti- ja kalenteriohjelmien synkronointi mahdollisuuksilla, to-do listoilla, asiakaskorteilla, tarjousseurannalla, jne. CRM-järjestelmän saa käyttöönsä kätevästi SaaS palveluna ja useimmat käyttöliittymätkin alkavat olla helppoja käyttää. Poikkeuksia luonnollisesti mahtuu joukkoon.

Nykyisissä CRM-sovelluksissa on siis mukana kaikki tarvittava myyntiä ja markkinointia silmällä pitäen. Vai onko sittenkään?

Otetaanpa esimerkki musiikkimaailmasta. Aikanaan Winamp oli kova sana musiikin soittamisessa. Aikana jolloin Metallica ei vielä ollut ottanut Napsteria hampaisiinsa. Se oli helppo ja tehokas käyttää; todellinen musanautiskelijan lapio jolla oli helppo hallita musiikkikirjastoa ja soittaa musiikkia. Winampin käyttöliittymääkin pääsit muuttelemaan omanlaiseksi ja makuun sopivaksi. Sitten eräänä päivänä iTunes tuli markkinoille ja mitä tapahtui? Käyttöliittymä oli toki hieno ja selkeä mutta suurin mullistus oli siinä miten helpoksi Apple teki uusien biisien hankkimisen parilla klikkauksella, ja laillisesti.

iTunes keskittyy yhteen asiaan ja tekee sen erinomaisesti. Onko CRM:n tarkoitus toimia pölyttyvänä arkistona, jota myyjät käyttävät vain jos uhkaat repiä kynnet irti, vai edistää aidosti myyntiä?

Kun perusasiat olivat kunnossa (eli biisit helposti ostettavissa), seuraava suuri edistysaskel erityisesti musabisneksen näkökulmasta oli iTunesin Genius-moottori. Yhtäkkiä soitin alkoikin ehdottaa käyttäjälle sopivia biisejä sen perusteella, mitä omassa musiikkikirjastossa oli, millaisia ratingeja olit antanut ja mitä kappaleita kuuntelit ahkerimmin. Jos tykkäsit tästä artistista, niin saattaisit pitää myös tästä biisistä tai artistista. Genius hyödyntää ns. collaborative filtering -tekniikkaa, minkä avulla datasta pyritään löytämään toistuvia kaavoja ja lainalaisuuksia ja tämän avulla ennustamaan tulevaa käyttäytymistä. Vastaavaa mallinnusta hyödyntää mm. Amazon.com ja monet muut verkkokaupat. Myynnin näkökulmasta tämä tarkoittaa merkittävää lisämyyntipotentiaalia ja ajatusmaailman renensanssia siirtymällä passiivisesta odottamisesta aktiiviseen toimintaan. Tällaiselle myynnin työkalulle on tilaa toimialasta riippumatta, koska keskiössä on loppupeleistä asiakas ja hänelle entistä paremmin suunnatut tuotteet ja palvelut.

Mutta miksi CRM-kehittäjät ja niiden käyttäjät ovat tyytyneet jäämään Winampin tasolle kun tarjolla olisi Genius-luokan älykkyyttä? Pohjautuuko eri asiakaskohderyhmien, tuotesuositusten ja kampanjoiden määritelmät olemassa olevaan tietoon siitä mikä todella vaikuttaa myyntiin? Vuosikymmenten kokemusta ja näppituntumaa liiketoiminnasta ei korvaa mikään mutta entäpä jos pahimmat kilpailijasi ottavat vastaavan sallitun “lisäaineen” käyttöönsä omassa myyntisuorituksessaan? Ainakin tämän tutkimuksen mukaan 40%:lla on siitä jo suunnitelma olemassa.

Useimmat yritykset keräävät jo tietoa myyntiprosessista, asiakkaista, myydyistä tuotteista, laskutuksesta, asiakaspalvelusta, jne. Tätä olemassa olevaa tietoa voidaan käyttää myynnin tukena Geniuksen tavoin. Toki tiedot voivat olla eri lähteissä ja eri ihmisten näppien alla mutta nämä ovat kohtuullisen vaivattomasti ratkaistavissa olevia ongelmia.

Tiedonlouhinnan ja analytiikan hyödyntäminen myynnin ja CRM:n taustamoottorina on seuraava askel myynnin tehostamiseksi. Jotkut näitä askeleita jo ottavat. Ehkäpä tämä on ensimmäinen työväline sitten kynän ja paperin keksimisen jälkeen, minkä myös huippumyyjät haluavat omaksua nopeasti?


12.02.2013 / Ville Niemijärvi

Liiketoiminta-analytiikkaa varten ei tarvitse välttämättä kalliita lisenssi-investointeja vaan analytiikan voi tilata myös palveluna. Tällöin datan analysointi ja (ennuste)mallien muodostaminen tapahtuu analytiikkaan erikoistuneiden yritysten palvelimilla ja ohjelmistoilla.

Asiakas saa itselleen lopuksi analyysien tulokset, esimerkiksi visualisoidun loppuraportin asiakaspoistumaan vaikuttavista tekijöistä. Tulokset voidaan myös integroida asiakkaan CRM-, raportointi- tai ERP -järjestelmiin. Yksinkertaisimmillaan tämä on nippu SQL-lauseita, jotka sisältävät analytiikkamallin muodostavan logiikan, jota voidaan sitten hyödyntää esimerkiksi hälyraporttien muodostamisessa. Tai jos ollaan tehty asiakassegmentointi, voidaan uudet segmentit ajaa eräajolla CRM-järjestelmään.

Perinteisissä raportointihankkeissa korostuu usein liiaksi raportointisofta: sen käyttöliittymä ja toiminnallisuus. Kuitenkin tärkeintä kaikissa päätöksentekojärjestelmissä on se mitä kysytään ja mitä ongelmia ollaan ratkaisemassa. Analytiikkahankkeissa tämä tulee erityisesti esille: analytiikkaprojektit ovat täsmäratkaisuja, joiden on tarkoitus taklata jokin liiketoimintaongelma, vähentää kuluja tai lisätä myyntiä. Se millainen käyttöliittymä analytiikkasoftassa on, ei ole mitään merkitystä asiakkaalle.

Tärkeintä kaikessa päätöksentekojärjestelmissä on se mitä kysytään ja mitä ongelmia ollaan ratkaisemassa. Käytettävä raportointi- tai analytiikkasofta on toissijainen.

Ainoastaan jos asiakas haluaa itse tehdä mallinnustyötä tai jos malleja on tarkoitus ajaa automatisoidusti jatkuvalla syötöllä, tulee softahankinta välttämättömäksi. Mutta jos esimerkiksi asiakassegmentoinnin tai ostoskorianalyysin haluaa tehdä kerran puolessa vuodessa, ei lisensseihin investointi ole kannattavaa vaan tällöin kannattaa tilata toteutus palveluna.