Analytiikka, liiketoimintaa vai sovelluskehitystä?

LinkedIniä tai muuta sosiaalista mediaa seuraamalla voisi helposti ajatella, että kotimaassa pääasiassa suuremmat konsulttiyritykset ja muut ohjelmistokehittäjät tekevät analytiikkaa, mutta todellisuudessa sitä tietysti tehdään eri organisaatioissa eri lähtökohdista.

Isommat, ”perinteiset” tiedolla johtamiseen panostaneet organisaatiot ovat saattaneet jo vuosia sitten hankkia SAS tai SPSS Modeler – ohjelmistoja, joilla liiketoimintalähtöiset data-analyytikot ovat tuottaneet analytiikkaprosesseja aina tuotantoon asti. Pankit, data brokerit, vakuutusyhtiöt, julkaisijat sekä teleoperaattorit ovat olleet pitkään kaupallisten analytiikka-alustojen käyttäjiä.

Ohjelmistokehittäjillä ja meillä konsulteilla on työkalupakki yleensä laajempi, mutta olemme kauempana liiketoiminnan käytännöistä. Kokemukseni mukaan taloudellisen mallin rakentaminen osaksi analytiikan tulosten arviointia saa paremman vastaanoton, kuin pelkkien tulosten esittely ilman tuollaista sidosta.

 

                    Mitä analytiikka on?

Analytiikka on, tai sen pitäisi olla liiketoiminnan kehittämisen ja johtamisen apuväline, ja eroaa perinteisestä operatiivisesta tai strategisesta raportoinnista siinä, että erilaisia mitattujen ilmiöiden vaikutussuhteita ja ennusteita pyritään tuottamaan algoritmien avulla. Datavisualisointi on taas luonteeltaan erilaisten ilmiöiden tarkastelua ihmisten havainto – ja jäsennyskyvyn asettamissa rajoissa.

Tilastotieteessä ja sen sovellusalueissa eri tieteissä oletetaan useimmiten taustalle jonkinlainen satunnaisprosessi, jonka parametrit ovat tiedossa mutta jonka arvot pyritään datasta estimoimaan. Tai voidaan ajatella niin että parametritkin ovat satunnaismuuttujia, mutta mallintajalla on jonkinlainen prioritiheys niille.

Liiketoiminnan data-analytiikka kokoaa yhteen työkaluja tietojenkäsittelytieteestä, tilastotieteestä ja sovelletusta matematiikasta. Tarkoitus ei ole tehdä tiedettä, vaan tuottaa hyödyntäjäorganisaatiolle taloudellista hyötyä, joten metodologisessa mielessä ei yleensä olla sitoutuneita johonkin yksittäiseen lähestymistapaan.

 

Liiketoiminnan ja datan vuoropuhelu

 Organisaatioilla on dataa eri muodoissa, eri määriä ja syntyen eri liiketoimintaprosessien seurauksena. Ehkä tärkein asia analytiikan tekemisessä on se, että liiketoiminnallinen ongelma on ymmärretty ja tiedetään mitä lähdetään tavoittelemaan.

Asiantuntija, joko organisaation oma tai ulkopuolinen, pystyy arvioimaan miten käytettävissä oleva data kelpaa liiketoiminnallisen ongelman ratkaisemiseen.

Iso osa työstä on datan kanssa painimista, ekonomisteilla on vitsi että data tunnustaa kunhan sitä kiduttaa riittävän pitkään. Siksi datan ominaisuuksien tutkimiseen on syytä käyttää jonkin verran aikaa ja tehdä tiivistä yhteistyötä ilmiöalueen asiantuntijoiden kanssa.

 

Lähde kehittämään liiketoimintaasi datan avulla!

Ready Solutions Oy:n konsulttitiimillä on vahvaa kokemusta eri toimialoilta sekä erilaisista ohjelmistotuotteista. Erityisesti energiatoimialalla voimme auttaa liiketoimintasi kehittämisessä monia muita toimijoita syvällisemmän toimialaosaamisemme vuoksi.

Readyn myyntitiimi vastaa mielellään kysymyksiisi:

myynti@readysolutions.fi

+358451374850

 

Onko datavisualisointi analytiikkaa?

Viimeisten vuosien aikana sanasta analytiikka on tullut ns. weasel word*, eli se voi tarkoittaa mitä tahansa.

Datavisualisointi on datan eri asteikollisten muuttujien esittämistä kuvioiden avulla niin että ihminen yrittää jäsentää sen informaatioksi. Datan muuntaminen informaatioksi vaatii useimmiten jonkinlaisen kontekstin, ja luonnollisesti yrityksessä se on liiketoiminnan joku osa-alue.

Vaikka vaatisi että oikeaa analytiikkaa voi olla vain algoritmien käsittelemän datan vasteena tuleva johdettu data, kuten ostotodennäköisyys, niin monesti datan visualisointi ennen sen syöttämistä algoritmeille on tärkeää laadun varmistuksen mielessä. Datan hyödyntäjän on tunnettava datansa.

Data informaatioksi – eri näkökulmat tuovat arvoa

Ready Solutions Oy:n osakkaan Asko Kauppisen mukaan datavisualisoinnin käyttötarpeet voidaan useimmiten täyttää hyvällä Business Intelligence – ohjelmistolla ilman että suuren joukon liiketoimintakäyttäjiä tarvitsee opetella ohjelmointikieliä. Markkinoilla on useita hyviä vaihtoehtoja, eikä ole järkevä ajattelumalli, että organisaatiolla pitäisi olla vain yksi teknologiajoukko, joka voidaan ottaa käyttöön.

Datan edistyneempi hallinta edellyttää jo jonkin verran enemmän investointeja, mutta esimerkiksi tiettyjä kehityshankkeita voidaan toteuttaa ilman suurta tarvetta kaupallisille ohjelmistoille. Nykyään Python ja R ovat suosituimpia työvälineitä Data Scientistien keskuudessa ja ne voidaan ottaa käyttöön nopeasti.

Riippumatta siitä mitä organisaatiossa tehdään tai millä välineillä, niin datan hyödyntämisen tulee palvella liiketoimintaa. Käyttötarve voi olla tuotekehitys, riskienhallinta, kannattavuus, asiakaspalvelun laatutason nostaminen taikka miltei mikä tahansa.

Ready Solutions Oy:n osakkaan Jarkko Sahlmanin mukaan informaation arvo tulee pelkästään siitä, että liiketoimintajohto tai yrityksen työntekijät operatiivisella tasolla ymmärtävät yrityksen eri toimintojen ja prosessien nykytilan suhteessa tavoitteisiin ja tämän jälkeen tekevät toimintaan muutoksia, jotta asetettuihin tavoitteisiin päästäisiin.

        Esimerkki –  mitä Google Analytics data kertoo?

Ready Solutions Oy:n markkinoinnin ja myynnin panosten vaikutusta voidaan tarkastella verkkosivujen erilaisilla kävijämäärien (käynnit, kävijät, uudet kävijät) sekä muilla, liikevaihtoon enemmän vaikuttavilla, muuttujilla mutta joita emme tässä halua avata tarkemmin.

Markkinoinnilla pyrimme avaamaan myyntimahdollisuuksia ja myyntimahdollisuus voi alkaa vaikkapa kontaktista myyntiimme verkkosivuillamme. Myyntimahdollisuudet taas pyritään muuttamaan toteutuneiksi kaupoiksi.

Heinäkuussa 2018 aloitimme useassa eri kanavassa cost per click – tyyppisen kampanjan, jolla pyrimme lisäämään liikennettä sivullamme olevaan artikkeliin sekä lisäämään LinkedInin puolella olevia yrityssivuston seuraajien määriä. Artikkeliin on tässä kampanjassa sijoitettu yhteydenottoon kannustavia CTA – elementtejä, kun joissain tilanteissa pyydämme vain kävijöitä seuraamaan yrityksemme sosiaalisten medioiden yrityssivuja.

Yllä oleva Power BI välineellä tuotettu kuvaaja on yksinkertainen, mutta tarjoaa mahdollisuuden verkkoliikenteen tarkasteluun usean eri dimension suhteen.

Mielenkiintoinen osa-alue datan visualisointiin tai perusymmärryksen luomiseen siitä, on eri julkaisujen / sivujen käytön tarkastelu. Jos saman kuukauden aikana on tehty useita erilaisia julkaisuja, jokaista markkinoitu eri variantein niin tällainen analyysi antaa mahdollisuuksia optimoida markkinointia. Alla olevassa kuvassa on alkuvuoden 2018 julkaisujen vierailudataa.

LinkedIn on lähteenä tuonut meille eniten uusia kävijöitä, joskin hinta on myös ollut kova cpc – mielessä.

                      Kehitä liiketoimintaasi datan avulla!

Ready Solutions Oy:n konsulttitiimillä on vahvaa kokemusta eri toimialoilta sekä erilaisista ohjelmistotuotteista. Erityisesti energiatoimialalla voimme auttaa liiketoimintasi kehittämisessä monia muita toimijoita syvällisemmän toimialaosaamisemme vuoksi.

Readyn konsultit vastaavat mielellään kysymyksiisi:

Asko.kauppinen@readysolutions.fi

Jarkko.sahlman@readysolutions.fi

+358451374850

 

*= näätä tyhjentää munan tekemällä siihen pienen reiän

Ready Solutions kasvaa

 

Uusia osakkaita

DI Jarkko Sahlman aloitti 19.3. Ready Solutions Oy:n osakkaana ja johtavana konsulttina. Jarkolla on erittäin laaja kokemus myynnin kehittämistehtävistä, energiamarkkinoista sekä erilaisten tiedolla johtamisen välineiden hyödyntämisestä, ml. QlikSense sekä QlikView. Aiemmin Jarkko on työskennellyt liikkeenjohdon konsulttina, energiatoimialalla myynnin ja riskienhallinnan johtotehtävissä sekä teollisuudessa controllerina. Koulutukseltaan Jarkko on tuotantotalouden DI Lappeenrannan teknillisestä yliopistosta.

FM Matti Vartiainen aloitti 19.3. Ready Solutions Oy:n osakkaana ja konsulttina. Matilla on vahva osaaminen liiketoimintalähtöisten raportointiratkaisujen tuottamisessa. Aiemmin Matti on työskennellyt konsulttina sekä energiatoimialalla Business Intelligence – kehittäjänä. Matti on koulutukseltaan FM pääaineena tietojenkäsittelytiede Itä-Suomen yliopistosta. Syventävinä opintoina Matti on opiskellut kehittyneen data-analytiikan opintoja.

Asko ja Jonne toivottavat uudet osakkaat lämpimästi tervetulleeksi edelleen kehittämään Ready Solutions Oy:n palveluita.

Matti LinkedInissä

Jarkko LinkedInissä

 

Analytiikan datarakenteet

Liiketoiminnan data-analytiikan datarakenteet

Yhtä tärkeitä asioita kuin data-analytiikassa käytettävät menetelmät ja niistä johdetut algoritmit, ovat datarakenteet. Vaikka käytännössä työtä niiden suhteen tekevät asiaan erikoistuneet asiantuntijat, niin myös organisaatiossa olisi hyvä olla ymmärrystä yleisellä tasolla millaiset ongelmat vaativat minkä tyyppistä datarakennetta.

Datarakenne mallintaa jonkun kiinnostavan liiketoiminnallisen ilmiön suhteessa eri havaintoyksiköihin, aikaan tai näiden kombinaatioon.

Alla olevassa kuvassa nähdään, että liiketoiminnallisen ongelman / tavoitteen sekä käytettävissä olevien datojen suhteen täytyy käydä iteratiivisesti määrittelyä sekä datan ensivaiheen analyysiä. Tässä vaiheessa ei välttämättä vielä sitouduta tiukasti johonkin tiettyyn metodologiseen kokonaisuuteen.

 

Kolme suurta kokonaisuutta datarakenteina ovat:

  • Poikkileikkaus
  • Aikasarja
  • Paneeli / kohortti / pitkittäisaineisto

Tässä esityksessä nuo datarakenteet pitää ajatella pikemminkin loogisina kokonaisuuksina, eikä vielä oteta kantaa siihen tarkoitetaanko rakenteella jotain tietokoneohjelman muistissa olevaa tietyn ohjelmointikielen alkeisobjektia vai tietokantataulua. Todellisuudessa tietokantataulukin on abstraktio, jossa data säilytetään tiedostoissa ja ohjelmisto huolehtii sen datan tuomisesta hyödyntävän ohjelmiston käyttöön.

 

Poikkileikkaus

Poikkileikkaus on datarakenne, jossa on P kappaletta erilaisten muuttujien yksittäistä havaintoa N kappaleelle eri havaintoyksiköitä. Havaintoyksikkö voi olla kotitalous, yritys, yrityspäättäjä, yksittäinen henkilö tai vaikkapa kone IoT – sovelluksissa.

Poikkileikkausrakenne ei suoraan sisällä havaintoyksiköiden osalta ajan suhteen minkään tyyppistä suhdetta, mutta epäsuorasti noiden P muuttujan aikaikkunoinnilla voidaan saavuttaa tilanne että ne kuvaavat havaintoyksiköiden havaintohetkeä edeltävää historiaa.

Joissain tilanteissa jotkut muuttujista voivat kuvata tulevaisuutta havaintohetkeen nähden eli nykyhetkeen verrattuna havaintohetki on menneisyydessä. Esimerkkinä vaikka lainahakemus, jonka kohdalla myönnettyyn luottoon liittyvät maksuerä saattaa jäädä maksamatta havaintohetkeä seuraavan 200 päivän aikana. Tällaisessa tilanteessa havaintohetki olisi 200 päivää menneisyydessä nykyhetkeen verrattuna.

Yksittäiset havaintoyksiköt tai niiden käytös ei välttämättä ole riippumatonta toisista havaintoyksiköistä, esimerkiksi kotitalouteen kuuluvat henkilöt voivat tehdä jonkun yrityksen suhteen asioita samalla tavalla. Esimerkiksi irtisanoa sopimuksensa yhtä aikaa.

Aikasarja

Aikasarjarakenne kuvaa yksittäisen aikasarjan havaintoa yhdestä muuttujasta T aikaperiodin yli. Jos K kappaletta eri aikasarjoja yhdistetään matriisiksi niin saadaan tilannee, jossa on KT havaintoa seurattuna T aikaperiodin yli.

 

Aikasarjat ovat perinteisiä ekonometriassa, tilastotieteen sovellusalueessa taloustieteessä, käytettyjä datarakenteita.

 

Aikasarjoissa esiintyy lähes aina peräkkäistä ja sarjojen välistä riippuvuutta  sekä toisaalta kausivaihtelua eli sarjan riippuvuutta kaudesta S, jona havainto mitataan.

  • autokorrelaatio kuvaa sarjan riippuvuutta sen omasta historiasta
  • ristikorrelaatio kuvaa sarjan riippuvuutta toisen sarjan historiasta tai nykyisestä tilasta
  • kausivaihtelu kuvaa sitä, että on mielekkäämpää verrata sarjan nykyistä tasoa M aikaperiodia sitten olleeseen tasoon eikä tasoon juuri välittömästi aiempina aikaperiodeina.

IoT – datan rakenne on luontevasti aikasarja, vaikka sen voisi mallintaa myös poikkileikkauksena tai paneelina.

Paneeli

Paneelissa yhdistää poikkileikkaus – ja aikasarjarakenteiden ominaisuuksia, koska tässä on jokaisesta N havaintoyksikön P muuttujasta dataa yli T aikaperiodin.

Paneelidatarakenteen käyttö edellyttää näistä eniten metodologista osaamista, koska ajalliset sekä havaintoyksiköiden väliset riippuvuudet ovat selkeästi hankalampia ottaa huomioon.

 

Lopuksi

Erilaiset ongelmat vaativat erilaisia datarakenteita ja asettavat tiukat ehdot lähtödatan luonteelle. Jokaisella organisaatiolla, aivan pienempiä yrityksiä lukuun ottamatta, tulisi olla yleisellä tasolla ymmärrystä siihen millaisia datarakenteita erilaisiin heidän liiketoimintansa ongelmiin / tavoitteisiin pitää käyttää.

Ready Solutions Oy on tiedonhallinnan asiantuntijayritys, joka pystyy auttamaan teitä tässä. Ota yhteyttä ja pohditaan yhdessä tiettyä tavoitetta vastaava ratkaisu.

Analytiikkaa, liiketoimintaa vai sovelluskehitystä?

Data Science on ohjelmistokehittäjien ja konsulttien hallitsemaa ilmatilaa

LinkedIniä seuraamalla voisi helposti ajatella että kotimaassa pääasiassa suuremmat konsulttiyritykset ja muut ohjelmistokehittäjät tekevät analytiikkaa, mutta todellisuudessa sitä tietysti tehdään eri organisaatioissa eri lähtökohdista.

Isommat ei-ohjelmistokehitysorientoituneet organisaatiot ovat saattaneet jo vuosia sitten hankkia
SAS tai SPSS Modeler – ohjelmistoja, joilla liiketoimintalähtöiset data-analyytikot ovat tehneet
analytiikkaprosessejaan. Pankit, vakuutusyhtiöt, julkaisijat sekä teleoperaattorit ovat tällaisia perinteisten analytiikka-alustojen käyttäjiä.

Ohjelmistokehittäjillä ja meillä konsulteilla on työkalupakki yleensä laajempi, mutta olemme kauempana liiketoiminnan käytännöistä. Oman kokemukseni mukaan taloudellisen mallin rakentaminen osaksi analytiikan tulosten arviointia saa paremman vastaanoton, kuin pelkkien
tulosten esittely ilman tuollaista sidosta.

 

Mitä on analytiikka?

Analytiikka on oikeastaan liiketoiminnan kehittämisen ja johtamisen apuväline, joka eroaa perinteisestä  operatiivisesta tai strategisesta raportoinnista siinä että erilaisia mitattujen ilmiöiden
vaikutussuhteita ja ennusteita pyritään tuottamaan algoritmien avulla. Datavisualisointi on taas luonteeltaan erilaisten ilmiöiden tarkastelua ihmisten oman havainto – ja jäsennyskyvyn asettamissa rajoissa.

Tilastotieteessä ja sen sovellusalueissa eri tieteissä oletetaan useimmiten taustalle joku satunnaisprosessi, jonka parametrit ovat tiedossa mutta jonka arvot pyritään datasta estimoimaan. Tai parametrit ovat satunnaismuuttujia, jos asiaa lähestystään bayesilaisen tradition näkökulmasta.

Liiketoiminnan data-analytiikka taas kokoaa yhteen työkaluja tietojenkäsittelytieteestä, tilastotieteestä ja sovelletusta matematiikasta. Tarkoitus ei ole tehdä tiedettä vaan tuottaa käyttäjäorganisaatiolle taloudellista hyötyä, joten metodologian kohdalla ei yleensä olla sitoutuneita johonkin yksittäiseen lähestymistapaan.

Datan ja liiketoiminnan vuoropuhelu

Organisaatioilla on dataa eri muodoissa, eri määriä ja syntyen eri liiketoimintaprosessien seurauksena. Joissain tilanteissa ulkoisten datalähteiden hyödyntäminen on tärkeässä roolissa, esimerkkinä nyt vaikkapa luotonanto jossa hyödynnetään luottotietorekisterien pitäjien datoja.

Ehkä tärkein asia analytiikan tekemisessä on se, että liiketoiminnallinen ongelma on ymmärretty ja tiedetään mitä lähdetään tavoittelemaan.

Asiantuntija, joko organisaation oma tai ulkopuolinen, pystyy arvioimaan miten käytettävissä oleva data kelpaa liiketoiminnallisen ongelman ratkaisemiseen.

Integraatiota ja perspiraatiota

Iso osa työstä on datan kanssa painimista, ekonomisteilla on vitsi että data tunnustaa kunhan sitä
kiduttaa riittävän pitkään ja se taitaa joskus pitää paikkansa.

Varaudu kehittäjänä siihen että inspiraation ja perspiraation suhteet voivat olla vääristyneet suhteessa omaan käsitykseesi työkuvasi sisällöstä.