Projekti-raportointia Power BI:llä

Projekti-raportointia Power BI:llä

Olemme toteuttaneet Projektiportfolioraportti esimerkin, jossa käytetään Microsoftin demo dataa Project Onlinesta ja sitä käsitellään eri tarpeisiin Power BI:llä.

 

Projektien hallinnan kannalta raha on yleensä kuningas ja siksi salkkutasolla olemme keränneet esille koko salkun kustannuksien datan. Esimerkiksi todelliset kustannukset, budjetoidu kustannukset ja viimeisen estimaatin kustannukset.

 

Lisäksi vohvelivalikon   kautta voimme pureutua dataan eri osastojen, projektityyppien tai projektin omistajien näkökulmasta, jolloin ennusteet ja projektit ovat paremmin vertailukelpoisia keskenään.

 

Portfolio kustannus/ päivä visuaalisaatiossa voimme seurata kuinka paljon salkku maksaa / päivä ja miten nämä kustannukset kasautuvat eri aikoihin. Esimerkin sakussa on ennustettu syyskuulle huomattavasti suurempia päiväkustannuksia kuin muulle osaa vuodesta. Olisiko tässä hyvä siirtää joitakin projekteja eri aikaan, jotta kuormitus olisi tasaisempaa? Toteutuneesta näemme, että joka tapauksessa kulut ovat seuranneet enemmän keskimääräistä päivähintaa. Erityisesti tässä raportissa Power BI pääsi osoittamaan vahvuutensa, sillä kyseinen data on projektitasolla Project Onlinessa ei päivätasolla, mitä raportointi vaatisi.

 

Mikäli rahaa käytetään huomattavasti vähemmän kuin mitä on arvioitu, voidaan siitä helposti päätellä, että projektit eivät todennäköisesti etene keskimäärin suunnitellulla nopeudella tai on mahdollisuus vapauttaa varoja muuhun käyttöön tämän vuoden osalta:

 

Koska meillä on käytössä koko projektisalkun tiedot voimme yksinkertaisella eksponentiaalisentasoituksen mallia (exponential smoothing) käyttämällä arvioida kertyviä tulevia kustannuksia ja niiden mahdollista kehittymistä.

 

Yksinkertaisilla liikennevaloilla saadaan projektisalkusta nousemaan esille projektit, mitkä kaipaavat huomiota. Tässä esimerkissä liikennevaloihin on käytetty automaattisia triggereitä perustuen esimerkiksi budjetin ylittämiseen yli 20% (Punainen).

 

Mikäli tilanne vaatii nopeampaa perehtymistä juuri tiettyyn projektiin voi raportilta helposti porautua siihen:

 

Ja nähdä mistä oikein on kyse, missä tilassa projekti on tai missä tilassa projektin välietapit ovat.

 

Projektiraporttia projektipäällikkö voi myös käyttää projektin seuraamiseen. Samalla päästään myös yhteen totuuteen, kun johto ja projektin vastuuhenkilöt näkevät samat tiedot. Tämä myös lisää näiden järjestelmien datan laatua, sillä virheet tulevat helposti näkyviin ja ne voidaan korjata suoraan järjestelmiin mistä ne ovat lähtöisin.

Power BI tarjoaa laajat julkaisuvaihtoedot raporteille kuten tämän raportin julkinen jakaminen osoittaa. Yrityksen sisäisesti julkaisun voidaan tehdä samaan tapaan tai vaikka esimerkiksi applikaation kautta suoraan puhelimeen. Lisäksi raportit on mahdollista toteuttaa niin että raportilla nähdään vain data, mihin on kirjautuneella henkilöllä oikeudet.

Tämän tyyppisen raportin lähteenä voi olla lähes mikä tahansa projekti järjestelmä. Parhaisiin tuloksiin päästään tietenkin ottamalla mukaan dataa suoraan esimerkiksi taloushallinonjärjestelmistä, jolloin projektien todelliset kustannukset voisivat olla lähes reaaliaikaisia. Vastaavasti mitä enemmän järjestelmiä huomioidaan sitä tarkempaa, data on ja sitä lähempänä ennuste voi olla toteumaa. Lisäksi Microsoftin alusta tarjoaa välineet kaikkeen datan hallintaan ja analysointiin, vaikka itse Power BI ei johonkin sovellukseen sellaisenaan toimisi.

Energiankulutuksen joustosta 1

Kohteen riippuvuus lämpötilasta

Yksittäisen kohteen energiankulutuksen aikasarjat ovat useimmiten omasta välittömästä historiastaan, vuodenajasta sekä ulkolämpötilasta riippuvia. Monilla yhtiöillä on mahdollisuus tarkastella yksittäisiä aikasarjoja graafisesti, mutta miten ottaa haltuun koko mittaustietojen kokonaisuus?

Ready Solutions Oy:n näkemyksen mukaan avainasemassa on mittausdatan mahdollisimman automaattinen hyödyntäminen, esimerkiksi koneoppimismenetelmien tuottamien ennusteiden avulla. Ennusteet ja mittausdatassa oleva informaatio täytyisi tiivistää muutamaan keskeiseen tunnuslukuun, joista yhden käsittelemme tässä kirjoituksessa.

 

Käyttötapaukset

Suoran sähkölämmityksen kohteen tapauksessa erilaiset riippuvuuden tunnusluvut tarjoavat sähkön myyjälle ja miksei myös verkkopalveluita tarjoavalle yhtiölle mahdollisuuden esimerkiksi riskiperusteiseen hinnoitteluun.

Kaukolämmön liiketoiminnassa, jossa hinnoittelu perustuu tyypillisesti muutamaan julkisen hinnaston mukaiseen komponenttiin, tällaisten tunnuslukujen avulla voitaisiin hinnoitella verkostokohtaisesti perusmaksuja. Tausta-ajatuksena on, että asiakas maksaa optiosta käyttää energiaa.

Olemme muutamissa tapauksissa rakentaneet kaukolämmön liiketoiminnoille automatisoidut prosessit, jotka tuottavat esimerkiksi tilausvesivirran tai tehon ennusteet.

Näiden suoraan liiketoimintaan liittyvien tapausten lisäksi mittausdatan laadunvarmistuksen näkökulmasta voi käydä läpi erityisen poikkeavia tunnuslukuja.

 

Kaarijousto – Arc Elasticity

Kaarijousto on tunnusluku, joka kohteen energiankulutuksen volyymista riippumattomasti pyrkii tiivistämään lämpötilariippuvuuden.

Jos käytetään yksinkertaista regressiomallia, niin jousto voidaan saada suoraan mallin kertoimia käyttäen. Muussa tapauksessa voidaan tuottaa paikalliset ennusteet ja laskea tulos auki niiden avulla. Molemmat esimerkit on esitetty kaavoina alla olevassa kuvassa.

Yllä olevassa kuvassa E on energiakulutus ja T on lämpötila, indeksoinneilla kuvataan paikallisuutta tai keskiarvoa tietyllä havaintoalueella.

Erityisesti pienten kulutuskohteiden tapauksessa ennusteiden tuottamisessa käytettyjen muuttujien arvojen vaihtelu voi olla suurta ja tuloksia täytyy tarkastella kriittisemmin.

 

Kiinnostaako koneoppiminen ja data-analytiikka energiatoimialalla?

 

Toteutimme Savon Voimalle konseptiimme perustuen useita koneoppimisen (ML) ratkaisuja, joiden kehityksen yhteydessä osoitimme että tällaiset projektit voidaan toteuttaa joustavasti ilman valtavia investointeja. Käy tutustumassa asiakas – caseemme!

 

 

ADMM esittely

ADMM – esittely

Toteutimme Savon Voimalle konseptiimme perustuen useita koneoppimisen (ML) ratkaisuja. Mitä tällainen konsepti sitten pitää sisällään?

 

Metadata kaiken keskellä

Uskomme vahvasti siihen että datan jäsentäminen tapahtuu metadatan avulla ja pelkät faktat eivät sinänsä kerro paljon. Haluamme konseptillamme tuoda käyttäjien nähtäville laajan kokoelman erilaista metadataa kehitetyistä ML – ratkaisuista, jotta niitä voidaan hyödyntää liiketoiminnassa.

Metadatan lisäksi tarvitaan käsitemalli eli ylimmän tason kuvaus erilaisista asioista, joita konseptiin kuuluu.

 

Käsitemallimme

ADMM eli analytical data mining mart on data mart, jonka avulla voidaan tuottaa ML – ratkaisuja liiketoiminnan tarpeisiin.

ML – ratkaisun lopputulos on score, joka voi olla esimerkiksi todennäköisyys tai sitten ehdollinen odotusarvo. Vain scoren hyödyntäminen liiketoimintaprosessissa tuottaa liiketoiminnallista arvoa, muussa tapauksessa hyöty jää jonkun ilmiön kuvailun asteelle.

Data Scientist tuottaa mallin, jolla pyritään tiivistetysti kuvaamaan jotain ilmiötä tai ennustamaan sitä. Malliin liittyy myös algoritmi eli laskukaava, jolla tulos tuotetaan. Algoritmi ei täysin vastaa tilastotieteen estimaattoria, joka sekin on laskukaava.

Käsitemallissamme kuvataa myös muita asioita, esimerkiksi käytetyt muuttujat ja niiden tyypit.

ADMM – toteutus

Olemme toteuttaneet ADMM – konseptiamme toistaiseksi yhdistelmänä Microsoftin Business Intelligence – teknologioita sekä avoimen lähdekoodin R – kieltä. Sinänsä konsepti voitaisiin hyvin toteuttaa muillakin teknologioilla.

Yksittäisessä projektissa dataintegraatiot tulevat viemään eniten aikaa, konseptiamme käyttämällä saadaan nopeasti valmis toimintamalli mutta jokainen ympäristö on tietolähteiden osalta erilainen.

 

Kysy lisää!

Jos haluat keskustella asiasta ja kysyä miten tällainen konsepti otetaan käyttöön, niin ota yhteyttä myyntiimme:

myynti@readysolutions.fi

+358451374850

Analytiikka, liiketoimintaa vai sovelluskehitystä?

LinkedIniä tai muuta sosiaalista mediaa seuraamalla voisi helposti ajatella, että kotimaassa pääasiassa suuremmat konsulttiyritykset ja muut ohjelmistokehittäjät tekevät analytiikkaa, mutta todellisuudessa sitä tietysti tehdään eri organisaatioissa eri lähtökohdista.

Isommat, ”perinteiset” tiedolla johtamiseen panostaneet organisaatiot ovat saattaneet jo vuosia sitten hankkia SAS tai SPSS Modeler – ohjelmistoja, joilla liiketoimintalähtöiset data-analyytikot ovat tuottaneet analytiikkaprosesseja aina tuotantoon asti. Pankit, data brokerit, vakuutusyhtiöt, julkaisijat sekä teleoperaattorit ovat olleet pitkään kaupallisten analytiikka-alustojen käyttäjiä.

Ohjelmistokehittäjillä ja meillä konsulteilla on työkalupakki yleensä laajempi, mutta olemme kauempana liiketoiminnan käytännöistä. Kokemukseni mukaan taloudellisen mallin rakentaminen osaksi analytiikan tulosten arviointia saa paremman vastaanoton, kuin pelkkien tulosten esittely ilman tuollaista sidosta.

 

                    Mitä analytiikka on?

Analytiikka on, tai sen pitäisi olla liiketoiminnan kehittämisen ja johtamisen apuväline, ja eroaa perinteisestä operatiivisesta tai strategisesta raportoinnista siinä, että erilaisia mitattujen ilmiöiden vaikutussuhteita ja ennusteita pyritään tuottamaan algoritmien avulla. Datavisualisointi on taas luonteeltaan erilaisten ilmiöiden tarkastelua ihmisten havainto – ja jäsennyskyvyn asettamissa rajoissa.

Tilastotieteessä ja sen sovellusalueissa eri tieteissä oletetaan useimmiten taustalle jonkinlainen satunnaisprosessi, jonka parametrit ovat tiedossa mutta jonka arvot pyritään datasta estimoimaan. Tai voidaan ajatella niin että parametritkin ovat satunnaismuuttujia, mutta mallintajalla on jonkinlainen prioritiheys niille.

Liiketoiminnan data-analytiikka kokoaa yhteen työkaluja tietojenkäsittelytieteestä, tilastotieteestä ja sovelletusta matematiikasta. Tarkoitus ei ole tehdä tiedettä, vaan tuottaa hyödyntäjäorganisaatiolle taloudellista hyötyä, joten metodologisessa mielessä ei yleensä olla sitoutuneita johonkin yksittäiseen lähestymistapaan.

 

Liiketoiminnan ja datan vuoropuhelu

 Organisaatioilla on dataa eri muodoissa, eri määriä ja syntyen eri liiketoimintaprosessien seurauksena. Ehkä tärkein asia analytiikan tekemisessä on se, että liiketoiminnallinen ongelma on ymmärretty ja tiedetään mitä lähdetään tavoittelemaan.

Asiantuntija, joko organisaation oma tai ulkopuolinen, pystyy arvioimaan miten käytettävissä oleva data kelpaa liiketoiminnallisen ongelman ratkaisemiseen.

Iso osa työstä on datan kanssa painimista, ekonomisteilla on vitsi että data tunnustaa kunhan sitä kiduttaa riittävän pitkään. Siksi datan ominaisuuksien tutkimiseen on syytä käyttää jonkin verran aikaa ja tehdä tiivistä yhteistyötä ilmiöalueen asiantuntijoiden kanssa.

 

Lähde kehittämään liiketoimintaasi datan avulla!

Ready Solutions Oy:n konsulttitiimillä on vahvaa kokemusta eri toimialoilta sekä erilaisista ohjelmistotuotteista. Erityisesti energiatoimialalla voimme auttaa liiketoimintasi kehittämisessä monia muita toimijoita syvällisemmän toimialaosaamisemme vuoksi.

Readyn myyntitiimi vastaa mielellään kysymyksiisi:

myynti@readysolutions.fi

+358451374850

 

Onko datavisualisointi analytiikkaa?

Viimeisten vuosien aikana sanasta analytiikka on tullut ns. weasel word*, eli se voi tarkoittaa mitä tahansa.

Datavisualisointi on datan eri asteikollisten muuttujien esittämistä kuvioiden avulla niin että ihminen yrittää jäsentää sen informaatioksi. Datan muuntaminen informaatioksi vaatii useimmiten jonkinlaisen kontekstin, ja luonnollisesti yrityksessä se on liiketoiminnan joku osa-alue.

Vaikka vaatisi että oikeaa analytiikkaa voi olla vain algoritmien käsittelemän datan vasteena tuleva johdettu data, kuten ostotodennäköisyys, niin monesti datan visualisointi ennen sen syöttämistä algoritmeille on tärkeää laadun varmistuksen mielessä. Datan hyödyntäjän on tunnettava datansa.

Data informaatioksi – eri näkökulmat tuovat arvoa

Ready Solutions Oy:n osakkaan Asko Kauppisen mukaan datavisualisoinnin käyttötarpeet voidaan useimmiten täyttää hyvällä Business Intelligence – ohjelmistolla ilman että suuren joukon liiketoimintakäyttäjiä tarvitsee opetella ohjelmointikieliä. Markkinoilla on useita hyviä vaihtoehtoja, eikä ole järkevä ajattelumalli, että organisaatiolla pitäisi olla vain yksi teknologiajoukko, joka voidaan ottaa käyttöön.

Datan edistyneempi hallinta edellyttää jo jonkin verran enemmän investointeja, mutta esimerkiksi tiettyjä kehityshankkeita voidaan toteuttaa ilman suurta tarvetta kaupallisille ohjelmistoille. Nykyään Python ja R ovat suosituimpia työvälineitä Data Scientistien keskuudessa ja ne voidaan ottaa käyttöön nopeasti.

Riippumatta siitä mitä organisaatiossa tehdään tai millä välineillä, niin datan hyödyntämisen tulee palvella liiketoimintaa. Käyttötarve voi olla tuotekehitys, riskienhallinta, kannattavuus, asiakaspalvelun laatutason nostaminen taikka miltei mikä tahansa.

Ready Solutions Oy:n osakkaan Jarkko Sahlmanin mukaan informaation arvo tulee pelkästään siitä, että liiketoimintajohto tai yrityksen työntekijät operatiivisella tasolla ymmärtävät yrityksen eri toimintojen ja prosessien nykytilan suhteessa tavoitteisiin ja tämän jälkeen tekevät toimintaan muutoksia, jotta asetettuihin tavoitteisiin päästäisiin.

        Esimerkki –  mitä Google Analytics data kertoo?

Ready Solutions Oy:n markkinoinnin ja myynnin panosten vaikutusta voidaan tarkastella verkkosivujen erilaisilla kävijämäärien (käynnit, kävijät, uudet kävijät) sekä muilla, liikevaihtoon enemmän vaikuttavilla, muuttujilla mutta joita emme tässä halua avata tarkemmin.

Markkinoinnilla pyrimme avaamaan myyntimahdollisuuksia ja myyntimahdollisuus voi alkaa vaikkapa kontaktista myyntiimme verkkosivuillamme. Myyntimahdollisuudet taas pyritään muuttamaan toteutuneiksi kaupoiksi.

Heinäkuussa 2018 aloitimme useassa eri kanavassa cost per click – tyyppisen kampanjan, jolla pyrimme lisäämään liikennettä sivullamme olevaan artikkeliin sekä lisäämään LinkedInin puolella olevia yrityssivuston seuraajien määriä. Artikkeliin on tässä kampanjassa sijoitettu yhteydenottoon kannustavia CTA – elementtejä, kun joissain tilanteissa pyydämme vain kävijöitä seuraamaan yrityksemme sosiaalisten medioiden yrityssivuja.

Yllä oleva Power BI välineellä tuotettu kuvaaja on yksinkertainen, mutta tarjoaa mahdollisuuden verkkoliikenteen tarkasteluun usean eri dimension suhteen.

Mielenkiintoinen osa-alue datan visualisointiin tai perusymmärryksen luomiseen siitä, on eri julkaisujen / sivujen käytön tarkastelu. Jos saman kuukauden aikana on tehty useita erilaisia julkaisuja, jokaista markkinoitu eri variantein niin tällainen analyysi antaa mahdollisuuksia optimoida markkinointia. Alla olevassa kuvassa on alkuvuoden 2018 julkaisujen vierailudataa.

LinkedIn on lähteenä tuonut meille eniten uusia kävijöitä, joskin hinta on myös ollut kova cpc – mielessä.

                      Kehitä liiketoimintaasi datan avulla!

Ready Solutions Oy:n konsulttitiimillä on vahvaa kokemusta eri toimialoilta sekä erilaisista ohjelmistotuotteista. Erityisesti energiatoimialalla voimme auttaa liiketoimintasi kehittämisessä monia muita toimijoita syvällisemmän toimialaosaamisemme vuoksi.

Readyn konsultit vastaavat mielellään kysymyksiisi:

Asko.kauppinen@readysolutions.fi

Jarkko.sahlman@readysolutions.fi

+358451374850

 

*= näätä tyhjentää munan tekemällä siihen pienen reiän

Ready Solutions kasvaa

 

Uusia osakkaita

DI Jarkko Sahlman aloitti 19.3. Ready Solutions Oy:n osakkaana ja johtavana konsulttina. Jarkolla on erittäin laaja kokemus myynnin kehittämistehtävistä, energiamarkkinoista sekä erilaisten tiedolla johtamisen välineiden hyödyntämisestä, ml. QlikSense sekä QlikView. Aiemmin Jarkko on työskennellyt liikkeenjohdon konsulttina, energiatoimialalla myynnin ja riskienhallinnan johtotehtävissä sekä teollisuudessa controllerina. Koulutukseltaan Jarkko on tuotantotalouden DI Lappeenrannan teknillisestä yliopistosta.

FM Matti Vartiainen aloitti 19.3. Ready Solutions Oy:n osakkaana ja konsulttina. Matilla on vahva osaaminen liiketoimintalähtöisten raportointiratkaisujen tuottamisessa. Aiemmin Matti on työskennellyt konsulttina sekä energiatoimialalla Business Intelligence – kehittäjänä. Matti on koulutukseltaan FM pääaineena tietojenkäsittelytiede Itä-Suomen yliopistosta. Syventävinä opintoina Matti on opiskellut kehittyneen data-analytiikan opintoja.

Asko ja Jonne toivottavat uudet osakkaat lämpimästi tervetulleeksi edelleen kehittämään Ready Solutions Oy:n palveluita.

Matti LinkedInissä

Jarkko LinkedInissä

 

Analytiikan datarakenteet

Liiketoiminnan data-analytiikan datarakenteet

Yhtä tärkeitä asioita kuin data-analytiikassa käytettävät menetelmät ja niistä johdetut algoritmit, ovat datarakenteet. Vaikka käytännössä työtä niiden suhteen tekevät asiaan erikoistuneet asiantuntijat, niin myös organisaatiossa olisi hyvä olla ymmärrystä yleisellä tasolla millaiset ongelmat vaativat minkä tyyppistä datarakennetta.

Datarakenne mallintaa jonkun kiinnostavan liiketoiminnallisen ilmiön suhteessa eri havaintoyksiköihin, aikaan tai näiden kombinaatioon.

Alla olevassa kuvassa nähdään, että liiketoiminnallisen ongelman / tavoitteen sekä käytettävissä olevien datojen suhteen täytyy käydä iteratiivisesti määrittelyä sekä datan ensivaiheen analyysiä. Tässä vaiheessa ei välttämättä vielä sitouduta tiukasti johonkin tiettyyn metodologiseen kokonaisuuteen.

 

Kolme suurta kokonaisuutta datarakenteina ovat:

  • Poikkileikkaus
  • Aikasarja
  • Paneeli / kohortti / pitkittäisaineisto

Tässä esityksessä nuo datarakenteet pitää ajatella pikemminkin loogisina kokonaisuuksina, eikä vielä oteta kantaa siihen tarkoitetaanko rakenteella jotain tietokoneohjelman muistissa olevaa tietyn ohjelmointikielen alkeisobjektia vai tietokantataulua. Todellisuudessa tietokantataulukin on abstraktio, jossa data säilytetään tiedostoissa ja ohjelmisto huolehtii sen datan tuomisesta hyödyntävän ohjelmiston käyttöön.

 

Poikkileikkaus

Poikkileikkaus on datarakenne, jossa on P kappaletta erilaisten muuttujien yksittäistä havaintoa N kappaleelle eri havaintoyksiköitä. Havaintoyksikkö voi olla kotitalous, yritys, yrityspäättäjä, yksittäinen henkilö tai vaikkapa kone IoT – sovelluksissa.

Poikkileikkausrakenne ei suoraan sisällä havaintoyksiköiden osalta ajan suhteen minkään tyyppistä suhdetta, mutta epäsuorasti noiden P muuttujan aikaikkunoinnilla voidaan saavuttaa tilanne että ne kuvaavat havaintoyksiköiden havaintohetkeä edeltävää historiaa.

Joissain tilanteissa jotkut muuttujista voivat kuvata tulevaisuutta havaintohetkeen nähden eli nykyhetkeen verrattuna havaintohetki on menneisyydessä. Esimerkkinä vaikka lainahakemus, jonka kohdalla myönnettyyn luottoon liittyvät maksuerä saattaa jäädä maksamatta havaintohetkeä seuraavan 200 päivän aikana. Tällaisessa tilanteessa havaintohetki olisi 200 päivää menneisyydessä nykyhetkeen verrattuna.

Yksittäiset havaintoyksiköt tai niiden käytös ei välttämättä ole riippumatonta toisista havaintoyksiköistä, esimerkiksi kotitalouteen kuuluvat henkilöt voivat tehdä jonkun yrityksen suhteen asioita samalla tavalla. Esimerkiksi irtisanoa sopimuksensa yhtä aikaa.

Aikasarja

Aikasarjarakenne kuvaa yksittäisen aikasarjan havaintoa yhdestä muuttujasta T aikaperiodin yli. Jos K kappaletta eri aikasarjoja yhdistetään matriisiksi niin saadaan tilannee, jossa on KT havaintoa seurattuna T aikaperiodin yli.

 

Aikasarjat ovat perinteisiä ekonometriassa, tilastotieteen sovellusalueessa taloustieteessä, käytettyjä datarakenteita.

 

Aikasarjoissa esiintyy lähes aina peräkkäistä ja sarjojen välistä riippuvuutta  sekä toisaalta kausivaihtelua eli sarjan riippuvuutta kaudesta S, jona havainto mitataan.

  • autokorrelaatio kuvaa sarjan riippuvuutta sen omasta historiasta
  • ristikorrelaatio kuvaa sarjan riippuvuutta toisen sarjan historiasta tai nykyisestä tilasta
  • kausivaihtelu kuvaa sitä, että on mielekkäämpää verrata sarjan nykyistä tasoa M aikaperiodia sitten olleeseen tasoon eikä tasoon juuri välittömästi aiempina aikaperiodeina.

IoT – datan rakenne on luontevasti aikasarja, vaikka sen voisi mallintaa myös poikkileikkauksena tai paneelina.

Paneeli

Paneelissa yhdistää poikkileikkaus – ja aikasarjarakenteiden ominaisuuksia, koska tässä on jokaisesta N havaintoyksikön P muuttujasta dataa yli T aikaperiodin.

Paneelidatarakenteen käyttö edellyttää näistä eniten metodologista osaamista, koska ajalliset sekä havaintoyksiköiden väliset riippuvuudet ovat selkeästi hankalampia ottaa huomioon.

 

Lopuksi

Erilaiset ongelmat vaativat erilaisia datarakenteita ja asettavat tiukat ehdot lähtödatan luonteelle. Jokaisella organisaatiolla, aivan pienempiä yrityksiä lukuun ottamatta, tulisi olla yleisellä tasolla ymmärrystä siihen millaisia datarakenteita erilaisiin heidän liiketoimintansa ongelmiin / tavoitteisiin pitää käyttää.

Ready Solutions Oy on tiedonhallinnan asiantuntijayritys, joka pystyy auttamaan teitä tässä. Ota yhteyttä ja pohditaan yhdessä tiettyä tavoitetta vastaava ratkaisu.

Analytiikkaa, liiketoimintaa vai sovelluskehitystä?

Data Science on ohjelmistokehittäjien ja konsulttien hallitsemaa ilmatilaa

LinkedIniä seuraamalla voisi helposti ajatella että kotimaassa pääasiassa suuremmat konsulttiyritykset ja muut ohjelmistokehittäjät tekevät analytiikkaa, mutta todellisuudessa sitä tietysti tehdään eri organisaatioissa eri lähtökohdista.

Isommat ei-ohjelmistokehitysorientoituneet organisaatiot ovat saattaneet jo vuosia sitten hankkia
SAS tai SPSS Modeler – ohjelmistoja, joilla liiketoimintalähtöiset data-analyytikot ovat tehneet
analytiikkaprosessejaan. Pankit, vakuutusyhtiöt, julkaisijat sekä teleoperaattorit ovat tällaisia perinteisten analytiikka-alustojen käyttäjiä.

Ohjelmistokehittäjillä ja meillä konsulteilla on työkalupakki yleensä laajempi, mutta olemme kauempana liiketoiminnan käytännöistä. Oman kokemukseni mukaan taloudellisen mallin rakentaminen osaksi analytiikan tulosten arviointia saa paremman vastaanoton, kuin pelkkien
tulosten esittely ilman tuollaista sidosta.

 

Mitä on analytiikka?

Analytiikka on oikeastaan liiketoiminnan kehittämisen ja johtamisen apuväline, joka eroaa perinteisestä  operatiivisesta tai strategisesta raportoinnista siinä että erilaisia mitattujen ilmiöiden
vaikutussuhteita ja ennusteita pyritään tuottamaan algoritmien avulla. Datavisualisointi on taas luonteeltaan erilaisten ilmiöiden tarkastelua ihmisten oman havainto – ja jäsennyskyvyn asettamissa rajoissa.

Tilastotieteessä ja sen sovellusalueissa eri tieteissä oletetaan useimmiten taustalle joku satunnaisprosessi, jonka parametrit ovat tiedossa mutta jonka arvot pyritään datasta estimoimaan. Tai parametrit ovat satunnaismuuttujia, jos asiaa lähestystään bayesilaisen tradition näkökulmasta.

Liiketoiminnan data-analytiikka taas kokoaa yhteen työkaluja tietojenkäsittelytieteestä, tilastotieteestä ja sovelletusta matematiikasta. Tarkoitus ei ole tehdä tiedettä vaan tuottaa käyttäjäorganisaatiolle taloudellista hyötyä, joten metodologian kohdalla ei yleensä olla sitoutuneita johonkin yksittäiseen lähestymistapaan.

Datan ja liiketoiminnan vuoropuhelu

Organisaatioilla on dataa eri muodoissa, eri määriä ja syntyen eri liiketoimintaprosessien seurauksena. Joissain tilanteissa ulkoisten datalähteiden hyödyntäminen on tärkeässä roolissa, esimerkkinä nyt vaikkapa luotonanto jossa hyödynnetään luottotietorekisterien pitäjien datoja.

Ehkä tärkein asia analytiikan tekemisessä on se, että liiketoiminnallinen ongelma on ymmärretty ja tiedetään mitä lähdetään tavoittelemaan.

Asiantuntija, joko organisaation oma tai ulkopuolinen, pystyy arvioimaan miten käytettävissä oleva data kelpaa liiketoiminnallisen ongelman ratkaisemiseen.

Integraatiota ja perspiraatiota

Iso osa työstä on datan kanssa painimista, ekonomisteilla on vitsi että data tunnustaa kunhan sitä
kiduttaa riittävän pitkään ja se taitaa joskus pitää paikkansa.

Varaudu kehittäjänä siihen että inspiraation ja perspiraation suhteet voivat olla vääristyneet suhteessa omaan käsitykseesi työkuvasi sisällöstä.