HRx 2019 tapahtuma

poissaolojen ennustamista

Osallistuimme HRx 2019 tapahtumaan. Paljon mielenkiintoisia esityksiä, ja erityisesti keskustelut HR-johtajien kanssa olivat hyvin silmiä avaavia. Monella oli kiinnostusta ennustavaan HR-analytiikkaan, erityisesti poissaoloja haluttiin pystyä ennustamaan, ja niistähän toki on merkittävää inhimillistä ja rahallista säästöä saatavissa jos sairauspoissaoloja pystyttäisiin vähentämään. Myös avoin data ’paljonko sairauspoissaolot ovat keskimäärin suomessa/tällä alalla’ tuntui kiinnostavan.

Toinen asia mikä tuli esille oli se että isoillakin firmoilla voi ihan perus-HR analytiikassa olla merkittäviä ongelmia: nuppilukuja ei tahdo saada ruotuun millään. Itse uskon että perussyy tähän on osaajien vähyys Suomessa, sekä se että HR-analytiikkaa päätyy helposti tekemään HR-perusjärjestelmän toimittaja (tai palkanlaskija). Kyseinen malli ei ole toiminut oikein missään muussakaan asiassa, esim. talousraportoinnissa, ja perussyy on se että analytiikka/raportointi on hyvin erilaista ajattelua kuin perusjärjestelmän pyörittäminen.

 

Ennustetietokanta

Useissa projekteissa on tullut eteen tilanne, jossa on olemassa toteumatietoja aikasarjoista ja niistä halutaan tuottaa ennusteita hieman eri tarkkuustasolla kuin toteumat itse ovat. Miten tällaisessa tilanteessa voisi toimia?

Esittelemme alla kaksi vaihtoehtoa, toinen näistä on melko suoraviivainen, mutta molemmat edellyttävät kuitenkin sitä, että normaalia raportointiin optimoitua dimensionaalista tietomallia hieman muokataan erillisellä linkkioliolla (”bridge-table”). Normaalisti dimensiomalli ei tue M:M tyyppisiä relaatioita, vaan kaikki relaatiot dimensioiden välillä menevät faktataulun kautta ja faktan sekä dimension relaatio on M:1.

Tämän erityisen linkkitaulun vuoksi on syytä päättää miten toteuman ja ennusteen lukuja lasketaan suhteessa toisiinsa, laitetaanko joku lisäehto voimaan?

Esimerkkinä datavisualisoinnista käytetään Power BI:n tuottamaa raporttia.

Vaihtoehto 1

Vaihtoehdon tietomalli on alempana.

 

 

Eri versioihin liittyvät ennusteet saadaan näytettyä hyvin alla olevassa kuvaajassa, koska versio on vain yksi dimensioista, jota voi käyttää luokkana. Data tulee yhdestä faktataulusta eli riveillä on sekä ennustetta että toteumaa.

 

Vaihtoehto 2

Vaihtoehdon tietomalli on alempana.

Tietomalli on hieman monimutkaisempi, mutta toisaalta ennusteita ja toteumia ei säilötä samassa taulussa. Data tulee kahdesta faktataulusta ja raportilla käytetään muutamia yhteisiä dimensioita akselien arvojen tai suodatusten määritykseen.