Datan laatu ja luotettavuus ovat dataan perustuvien päätösten tärkeimmät ominaisuudet. NodeGraph on vuonna 2016 Ruotsissa perustettu yritys, jonka tarkoituksena on parantaa asiakkaiden Qlik-sovellusketjujen ymmärrystä ja luottamusta käytettyyn dataan.

Luotettavaa dataa analytiikkatyökalujen avulla

“Tullessaan töihin Kalle ottaa kahvin toimistonsa keittiöstä, istuu työpisteelleen ja avaa Qlik Sensestä Myynti-sovelluksen. Ensimmäisenä Kalle tarkistaa uuden tuoteperheen katteen viime viikolta ja miettii, lasketaanko mukaan rahtikulut, jotka tuodaan erikseen logistiikkajärjestelmästä. Hetken lukuja pyöritelleensä hän huomaa eilisen päivän kokonaismyynnin näyttävän liian pieneltä. Kaikilta myyntipisteiltä tulee myyntiä mutta selvästi vähemmän kuin normaalin keskiviikon osalta pitäisi. Kalle laittaa Slack-viestillä Qlik-vastaavalle kysymyksen varmistaakseen, että kaikki tiedot ovat ladattu oikein ja avaa tämän jälkeen Sharepointin ja etsii kyseisen sovelluksen kuvauksen tarkistaaksensa katteen laskentalogiikan.”

Kuulostaako tutulta? Edellä kuvattu tilanne heijastaa monen yrityksen kamppailua datan luotettavuuden varmistamisesta, joka on aikaa vievää ja tehotonta. Loppukäyttäjän epävarmuuden sijaan tieto datan validoinnista on mahdollista ilmoittaa käyttäjälle heti Qlik-sovelluksen avauksen yhteydessä, jolloin käyttäjä voi tarkistaa sekä laskentalogiikan että tietolähteet helposti ja varmasti.

Laatuun ja luotettavuuteen voidaan vaikuttaa parhaiten näkyvyydellä ja automaattisilla testausvälineillä, jotka testaavat niin datan laatua kuin ratkaisuun tehtyjä muutoksia. Näihin tarpeisiin NodeGraph tarjoaa kaksi hyvää ja yksinkertaista työkalua: Data Atlaksen ja Data Quality Managerin.

Data Atlas: Qlik-latausketjun visualisointi ja dokumentointi

Data Atlas on helppokäyttöinen työväline Qlik-sovellusketjujen visualisointiin. Data Atlaksen avulla nähdään koko jalostusketju tietokantaan lähetetystä SQL-lauseesta QVD-kerroksien läpi loppukäyttäjälle näkyvään laskentakaavaan asti. Visuaalinen esitystapa on mielestäni huomattavasti selkeämpi kuin perinteinen sovellusdokumentti, jossa laskentalogiikka on pyritty kirjoittamaan auki Word-dokumenttiin. Kaiken lisäksi Data Atlas voidaan päivittää automaattisesti aina kun Qlik-latausketjut on ajettu, joten se on aina ajan tasalla. Data Atlaksen avulla voidaan helposti varmistaa, mistä tietokannan kyselyistä laskenta tehdään. Toisaalta voidaan myös tarkastaa, mitä QVD:ita tai QVD Generaattoreita ei enää tarvita.
 

 
Väitän, että manuaalisesti ylläpidettävät sovelluskuvaukset

A) Vanhenevat nopeasti ja vaativat paljon ylläpitotyötä
B) Eivät ole tarpeeksi tarkkoja tai selkeitä useimpiin tarpeisiin
C) Ovat kehittäjien mielestä ärsyttävin osa kehitystyötä

Data Quality Manager: Automaattinen datan validointi

NodeGraph on viime aikoina keskittynyt Data Atlaksen lisäksi datan laadun parantamiseen. Tätä varten on vastikään lanseerattu Data Quality Manager (DQM), joka keskittyy Qlik-sovellusten testaukseen ja datan validointiin.
 

Data quality is the goal – testing is how you get there

– NodeGraph
 

Data Quality Managerilla ja hyvin suunnitelluilla testitapauksilla voidaan varmistaa, että tuotannossa pyörivät Qlik-sovellukset sisältävät uusimmat tiedot kaikilta liiketoiminta-alueilta, lähteestä saadut tiedot ovat oikein ja laskennat Qlikissä tuottavat oikeat tulokset. Tämän lisäksi DQM voidaan valjastaa testaamaan sovellukset ennen tuotantoonvientiä kaikkien mahdollisten mittareiden osalta. Näin vältytään kehityksen aikana tehtyjen ei-haluttujen muutosten siirtämiseltä tuotantoon. DQM voi tarkistaa myös lähdejärjestelmiin tehtyjä syöttövirheitä, joten sen ei tarvitse pelkästään keskittyä Qlik-jalostusketjun tarkastamiseen.
 

 
Hyvillä työvälineillä ja oikeilla toimintatavoilla voidaan parantaa loppukäyttäjien luottamusta ja järjestelmän läpinäkyvyyttä. Näin voidaan keskittyä oikeisiin asioihin turhien sijaan.