19.05.2004
Tiedon louhinnan menetelmät avuksi suurten aineistojen käsittelyssä

Tiedon louhinnan menetelmiä käytetään tilastotieteen tavoin numeerisessa muodossa olevan aineiston analysoinnissa, mutta ne pystyvät käsittelemään suurempia aineistokokoja kuin perinteiset tilastotieteelliset menetelmät. Tiedon louhinnan menetelmiä ovat kehittyneet tarpeesta analysoida mm. valtavan suuria tietokanta-aineistoja, jotka perinteisen tilastotieteen näkökulmasta ovat valikoituneita näytteitä, ja siten suuren kokonsa lisäksi jo perustaltaan ongelmallisia käsitellä.

SC-Research oli mukana Suomen Tilastoseuran järjestämillä tilastopäivillä 17.–18.5 Helsingissä. Päivillä esiteltiin tiedon louhinnan menetelmistä mm. itseorganisoituvat kartat, riippumattomien komponenttien analyysi, neuroverkot, sekä niiden käyttömahdollisuudet aineiston puuttuvien ja virheellisten tietojen käsittelyssä.

Suomen tilastoseura on vuonna 1920 perustettu voittoa tavoittelematon tieteellinen seura. Tilastoseuran tarkoituksena on edistää tilastotieteen tutkimusta, opetusta ja soveltamista sekä toimia tilastotieteilijöiden ja tilastoja tekevien henkilöiden yhdyssiteenä.


Soile Kotala

Alkuun