data mining
andmekaeve
olemus
kontekstist sõltuv valdkond ja protsess, mis
otsib suurtest andmestutest tähenduslikku teavet:
- tendentse
- mustrieid
- sarnasusi
- anomaaliaid
- sõltuvusi
on interdistsiplinaarne, ta alused on näiteks
- tehisintellekt
- masinõpe
- matemaatiline statistika
- andmebaasid
ISO 5127, ISO/TR 14873:
arvutustehniline otsinguprotsess, mis tuvastab
kvantitatiivsetes andmetes seaduspärasusi,
analüüsides neid andmeid
eri vaatepunktidest ja eri mõõtmetes,
ning liigitab neid kategooriateks,
võttes kokku võimalikud seosed ja toimed
=
computational search and retrieval process that identifies patterns by analysing quantitative data from different perspectives and dimensions, categorizing it, and summarizing potential relationships and impacts
ülevaateid
https://www.youtube.com/watch?v=QriqjCNJ6qo
https://arxiv.org/pdf/1211.5723.pdf
http://infolab.stanford.edu/~ullman/mmds/ch1.pdf
http://web.stanford.edu/class/cs259d/lectures/Session11.pdf
https://www.youtube.com/watch?v=W44q6qszdqY
https://www.youtube.com/watch?v=p5jD5clrIhQ
https://en.wikipedia.org/wiki/Data_mining
http://www.sciencedirect.com/science/book/9780123814791
http://myweb.sabanciuniv.edu/rdehkharghani/files/2016/02/The-Morgan-Kaufmann-Series-in-Data-Management-Systems-Jiawei-Han-Micheline-Kamber-Jian-Pei-Data-Mining.-Concepts-and-Techniques-3rd-Edition-Morgan-Kaufmann-2011.pdf
vt ka
- andmekaevur