Sosiaalinen massadata

Sosiaalinen massadata on sosiaalisen median ja mobiilisovellusten käyttäjien vuorovaikutuksesta kerättyä massadataa.[1] Sosiaalisen massadatan avulla voidaan analysoida muun muassa sosiaalisia verkostoja, mediaa, trendejä ja mielipiteitä.[2] Esimerkiksi Facebookin ja Twitterin sosiaalisen datan avulla voidaan mitata ihmisten poliittisia näkemyksiä tai mobiililaitevalmistajien lippulaivamallien suosiota.[1]

Massadata muokkaa

Massadata on suomenkielinen vastinen big datalle, joka on suhteellisen vakiintunut termi myös suomenkielessä. Big data määritellään usein 3V-mallin avulla, sillä sille on ominaista mallin kuvaamat kolme ominaisuutta: tiedon määrän (volume) suuruus, tiedon nopea muuttumisnopeus (velocity) ja tiedon monimuotoisuus (variety).[3] Nykyaikana tieto myös muuntuu hyvin nopeasti ja tiedosta voi nopeasti tulla vanhentunutta. Lisäksi tieto on useimmiten hyvin monimuotoista, sillä tietoa kerätään monesta eri lähteestä, kuten sosiaalisesta mediasta, tuotantolinjoilta, asiakaskyselyistä jne.[4] Big data -termin käyttö tieteellisissä artikkeleissa on lisääntynyt viimeisten viiden vuoden aikana merkittävästi [3]. Tähän trendiin on vaikuttanut hyvin voimakkaasti sekä big datan lisääntynyt hyödyntäminen että sen kerääminen. Suurimpia syitä big data -ilmiön kasvuun on muun muassa kannettavien mobiili- ja kommunikaatiolaitteiden yleistyminen, datan varastointiteknologioiden kehittyminen sekä parantunut tiedonsiirtonopeus.

Sosiaalinen media muokkaa

Sosiaalinen media on joukko internetpohjaisia sovelluksia, joiden myötä käyttäjät voivat luoda ja jakaa sisältöä keskenään.[5] Sosiaalisen median alle voidaan lukea useita yksilöiden välisiä massaviestimiä, kuten Facebook, Twitter, YouTube ja Reddit. Ominaista näille kaikille palveluille on se, että käyttäjät toimivat pääsääntöisesti yksittäisinä käyttäjinä (pl. Yritysten ja eturyhmien käyttäjätilit). Sosiaalisesta mediasta on tullut yksi suurimmista ja luotettavimmista massadatan lähteistä. Suurimmat internet-palvelut tänä päivänä ovat sosiaalisen median palveluita.[4] Sosiaalisen median palveluiden suuresta määrästä ja kasvunopeudesta johtuen näistä palveluista on tullut tärkeä tutkimusaihe monilla eri tieteen aloilla.[4]

Käyttö muokkaa

Sosiaalista massadataa voidaan hyödyntää sosiaalisen median analyysityökaluja käyttäen.[1] Tällä tavoin voidaan saada apua poliittisten keskusteluiden ja mielipiteiden tutkinnassa, kuten esimerkiksi USA:n vaalien yhteydessä on tehty.[1] Tunneanalyysi on eräs analyysityökalu sosiaalisen massadatan analysoimiseksi.[1]

Kritiikki muokkaa

Sosiaalisen massadatan analysoimiseen käytetty tunneanalyysi on saanut osakseen kritiikkiä, johtuen etenkin Twitterin twiittien pituusrajoituksesta ja sisällön epäsäännönmukaisesta rakenteesta.[6] Viestien lyhyys rajoittaa ilmaisun keinoja ja siten viestien väärin tulkitsemisen mahdollisuus kasvaa. Myös esimerkiksi sarkastisten viestien tulkinta luo lisähaasteen tunneanalyysille.[6]

Lähteet muokkaa

  1. a b c d e Mukkamala, Hussain, Vatrapu: Fuzzy-Set Based Sentiment Analysis of Big Social Data. IEEE 18th International Enterprise Distributed Object Computing Conference. ISBN 978-1-4799-5470-4. Teoksen verkkoversio.
  2. Cambria, Howard, Xia, Chua: Computational Intelligence for Big Social Data Analysis. IEEE Computational Intelligence Magazine, 2016, 11. vsk, nro 3. doi:10.1109/MCI.2016.2572481. ISSN 1556-603X. Artikkelin verkkoversio.
  3. a b Gandomi, Haider: Beyond the hype: Big data concepts, methods, and analytics. International Journal of Information Management, 2014, 35. vsk, nro 2. doi:10.1016/j.ijinfomgt.2014.10.007. Artikkelin verkkoversio.
  4. a b c Bello-Orgaz, Jung, Camacho: Social big data: Recent achievements and new challenges. Information Fusion, 2016, nro 28. doi:10.1016/j.inffus.2015.08.005. Artikkelin verkkoversio.
  5. Ngai, Tao, Moon: Social media research: Theories, constructs, and conceptual frameworks. International Journal of Information Management, 2015, 35. vsk, nro 1. doi:10.1016/j.ijinfomgt.2014.09.004. Artikkelin verkkoversio.
  6. a b Khan, Bashir, Qamar: TOM: Twitter opinion mining framework using hybrid classification scheme. Decision Support Systems, 2014, 57. vsk, nro 1. doi:10.1016/j.dss.2013.09.004. Artikkelin verkkoversio.