Synteettinen data

algoritmien avulla keinotekoisesti luotua aineistoa, joka ei perustu todellisiin havaintoihin tai ilmiöihin
(Ohjattu sivulta Keinoälyn luoma data)

Synteettinen data on aineistoa, joka on keinotekoisesti luotu, eikä sitä ole tuotettu todellisista ilmiöistä tai havainnoista.[1]. Synteettistä dataa luodaan tyypillisesti algoritmien avulla, ja sitä voidaan käyttää matemaattisten mallien toimivuuden varmistamiseen ja koneoppimismallien kouluttamiseen[1] Synteettistä dataa käytetään monilla eri aloilla tietojen suojaamiseen. Tämä on tarpeen, koska muutoin tietojen luottamuksellisuus vaarantuisi. Vaikka arkaluonteisia tietokokonaisuuksia on olemassa, niitä ei voida luovuttaa suurelle yleisölle tietosuojasyistä[2]. Tämänkaltaisia tietoja ovat mm. potilasrekisterit, pankkitiedot ja sotilastiedustelutiedot[2].

Lähteet

muokkaa
  1. a b Yasar, Kinza & Laskowski, Nicole: What is synthetic data? - Definition SearchCIO. Viimeksi päivitetty maaliskuussa 2023.. TechTarget. Arkistoitu 3.12.2023. Viitattu 27.2.2024. (englanniksi)
  2. a b Nikolenko, Sergey I.: Synthetic Data for Deep Learning. Osa kirjasarjaa: Springer Optimization and Its Applications (SOIA), osa: 174. Springer, 2021. ISBN 978-3-030-75177-7. Kustantajan verkkosivut (viitattu 27.2.2023). doi:10.1007/978-3-030-75178-4. (englanniksi)