Strojno učenje

Iz Na prostem
Pojdi na navigacijo Pojdi na iskanje

Strojno učenje (ang. Machine learning) je posebna vrsta umetne inteligence. Nanaša se na algoritme oz. navodila za reševanje naloge, ki imajo sposobnost samostojnega učenja pri uporabi podatkov, opazovanjih in komunikaciji s svetom okoli njih.
Algoritmi strojnega učenja na podlagi pridobljenih podatkov sami, brez pomoči človeških programerjev, prilagajajo začetne parametre vrednotenja in merjenja ter razvijejo lastna pravila z izdelavo statističnega prikaza okolja, ki jim je dano. Ti algoritmi ne vsebujejo podrobnih pravil, temveč navodila, kako se “učiti” in kako preseči posamezne parametre. Ta proces imenujemo tudi učenje algoritma strojnega učenja.
Algoritmi strojnega učenja so posebej uspešni pri prepoznavanju vzorcev v zelo velikih naborih podatkov kot npr. pri prevajanju besed, prepoznavanju slik ali napovedovanju borznih trendov.

Proces strojnega učenja poteka v dveh stopnjah.

Proces strojnega učenja. Vir: Chiara Ullstein
  • Na prvi stopnji učenja se s pomočjo različnih metod zbirajo in obdelujejo podatki. Obdelani podatki se uporabijo kot vhodni podatki za proces učenja. Tekom procesa se učni algoritem “uči” iz vnesenih obdelanih podatkov. Učenje zajema statistično prepoznavanje vzorcev v vhodnih podatkih in ustvarjanje novega sklopa pravil na podlagi najdenih vzorcev. Rezultat učnega procesa na prvi stopnji je nov algoritem, ki se imenuje model strojnega učenja.
  • Na drugi stopnji se model strojnega učenja aplicira na želeno področje uporabe. V fazi uporabe se v model vnesejo novi podatki, na podlagi katerih strojno učenje ustvari rezultat v obliki napovedi, prevoda, najbolj ustrezne izbire itd. Rezultat tega koraka je na primer napoved verjetnosti, da bo bolnik imel rakast tumor ali verjetnost, da bo kandidat za službo ustrezal podjetju.

Strojno učenje zagotavlja dobre rezultate v primeru, da so nabori vhodnih podatkov dovolj obežni in kakovostni. V nasprotnem primeru so lahko rezultati strojnega učenja nenatančni in slabe kakovosti, tudi pristranski. Velik izziv predstavljajo podatki, ki se nanašajo na redke pojave, omejeno število dejavnikov ali družbene okoliščine, ki jih je težko opredeliti v številkah. Struktur (vzorcev) neenakosti v napačno zbranih in obdelanih podatkih se nauči tudi algoritem strojnega učenja in jih nato vključuje v svoje napovedi. To lahko privede do pristranskih napovedi v škodo družbenih skupin, ki so na primer manj zastopane v naboru podatkov. Na koncu se lahko tudi zgodi, da si rezultate strojnega učenja napačno razlagamo.

Glej tudi:

Viri:

  • Povzeto po »Kaj je umetna inteligenca in zakaj je pomembna?« (prevod informativnega gradiva za udeležence/ke globalnega občanskega dialoga Mi, internet. Gradivo je v slovenski jezik prevedel mag. Simon Delakorda, Inštitut za elektronsko participacijo).