Mašininis mokymasis (ML) per pastaruosius kelerius metus tapo svarbia tema, tačiau ko nesuprantate, mašininio mokymosi koncepcija egzistuoja dešimtmečius. Iki šiol naudotos mašininio mokymosi sistemos yra pagrįstos žmogaus smegenų modeliu. aprašyta Donaldas Hebbas savo knygoje „Elgesio organizacija“ 1949 m.

Kai smegenų ląstelės šaudo pasikartojančiu pavidalu, susidaro arba išsiplečia sinapsiniai mygtukai, jei jie jau yra, sakė Hebbas. Tas pats principas galioja ir skaitmeninio neuroninio tinklo mazgams. Mazgai plėtoja santykius, kurie sustiprėja, kai jie aktyvuojami tuo pačiu metu, ir susilpnėja, kai šaudoma atskirai. Mokymasis sustiprinti yra mašininio mokymosi forma, paremta šia koncepcija, tačiau netrukdykime sau.

"Tyrimas yra automatiškai pagerinti mašininio mokymosi patirtį naudojant kompiuterinius algoritmus." Tomas Mitchellas

IBM programuotojas ir dirbtinio intelekto pradininkas Arthuras Samuelis 1952 metais sukūrė terminą „mašininis mokymasis“. Samuelis parašyta Šaškių žaidimų programa, kuri „išmoko“ ir žaidė geriau. "alfa-beta budama"Tai įvertina lentą pagal gabalų padėtį ir abiejų pusių laimėjimo galimybes. Šis modelis peraugo į" Minimax "algoritmą, kuris vis dar mokomas.

Per kelis dešimtmečius kiti pionieriai sujungė, pritaikė ir pritaikė Hebbo ir Samuelio modelius (ir juos taikys) įvairioms programoms. Pavyzdžiui, Frankas Rosenblattas 1957 m pastatytas Pažymėkite 1 jutiklį, vieną iš pirmųjų vaizdo atpažinimo mašinų ir pirmąjį sėkmingą neurokompiuterį.




Daugelis programų, tokių kaip kalbos ir veido atpažinimas, duomenų analizė, natūralios kalbos apdorojimas ir net įspėjimai apie sukčiavimą mūsų el. Laiškuose, yra pagrįsti šių novatorių darbu.




Marcello Pelillo 1967 m., Po dešimties metų pažengęs „artimiausio kaimyno taisyklė“ modelio atpažinimui. Artimiausias kaimyno algoritmas yra šiandienos GPS žemėlapių programų senelis. Kiti ir toliau kūrė šiuos pamatus, kurdami daugiasluoksnius suvokimo nervinius tinklus 1960 m nugaros sklidimas Tai, ką tyrėjai 1970 m. Panaudojo giliųjų nervų tinklų mokymui.

Visi šie ankstesni tyrimai buvo kertiniai šiandien tęsiamų tyrimų akmenys. Daugelis programų, tokių kaip kalbos ir veido atpažinimas, duomenų analizė, natūralios kalbos apdorojimas (kalbos sintezė) ir net įspėjimai apie sukčiavimą mūsų el. Laiškuose, yra pagrįsti šių novatorių darbu. Šiandieninė automatika beveik kiekviename ekonomikos sektoriuje išryškino mašininį mokymąsi, tačiau jis visada vyksta fone.




Kas yra mašininis mokymasis?

„Academia“ nenustatė standartinio mašininio mokymosi apibrėžimo. ML taikymo sritis yra plati ir ji nėra lengvai sujungiama į sakinį, nors kai kurie tai bando.




MIT apibrėžimas skaitytojas"Mašininio mokymosi algoritmai naudoja statistiką, kad surastų modelius dideliame duomenų kiekyje, įskaitant skaičius, žodžius, vaizdus, ​​paspaudimus, kas yra jūsų. Jei tai galima išsaugoti skaitmeniniu būdu, ją galima įtraukti į mašininio mokymosi algoritmą."

„Mašinų mokymasis yra mokslas, kaip priversti kompiuterius judėti be aiškaus programavimo“, - Stanfordo mašininio mokymo kursas paaiškina o.




Beje, Carnegie Mellon sako, "Mašinų mokymosi sritis" Kaip įdiegti kompiuterines sistemas, kurios automatiškai tobulinamos atsižvelgiant į patirtį ir kokie yra pagrindiniai dėsniai, reglamentuojantys visus mokymosi procesus? " "

Praktiniais tikslais galime sumesti šiuos ingredientus į savo puodą ir išvirti:

Mašininis mokymasis apima kompiuterio, turinčio daugybę atvejų, mokymą priimti loginius sprendimus, pagrįstus ribotu duomenų kiekiu, kaip įvestį, ir pagerinti šį procesą naudojant.




Ne visi „mąstantys“ kompiuteriai yra lygūs

Mes girdime daugybę kitų terminų, iškeltų diskusijose apie mašininį mokymąsi, ypač dirbtinį intelektą ir gilųjį mokymąsi. Nors šie laukai yra susiję, jie nėra vienodi. Suprasti santykį tarp šių technologijų yra raktas norint sužinoti, kas yra mašininis mokymasis.

Dirbtinis intelektas, mašininis mokymasis ir gilus mokymasis yra trys kartu sujungtos informatikos kategorijos. Taigi, mašininis mokymasis yra dirbtinio intelekto pogrupis, o gilus mokymasis yra ML pogrupis (žr. Diagramą).

generolas dirbtinis intelektas Tai instrukcijų rinkinys, nurodantis kompiuteriui, kaip elgtis ar rodyti į žmogų panašų elgesį. Tai, kaip jis reaguoja į įvestį, yra užkoduotas, ty „Jei taip atsitiks, atlikite tai“. Bendra nykščio taisyklė yra ta, kad kai AI aiškiai nurodoma, kokius sprendimus priimti, programa yra už mašininio mokymosi srities ribų.

Mašininis mokymasis yra dirbtinio intelekto pogrupis, galintis veikti savarankiškai. Skirtingai nuo bendro intelekto, ML algoritmui nereikia pasakyti, kaip interpretuoti informaciją. Paprasčiausi dirbtiniai neuroniniai tinklai (ANN) susideda iš vieno mašininio mokymosi algoritmų sluoksnio (žr. Toliau).

Kaip ir vaiką, jį reikia mokyti naudojant paženklintus ar įslaptintus duomenų rinkinius ar įvestį. Kitaip tariant, kai pateikiami duomenys, reikia pasakyti, kas tai yra, tai yra, tai yra katė ir tai yra šuo. Ginkluota šia informacija, ANN gali atlikti savo užduotį be aiškių nurodymų, kad galėtų padaryti išvadas ar išvadas.

Gilus mokymasis yra dirbtinio intelekto ir mašininio mokymosi pogrupis. Šios struktūros susideda iš kelių ML algoritmo sluoksnių. Dėl šios priežasties jie dažnai vadinami „giliaisiais neuroniniais tinklais“ (DNN). Įvestis perduodama per sluoksnius ir pridedama kiekviena kvalifikacija ar etiketė. Štai kodėl norint giliai mokytis, nereikia komentuoti iš anksto suklasifikuotų duomenų.

Mes iš karto ištirsime ML ir DL skirtumus.

Kaip išmokti dirbtinius neuroninius tinklus?

Nesvarbu, ar kalbame apie vieno sluoksnio mašininį mokymąsi, ar apie giliuosius neuroninius tinklus, abiem reikia mokyti. Nors kai kurias paprastas ML programas, dar vadinamas studentais, galima mokyti naudojant palyginti nedaug informacijos pavyzdžių, tačiau norint tinkamai veikti, daugumai duomenų reikia įvesti daug.

Nepaisant pradinių apmokytos ML sistemos poreikių, kuo daugiau pateiktų pavyzdžių, tuo geriau ji veikia. Giliai besimokantiems žmonėms paprastai reikia daugiau informacijos nei vienos pakopos ML, nes jie neturi ką pasakyti, kaip klasifikuoti duomenis. Neretai sistemos mokymams naudoja duomenų rinkinius, kuriuose yra milijonai ar šimtai milijonų pavyzdžių.

Tai, kaip ML programos naudoja šį didelį duomenų kiekį, priklauso nuo to, koks mokymosi tipas naudojamas. Šiuo metu yra trys mokymosi modeliai, prižiūrimi, neprižiūrimi ir stiprinami. Kurį naudoti daugiausia priklauso nuo to, ką reikia nuveikti.

Vadovaujamasi mokymuisi

Vadovaujamas mokymasis nėra tas, ką reiškia jo pavadinimas. Operatoriai nesėdi dirbdami, stebėdami mokinį ir prisitaikydami prie klaidų. Prižiūrimas mokymas reiškia, kad įvesties duomenys turi būti pažymėti etiketėmis arba klasifikuoti, kad algoritmai galėtų atlikti savo darbą. Sistema turi žinoti, kokie yra įvesties duomenys, kad suprastų, ką daryti.

Vadovaujantis mokymasis yra labiausiai paplitęs ML mokymo metodas ir naudojamas daugelyje įprastų praktikų.

Pavyzdžiui, daugelis paslaugų, tokių kaip „PlayStation Network“, „Netflix“, „Spotify“ ir kitos, naudojasi šia paslauga, kad sukurtų automatiškai pasirinktus sąrašus pagal vartotojo pageidavimus. Kiekvieną kartą, kai vartotojas perka žaidimą, žiūri filmą ar groja dainą, ML algoritmai įrašo ir analizuoja šiuos duomenis bei jų žymas, tada ieško panašaus turinio. Kuo daugiau naudojama paslauga, tuo geriau sistema sužino ir nuspėja, ko nori vartotojas.

Neprižiūrimas mokymasis

Neprižiūrint mokytis nereikia žymos. Tokiu atveju studentas ieško modelių ir kuria savo kategorijas. Pavyzdžiui, jei jis maitina šuns atvaizdą, jis negali jo taip klasifikuoti, nes nėra duomenų, kurie jam pasakytų, kas nutiko. Vietoj to, jis žiūri į tokius dalykus kaip formos ar spalvos ir sukuria pagrindinę klasifikaciją. Mityba iš daugiau duomenų, tai gali pagerinti šunų profilį ir sukurti papildomas žymas, skiriančias juos nuo kitų objektų ar gyvūnų.

Vieno sluoksnio ML sistemos nėra efektyvios dirbant su nepažymėtu įvestimi. Dalis to, kad informacijai suprasti reikalingi gilūs neuroniniai tinklai. Daugiasluoksniai tinklai yra tinkamesni tokio tipo manipuliavimui, nes kiekvienas sluoksnis atlieka tam tikrą funkciją su įvestimi, prieš perduodamas kitam sluoksniui su jo rezultatais. Neprižiūrimas mokymasis laikomas nedažna ugdymo forma, nes ANN yra daug labiau paplitę nei DNN.

Tačiau yra gerai žinomų ML sistemų, kuriose naudojamas neprižiūrimas mokymasis, pavyzdžių. „Google Lens“ naudoja šį mokymosi metodą objektams atpažinti statiniuose ir gyvuose vaizduose. Kitas pavyzdys yra algoritmai, kuriuos kibernetinio saugumo įmonė „Darktrace“ naudoja vidaus saugumo nuotėkiams aptikti. „Darktrace“ ML sistemoje neprižiūrimas mokymasis yra nepanašus į žmogaus imuninę sistemą.

Generalinė direktorė Nicole Eagan „Žmogaus kūnas labai panašus į savo imuninę sistemą“ pasakojo MIT technologijų apžvalga. "Kadangi tai yra gana sudėtinga, jis turi įgimtą savęs, o ne savęs, jausmą. Ir radęs kažką, kas nepriklauso - tai nėra spontaniškai, - jis reaguoja itin jautriai ir greitai.

Sustiprinimo mokymasis

Trečiasis mokymo metodas taip pat susijęs su nepažymėtais duomenimis. Dėl šios priežasties mokymasis sustiprinti naudojamas tik giliai besimokantiems. Tiek neprižiūrimos, tiek valdomos sistemos apdoroja duomenis su konkrečiais iš anksto nustatytais tikslais. Kaip jie pasiekia šiuos tikslus, skiriasi algoritmai.

Skirtingai nei neprižiūrimi besimokantieji, dirbantys pagal tam tikrus parametrus, norėdami juos pasiekti iki galutinio tikslo, mokymasis stiprinant naudoja balų sistemą, kad pasiektų norimą rezultatą.

Algoritmai išbando įvairius būdus, kaip pasiekti savo tikslus, ir yra apdovanojami ar baudžiami, atsižvelgiant į tai, ar jų požiūris yra efektyvus, ar neefektyvus siekiant galutinių rezultatų. Sustiprinimo mokymai labai tinka mokyti dirbtinio intelekto, kaip žaisti ir kaip žaisti. Go, Šachmatai, Dota 2arba „Pac-Man“.

Ši švietimo sistema yra panaši į žaidimą „Hot & Cold“ su mažyliu. Jūs paprašote vaiko surasti kamuolį ir, kaip atrodo, nukreipiate jį į pastiprinimo žodžius „šiltesnis“ ir „vėsesnis“, atsižvelgiant į tai, ar jis priartėja prie kamuolio, ar ne. Naudodamas neprižiūrimą mokymąsi, mažylis turėtų surasti kamuolį vadovaudamasis iš anksto nustatytu žemėlapiu ar instrukcijomis. Bet kokiu atveju vaikas vis tiek turi sužinoti, kas yra kamuolys.

Mokymasis sustiprinti yra naujausia ML sistemų mokymo forma, pastaraisiais metais atlikta daugiau tyrimų. Kaip minėta anksčiau, Arthuro Samuelio 1952 m. Šaškių žaidimas buvo ankstyvoji mašinų mokymosi forma. Tokie gilūs mokiniai kaip „Google“ „AlphaGo“ ir „OpenAi“ „Dota 2“ robotas „Penkios“ dabar, sumušti profesionalus Žmogaus aktoriai žaidimuose yra daug sudėtingesni nei šaškės.

Mašinų mokymasis šiandien ir rytoj

Nors mašininis mokymasis egzistuoja dešimtmečius, pastaraisiais metais matėme tik didelį spaudimą dėl praktinių pritaikymų naudojant šią technologiją. Tikėtina, kad naudojate įrenginį ar programą, pagrįstą ML algoritmais. Akivaizdus pavyzdys yra įvairios programos, tokios kaip išmanieji telefonai, balso padėjėjai, žemėlapiai ir mankštos stebėjimo priemonės. Yra ir kitų naudojimo atvejų, kurie yra mažiau akivaizdūs, tačiau gali padaryti nuostabių dalykų.

Stebėjimo sistemos toli gražu nėra paprastos montuojamos vaizdo kameros, kurias šiandien stebi apsaugos darbuotojai. Pažangios sistemos dabar naudoja mašininį mokymąsi, kad automatizuotų įvairias užduotis, įskaitant įtartino elgesio nustatymą ir asmenų sekimą atpažįstant veidą.

Daug metų dirbęs „Nevada“ kazino, iš pirmų rankų pamačiau stebėjimo sistemą, kuri ne tik pažymėjo potencialius apgavikus, bet ir stebėjo įtariamąjį kazino ir automatiškai įsijungė pagal tai, kuri kamera yra matoma. Buvo puiku žiūrėti stebėjimo sistemą, stebinčią kazino ir net automobilių stovėjimo aikštelę be jokio žmogaus įsikišimo.

„Pasaulyje baigiasi skaičiavimo pajėgumai. Moore'o įstatymas šiek tiek baigiasi ... norint sukurti visas šias turtingas patirtis, visas šias dirbtines intelektus, apie kuriuos kalbėjome [mums reikia kvantinio skaičiavimo] “- Satya Nadella, „Microsoft“ generalinis direktorius.

Šiandien matomos mašininio mokymosi programos jau stulbina, bet kokia ateitis? Dirbtinio intelekto laukas dar tik pradeda atsiverti.

Mašininio mokymosi ir giluminio mokymosi algoritmai turi begalę galimybių augti, ir esame įsitikinę, kad per ateinantį dešimtmetį vartotojų ir įmonių rinkose išvysime dar daugiau praktinių programų. Tiesą sakant, „Forbes“ Pastabos Kai 82 proc. Rinkodaros lyderių perima mašininį mokymąsi, kad pagerintų personalizavimą, galime tikėtis, kad ateityje ML bus naudojamas komerciškai, pritaikant tikslinę reklamą ir paslaugas.

Kitas didelis sprogimas greičiausiai bus kvantinis mašinų mokymasis. Tokie mokslininkai kaip MIT, IBM ir NASA eksperimentavo taikydami kvantinį skaičiavimą mašinų mokymuisi. Nenuostabu, kad kai kurios problemos išspręsta per daug trumpesnį laiką nei šiuolaikinė apdorojimo įranga. „Microsoft“, ve „Google“ Neseniai ji paskelbė, kad jie planuoja žengti į priekį kvantinės ML srityje, todėl artimiausiu metu tai išgirsime ir pamatysime daug daugiau.

Apibūdinantis