prozesu bakoitzak datuak aztertzea dakar ezagutza bila. Modu sinpleago batean egin daiteke, datu-basea ulertzeko kontzeptu estatistikoak aplikatzen dituen esplorazio analisi batekin edo ikaskuntza automatikoko modelizazioarekin. Modelizaziora pasatzen bazara, datu-zientzilariak ziurrenik eredu hori ekoizpenera transferitu beharko du, inplementaziotik.
Deploy proiektu bat amaitzeko prozesua
da , eta bertan aplikazioa egunero beste pertsonek erabiltzeko esportatzeko kodea sortzen da. Data Science proiektu bateko ML eredu baten adibidean, garrantzitsua da jendeak eredu hori nola erabiliko duen erabakitzea iragarpenak egiteko edo ereduak eta zirkunstantziak identifikatzeko.
Hori dela eta, arlo hau aztertzen duenak hedapena zer den menperatu eta optimizatzen jakin behar du. Menperatzen duzunean, eremu zehatz bat ere badago zure zain: Machine Learning Engineering.
Jarraitu beheko gaiak gaiari buruz gehiago ulertzeko.
Zer da Machine Learning ereduaren hedapena?
Hedapena eguneroko erabilerarako eredu bat prestatzeko etapa da, hau da, aplikazio handiago batera egokitzea, erabiltzaileek algoritmoa erabil dezaten.
eredua, oro har, programatzailearen makinan sortzen da edo, azken kasuetan, koadernoetan (garapen errazagoa ahalbidetzen duten inguruneak, liburutegi guztiak kargatuta) hodeian.Hala ere, ereduak ez luke hor gelditu behar. Azken finean, existitzen bada, helburu baterako sortu zen eta helburu hori azken fase bat igarotzean bakarrik beteko du.
Hori dela eta, hedapenaren ideia dugu:
garapen ingurunean sortutakoaren eta erabiltzaile arruntentzako benetako aplikazio baten arteko lotura da. Software Ingeniaritza proiektuetako azken prozesua da, adibidez, benetan saldu beharreko produktua sortzen duena. Interfazeak eta diseinua dakar,
Datuen Zientziaren eszenatokian, hedapena da eremuari negozio-arazoak benetan konpontzeko aukera ematen diona.
Demagun transakzio elektronikoetan izan daitezkeen iruzurrak aurreikusteko algoritmo bat garatu behar dugula. Inplementazioa gertatzen denean Herrialdearen posta elektronikoko zerrenda profesionalek garatutako kode guztia prestatzen dute, eragiketa berriak bertara pasa daitezen eta iragarpen hori egin dezan.
Ikaskuntza automatikoari dagokione
hedapenarekin kezka gehigarria dago: beste izaera bateko produktuak ez bezala, ML duen aplikazio batek oso azkar galtzen du kalitatea, degradazioa schnellere innovation und anpassungsfähigkeit deitzen dugun hori igarotzen baita, datuak eta errealitatea aldatzen diren heinean.Degradazioa algoritmoaren zehaztasuna galtzea da . %75eko probabilitatearekin ongi atera bazuen, orain %55 besterik ez du, adibidez. Horrela, jada ez du lehen bezainbeste laguntzen.
Imajinatu iruzurra kasua. Azterketak eta modelizazioak ziurrenik iruzur mota zehatzak zehazteko ezaugarri garrantzitsuen kopuru mugatu bat aurkeztu br lists zuen oinarri historiko batean egin ziren. Hala ere, zer gertatzen da iruzur berriak gertatzen hasten direnean, ezaugarri berriekin? Hedapena da, hain zuzen ere, gai hau zaintzen duena.
Inplementazio estrategia desberdinak
Inplementazio-ikuspegi desberdinak daude eredu bat banatzeko helburu desberdinetarako.
Lehenik eta behin, lineaz kanpoko analisiaren kasua dago, garatzailearen berezko kodean egindakoa. Ereduarekin lekuko egiaztapenetarako erabiltzen da, eskatzaileari bidali behar zaion erantzun bakarrarekin. Horren adibide da gertaera zehatz bati lotutako analisia. Mota honetan, hedapenaren nozioa ia ez da existitzen.
Loteen analisirako ere zabaldu beharra dago. Hau da, ereduaren azterketarako maiztasun erregularrean bidaltzen den datu multzoa. Adibidez: asteko analisiak.
Beste mota bat denbora errealeko analisia da. Web bidez aztertzeko API baten egoera (bi sistemen arteko komunikazio-kodea) izan daiteke . Adibidez, bezero batek web-inprimaki bat betetzen du eta mailegu batean zenbat irabazi behar duen zehazten duen azterketa baterako beharrezkoak diren datuak bidaltzen ditu. Adibide honetan, eredua kasuan kasuko webgunearen kodean inplementatutako API batera konektatuta dago.
Beste mota bat streaming-erako hedapena da, eta horrek nolabaiteko konplexutasun handiagoa dakar, uneoro iristen diren datu gehiago lantzen baititu. Analisi hauek eskaerak lehenesteko ilara-egitura bat ere eskatzen dute.
Eredua zabaltzeko prozesuaren urratsak
Pentsa dezagun weberako API bidez inplementatzeko adibide sinple bat sailkapen arazo tipiko batean – bi kategoriatan bereiztea, hala nola, bai edo ez. Beraz, urratsak hauek izango lirateke:
- Esportatu eredua: lehenik eta behin, eredua beste ingurune batera inporta daitekeen prestakuntzarekin gordetako bertsio batera esportatu behar duzu;
- Eredua inportatu : hedapen-egitura sortzeko ingurune batean, programatzaileak trebatutako eredua inportatu behar du;
- Sortu APIa : une honetan, kodea sortzen da web interfazearen inprimakietan sartutako datuak jasotzeko eta iragartzeko erabiltzen diren aldagaietara transmititzeko;
- Probatu APIa : ondoren, probatu iragarpenak egiaztatzeko sortu dena.