Mitä ”perusviiva” tarkoittaa koneoppimisen ja tietojenkäsittelyn yhteydessä?
Joku kirjoitti minulle:
Vihje: Asianmukainen lähtötaso antaa RMSE: n noin 200.
En ”t” Tarkoittaako hän, että jos harjoitustietojeni ennakoivan mallini RMSE on alle 500, se on hyvä?
Ja mikä voisi olla ”lähtötapa”?
Vastaa
Lähtötaso on hyvin perustavan mallin / ratkaisun tulos. Luodaan yleensä lähtötaso ja yrität sitten tehdä monimutkaisempia ratkaisuja paremman tuloksen saavuttamiseksi. Jos saavutat paremman pistemäärän kuin lähtötaso, se on hyvä.
Kommentit
- hyvin, mutta mitä se tarkoittaa tarkalleen mielipiteelleni? Kahdelle lainaukselleni
- Koska lähtötaso on 200, haluat paremman pistemäärän. Sinun tapauksessasi parempi pisteet tarkoittaa sitä alhaisempaa, mitä parempi. Haluat päästä alle 200. I ' m olettaen, että sinulla on regressio. Ensimmäinen asia, jota käytetään lähtötilanteeseen, olisi tavallinen pienimmän neliösumman regressio.
Vastaus
Perusviiva on menetelmä, joka käyttää heuristiikkaa, yksinkertaisia yhteenvetotilastoja, satunnaisuutta tai koneoppimista ennusteiden luomiseen tietojoukolle. Näiden ennusteiden avulla voit mitata perustason suorituskykyä (esim. Tarkkuutta) – tästä metriikasta tulee sitten vertailemaan muita koneoppimisalgoritmeja.
Tarkemmin:
Koneoppimisalgoritmi yrittää oppia funktion, joka mallintaa syötetyn (ominaisuus) datan ja kohdemuuttujan (tai tunnisteen) välistä suhdetta. Kun testaat sitä, mitat yleensä suorituskykyä tavalla tai toisella. Esimerkiksi algoritmisi voi olla 75% tarkka. Mutta mitä tämä tarkoittaa? Voit päätellä tämän merkityksen vertaamalla lähtötason suorituskykyyn.
Tyypillisiin perusviivoihin kuuluvat ne, joita tukee scikit-learn ”s” dummy ”-estimaattorit :
Luokitus perusviivat:
- ”kerrostettu”: luo ennusteita kunnioittamalla koulutusjoukon luokkajakaumaa.
- ”useimmiten”: ennustaa aina yleisimmät tunnisteet koulutusjoukossa.
- ”aiempi”: ennustaa aina luokituksen jotka maksimoivat luokan aikaisemman.
- ”yhtenäinen”: tuottaa ennustuksia tasaisesti satunnaisesti.
- ”vakio”: ennustaa aina käyttäjän antaman vakion etiketin.
Tästä on hyötyä mittareille, jotka arvioivat luokan, joka ei ole enemmistö.
Regressio -viivat:
- “mediaani”: ennustaa aina harjoitusjoukon mediaanin.
- “kvantiili”: ennustaa aina tietyn harjoitussarjan kvantiilin, joka toimitetaan kvanttiparametrin kanssa.
- ”vakio”: ennustaa aina käyttäjän antaman vakion arvon.
Yleensä haluat, että lähestymistapasi ylittää valitsemasi perusviivat. Yllä olevassa esimerkissä haluat, että 75%: n tarkkuutesi on korkeampi kuin mikään lähtötaso, jonka olet käyttänyt samoilla tiedoilla.
Lopuksi, jos käsittelet tiettyä koneoppimisen aluetta (kuten suosittelija) järjestelmät), niin valitset tyypillisesti lähtötasot, jotka ovat nykyaikaisia (SoTA) lähestymistapoja – koska yleensä haluat osoittaa, että lähestymistapasi toimii paremmin kuin nämä. Esimerkiksi kun arvioit uutta yhteistyösuodatusalgoritmia, saatat haluta verrata sitä matriisifaktorointiin – joka itsessään on oppimisalgoritmi, mutta on nyt suosittu lähtötaso, koska se on ollut niin menestyksekäs suosittelevassa järjestelmätutkimuksessa. >
Vastaus
Koska meillä on monia koneoppimisalgoritmeja, meidän on tiedettävä, mikä ML-algoritmi sopii parhaiten ongelmaan. Tämä tunnistetaan Baseline Prediction -algoritmilla.
Perustason ennustealgoritmi tarjoaa joukon ennusteita, jotka voit arvioida samalla tavalla kuin ongelmasi ennusteet, kuten luokittelutarkkuus tai RMSE.
Näiden algoritmien tulokset tarjoavat tarvittavan vertailukohdan arvioidessasi kaikkia muita koneesi oppimisalgoritmeja.
Lisätietoja varten meillä on erittäin hyvä blogi ML: stä: Mitä " baseline " tarkoittaa koneoppimisen yhteydessä?