Begeleid leren in Apache Mahout



Supervised Learning is een techniek van machine learning, waarbij een functie wordt afgeleid uit de gelabelde voorbeelden van trainingsgegevens.

samenvoegen sorteer broncode c ++

Begeleid Leren is de methode waarbij de trainingsgegevens zowel de input als de gewenste resultaten bevatten. Het systeem trainen met voorbeelden wordt begeleid leren genoemd. Of anders kan het trainen van het algoritme met een leraar ook worden behandeld als leren onder supervisie. Nadat het algoritme is getraind met alle voorbeeldgegevens of gelabelde gegevens, die beide voorspellers op de doelvariabele hebben, kan men het algoritme trainen en het ongeziene voorbeeld gebruiken voor verdere classificatie.





Hier zijn enkele van de belangrijke kenmerken van begeleid leren in Mahout:

  • De opbouw van een goede training-, validatie- en testset (Bok) is cruciaal.
  • Deze methoden zijn meestal snel en nauwkeurig.
  • De begeleide leermethoden moeten kunnen generaliseren.
  • Ze geven correcte resultaten, wanneer nieuwe gegevens worden ingevoerd zonder dat eenprioridoelwit.
  • In sommige gevallen zijn de juiste resultaten (doelen) bekend en worden deze tijdens het leerproces als input voor het model gebruikt.

Voorbeeld van begeleid leren

Voor het geval je een missie wilt trainen en je krijgt twee verschillende groepen afbeeldingen samen met de gelabelde gegevens, bijv. op de bovenstaande afbeelding heeft de ene groep de afbeeldingen van een olifant en de andere groep die van een leeuw. Gelabelde gegevens impliceren dat elke gegevensset een doelwaarde heeft. In het bovenstaande voorbeeld bestaat de dataset uit afbeeldingen van een olifant, terwijl het label dat eraan wordt gegeven, d.w.z. 'Olifant', de doelwaarde van de dataset is. Een dergelijke gelabelde dataset wordt gebruikt voor het trainingsproces, zodat het trainingsalgoritme gebruik kan maken van deze dataset en een model kan bouwen dat verder kan worden gebruikt om de ongeziene voorbeelden te classificeren zonder de gelabelde data of doelvariabele.



Laten we eens kijken naar de kenmerken die helpen bij het identificeren van een object als een olifant of een leeuw:

De eigenschappen zou kunnen - maat, kleur, hoogte, oormaat, slurf, slagtand

Dit kan een feature set worden genoemd, die zal worden gebruikt voor het trainingsdoel. Deze functieset heeft invloed op de uiteindelijke doelvariabele. Deze variabelen staan ​​bekend als voorspellende variabelen , omdat ze ons helpen bij het bepalen van de uiteindelijke doelvariabele . De laatste variabele kan ook een label worden genoemd. De laatste variabele hier is olifant / leeuw.



wat zijn beperkingen in sql

table-word

In dit voorbeeld is elk van de records in de categorieën grootte, kleur, hoogte, oormaat, romp en slagtand een voorspellende variabele, terwijl Olifant en Leeuw de doelvariabelen zijn. Deze variabelen kunnen worden behandeld als trainingsvoorbeelden en trainingsdatasets.

Supervised Learning is dus een manier waarop je samen met de labels traint, waarbij je het algoritme vraagt ​​om er bepaalde features uit te halen, en op basis daarvan kan het algoritme, wanneer je een onzichtbaar voorbeeld ziet, het classificeren. in de juiste klas.

Heeft u een vraag voor ons? Noem ze in het opmerkingengedeelte en we nemen contact met u op.

php mysql_fetch_

Gerelateerde berichten: