MODELLERINGSTECHNIEKEN IN BUSINESS ANALYTICS MET R

Verschillende modelleertechnieken:

We kunnen elk probleem opdelen in kleinere processen:

c ++ sorteer nummers in oplopende volgorde

Classificatie - is, waar we de gegevens classificeren. Bijv. ziekten alle ziekten vertonen een bepaald gedrag en we kunnen ze verder classificeren.

Bijvoorbeeld: ziekten die de immuniteit verminderen, ziekten die hoofdpijn veroorzaken, enz.

Regressie - betreft het vinden van een verband tussen meerdere variabelen.

Bijvoorbeeld: hoe het gewicht van een mens verband houdt met zijn lengte.

AnomolyDetectie - is eigenlijk een fluctuatie.

Bijvoorbeeld: in het geval van hoogspanning of laagspanning.

Een ander voorbeeld kan gereguleerd gedrag zijn, waarbij wordt gereden aan de rechterkant of aan de linkerkant, afhankelijk van het land. De anomolie hier is dat iemand van het tegenovergestelde rijdt.

Een ander voorbeeld kan netwerkinbraak zijn. Hier logt een geverifieerde gebruiker in op de website van uw bedrijf, en als iemand niet-geverifieerd inlogt, is dit eenAn0moly.

Ken het belang toe - Het geeft in feite meerdere attributen, zoals lengte, gewicht, temperatuur, hartslag. Een punt om op te merken is dat al deze attributen belangrijk zijn voor een taak.

Bijvoorbeeld: Iemand probeert te voorspellen op welk tijdstip iemand op kantoor zal komen. Elk attribuut speelt een belangrijke rol, maar niet alle attributen zijn belangrijk.

Verenigingsregels - In eenvoudiger bewoordingen is het om het volgende gedrag te analyseren of te voorspellen, waarbij het draait om de aanbevelingsengine.

Bijvoorbeeld: iemand die brood koopt, kan ook melk kopen. Als we het winkelgedrag uit het verleden analyseren, hebben alle artikelen in het winkelmandje een relatie. In dat geval is de kans groot dat degene die brood koopt, ook melk koopt.

Clustering - Het is een van de oudste technieken in de statistiek. In feite kan men elk probleem altijd modelleren, of het nu gaat om classificatie of clustering, wat betekent dat vergelijkbare entiteiten worden gegroepeerd.

Bijvoorbeeld:

1) Neem een mand met appels en sinaasappels, waarin we appels van sinaasappels kunnen scheiden.

2) Een belangrijke use case voor clustering is de zorg. Vrijwel alle statistieken en analyses zijn begonnen met use cases in de gezondheidszorg. Om dieper te gaan, is er een clusteringsterm genaamd cohorten (mensen met vergelijkbare ziekten), zodat ze los van bestaande klanten kunnen worden bestudeerd. Als bijvoorbeeld 10 mensen koorts hebben en nog eens 10 mensen hoofdpijn, zullen we ontdekken wat ze gemeen hebben en medicijnen genereren.

Functie-extractie - In functie-extractie zijn nauwkeurigheid, validiteit en mislukking behoorlijk relevant. Met andere woorden, kenmerkextractie kan worden aangeduid als patroonherkenning.

Bijvoorbeeld:

Wanneer een gebruiker in Google Zoeken een term invoert, levert deze resultaten op. Nu is een belangrijke vraag die gesteld moet worden: hoe wist het welke pagina relevant en niet relevant is voor de term? Dit kan worden beantwoord met kenmerkextractie en patroonherkenning, waar het prominente kenmerken toevoegt. Laten we zeggen dat er een foto wordt gegeven, dat bepaalde camera's gezichten detecteren, gezichten markeren om mooie afbeeldingen te geven, waarbij ook functieherkenning wordt gebruikt.

Begeleid leren versus onbewaakt leren

naar) Voorspellingscategorie - De technieken omvatten regressie, logistieke, neurale netwerken en beslissingsbomen. Enkele voorbeelden zijn fraudedetectie (waarbij een computer de volgende fraude leert en voorspelt uit een eerdere geschiedenis van fraude). Bij onbewaakt leren kan men niet voorspellen met voorbeelden omdat er geen historische gegevens zijn.

b) Classificatiecategorie - Als we een voorbeeld nemen, of de transactie nu frauduleus is of niet, komt deze in de classificatiecategorie terecht. Hier nemen we historische gegevens en classificeren deze met beslissingsbomen, of als we helemaal geen historische gegevens gebruiken, beginnen we direct met gegevens en proberen we zelf functies te exploiteren. Als we bijvoorbeeld de werknemers willen kennen, die de organisatie waarschijnlijk zullen verlaten of zullen blijven. In het geval dat het een nieuwe organisatie betreft, waar we geen gebruik kunnen maken van historische data, kunnen we altijd gebruik maken van clustering voor data-extractie.

c) Verkenningscategorie - Dit is een ongecompliceerde methode om te bedenken wat big data betekent. Bij onbewaakt leren wordt dit principecomponenten en clustering genoemd.

d) Affiniteitscategorie - hierbij zijn meerdere elementen betrokken, zoals cross-sell / up sell, market basket analyse. Bij de mandanalyse is er geen begeleid leren omdat er geen historische gegevens zijn. Dus we nemen gegevens direct en zoeken associaties, sequentiebepaling en factoranalyse.

Heeft u een vraag voor ons? Noem ze in het opmerkingengedeelte en we nemen contact met u op.

Gerelateerde berichten:

Modelleringstechnieken in Business Analytics met R

De blog geeft een korte introductie van modelleringstechnieken in Business Analytics met R.

Verschillende modelleertechnieken:

Begeleid leren versus onbewaakt leren

Categorieën

Popular Articles

AWS S3-zelfstudie: duik diep in de eenvoudige opslagservice van Amazon

Datawetenschap en machine learning voor niet-programmeurs

Wat is aggregatie in Java en waarom heb je het nodig?

Overzicht van HBase-opslagarchitectuur

Java 9-functies en verbeteringen

Alles wat u moet weten over NgStyle in Angular 8

Leer hoe u Java-opdrachtregelargumenten met voorbeelden kunt gebruiken

MySQL-zelfstudie - een beginnershandleiding om MySQL te leren kennen

Python-klassen en -objecten - Objectgeoriënteerd programmeren

Wat is EJB in Java en hoe het te implementeren?

Truffel Ethereum-zelfstudie - Ethereum DApps ontwikkelen met truffel

Waarom zou een Software Testing Engineer Big Data en Hadoop Ecosystem Technologies moeten leren?