Anàlisi i detecció de desgast en un negoci de telecomunicacions

bitcoin és un eixam de ciberestris Servir la deessa de la saviesa, alimentant-se sobre el foc de la veritat, que creix de manera exponencial cada vegada més ràpida, més ràpida, i més forta darrere d'una paret d'energia xifrada

II.6 Tècniques de dades de dades

Darrere d’aquestes anàlisis es posicionen eines en diferents tècniques. T’oferim una presentació de les tècniques més importants.

– Anàlisi de la cistella de la mestressa de casa

– raonament basat en la memòria

– Detecció automàtica de clústers

– Anàlisi d’enllaços

– Arbres de decisió

– xarxes neuronals

– Descobriment de regles

– senyal de processament

– fractals

II.6.1 Anàlisi de la cistella de llum

L’anàlisi de la mestressa de casa és un mitjà per trobar els grups de “articles que van junts durant un Transacció.Aquesta és una tècnica de descobriment de coneixements sense processats (tipus anàlisi de clústers) que genera normes que etsporten l’anàlisi de la sèrie temporal (si les transaccions no són anònimes). Les regles generades són senzilles, fàcils d’entendre i acompanyades d’una probabilitat, infectades amb una eina agradable i directament explotable per l’usuari.

Exemple: el client que compra de pintar un pinzell

El client que compra te compra dúscre

II.6.2 Anàlisi dels enllaços

L’anàlisi dels enllaços és una tècnica de descripció que inspira i es basa en la teoria de la gràfica. Consta de les entitats entre elles (clients, empreses, …) per deslox. A cada enllaç es veu afectat un pes, definit per l’anàlisi, que quantifica la força d’aquesta relació. Aquesta tècnica es pot utilitzar per a la predicció o classificació, però una simple observació del gràfic permet realitzar l’anàlisi.

II.6.3 Els arbres de decisió

Els arbres de decisió s’utilitzen en el lecadre del descobriment de coneixements dirigits. Són eines molt potents utilitzades principalment per a laclassificació, descripció o estimació. El principi de funcionament és el següent: Per explicar una variable, el sistema investiga els més decisius i retalla les poblacions de població amb la mateixa entitat de ceceritère. Cada sub-població s’analitza com a cop d’ull inicial. El model representat és fàcil d’entendre i les regles trobades són molt explícites. Per tant, el CESYSTEM és molt apreciat.

El propòsit d’aquesta tècnica és crear un eix de dedicació procedent a un anàlisi de criteri. La determinació d’aquests criteris significatius es fa segons els pesos estadístics dels valors. L’eina de vaparcurry de la mineria de dades Els diferents criteris possibles, que seran per trobar enllaços entre els camins que tinguin un problema donat.

Donem un conjunt de x els elements del qual es destaquen Xi i els atributs dels quals són quantitativa. Cada element de X està etiquetat, és a dir, s’associa amb ella una classe o un atribut objectiu que denotem pertanyent a Y.

De les anteriors, construïm unarbre dita “decisió” de manera que:

– Cada node correspon a una prova sobre el valor d’un atribut múltiple;

– cada branca que comença des d’un node correspon a uns valors d’oseja d’aquesta prova;

Els arbres de decisió són per a la laclassificació i predicció.

El seu funcionament es basa en una cadena de regles expressades en el llenguatge actual.

Un arbre de decisió és una estructura que permet un resultat des del resultat de les decisions. Per navegar per un arbre de decisió i trobar una solució de l’arrel. Cada node és una decisió atòmica. Es tindrà en compte la resposta possible i permet anar cap a un fill del node. A prop de la propera, baixem a l’Ajust per caure en un full. El full representa l’arbre que l’arbre porta al cas que acabem de provar.

– Comenceu a l’arrel de l’arbre

– Baixeu-vos a l’arbre a l’arbre passant Els nodes de prova

– El full de final a fi us permet classificar la instància provada.

Molt sovint considerem que un node s’estén sobre una variable, el valor que fa aquesta variable es pot saber sobre quins cables baixen. Per a les variables enumerades, de vegades és possible tenir un fill per valor, també es pot decidir que diverses variables diferents condueixen a la mateixa sota l’arbre.Per a variables contínues, no es pot imaginar crear un node potencialment insegurat un nombre de fils infinits, el domini continu (arrodonit, aproximació) ha de ser discreta, de manera que decideixi segmentar el domini en els conjunts. El més fàcil de l’arbre és senzill, i més aparentment ràpid utilitzar-lo. De fet, és més interessant aconseguir un arbre adaptat a les probabilitats de les variables per provar. La major part del temps un arbre equilibrat serà el resultat de la comoditat. Si un arbre només pot conduir a una solució, tot aquest subarbre es pot reduir a la conclusió sasimple, simplifica el tractament i no canvia res final.

L’algorisme ID3 va ser proposat per Quinlan el 1979 va generar Decisions de Dedo. Imagineu-vos que tenim a la nostra disposició un conjunt de registre. Tots els registres tenen la mateixa estructura, és a dir, una sèrie de parells d’atributs o valor. Un dels sesattributs representa la categoria de gravació. Leproblem és construir un arbre de decisió que la base de les respostes a les preguntes sobre els atributs no objectius pugui predir correctament el valor de l’atribut. Sovint, l’atribut objectiu només pren valors reals, false OUECKEC, èxit.

Les idees principals sobre les quals els drets són els usuaris:

En l’arbre de decisió Cada node correspon a un no atribut objectiu i cada arc a un valor de decet possible. Un full de l’eix proporciona el valor esperat de l’atribut objectiu del registre provat descrit pel camí de l’arrel de l’arbre de decisió fins al full.

En l’arbre de decisió, a cada node ha d’estar associat amb l’atribut no objectiu que proporciona la informació d’altres atributs que encara no s’utilitzen en el camí de l’arrel. (Criteri d’un bon arbre de dedicació)

L’entropia s’utilitza per mesurar la informació de la màquina proporcionada per un node. (Aquesta noció nociva introduïda per Claude Shannon durant la seva investigació va investigar la teoria de la informació que serveix de base de mètodes de mineria de dades.)

Un arbre de decisió pot ser explotada Diddore Manners:

Ø Classificant les noves dades (una noddacina per la qual entre els registres),

Ø fent l’estimació de l’atribut,

Ø mitjançant l’extracció d’un conjunt de regles de desclassificació sobre l’atribut objectiu,

Ø interpretant la rellevància dels atributs de la fulla que corresponen a un rànquing.

Fig. 4 Els arbres de decisió

a. El carro

Aquest algorisme ha estat publicat el 1984 parl.bremen. S’utilitza en moltes eines de mercat.

Procés

Ø trobar la primera bifurcació,

Ø desenvolupar l’eix complet,

Ø Mesurar la taxa d’error a cada node,

Ø Calculeu tota la taxa d’error de l’arbre,

Ø elaguer,

Ø identificar els subtrats,

Ø Avaluar els subàrees,

Ø avaluar el millor subarbre.

La primera bifurcació és la que divideix millors registres en grups. Per tant, determinar el criteri que farà el millor repartiment entre els elements, es calcula un índex de diversitat, segons la següent fórmula:

Max. De: Diversitat (abans de la divisió) – (Diversitat Son + Diversitat Diversitat Filferro)

Hi ha diferents modes de càlcul per a l’índex de dediació:

Ø min. (Probabilitat (C1), probabilitat (C2)),

Ø 2 probabilitat (C1) Probabilitat (C2),

Ø (probabilitat (C1) logprobabilitat (C1)) + probabilitat (C2) Logprobabilitat (C2))

Fig: 5 L’algoritme de Decart

Un cop establerta la primera bifurcació, de manera que tenim el node arrel que es separa a la meitat. L’entrenador és, per tant, desenvolupar l’arbre complet dividint els nous nodes creats a Lamême, i així el resultat de la divisió té un valor significatiu. El node Lenner és el node de fulla que dóna el rànquing final d’un registre.

L’arbre resultant no és necessàriament el mateix, el següent pas és calcular la taxa d’error del node. Si assumim que 11 enregistraments a 15 es basen correctament en l’assemblea d’aprenentatge, l’exploració d’aquest node és de 11/15, o 0.7333. La taxa d’error és de 1 – 0,7333 = 0,2667.El càlcul de la taxa d’error de cada node es fa, és possible calcular la taxa d’error de tot l’arbre:

t: taxa d’error d’un node

p: probabilitat Per anar al node

Taxa d’error de l’eix = (t * p)

en l’exemple, amb una taxa d’error de (15/17) per a lenotud masculí

((11/15) * 0,80) + ((15/17) * 0.20) = 0,763

El perill de l’arbre de decisió, tal com es descriu al final del primer passatge, És que certs nodesfouls no contenen suficients enregistraments per als éssers informatius. Ha de ser podat, l’ésser més complex per trobar el bon límit per aplicar.

L’elecció de les branques a suprimir, es fa mitjançant la taxa d’error ajustada d’un eix que secalitza, en cadascuna Sub Possible Arbre, de la següent manera:

El permís de les fulles

taxa d’error ajustada = taxa d’error + recompte de tuil

Un primer sota arbre és candidat quan La seva taxa d’error ajustada es torna menor o igual a la taxa d’error ajustada a tot l’arbre. Totes les branques, que no són part d’ella, SOFELS, i el procés torna a començar fins a l’arrel fins llavors.

Per tant, heu de triar entre tots els tremolors. Per això, cadascun d’ells s’executarà amb una prova sencera, la que tindrà la taxa d’error més petita serà la millor.

Finalment, controlar l’eficiència del tremolor, un conjunt d’avaluació A ell. La seva taxa d’error obtinguda donarà una estimació del rendiment de l’arbre.

Primer, utilitza punys per triar les bifurcacions més quettestes de Chi-2, que no detallarà aquí.

i Finalment, a diferència dels altres, no es desenvolupa arbre complet, i després la poda, però intenta de la transició de limitar el seu creixement.

b. L’algorisme ID3

El principi de l’algorisme ID3 per determinar l’atribut al lloc a l’arrel de l’arbre de decisió es pot expressar ara: per cercar l’atribut que s’aplica el guany de la màxima informació, el lloc a l’arrel , etape per a cada fill, és a dir, per a cada valor de l’atribut. Dit això, podem donar l’algoritmeid3.

Entrades: conjunt d’atributs A; mostra e; Classe C

Inici

Inicialitzar a l’eix buit;

Si tots els exemples d’e tenen lamême classe c

A continuació, etiqueta el parc arrel; en cas contrari, si tots els atributs estan buits

A continuació, etiqueta laracina per la classe majoritària a e;

En cas contrari, sigui el millor atribut escollit en A;

etiqueta El Para –

Per a qualsevol valor VDE a

Construir una safata de tira per v;

Let aev l conjunt d’exemples com E (a) = v ;

Afegeix l’eix construït Parid3 (A- {A}, EAV, C);

Finpour

Finsinon

Finsinon

root de retorn;

End

AnteriorSomaireSUMTANT

Deixa un comentari

L'adreça electrònica no es publicarà. Els camps necessaris estan marcats amb *