User:Ldpalcu/sandbox/Detectia anomaliilor in sisteme industriale. Tipuri de anomalii.

'''Detectia anomaliilor in sisteme industriale. Tipuri de anomalii.'''

Evolutia sistemelor industriale actuale este corelata cu evolutia tehnologica. Tot mai multe industrii se bazeaza pe noi tehnologii pentru a putea depasi problemele care apar utilizand metode traditionale (de exemplu, cele de natura umana). Printre aceste tehnologii se numara si cele care au la baza inteligenta artificiala ale caror rol este acela de a automatiza procesele astfel incat sa reduca numarul de probleme (erori, defecte etc.) care ar putea apara in procesele realizate in orice industrie. .

In ultimii ani, accentul a fost pus pe automatizarea proceselor industriale atat pentru eficientizare, cat si pentru reducerea costurilor. De exemplu, daca in urma unui proces de asamblare al unui produs, se descopera ca una dintre componente este defecta, atunci acest proces poate fi oprit sau reluat utilizand o alta componenta, produsul final fiind unul functionabil si satisfacator pentru client. Cand unul dintre sisteme urmeaza sa se defecteze, diagnosticarea sau prezicerea defectiunii inainte ca aceasta sa se intample salveaza atat timp, cat si reduce costurile. Acest proces de identificare a neregularitatilor poarta numele de detectie a anomaliilor. In urma cu multi ani acest proces era realizat de catre oameni, manual, fiind un proces obositor atat din punct de vedere psihic, cat si fizic, fapt ceea ce cauza erori. Prin urmare evolutia tehnologica a adus un aport substantial prin automatizarea acestor metode traditionale. Cele mai recente tehnici sunt bazate pe metode de invatare automata (Machine Learning - ML) sau chiar metode de invatare automata aprofundata (Deep Learning - DL). Datorita volumului mare date din ultimii ani si a puterii de procesare a acestora, aceste tehnici au inregistrat performante mari, depasind chiar performantele oamenilor. Algoritmii bazati pe aceste metode reusesc sa invete sabloane comune anomaliilor, astfel reusind sa le diferentieze pe acestea de restul datelor.

In acest articol se vor prezenta cateva dintre metodele actuale bazate pe inteligenta artificiala folosite pentru detectia anomaliilor in sisteme industriale, aceste idei fiind organizate astfel: o introducere a ceea ce inseamna anomalie, cat si tipul acestora; aspecte ale problemei de detectie a anomaliilor; o introducere a metodelor de invatare automata folosite in general pentru rezolvarea problemei noastre; aplicatii ale acestor metode in diferite situatii de identificare a neregularitatilor in sisteme industriale (cazuri de utilizare).

Anomalie: definitie. Tipuri de anomalii
Anomalia reprezinta un sablon in date care nu este in conformitate cu comportamentul asteptat. In diferite situatii o anomalie poate reprezenta:  o  neregularitate  intr-un  trafic  de  retea  care poate  fi  asociata  cu  infiltrarea  intr-un  calculator  personal  si transmiterea  datelor  acestuia  unei  destinatii  neautorizate;  o eroare intr-o imagine medicala de tip MRI care ar putea indica o  informatie  falsa,  de  exemplu,  prezenta  unei  tumori;  citiri eronate  ale  unor  senzori  care  ar  putea  cauza  un  accident; fisuri in tranzactiile cu carduri de credit care ar putea  revela identitatea cardului sau a detinatorului acestuia; un defect intr-un proces industrial care ar putea compromite integritatea unui produs.

Anomaliile pot fi clasificate in 3 categorii :
 * Anomalie punct: cand o instanta particulara deviaza de la comportamentul normal al intregului set de date. De exemplu, una dintre tranzactiile unui restaurant este cu mult mai mare decat restul tranzactiilor, fapt ce ar putea indica o frauda.
 * Anomalie contextuala (cunoscuta ca si anomalie conditionala): cand o instanta se comporta anormal intr-un context particular. De exemplu: un anumit senzor indica scaderea brusca a temperaturii pe perioada lunii Iunie (nu reprezinta o valoare normala pentru acest moment al anului).
 * Anomalie colectiva sau de grup: cand o  colectie  de  instante  similare dintr-un set de date nu au acelasi comportament cu restul instantelor din intregul set de date. De exemplu, o colectie de tranzactii se intampla la un anumit moment de timp, avand o valoare foarte mare fata de restul tranzactiilor.

Tipul datelor de intrare
Majoritatea datelor se afla sub forma tabulara, unde fiecare rand reprezinta un exemplu din setul de date, iar coloanele sunt trasaturi (caracteristici) specifice acestor date. Acestea pot fi univariate sau multivariate. In cazul datelor univariate, doar o variabila (trasatura) se schimba pe parcursul unei perioade de timp. Pentru datele multivariate, exista mai multe variabile (trasaturi) care se schimba in timp.

Aceste variabile (trasaturi) ale datelor pot fi de mai multe tipuri: binare (1 sau 0), numerice, string-uri sau chiar hibride.

De asemenea, exista si structuri de date complexe cum ar fi cele care prezinta o anumita relatie intre ele: secvente, relatii spatiale sau spatiale-temporale, grafuri.

Categorii de tehnici

 * Tehnici supervizate: acestea se bazeaza pe informatii care sunt furnizate de un agent extern si care necesita date care au etichete atat pt datele normale, cat si anomalii.
 * Tehnici semi-supervizate: doar datele normale au etichete.
 * Tehnici nesupervizate: Nu sunt etichete pt date. Sunt bazate pe faptul ca anomaliile sunt foarte rare in comparatie cu datele normale. Deobicei, acestea sunt reprezentate de metode de clusterizare care nu necesita meta informatii pentru instantele din setul de date.

Rezultatul tehnicilor de detecție

 * Scor:se asigneaza un scor pentru fiecare instanta. Acest scor poate  fi  reprezentat  printr-o  probabilitate.  Stabilind un anumit prag, instantele din setul de date pot fi considerate ca a fi anomalii sau nu.
 * Eticheta:Pe baza  scorului  obtinut  si  a  pragului  stabilit,nsunt asignate etichete instantelor. De exemplu, normal sau anomalie.

Evaluarea metodelor

 * Acuratetea reprezinta numarul exemplelor corect identificate din numarul total al acestora. Aceasta nu este o metrica suficienta pentru a evalua intregul pipeline de detectie a anomaliilor. De cele mai multe ori, setul de date nu este egal impartit intre datele normale si anomalii, acestea din urma fiind mult mai putine. Astfel, sunt introduse alte metrici care reusesc sa ofere o evaluare mai precisa.
 * $$ P =\frac{True\ positives + True\ negatives}{Total\ number\ of\ examples} \! $$


 * Precision: reprezinta cate dintre exemplele identificate pentru o anumita clasa au cu adevarat acea clasa.
 * $$ P =\frac{True\ positives}{True\ positives + False\ positives} \! $$


 * Recall: cate dintre exemplele unei clase au fost identificate corect.
 * $$ R =\frac{True\ positives}{True\ positives + False\ negatives} \! $$


 * F1 score: media harmonica intre Recall si Precision
 * $$ F1 =2 *\frac{Precision * Recall}{Precision + Recall} \! $$

Legenda:
 * True positives = numarul de exemple pozitive (anomalii) care au fost identificate corect.
 * True negatives = numarul de exemple negative (date normale) care au fost identificate corect.
 * False positives = numarul de exemple care au fost identificate ca fiind pozitive, dar de fapt erau negative.
 * False negatives = numarul de exemple care au fost identificate ca fiind negative, dar de fapt erau pozitive.

Pasii prezentati anterior sunt ilustrati in figura [[Media:Framework anomaly detection.png|Detectia anomaliilor: proces]].

Invatarea automata:caracteristici
Invatarea automata (Machine Learning) reprezinta un proces prin care este contruit un model. Acest model reuseste sa invete anumite sabloane care apar in diferite date de intrare fara interventia unui specialist. Aceste sabloane sunt utile pentru a intelege anumite relatii care apar intre date. Dupa cum a fost prezentat si mai in sus, in functie de tipul datelor (etichetate sau neetichetate), avem tehnici supervizate, semi-supervizate sau nesupervizate. Metodele bazate pe tehnici supervizate se impart in doua categorii: regresie (prezicearea unei valori numerice - iesirea este un scor) si clasificare (prezicerea unei clase - iesirea este o eticheta). Procesul de invatare consta in invatarea unor parametrii specifice unei functii care sunt potriviti pe un set de date specific, dintr-un anumit domeniu sau mai multe domenii. Acesti parametrii sunt actualizati la fiecare pas de invatare astfel incat eroarea sa fie minimizata. Eroarea este definita ca o functie care cuantifica cat de mult difera predictiile modelului de "ground-truth"-ul datelor reale. In cazul datelor etichetate, vom folosi eticheta pentru a putea evalua predictia modelului.

Invatarea automata aprofundata (Deep Learning) are aceleasi caracteristici ca si invatarea automata din punct de vedere al procesului de invatare, modul cum sunt impartite metodele. Diferenta consta in algoritmii folositi, care spre deosebire de ceilalti isi extrag singuri trasaturile din date, fara sa mai fie nevoie de interventie umana pentru a defini trasaturile datelor. Deobicei, aceste metode sunt reprezentate de retelele neuronale adanci (de exemplu, Neural Networks, Convolutional Neural Networks, Recurrent Neural Networks etc.).

Pipeline specific procesului de invatare automata
Acesta este alcatuit din urmatorii pasi:


 * 1) Achizitia de date si preprocesarea acestora: prin preporcesare putem intelege inlocuirea valorilor lipsa sau eliminarea acestora.
 * 2) Selectia si extragerea trasaturilor: cele mai importante caracteristici ale datelor (ex. al semnalelor) sunt identificate si extrase din date.
 * 3) Alegerea modelului: alegerea unui algoritm de invatare automata care sa fie potrivit pentru task-ul care trebuie rezolvat.
 * 4) Validare si Evaluare: evaluarea modelului creat pe un alt set de date diferit fata de cel pe care a avut loc antrenarea.

Metode de selectie a trasaturilor

 * Wrapper methods - modelele de ML sunt vazute ca fiind niste cutii negre care au ca input un subset de trasaturi. Pentru a alege cel mai optim subset, cel care are ca si rezultat o performanta mai mare a algoritmului, avem nevoie de algoritmi de aproximare, fiind o problema NP-hard. Aceste strategii pot fi: adaugare de trasaturi la un subset mic de trasaturi care sa creasca acuratetea sau eliminarea acelor trasaturi din totalul de trasaturi astfel incat performanta modelului sa creasca.
 * Embedded methods - selectia trasaturilor este realizata in timpul antrenarii modelului de ML.
 * Filter methods - sunt selectate k trasaturi pe baza performantei modelului.

Algoritmi de invatare automata
Printre algoritmii de ML, cei mai utilizati sunt:


 * K-Nearest Neighbors este o  metoda  non-parametrica. Exemplul care este clasificat primeste eticheta celor mai apropiati k vecini.  Distanta  dintre  exemplu  si  vecini  se poate calcula utilizand diferite metode, cum ar fi distanta Euclideana.
 * Support Vector Machines separa datele  de  intrare  utilizand  hiperplane,  iar  in  acelasi  timp  maximizeaza  distanta  dintre  hiperplan  si  vectorii  suport.  Vectorii  suport sunt  cele  mai  apropiate  exemple  de  hiperplan.  Aceste exemple  fac  parte  din  clase  diferite.  Cand  setul  de  date nu este linear separabil, SVM utilizeaza o functie numita kernel pentru a mapa trasaturile setului de date intr-un alt spatiu (mai mare) unde datele pot fi separate liniar.
 * Decision tree construieste un  arbore  binar,  unde  copiii fiecarui  nod  sunt  rezultatul  unei  impartiri  care  aduce cel  mai  bun  castig  de  informatie  pentru  algoritmul  de invatare. Aceasta impartire se realizeaza in urma alegerii celei mai reprezentative trasaturi (care aduce cel mai bun castig  de  informatie)  impreuna  cu  un  prag  (threshold). Exemplele  sunt  impartite  in  doua  noduri  in  functie  de valorile  trasaturii  alese  care  satisfac  pragul  gasit.  De exemplu,  daca  avem  un  prag T al  valorilor  trasaturii respective,  exemplele  sub  pragul T sunt  distribuite  in primul nod, in timp ce celelalte exemple sunt distribuite in  cel  de-al  doilea  nod.  Avantajul  acestui  algoritm  este faptul  ca  acesta e foarte usor de interpretat  fata  de  alti algoritmi de invatare automata care au un comportament de cutie neagra.
 * Random Forest este un  algoritm  similar  cu  Decision Tree.   Singura   diferenta   consta   in   numarul   de   arbori utilizati pentru a determina eroarea. Studiile au aratat ca daca  adancimea  unui  singur  arbore  este  crescuta  apare fenomenul  de  overfitting  (algoritmul  nu  mai  generalizeaza, acesta invatand foarte multe iregularitati). Pentru a  evita  acest  fapt,  algoritmul  de  random  forest  combina mai multi arbori, care sunt antrenati pe un subset de date.vSe incepe cu un arbore care este antrenat pe un subset de date, informatia rezultata fiind utilizata de al doilea arbore pe un alt subset de date si tot asa. Prin combinarea a mai multor arbori de decizie se obtine o aproximare mult mai precisa  a  datelor (se  generalizeaza  mai  bine).
 * Neural Networks sunt inspirate  din  retelele  functionale ale  creierului  si  au  fost  create  pentru  a  putea  invata si  functii  non-lineare.  Aceastea  sunt  alcatuite  din  mai multe nivele: nivelul de inceput care este reprezentat prin trasaturile  setului  de  date X=x1, x2, ..., xn,  nivelul  de iesire  al  carui  rezultat  este  un  scor  si  mai  multe  nivele ascunse care se regasesc intre primele doua nivele. Aceste nivele ascunse pot invata functii non-lineare. Procesul de invatare  este  compus  din  doua  parti:  partea  de  forward propagation (are  loc  partea  de  invatare  si  de  prezicere a unui  scor)  si  partea  de  backpropagation  (parametrii modelului  sunt  actualizati  in  functie  de  eroarea  pe  care modelul o are).
 * Retele neuronale convolutionale reprezinta o clasa a retelelor neuronale adanci folosite deobicei in analiza imaginilor. Acestea aplica o operatie de convolutie datelor de intrare (de exemplu, imagini), rezultatul acestei operatii fiind dat urmatorului nivel de convolutie. In caz ca avem o imagine de dimensiune 1000 x 1000 care are 1 milion de trasaturi, retelele neuronale nu ar generaliza destul de bine cu putine date. De asemenea, timpul de antrenament si cerintele memorie ar fi destul de ridicate. Operatia de convolutie reprezinta o solutie pentru aceasta problema, reducand numarul de trasaturi. Alte avantaje ale acestor retele ar fi faptul ca parametrii acestora sunt distribuiti ceea ce face ca aceste retele sa fie invariante la locatie, dar si sparsitatea legaturilor. Retelele convolutionale gasesc sabloane in imagini, primele nivele de inceput ale acestora recunoscand trasaturi simple precum linii, colturi etc, urmatoarele nivele recunoscand trasaturi mai complexe, precum forme geometrice.

Inspectarea calitatii produselor in diferite industrii
Defectarea componentelor unui produs de tip hardware inca din timpul procesului se asamblare a acestuia poate avea efecte negative asupra intregii linii de productie. Daca o componenta a produsului este detectata ca fiind defecta (zgarieturi, gauri) doar la sfarsitul liniei de productie, costurile de productie pot fi destul de mari, deoarece in realizarea acestui produs final au fost folosite alte componente care nu reprezentau erori. Pe deoparte daca unul dintre aceste produse ajunge la client, acest fapt va avea un impact negativ asupra vanzarilor urmatoare.

In urmatoarele paragrafe vor fi prezentate diferite aplicatii ale invatarii automate in inspectia calitatii produselor, precum si evolutia acestora: de la metode bazate pe algoritmi simpli la metode bazate pe retele neuronale.

Inspectia autovehiculelor
prezinta o metoda prin care sunt combinate domeniul de procesare al imaginilor cu cel al invatarii automate. Metoda este aplicata pentru detectarea defectelor in industria automobilelor. Dupa asamblarea automobilului, acesta este introdus intr-un laborator de inspectie unde sunt amplasate mai multe camere care vor prelua datele necesare. Acest sistem de inspectare a autovehiculelor este alcatuit din doua parti:
 * 1) Partea de achizitionare a imaginilior (partea hardware) : surse de lumina, camere industriale, lentile, cat si un sistem de control al miscarii autovehicului alcatuit din balustrade, servo-controler, servo driver si servo motors. Aceste sisteme se ocupa de miscarea si pozitionarea masinii astfel incat camerele sa reuseasca sa capteze toate partile masinii care urmeaza a fi inspectate. Componenta cheie a sistemului propus este o camera “GCP4241 GigE Vision plane-array CCD (SMARTEK Vision, Cakovec, Croatia)” care are 12 Mpx (4240 x 2824) la o rata a cadrului de 9 fps, fiind perfecta pt obiecte care se misca, lumina putina.
 * 2) Partea de prelucrare si clasificare a imaginilor alcatuita din urmatorii pasi:
 * Procesarea imaginilor: Desi au fost folosite atat surse de lumina aditionale, cat si camere care sa au o performanta buna in conditii de iluminare neadecvata, totusi apar probleme de iluminare si de variatiune a reflexiilor care au ca si rezultat ascunderea sau estomparea defectelor. Astfel, acest pas este necesar pentru a diferentia mai bine intre zonele cu defecte si imaginea de background. Pentru diminuarea acestor varaitiuni a fost folosit modelul de lumina a lui Phong ca si reper pentru a reduce componenta de reflexie speculara.
 * Binarizarea defectelor: Extragerea de zone candidat care contin defecte utilizand matricea de tip Hessian.
 * Extragerea trasaturilor si clasificarea: 5 trasaturi comune imaginilor sunt extrase: aria zonei care contine defectul (regiunea), cel mai lung si cel mai mic diametru al unui dreptunghi circumscris zonei care contine regiunea unde apare defectul, aspect ratio al celui mai mic dreptunghi circumscris, thinness ratio (similaritatea dintre zona care contine defectul si cercul care poate fi calculat utilizand perimetrul si aria). Pentru a diferentia mai bine intre defecte si pseudo-defecte (extragerea de zone candidat nu este perfecta, astfel pot aparea si pseudo-defecte), 5 caracteristici de natura statistica sunt adaugate: media, valoarea pixelilor (histograma), deviatia standard, valoarea medie a zonelor de divergenta, deviatia standard, cat si valoarea maxima a acestei zone. Pe baza acestor trasaturi extrase, s-a relizat o clasificare a zonelor candidat utilizand clasificatorul SVM, descris in sectiunea . Rezultatele arata ca acuratetea de clasificare a zgarieturilor este de 97%, in timp ce cea de detectie a gaurilor fiind de 95.6%. O posibila cauza a unei acurateti atat de mici pentru a detecta gauri poate fi atat modul in care au fost achizitionate imaginile si prelucrate, cat si existenta unor alti factori externi care sa ascunda aceste defecte.





Ca si solutii pentru o imbunatatire a sistemului, partea de prelucrare a imaginilor, cat si partea de extragere a trasaturilor ar putea fi inlocuita cu metode mult mai avansate de inteligenta artificiala care isi pot extrage singure trasaturile ceea ce ar putea duce la o creste a acuratetii (metode bazate pe Deep Learning).

Inspectia circuitelor electronice
In este prezentat un alt caz de aplicare a metodelor de invatare automata pentru realizarea inspectiei unor circuite electronice (placute cu cip). De asemenea, este ilustrata o evolutie a acestor metode, de la combinatia dintre procesare de imagini si invatare automata la invatarea automata utilizand retele neuronale convolutionale a caror acuratete este mai mare.

Prima metoda cuprinde doua parti:
 * 1) Extragerea regiunilor de interest utilizand metode de procesare a imaginilor. In cazul nostru regiunea de interest este reprezentata de cip-ul placutelor (partea neagra a placutei). Astfel, sunt aplicate operatii precum conversia imaginii intr-o imagine binara (gray scaling), transformari cum ar fi eroziunea, dilatarea, inchiderea etc. Aceste transformari sunt utile pentru a elimina zgomotul din imagine. Dupa acestea, pe baza unui sablon (avem o imagine care ilustreaza cum ar trebui sa arate portiunea care urmeaza a fi inspectata), regiunea de interest este extrasa.


 * 1) Defectele acestor chip-uri sunt detecate utilizand retele neuronale convolutionale  (de exemplu, GoogLeNet, ResNet, DenseNet). Utilizand aceste retele, se realizeaza o clasificare a regiunilor extrase in normale si anomalii. Clasificatorul primeste ca si date de intrare, atat zone care contin defecte, cat si zone care nu contin defecte.

Un dezavantaj al aceste motode este faptul ca parametrii metodelor de procesare a imaginilor trebuie schimbate de fiecare data cand conditiile de lumina de schimba sau setarile camerii, chiar si cand produsul este schimbat (in acest caz trebuie schimbat sablonul).

Cea de-a doua metoda este bazata pe o retea neuronala convolutionala (o arhitectura de tip deep learning) care reuseste sa prezica atat regiunile de interest, cat si sa le clasifice. Pentru aceasta avem nevoie de un set de date care pe langa etichete (defect si normal), exista si un bounding box care sa indice locul unde se afla regiunea de interest (in cazul nostru chip-ul). Un dezavantaj al acestei metode ar fi partea de etichetare a datelor care necesita timp deoarece volumul de date cerut de catre acesti algoritmi este si el unul destul de mare.

Pe langa partea de clasificare, au introdus in pipeline-ul lor si o parte de interpretabilitate. De multe ori, modelele bazate pe retelele neuronale (de tip black box) nu sunt direct interpretabile ceea ce duce la scaderea gradului de incredere in aceste modele de catre specialisti in domeniu. Astfel, prin interpretabilitate se obtine o harta (heatmap) care indica care zone din imagine au fost importante in clasificare.



Mentenanta predictiva
Mentenanta poate fi de mai multe tipuri:
 * reactiva - componentele sunt inlocuite cand defectele se produc.
 * preventiva - componentele sunt inlocuite la urmatoarea interventie stabilita, cu speranta ca aceasta are loc inaintea unui defect.
 * predictiva - un sistem de monitorizare va oferi informatii despre componentele care cel mai probabil se vor defecta, fapt ce permite inlocuirea lor.

Scopul monitorizarii acestor componente este de a detecta erori sau defecte atat in prezent, cat si cele care vor aparea in viitor. Pentru aceasta, trebuie sa avem atat modele de invatare automata care reusesc sa identifice o eroare sau un defect in momentul producerii acestuia, dar si modele care sa gaseasca diferite sabloane in semnalele datelor care duc la prezicerea viitoarelor erori.

prezinta cum metodele de invatare automata au fost aplicate pentru monitorizarea turbinelor eoliene. Acestea se pot afla atat pe pamant, cat si pe mare. Monitorizarea componentelor turbinelor implica identificarea schimbarilor care au loc in procesul acestora si care ar putea indica o anumita eroare sau un defect. Prezicerea acestui moment are ca si rezultat o reducere a costurilor intretinerii acestor sisteme. Printre aceste componente se numara: rotorul, sistemul de transmisie, dar si cel de producere a energiei. Acestea au cea mai mare rata de defectare decat celelalte. au analizat 300 de turbine eoliene care se afla in mare si au descoperit ca rata de defectare a acestora pe an este in jur de 10, dintre care 80% necesita reparatii minore ( <1k Euro), 17.5% reparatii majore (1-10 K Euro) si 2.5% inlocuirea acestora (>10K Euro).

Deobicei, datele sunt sub forma de semnale in timp. Senzorii care colecteaza aceste semnale sunt deobicei plasati pe diferite componente ale turbinelor astfel incat sa reuseasca sa capteze diferite vibratii, temperatura, curentii, viteza vantului. Pe langa acestea mai sunt colectate imagini cu ajurotul dronelor, dar si date sub forma de text care indica evenimentele care au loc. Astfel, apar urmatoarele provocari: volumul datelor, velocitatea, varietatea si consistenta acestora pe care modelele de invatare automata trebuie sa le depaseasca.

Dintre modelele de ML prezentate in sectiuniile anterioare, retelele neuronale sunt utilizate pentru prognoza (de exemplu, prezicerea vitezei vantului), control (ex controlarea sistemului de energie a turbinei), identificarea erorilor care ar putea sa apara (evenimente viitoare). Alti algoritmi, precum SVM sunt utilizati pentru a detecta erori care se produc in prezent. Acestea au cele mai bune reultate, deoarece reusesc sa invete functii complexe care nu sunt liniare.

Task-uri de mentenanta predictiva care au fost rezolvate utilizand metode de invatare automata:


 * 1) Utilizând metode care sunt bazate pe regresie, se poate modela curba de putere care prezinta relatia dintre viteza vantului si puterea sau energia generate de turbina eoliana. Aceste curbe de putere sunt specifice anumitor zone unde sunt plasate turbinele. Deobicei, acestea difera fata de cele care au fost produse in momentul testarii turbinelor. Prin modelarea acestei curbe de putere, se poate prezice potentialul de energie produsa pentru o anumita locatie care are ca si consecințe pozitive monitorizarea si intervenirea in momentul in care una dintre turbine se defecteaza, dar cat si optimizarea consumului de energie produsa.
 * 2) Detectare de “Brush failure” bazat pe date de tip SCADA care au fost preluate o data la 10 minute. Utilizand metode se selectie de tipul wrapper si embedded, acestia au gasit 10 semnale care sunt cele mai bune pentru a prezice acest fenomen. Clasificarea a avut loc utilizand Random Forests. Acestia eu reusit sa prezica brush failures cu o acuratete de 97.1%  inainte cu 12 h ca acesta sa aiba loc.
 * 3) Elicele turbinei sunt cele mai expuse la diferite conditii ale mediului in care sunt plasate care ar putea duce la defecte precum gauri, eroziune, schimbarea unghiului de rotatie, pierderea conexiunii cu partea care se ocupa de rotirea acestora. Deobicei, acestea erau inspectate vizual de catre oameni ceea ce reprezenta un risc destul de mare pentru acestia. Astfel, au fost colectate semnale ale vibratiilor produse de viteza de rotatie a elicelor pentru a detecta momentul cand acestea prezinta schimbari care pot duce la defectarea acestora. Au fost folosite 4 trasaturi pentru a caracteriza aceste semnale (suma valorilor, intervalul lor, deviatia standard, kurtosis). Prin utilizarea unui decision tree, acuratetea clasificarii a fost de 91.67%. Pentru detectarea gaurilor, eroziunilor s-au utilizat tehnici de procesare de imagini si invatare automata precum au fost descrise in celelalte paragrafe.

Concluzii
Metodele de detectie ale anomaliilor bazate pe inteligenta artificiala au inregistrat performante destul de mari in ultimii ani datorita atat volumului mare de date la care avem acces, cat si datorita puterii de procesare a acestora. Acuratetea acestor algoritmi depaseste uneori cea umana, reusind sa elimine factorii de risc din diferite procese industriale. Automatizarea acestor procese are ca si efecte pozitive: reducerea costurilor (prezicearea defectelor inainte ca acestea sa se produca), eficientizarea procesului industrial (pot fi inspectate un numar mai mare de produse), calitatea produselor, rata de multumire a clientilor etc. Intr-o lume a vitezei, automatizarea diferitelor procese industriale, printre care si detectia anomaliilor, prezinta un plus fata de concurenta.