Simplitatea lucrurilor complicate - Referate profesionale unice

Acasa » tehnologie » electronica electricitate
Tehnici de identificare cu ANN

Tehnici de identificare cu ANN

Identificarea sistemelor neliniare prin ANN ofera posibilitatea de a dispune de un model care reprezinta adecvat sistemul studiat. Pentru identificarea cu retele neurale se utilizeaza doua metode: modelarea directa si cea inversa a procesului. Renuntand la o abordare teoretica generala, vom prezenta cateva solutii practice.

Structura pentru modelare directa este una clasica de instruire supervizata, cu o arhitectura ca in Figura III.61. Reteaua neurala model este plasata in paralel cu sistemul, iar ca semnal de invatare este utilizata eroarea de predictie, adica diferenta dintre iesirea sistemului (acesta fiind instructorul care prescrie tinte) si cea a retelei. Natura dinamica a sistemului poate fi bine reprezentata prin retele recurente sau utilizarea in retele directe a unor neuroni cu comportament dinamic (ale caror intrari contin si valori corespunzatoare iesirilor si intrarilor trecute).

Daca sistemul este descris de urmatoarea ecuatie discreta cu diferente:

y^p(t+1)= f (y^p (t),..,y^p (t-n+1);u(t),..,u(t-m+1))

adica iesirea y^p a procesului la momentul t+1 depinde de n, respectiv m valori anterioare ale iesirii si intrarii, atunci este firesc sa alegem ca model al sistemului o ANN cu structura identica:

y^m(t+1) = f(y^p(t).,,,.y^p(t-n+1);u(t),..,u(t-m+1)) (6.33)

unde f(.) reprezinta schema neliniara de intrare-iesire a retelei. Intrarile retelei includ valorile reale ale iesirii sistemului, fara ca reteaua sa aiba reactie (in figura 6.6 aceasta este figurata numai simbolic).

Daca dupa o anumita perioada de instruire reteaua da o buna reprezentare a procesului, atunci insasi iesirile retelei si valorile lor anterioare pot fi plasate pe reactie si utilizate ca intrari ale acesteia. Astfel, reteaua poate fi utilizata independent de proces si modelul va fi descris prin:

y^m (t+1) = f(y^m(t),.,y^m(t-n+1);u(t),.,u(t-m+1))

Structura de model (6.33) este cunoscuta sub numele de serie - paralel si este avantajoasa din punct de vedere al stabilitatii. Structura (6.34) este denumita model paralel si prezinta avantajul independentei fata de perturbatiile si zgomotele de la iesirea sistemului real.

Figura III.61. Identificarea unui model direct al procesului prin ANN

Algoritmul de instruire pentru retele cu modelare directa porneste de la descrierea retelei model:

(10.634)

unde este vectorul intrarilor modelului, iar este centrul functiei gaussiene al unitatii ascunse i. Parametrii x^m_i si D^m satisfac doua conditii de interpolare: x^m_i sunt uniform distribuite peste spatiul de intrare, iar D^m sunt ajustate astfel incat, peste acest spatiu, = constant. Minimizarea erorii medii patratice intre iesirile procesului real si model se face prin ajustarea vectorului parametrilor C^m_i :

(6.35)

unde a este un parametru de amplificare. Utilizand teoria standard a sistemelor liniare se poate demonstra ca solutiile C^m_i exista intotdeauna

Modelarea inversa are doua variante. Modelarea inversa propriu-zisa sau generala (Figura III.62a) forteaza reteaua sa reprezinte inversul procesului prin aplicarea unui semnal sintetic de invatare s_s la intrarea acestuia si utilizarea iesirilor procesului ca intrari ale retelei. Eroarea utilizata de algoritmul de instruire este diferenta dintre iesirea retelei si semnalul sintetic. Metoda prezinta unele inconveniente: procedura de instruire este indirecta si complexa, semnalele de invatare trebuie sa acopere intreaga gama de intrari ale sistemului (care trebuie sa fie apriori cunoscuta), iar pentru anumite traiectorii ale sistemului se poate obtine un invers incorect.

O a doua abordare a modelarii inverse este cunoscuta sub numele de modelare inversa specializata (Figura III.62b), in care reteaua model invers precede sistemul si primeste la intrare un semnal de invatare r, care reprezinta iesirea operationala dorita a sistemului reglat (adica referinta sistemului). O a doua ANN instruita reprezinta un model direct al sistemului si este plasata in paralel cu procesul. Algoritmul de instruire prelucreaza ca eroare una din diferentele r - y^p sau r - y^m (in cazul cand perturbatiile din sistemul real sunt prea mari). Eroarea se propaga inapoi intre retelele model direct si invers, fiind ajustate numai ponderile celei din urma.

Relatia neliniara intrare-iesire pentru retelele ce modeleaza inversul procesului este:

(6.36)

adica reteaua model invers primeste ca intrari iesirile curenta si trecute ale sistemului, semnalul de referinta si valorile trecute ale intrarilor sistemului. In cazul in care instruirea inversului se face utilizand iesirea y^m a modelului direct, relatia (6.36) devine:

(6.37)

Modelarea inversa specializata este mai avantajoasa decat cea inversa propriu-zisa, pentru ca procedura de instruire este directa, bazandu-se pe eroarea intre iesirea dorita a sistemului si cea reala. Pe de alta parte insa, metoda specializata permite instruirea retelei model invers numai intr-o anumita regiune de lucru a procesului, pe cand instruirea modelului general produce un invers peste tot spatiul de operare.

Algoritmii de instruire al retelei model invers porneste de la relatiile:

(6.38)

Faptul ca modelul se poate utiliza si ca un controler este sugerat prin indicele c. Atunci cand se aproximeaza inversul modelului direct al procesului (si nu al procesului insusi), vectorul x^c(t) de intrare al retelei (daca valoarea r(t+1) este cunoscuta) este:

(6.39)

unde este centrul functiei gaussiene a unitatii ascunse i.

Figura III.62. Identificarea unui model invers al procesului prin ANN (a -modelare inversa propriu-zisa, b - modelare inversa specializata)

Algoritmii neiterativi utilizeaza intr-o prima varianta o arhitectura specializata de instruire conceputa de Psaltis, care ajusteaza coeficientii C_i^c :

Procedura de instruire utilizeaza modelul procesului, pentru a se putea calcula derivatele din relatia modelului. Pentru minimizarea erorii medii patratice intre iesirea modelului direct si intrarea controlerului se utilizeaza functia obiectiv . Daca sistemul este monoton crescator in raport cu u(t), se obtine cert convergeta spre un minim global. O varianta de algoritm neiterativ utilizeaza un semnal sintetic s_s, iar ponderile sunt definite astfel incat legea de adaptare sa nu mai apeleze la calculul unor derivate ale marimilor din proces:

(6.40)

Algoritmii iterativi utilizeaza numai modelul direct al procesului, calculul inversului facandu-se pe baza unei proceduri recursive de cautare in fiecare punct de operare. Obiectivul urmarit este gasirea unei intrari u care sa produca o iesire a modelului y^m(t+1) egala cu r(t+1).

Daca se utilizeaza metoda substitutiei succesive, obtinem:

(6.41)

Metoda este rapida si are cerinte reduse de memorie, ceea ce permite realizarea unui bun compromis intre precizia retelei instruite si viteza de convergenta.

Politica de confidentialitate

.com	Copyright © 2025 - Toate drepturile rezervate. Toate documentele au caracter informativ cu scop educational.

Tehnici de identificare cu ANN

Tehnici de identificare cu ANN

Comentarii literare

Personaje din literatura

Tehnica si mecanica

Economie

Geografie