Spatiile instruirii

Spatiile instruirii sunt:

  • Spaţiul intrarilor (spatiul problemei) este domeniul dinamic al variabilelor de intrare, in general cunoscut
  •  Spatiul iesirilor sistemului (spatiul funcţiei) este

-domeniul dinamic al variabilelor de iesire

– specificat ca și constrangere hard sau soft

  • Spatiul evaluarii (potrivirii) este:

-Spatiul in care se evalueaza “calitatea” solutiilor rezultate in urma instruirii

– In general se scaleaza adecvarea (potrivirea – fitness ) solutiei

• probleme de minimizare

• probleme de maximizare

Uneori spatial evaluarii este identic cu spatiul iesirii, alteori se fac transformari, de la spatiul iesirii la cel al evaluarii

Dificultăți ale instruirii

  •  Numar mare de variabile
  •  Functii de evaluare complexe, neliniare, variabile in timp si in spatiul parametrilor de intrare
  •  Mediu complex si variabil

Legea suficientei

Daca solutia unei probleme este:

– destul de buna (satisface specificatiile)

 – destul de rapida

 – destul de ieftina.

Instruire supervizată

Procesul de invatare (adaptare) al sistemului astfel ca el sa produca o iesire specificata ca raspuns la o intrare specificata.

 Sistemul să emuleze comportamentul descris prin exemplele intrare – ieșire, dezvoltându-și în același timp și capacitate de generalizare.

 Exista o masura directa a nivelului de potrivire

– o funcție eroare dintre ieșirea dorită și ieșirea calculată (suma erorilor pătratice, media erorilor pătratice, radicalul erorii medii pătratice, suma erorilor absolute).

– Algoritmul de instruire utilizează adeseori informații despre gradienții funcției eroare, în raport cu o suprafață a erorii mediată pentru toate exemplele intrare-ieșire într-o epocă de instruire.

Instruirea nesupervizată

Sistemul se adapteaza la regularitatile sau similitudinile naturale existente in setul de date, pentru a se realiza gruparea datelor

 Nu exista un “profesor” sau “critic” extern

 Nu exista nici o indicatie a potrivirii datelor incorporata in algoritmul de instruie nesupervizata

Interpretarea rezultatului instruirii (este bun, este utilizabil) este realizata la finalizarea instruirii

 Evaluarea “off-line” este in general realizata de un expert uman sau de un sistem inteligent.

Instruirea cu întărire

Interactiune cu un critic care furnizeaza informatii euristice pentru intarire (ajutor, sprijin, reimprospatare)

 Este necesar sa existe un fel de masura a potrivirii sau scopului

 O astfel de masura nu se poate obtine direct, dar pot exista sugestii: solutia este buna, este rea, cum este fata de o alta solutie

 Este metoda de adaptare cea mai apropiata de sistemele biologice

– animalele (inclusiv oamenii) tind sa evite comportarile ce le provoaca discomfort si tind sa caute sau sa repete actiunile care le aduc comfort.

Advertisements

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s