neděle 15. června 2008

Umělá inteligence v modelování a řízení - shrnutí, příprava k rozpravě o knize

úvod

matematické modely - představují vhodnou formu pro vyjádření poznatků o zkoumaných objektech a jevech, jsou efektivním nástrojem pro jejich použití a hlubší poznání

matematické analyticko - statistické modely považujeme za modely konvenční

hluboké (kvantitativní) informace - objektivní informace

precizní modely - reflektují exaktní, obecně platné přirodní zákony

modely matematické statistiky - reflektují stochastičnost, jsou postaveny na principech empirické pravděpodobnosti

často jsou ale problémy vysvětleny vágně, s pomocí těchto přístupů jsou neřešitelné, protože existující informace jsou nepřesné nebo neúplné

k těmto problémům je použit tzv. expert, který používá jako aparát svého mozku. Sice používá klasické metody, ale k porovnání nepoužívá přesně definovaných vstupů a výstupů. Používá spíše pojmovou, slovní neurčitost, vágnost.

Expert integruje hluboké ( objektivní ) znalosti se znalostmi mělkými ( subjektivními ) s efektem dosažení vyšší kvality závěrů při řešení problémů, rozhodování či řízení.

Umělá inteligence reflektuje schopnost lidského organismu, snaží se o vytvoření algoritmů a systémů, projevujících v jistém smyslu inteligentní chování a schopnosti.

Dílčí oblasti UI

- metodologie kvalitativního modelování - naivní fyzika ke kontrukci modelů postavených na integraci hlubokých a mělkých znalostí

- fuzzy modely - pro formalizaci pojmové neurčitosti a její zpracování je využíváno principů fuzzy množinové matematiky a vícehodnotové jazykové (fuzzy) logiky

Nejrozšířenějšími systémy jsou systémy expertní, popřípadě systémy využívající fuzzy inteligentní regulátory.

- kognitivní modelování - metody odrážející zákony lidské psychologie

- neuronové sítě - inspirované pochody v biologických subjektech

- genetické algoritmy - mechanismus přirozeného výběru a zákony genetiky

Modelování a umělá inteligence

Modelování je proces tvorby modelů, v němž se v konvenčních přístupech využívá matematicko-fyzikální analýza a experimenty

Model je definován jako zobrazení existujících stránek reálného systému. Identifikace je proces ztotožnění modelu s objektem. Modelování a identifikace se vzájemně prolínají.

Zkoumaný systém nazýváme procesem, určený systém nazýváme modelem. Objekt je hmotná část skutečnosti, na které definujeme systém.

Konvenční model využívá k vyjádření problému fyzikálního a matematického formálního aparátu. Jeho meze definuje dostupnost přesné a úplné informace.

Při zpracování složitých soustav se setkáváme s neurčitostí, která má 3 druhy:

  • fuzzivnost ( vágnost )
  • nespecifičnost ( špatné vymezení )
  • spor ( konflikt )

Dalším problémem je subjektivita - subjektivně zabarvené informace.

Využití znalostí v procesu modelování
- znalosti hluboké - zdrojem je vlastní poznání přírodních dějů ve formě přírodních zákonů
- znalosti mělké - dlouhodobá zkušenost, praxe, experimentování

Hluboké znalosti = kvantitativní
Mělké znalosti = kvalitativní

Využívají se v nekonvenčních nenumerických modelech.
Metaznalosti = znalosti o znalostech.

kvalitativní modely

Používáme tehdy, když nechceme nebo neumíme analyticky přesně popsat vztahy mezi proměnnými veličinami popisovaných dějů.
Kvalitativní hodnota proměnné je dána údajem o velikosti hodnoty, charakterizující polohu aktuální hodnoty proměnné vůči významným mezním hodnotám a údaji o vývojové tendenci proměnné.

Kvalitativní simulace systému spočívá v odvození kvalitativního průběhu jeho proměnných ze soustavy konfluencí, které systém charakterizují a z kvalitativních hodnot nezávisle proměnných ve zvoleném časovém okamžiku.

Kvalitativní model se může skládat ze dvou částí - hlubokých znalostí a mělkých znalostí.
Kvalitativní modelování lze tedy považovat za jednu z metod umožňující integraci znalostí.
Kvalitativní proměnná je vyjářena pomocí K-, K0, K+

semikvalitativní modely

leží mezi modelem konvenčním a modelem kvalitativním, představuje kompromis mezi přesností modelu kvantitativního a jednoduchostí, s níž lze sestavit model kvalitativní

Semikvalitativní proměnná - vyjádřena pomocí číselných intervalů.
Absorbční intervaly - reprezentují maximum a minimum semikvalitativních hodnot, které mohou být uvažovány

fuzzy modely

Slova jsou nositeli neurčitosti, zvané pojmová neurčitost, čili vágnost.
Vágnost je formalizována pomocí aparátu fuzzy množinové teorie.
Fuzzy množina je definována jako třída, která přiřazuje prvkům neurčitost pomocí vlastnosti jejich částečné příslušnosti formou tzv. míry příslušnosti.

Přirozený jazyk  má schopnost efektivního používání vágních pojmů

Jazyková proměnná - například výška stromu může být "nízký", "středně vysoký", "vysoký"

Vícehodnotová logika rozšiřuje binární 0/1 a je typickým nástrojem umělé inteligence. Používá i logické spojky konjunkce, disjunkce, odvážná konjunkce a implikace.
Jazykový model  je výrok, v němž se vykytují jména jazykových proměnných, jména jejich jazykových hodnot, logické spojky a pravdivostní hodnoty.

Prohlášení je složený podmíněný výraz.
Aproximace jazykového modelu - vycházíme z neznalosti popisované funkce, nepřenosti a omylnosti lidského myšlení, postupujeme metodou pokládání dotazů a vyvozování odpovědí - základní procedura využití expertních systémů.

expertní systémy

Nejrozšířenější fuzzy systémy, kterými jsou speciální programy používané pro řešení složitých problémů, tzv. expertní systémy.
Znalosti - vzájemně provázané a měnitelné či doplnitelné struktury souvisejících jazykově vyjádřitelných poznatků.

Expertní systémy - takové znalostní systémy, které jsou určeny k řešení odborných problémů, vyžadujících na rozdíl od všeobecných především znalosti často velmi úzce specializované.

Posláním je poskytovat závěry o stavech sledované soustavy nebo o postupech řešení úloh. Jsou získávány na základě numerických nebo jazykových informací o konkrétním stavu soustavy.

Základní třídy problémů řešených ES:
- interperetace - rozpoznání situací z údajů
- predikce - odvození očekávaných důsledků dané situace
- diagnostika - určení stavu systému z pozorovatelných projevů jeho chování
- konstruování - výběr a sestavení objektů do určitého funkčního celku
- plánování - sestavení posloupnosti akcí za účelem dosažení plánovaného cíle
- monitorování - sledování a porovnávání údajů
- ladění a opravování - výběr, sestavení a uskutečnění posloupnosti akcí odstraňující odchylky nebo chybového stavu
- učení - diagnostika, ladění a upravování vědodomostí studenta
- řízení - interpretace, predikce, monitorování a oprava chování systému

Architektura ES - báze znalosti, inferenční ( vyvozovací ) mechanismus

Uživatelské programové vybavení - až 50% kódu tvoří komunikační modul
- zabezpečení plynulého dialogu
- poskytování informace o průběhu konzultace
- poskytování informací o bázi znalostí a stavu aktuálního problému
Proces tvorby báze znalostí:
- identifikace problému,
- návrh koncepce báze znalostí,
- volba reprezentace znalostí,
- implementace,
- ladění báze znalostí,
- využívání báze znalostí

Aktivizace fuzzy modelu - pokud není nalezena odpověď, musí dojít k rozmazání (znejistění) dotazu. Je nutno definovat algoritmus procedury rozmazávání a stop-kritérium procedury rozmazávání.

fuzzy regulátory FLC

využití jazykového popisu procesu řízení a vyvozovacího kompozičního pravidla, které jsou základem teorie fuzzy regulece (FLC-Fuzzy Logic Control). Existuje podobnost mezi fuzzy pravidlovými expertními systémy a systémy FLC.

Základní myšlenkou přístupu je vtělení zkušenosti operátora do funkce regulátoru. Řídící algoritmus je reprezentován soustavou jazykových pravidel, odrážejících jeho řícící strategii, přičemž jazykové pojmy jsou reprezentovány fuzzy množinami. Hlavní výhodou takového přístupu je možnost implementace heuristických pravidel "rule of the thumb", jakož i zkušenosti a intuice jako součástí modelu procesu.

Zkušený operátor je schopen řídit složitý proces úspěšněji než automatický regulátor.

Odlišnosti FLC a expertních systémů:
- FLC jsou spíše k řízení inženýrské problematiky než k oblasti UI
- FLC jsou budovány výhradně formou řídících pravidel
- oblasti použití FLC v průmyslových procesech jsou širší než ES
- pravidla nejsou definována expertem, ale tvůrcem FLC
- vstupy jsou pravidelné informace o chování řízeného systému a výstupy jsou proměnné o velikosti akčních zásahů

Struktura a parametry systému FLC:
- blok FUZZIFIKACE - měření hodnot vstupních veličin, převod rozsahů měřených dat do odpovídajících univerz, fuzzifikace - transformace vstupních dat do formy fuzzy množin
- ZNALOSTNÍ BÁZE - báze dat (diskretace uvažovaných univerz, normalizace univerza, fuzzy rozdělení vnitřního prostoru), báze znalostí (jazyková řídící pravidla) - výběr proměnných stavu procesu a řídících proměnných, zdroje a metody odvození fuzzy řídících pravidel
- ROZHODOVACÍ LOGIKA - vyvozování fuzzy řídících zásahů s využitím příslušných fuzzy inferenčních algoritmů
- DEFUZZIFIKACE - transformace vyvozeného fuzzy akčního zásahu do obyčejné číselné formy, převod výstupních veličin do odpovídajících univerz

  • metoda maximálního kritéria
  • metoda průměrného maxima
  • metoda těžiště

Fuzzy systémy FLC

  • 1. generace FLC - 1987 v Japonsku - nejsou programovatelné - kamery, fotoaparáty, vysavače, pračky, nádoby na vaření rýže
  • 2. generace FLC - 1990 - Togai InfraLogic (USA), Omron, Fujitsu - jsou určeny pro real-time FLC aplikace - 8bitové, jsou dnes používány jako koprocesory, s jejich programováním je spojena řada problémů a omezení
  • 3. generace - standardní procesory CPU - Fuzzy-166 - Siemens a Inform, RISC-CPU, obsahuje plný rozsah standardních příkazů, dále také Fujitsu, programovací jazyky L.P.L., FuzzyLISP, FAGOL, FuzzyPROLOG

inteligentní regulátory

Využívání obecných řídících znalostí a heuristik nikoliv k přímému popisu řízení, nýbrž k nastavení a adaptaci klasického regulátoru.
Inteligentní regulátor - přístup expertního řízení využívá techniky expertního systému k implementaci co největší jeho části.

Jestliže u systémů fuzzy regulace FLC byl expertní systém využíván pro přímé stanovení velikosti akčního zásahu (a nahrazoval tedy klasický regulátor jako takový), v inteligentních regulátorech jsou expertní systémy použity současně s klasickým regulátorem pro optimalizaci jeho řídící funkce.
Systémy inteligentní regulace jsou v praci méně rozšířeny než systémy FLC.
ES v inteligentních regulátorech mají některé odlišnosti:
- ES jsou integrovány do celku inteligentního regulátoru,
- ES nejsou využívány interaktivně operátorem, ale počítačem,
- jsou zdůrazněny funkce induktivního učení,
- výsledky jsou aplikovány v uzavřené smyčce, vzniká zpětná vazba

Inteligentní regulátor:
- dokáže uspokojivě regulovat libovolné v čase proměnné nelineární procesy
- požaduje minimální předběžné znalosti o procesu,
- dovoluje uživateli zadávat specifické vlastnosti,
- postupně zvětšuje množství znalostí o procesu,
- poskytuje uživatli informace o průběhu řízení,
- umožňuje jednoduchou reprezentaci základních znalostí

ES v reálném čase
- nemonotónní vyvozování - pracuje v dynamickém čase, exponenciální zapomínání
- asynchronní události - přerušení méně významných procedur
- vyvozování v čase - rozlišuje minulé, současné a budoucí situace
- časově omezené vyvozování - procedury vstupují do zpracování, kdy je potřeba
- paralelní vyvozování - požadavky na synchronizaci mezi různými činnostmi
- vazba na okolí

Inteligentní regulátor se skládá ze 2 částí - výpočetní algoritmus a znalostní systém (plus komunikační interface)
Architektura výpočetního algoritmu - řídící algoritmy, identifikační a monitorovací algoritmy
Architektura znalostního systému - zdroje se spouštějí a vyvolávají navzájem nebo jsou řazeny do předem definovaných posloupností nebo dochází k dynamickému generování posloupností - komunikují prostřednictvím Mailboxu

Systémy inteligentního řízení - znalostní zdroje:
- operátor požadavků - pokládá dotazy
- manuální supervizor regulace - dohlíží nad manuální řídící fázi a kontroluje stabilitu
- supervizor - inicializuje a dohlíží nad identifikačními experimenty, předběžná analýza
- modelář - zahrnuje znalosti o tvorbě modelu a výběru finálního řešení
- designer - obsahuje znalosti o způsobu regulace
- řídící supervizor - manuální změny parametrických příkazů regulátorů
- vysvětlovač - generuje vysvětlení otázek o procesu a regulátoru,
- Y-statistika - statistika o výstupu procesu a jeho chybě
- U-statistika - statistika o řídícím signálu (akční veličině)

kognitivní modelování

rozvoj snahy využít i jiné zdroje informací než takové, které jsou formalizovatelné rovnicemi - kognitivní (psychologické) modelování, které vychází z "cognitive science", což je věda o našem vnímání.
Člověk - nositel psychologického know-how.

Jednoduchost - nutná podmínka realizovatelnosti procesu
Reflexivnost - schopnost pravdivě popsat realitu
Ztráta informace - může nastat při nevhodně zvoleném formálním aparátu zpracování dat

Definice pojmu - a vzdálenost mezi pojmy - prostřednictvím monotónní otázky. Otázky také umožňují kvantifikaci oblasti nejistoty.

Otázka - stabilní, variabilní, vybalancovaná, obtížná (nejasná), jasná.
Je-li otázka snadná, variabilita je nízká, je-li otázka obtížná, variabilita je vysoká. Je-li otázka jednoznačná, variabilita je nízká a je-li otázka rozmazaná, variabilita je vysoká.

Kognitivní analýza - podstatou metody pro určení vlastností a diskriminačních schopností znalostní báze. Základem jsou testy konzistence, což je využíváno v oboru znalostního inženýrství.
Test konzistence spočívá ve stanovení vzájemné podobnosti prohlášení, tvořících bázi znalostí. Při testu pokládáme expertnímu systému s modifikovanou bází takovou množinu dotazů, jaké lze v praci očekávat. Míra podobnosti (konzistence) dotazu a aktivovaného prohlášení  je při testu oceněna hodnotou podobnosti V(k,r) v intervalu <0,1>
Bude-li převážná část odpovědí jednoznačných, označíme bázi jako stabilní, bude-li převážná část odpovědí neurčitých, označíme bázi jako variabilní, bude-li poměr jednoznačných a neurčitých odpovědí přibližně stejný, označíme bázi jako balancovanou, v opačném případě jako extremální.

Ke grafickému vyjádření se využívá tzv. ternární diagram (trojúhelník)

neuronové sítě

Struktury, které jsou inspirovány svými biologickými vzory. Účelem je simulovat a implementovat některé funkce lidkského mozku, především schopnost adaptace a učení.

Neuronová síť čerpá z trénovací množiny dat, které jsou uloženy ve kvalitě vazeb mezi jejími stavebními prvky - neurony.

Neuron se skládá z dendridů (vstupy signálů do těla neuronu), těla buňky (v němž se sčítají signály), axonového vlákna (přenáší signál neuronem) a synapsů (výstupní část neuronu)
Zpracování informace v neuronu
- operace synaptické - paměť předchozích informací
- operace somatické - váženy příslušnými vahami a dále sečítány

Architektura neuronové sítě - vícevstvé sítě
- vstupní vrstva -
- výstupní vrstva
- skrytá vrstva - mezivrstvy

Základní schopností neuronové sítě považujeme schopnost adaptace - učení, pro adaptaci vícevrstvé neuronové sítě se spojitými perceptrony byla vyvinuta a často je používána adaptační metoda zv. "back-propagation" BP - metoda zpětného šíření

Strategie adaptační metody - základem je použití trénovací množiny, algoritmus učení metody BP lze popsat následně:
- neurony vstupní vrstvy excitujeme na odpovídající úroveň
- provedeme šíření tohoto signálu dopředným způsobem
- porovnáme požadovaný stav se skutečnou odezvou neuronové sítě
- diference skutečné a požadované hodnoty odezvy definuje chybu
- po vyčerpání trénovací množiny vyhodnotíme celkovou chybu
Cílem adaptivní strategie metody BP je minimalizace funkce chyby.

fuzzy neuronové systémy

normální neuronové sítě jsou již samy o sobě schopny zpracovat nepřesná data a modelovat špatně definované soustavy. Nicméně k tomu byla rozpracována i fuzzy logika, která se ukázala s neuronovými sítěmi jako výhodnější, tzv. fuzzy-neuronové sítě.
Schopnost neuronové sítě učit se a schopnost fuzzy lgiky zpracovávat vágní a ne zcela přesné informace vede ke zvýšení robusnosti a adekvátnosti takové sítě.

Neuronové sítě a fuzzy logika - na rozdíl od fuzzy modelů, kde jsou znalosti vyjádřeny explicitně pomocí IF-THEN, neuronové sítě akumulují "implicitní znalosti", koncentrované v jejich vektoru synaptických vah.

Návrh fuzzy-neuronové sítě spočívá v tom, že v druhé vrstvě každý neuron reprezentuje jednu jazykovou hodnotu vstupní proměnné a obsahuje funkci příslušnosti odpovídající této hodnotě. Každý neuron třetí vrstvy odpovídá jednomu podmíněnému pravidlu a je spojen s neurony druhé vrstvy podle jazykových hodnot, které jsou obsaženy v implikacích antecendentu tohoto pravidla. Každý neuron čtvrté vrstvy odpovídá jedné jazykové hodnotě výstupní proměnné  a je spojen s těmi neurony třetí vrstvy (pravidly), které obsahují tuto hodnotu ve svém konsekventu.

Adaptační procedura obsahuje
- tvar fuzzy množin (parametry) jazykových hodnot pravidel,
- váhové koeficienty jednotlivých pravidel,
- váhové koeficienty jazykových hodnot antecendentu a konsekventu.

Fuzzy-neuro modelování pozůstává ze dvou fází - strukturální identifikace a parametrické identifikace, blíže viz návrh fuzzy-neuronové sítě.

genetické systémy

vyhledávací algoritmy založené na principech genetiky a na mechanismu přirozeného výběru.

Genetický algoritmus - robusní vyhledávací procedura - uplatňuje se v optimalizaci a strojovém učení, vyznačuje se
- širší hranice použitelnosti než klasické optimalizační metody
- nepracují s lokálními parametry optimalizačního procesu
- jsou slepé prohledávací metody vyžadující minimum dodatečných informací
- používají statistická, přechodová pravidla

Základem GA je textový řetězec, jehož vzorem je chromozom
- chromozom má konečnou délku,
- množina chromozomů se nazývá populace,
- generace chromozomů vzniká reprodukcí populace, každý chromosom je vybaven fitness hodnotou, která vyjadřuje míru přiblížení se chromosomu optimálnímu
- operace s chromozomi mohou být - reprodukce, křížení, mutace

Fuzzy-genetické systémy - pokus o zavedení BP procesu do genetických systémů, ale vyvolává řadu obtíží, protože reálné prostředí se vyznačuje diskontinuitou, silnou multimodálností, špatně definovanými hodnotami nebo šumem. GA narozdíl od toho lépe konverguje k optimu a má schopnost prohledat nové oblasti prostoru řešení, hledat optimum globální.

Fuzzy-neuro-genetické systémy - fuzzy parametry mohou být v průběhu modelování zakódovány do chromosomu a optimalizovány (adaptovány), v takovém případě pracuje GA jako dohlížecí, klasifikační systém. Významnou skutečností je možnost použití GA pro adaptace fuzzy pravidlového modelu cestou optimalizace jeho tranformační matice ve vztahu pro fuzzy inferenci.

Kvalita estimace závisí na:
- kvalitě báze znalostí,
- kvalitě definice fuzzy množin jazykových hodnot,
- výběru operátorů fuzzy implikační funkce,
- výběru defuzzifikační strategie

Neuronové sítě v obvodech řízení - NS nemusí být předem naučená, trénovací množina je tvořena náhodnými dvojicemi vstupního a výstupního signálu v pracovním rozsahu procesu. Pro minimalizaci odchylky mezi akčním zásahem, působícím na proces a výstupem NS, je použit algoritmus BP. Učení NS probíhá v off-line režimu.

Žádné komentáře:

Okomentovat