Přejít na navigaci (přeskočit obsah)

STATISTICA Automatizované neuronové sítě Cz

Neuronové sítě

Popularita metodologie neuronových sítí rychle stoupá v nejrůznějších oblastech od základního výzkumu po vytěžování dat (data mining), v oblastech predikcí v komerční sféře, řízení rizik, marketingu a další. Systém STATISTICA Automatizované neuronové sítě je jednou z nejpokročilejších a nejvýkonnějších aplikací technologie neuronových sítí dostupná na současném trhu. Systém nabízí množství jedinečných prostředků a je určen nejen pro specialisty v oboru neuronových sítí (kterým nabízí mimořádný rozsah typů sítí a trénovacích algoritmů), ale i pro nové uživatele této technologie (pro které je k dispozici Automatický vyhledávač sítě, nástroj, který uživatele provede všemi kroky potřebnými pro vytváření neuronových sítí).

STATISTICA Automatizované neuronové sítě je vynikající aplikace implementující neuronové sítě, snadno se používá a k tomu je v češtině:
  • Výjimečná snadnost použití kombinovaná s překvapivým analytickým výkonem; automatický vyhledávač sítě provede uživatele krok po kroku postupem pro vytvoření skupiny rozdílných sítí a výběrem nejvhodnější sítě s nejlepším výkonem (což je úloha, která by jinak vyžadovala zdlouhavý postup metodou "pokusů a omylů" při solidních znalostech základní teorie).
  • Integrovaný pre a post-processing obsahující výběr dat, kódování jmenovitých hodnot, škálování, normalizaci a nahrazování chybějících hodnot s interpretací pro klasifikaci, regresi a problematiku časových řad.
  • Vyspělé, vysoce optimalizované trénovací algoritmy včetně metody konjugovaných gradientů a metody Broyden-Fletcher-Goldfarb-Shanno (BFGS); plná kontrola nad všemi aspekty, které ovlivňují chování neuronové sítě, jako je aktivační a chybová funkce nebo komplexnost sítě.
  • Podpora kombinací sítí a síťových architektur prakticky neomezené velikosti organizovaných v sadách neuronových sítí pro vytváření kolekcí.
  • Komplexní grafická a statistická zpětná vazba poskytující interaktivní průzkumné analýzy.
  • Plná integrace v rámci systému STATISTICA; všechny výsledky, grafy, reporty atd. mohou být dále upravovány pomocí grafických a analytických nástrojů systému STATISTICA. Lze tak např. provádět další analýzy reziduí, vytvářet komentované souhrnné reporty apod.
  • Plná integrace s nástroji STATISTICA pro automatizaci; uživatel může využít kompletního makra pro všechny analýzy, programovat vlastní analýzy za pomoci neuronové sítě v prostředí STATISTICA Visual Basic nebo volat systém STATISTICA Automatizované neuronové sítě z libovolné aplikace podporující COM. Může tak např. automaticky provádět analýzy s neuronovými sítěmi v tabulkách MS Excel či zahrnout procedury neuronových sítí do vlastních aplikací vyvinutých v C, C++, C#, Java apod.
STATISTICA Automatizované neuronové sítě – řešení reálných problémů v neuronovém počítání

Používání neuronových sítí představuje více než jen jednoduše nakrmit neuronovou síť daty.

STATISTICA Automatizované neuronové sítě obsahuje funkcionalitu, která vám bude pomáhat v kritických oblastech návrhu. Zahrnuje nejen vyspělé architektury neuronových sítí a trénovací algoritmy, ale též inovativní přístup k návrhu síťové architektury s použitím specifických a smysluplných chybových funkcí, které umožňují interpretaci dosažených výsledků. Mimoto vývojáři softwaru a uživatelé, kteří využívají zákaznicky upravené aplikace, ocení fakt, že sítě mohou být zahrnuty do uživatelské aplikace prostřednictvím buď COM funkcí knihovny STATISTICA, které kompletně zpřístupňují možnosti systému, nebo užitím programem generovaného C/C++ kódu plně natrénované sítě.

Vstup dat

Systém je plně integrován se systémem STATISTICA, tudíž je zde k dispozici velký výběr nástrojů pro editaci (přípravu) dat pro analýzy (transformace, výběr podmínek případů, nástroje pro ověření dat atd.). Jako všechny analýzy STATISTICA, program může být „připojen“ k databázi skrze nástroje pro in-place-database processing nebo může být navázán na aktivní data tak, že modely jsou přetrénovány nebo použity (např. pro vypočítání predikovaných hodnot nebo klasifikaci) automaticky pokaždé, kdy se změní data.

Škálování dat a příprava jmenovitých hodnot

Data musí být obvykle připravena pro vstup do neuronové sítě. Důležité je to též pro korektní interpretaci výstupu z neuronové sítě. STATISTICA Automatizované neuronové sítě (SANS) obsahuje automatické škálování dat pro vstup i výstup, je zde i automatický záznam jmenovitých hodnot proměnných (např. pohlaví = {muž, žena}), obsahuje one-of-N kódování. SANS též obsahuje prostředky pro zacházení s chybějícími daty. Též jsou zde k dispozici prostředky pro přípravu a interpretaci dat pro použití s časovými řadami. Velký počet relevantních nástrojů je též obsažen ve STATISTICA.

Volba modelu neuronové sítě, kolekce neuronových sítí

STATISTICA Automatizované neuronové sítě (SANS) podporuje mnoho důležitých tříd z neuronových sítí pro řešení problémů reálného světa včetně:

  • Vícerozměrných perceptronů
  • RBF sítí
  • Samoorganizovaných map

Výše uvedené architektury mohou být použity pro regresi, klasifikaci, regresi v časových řadách, klasifikaci v časových řadách a shlukovou analýzu.

Navíc Automatický vyhledávač sítě podporuje vytváření kolekcí neuronových sítí z libovolné (když je to smysluplné) kombinace typů sítí popsaných výše. Kombinování sítí pro vytvoření kolekce předpovědí je mimořádně snadné použít v SANS, především pro malé nebo šum obsahující sady dat.

SANS obsahují četné prostředky pro pomoc s výběrem vhodné síťové architektury. Statistická a grafická odezva SANS obsahuje histogramy, matice, grafy pro individuální nebo celkové chyby případů, souhrn výkonnosti zatřídění/nezatřídění a důležité statistiky jako je korelace regrese, vše je automaticky spočítáno.

Pro vizualizaci dat SANS zobrazuje bodové grafy a 3D grafy povrchů odezvy, které napomáhají uživatelovu porozumění chování sítě.

Přirozeně lze využívat informace z jakéhokoliv z těchto zdrojů pro další analýzu s ostatními nástroji STATISTICA nebo pro zahrnutí do výsledné zprávy, další analýzu nebo zákaznickou úpravu.

SANS si automaticky ponechává kopii nejlepších sítí nalezených při vašich pokusech na úloze, které mohou být kdykoliv znovu využity. Užitečnost a prediktivní validita sítě může být automaticky odhadnuta se zahrnutím testovacího a validačního vzorku a vyhodnocením velikosti a efektivity sítě jakož i ceny nesprávné klasifikace.

Pro rozšíření výkonu STATISTICA Automatizované neuronové sítě podporuje několik voleb pro úpravu sítě. Můžete zvolit lineární výstupní vrstvu pro sítě použité v regresní úloze nebo softmax aktivační funkci pro odhad pravděpodobnosti v klasifikační úloze. Chybová funkce křížové entropie, založená na modelech teorie informací, je taktéž zahrnuta a je zde i řada specializovaných aktivačních funkcí včetně exponenciální, hyperbolického tangentu, logistické sigmoidy a funkce sinus pro skryté a výstupní neurony.

Automatické vyhledání sítě (automatický výpočet a výběr více architektur sítí)

Automatické vyhledávání sítě zahrnuté v systému STATISTICA Automatizované neuronové sítě je nástroj poskytující výpočet velkého počtu různých architektur neuronových sítí různé komplexnosti a výběr toho nejlepšího souboru specifických architektur pro řešený problém.

Významná část času během návrhu neuronové sítě je strávena výběrem vhodných proměnných a následně optimalizováním architektury sítě za pomoci heuristického vyhledávání. Toto vyhledávání zahrnuje typ neuronové sítě, velikost neuronové sítě a její architekturu, aktivační funkce a dokonce i chybové funkce, pokud je to vhodné.

Automatické vyhledávání sítě je extrémně efektivní nástroj, který používá sofistikované techniky pro automatické vyhledávání optimálních síťových architektur. Proč trávit hodiny prací u terminálu, když můžete nechat STATISTICA Automatizované neuronové sítě udělat práci za vás?

Trénování neuronové sítě

Pokud experimentujete s architekturami a typy neuronových sítí, spoléháte se kriticky na kvalitu a rychlost trénovacího algoritmu sítě. STATISTICA Automatizované neuronové sítě (SANS) podporuje nejlepší známé vyspělé trénovací algoritmy.

SANS přirozeně obsahují rychlé trénovací algoritmy druhého řádu: metodu konjugovaného gradientu a BFGS. Je zde i méně paměťově náročná verze BFGS, do které se SANS automaticky přepnou, když je velikost paměti na vašem počítači na kritických úrovních. Tyto algoritmy typicky konvergují mnohem rychleji než algoritmy prvního řádu, jako je metoda gradientního spádu.

STATISTICA Automatizované neuronové sítě iterativní trénovací procedura je doplněna automatickým sledováním obou chyb, trénovací a nezávislé testovací chyby, zatímco postupuje trénování. Trénování může být kdykoliv ukončeno kliknutím na tlačítko, můžete též specifikovat podmínku pro zastavení, kdy by mohlo být trénování předčasně ukončeno například, když je dosaženo cílové chyby nebo když se výběrová chyba zhoršuje po daný počet epoch. Když dojde k přeučení, nemusíte si dělat starosti: SANS si automaticky ponechají kopii nejlepší objevené sítě, která je automaticky získána a použita jako nejlepší řešení. Když je trénování ukončeno, můžete na závěr vyzkoušet výkonnost na trénovacích, testovacích a validačních vzorcích.

STATISTICA Automatizované neuronové sítě též obsahují řadu trénovacích algoritmů pro shlukovou analýzu, které jsou založeny na dobře známém Kohonenovu algoritmu pro samoorganizované mapy.

Vyzkoušení a testování neuronové sítě

Jakmile máte natrénovanou síť, budete chtít otestovat její výkonnost a prozkoumat její charakteristiky. STATISTICA Automatizované neuronové sítě využívá řadu statistických grafických prostředků.

Můžete vybrat více modelů (a kolekcí) - pokud tak učiníte, SANS bude zobrazovat, pokud je to možné, výsledky komparativním způsobem (např. zobrazením odezvových křivek pro několik modelů v jednom grafu, nebo przentací předpovědí více modelů v jedné tabulce). Tato vlastnost je zvláště užitečná pro srovnání více modelů trénovaných na stejné datové sadě.

Všechny statistiky jsou generovány nezávisle pro trénovací, testovací a validační vzorek nebo kombinaci dle vašeho výběru.

Vypočítané celkové statistiky obsahují střední chybu sítě, tzv. matici záměn pro klasifikační problém (sumarizuje správné a nesprávné klasifikace přes všechny třídy) a korelaci pro regresní problém - vše je vypočítáno automaticky. Kohonenovy sítě obsahují okno topologické mapy, které vám umožňuje vizuálně prozkoumat aktivace jednotek během analýzy dat.

Přehled trénovacích algoritmů
  • Gradientní spád
  • Konjugovaný gradient
  • BFGS
  • Kohonenovo trénování
  • Stanovení středů metodou k-průměrů pro RBF sítě
Systémové požadavky STATISTICA

Minimální:

  • Operační systém: Windows 2000 nebo vyšší
  • RAM: 256 MB
  • Rychlost procesoru: 500 MHz
Doporučené:
  • Operační systém: Windows XP nebo vyšší
  • RAM: 512 MB
  • Rychlost procesoru: 2.0 GHz

Omezení velikosti

Sítě mohou mít prakticky neomezenou velikost (to znamená, že mohou být mnohem větší, než by kdy mohlo být použitelné nebo rozumné), program je prakticky omezen pouze hardwarem počítače.

Elektronická příručka

Systém STATISTICA Automatizované neuronové sítě je vybaven bohatě ilustrovanou elektronickou příručkou s obsáhlým koncepčním úvodem do problematiky neuronových sítí, doplněnou výukovými částmi a rozsáhlou nápovědou přístupnou z každého dialogového okna.

Příklady reálných aplikací

Technologii neuronových sítí lze použít prakticky v každé situaci, v níž je cílem nalezení neznámé proměnné nebo vlastnosti na základě známých pozorování nebo naměřených hodnot (tzn. v nejrůznějších formách regresí, klasifikací a časových řad), je-li k dispozici dostatečné množství "historických" dat a existují-li mezi nimi objektivní vztahy nebo množina vztahů (neuronové sítě jsou relativně tolerantní k šumovým jevům). Dále lze neuronové sítě výhodně použít pro vyšetřovací analýzu pro případ hledání shluků dat (Kohonenovy sítě).

V Elektronické učebnici statistiky, v kapitole neuronové sítě, lze nalézt obsažnou diskusi o teoretických úvahách týkajících se oblastí vhodných pro úspěšné využití technologie neuronových sítí. Následující seznam uvádí výběr reprezentativních příkladů použití. V žádném případě však tento seznam nepokrývá veškeré oblasti užití této technologie.

  • Optické rozpoznávání znaků, včetně rozpoznávání podpisů (jistá společnost například vyvinula zařízení, které určuje pravost podpisu nejen podle celkového vzhledu písma, ale i rychlosti pohybu psacího náčiní při podpisu).

  • Zpracování obrazu (byl například vyvinut systém, který sleduje obrazy z londýnských stanic metra a dokáže rozpoznat, zda je stanice zaplněna, prázdná nebo poloprázdná bez ohledu na světelné podmínky či přítomnost-nepřítomnost vlakové soupravy ve stanici).

  • Předpověď finančních časových řad (společnost LBS Capital Management například tvrdí, že se její obchodní výsledky podstatně zlepšily použitím vícevrstvé sítě perceptorů pro předpovědi cen akcií).

  • Úvěrová rizika (klasický problém - na základě dotazníku rozhodnout, zda je uchazeč o úvěr vhodnou osobou z hlediska úvěrového rizika).

  • Výběr skupiny zákazníků pro hromadnou korespondenci (tzn. identifikace zákazníků, u kterých je nejvyšší pravděpodobnost příznivé reakce na hromadnou korespondenci na základě informací z existující databáze zákazníků).

  • Detekce a ohodnocení v medicíně (například detekce epileptických záchvatů, odhad velikosti tumoru prostaty).

  • Monitorování stavu strojů (např. odhadování, kdy může dojít k poruše vlivem vibrací nebo akustických zátěží a následné plánování preventivní údržby).

  • Syntéza řeči (slavným příkladem z této oblasti byl např. známý Nettalk, který se učil vytvářet fonémy na základě psaného textu).

  • Předpovědi na základě chaotických časových řad (mnoho výzkumných pracovníků prokázalo schopnost neuronových sítí dosahovat dobrých odhadů na základě chaotických časových řad).

  • Řízení procesů (například monitorování strojního zařízení v průmyslových procesech a průběžné nastavování řídících parametrů).

  • Systémy provozování strojů (odhady spotřeby paliv na základě snímaných měření).

  • Jazyková analýza (např. použití neuronové technologie pro identifikaci klíčových frází, slov atd. v domorodých jihoamerických jazycích).

Volitelný generátor zdrojového kódu

Generátor zdrojového kódu je volitelný přídavný modul, který dává uživateli možnost stavět jeho vlastní aplikace na základě řešení nalezeného systémem STATISTICA Automatizované neuronové sítě. Modul vytváří zdrojový kód pro sestavení neuronové sítě (v C nebo PMML), který lze následně zkompilovat do vlastního programu. Modul je určen především pro podnikové programátory, kteří potřebují převést nalezená vysoce optimalizovaná řešení do svých stávajících aplikací určených k řešení opakujících se analytických problémů. Poznámka: Generátor je přídavná placená aplikace.


Minimální požadavky: Windows XP/Vista/7/8, procesor 1GHz, 1GB RAM, MS Internet Explorer min. verze 6 


Created by www.Corpus.cx
Copyright 2004 - 2022 StatSoft CR s.r.o.