AI – Umělá inteligence – podceňovaná nebo přeceňovaná?
A jak změní naše počítače… a celý náš svět?
Už od nepaměti se člověk snaží usnadnit si práci. Od obyčejných mechanických strojů se vývoj posouvá i do oblastí, které by před sto lety byly jen těžko uvěřitelné – natož pochopitelné.
Poslední dobou to vypadá, že vše, co nás obklopuje, bude SMART. Chytré telefony, ledničky, kamery, domy, auta, lavičky i celá města. Ne, to ještě není AI. Dnes ještě ne.
AI – z anglického artificial intelligence – termín, který slýcháme poměrně často. Jak moc rozumíme tomu, o co se vlastně jedná? Jak moc z toho máme mít strach? Co si od toho máme slibovat?
Ve filmu Terminátor převezme celosvětová síť Skynet (AI) vládu nad stroji (většina z nich byly různé druhy bojových robotů) a snaží se ovládnout/zničit svět lidí. Zmíněné hrozby jsou určeny vlastnostmi nástrojů, které má umělá inteligence k dispozici – a pokud se nekontrolovatelně bude používat ve strojích na zabíjení lidí… máme se podle tvůrců filmu zřejmě na co těšit.
Kybernetika a informatika
Precizněji a intenzivněji se umělou inteligencí začala zabývat kybernetika – jako nauka o principech řízení a přenosu informací ve strojích, živých organismech a společenstvích. Matematický popis i poměrně složitých systémů naznačoval zajímavé možnosti. Výpočetní technika před několika desetiletími však neměla šanci reálně otestovat všechny v té době známé teorie. Ale obor informatiky zabývající se tvorbou strojů vykazujících známky inteligentního chování (což je právě AI) se teoreticky vyvíjí již poměrně dlouho.
„V blízké budoucnosti nastala doba, kdy přírodní zdroje pomalu docházejí a technologie naopak nezadržitelně expanduje. Vyvinutí roboti se starají o uspokojení všech potřeb svých majitelů, ale je zde jedna výjimka. Je jí láska, což je ta poslední hranice, kterou ještě stroje nedokázaly překonat. Výzkumníci z firmy Cybertronics Manufacturing jsou prvními, kdo sestrojí robota, který je naprogramován k vnímání emocí. Jmenuje se David …“ [csfd]
Rozeznal by dinosaurus čivavu od muffinu?
Při vývoji a návrhu AI se inspirujeme v evoluci vývoje inteligence ve vesmíru – respektive v přírodě na Zemi. Například ustrnutí – jako obranná strategie přežití – fungovalo až do té doby, než predátoři nezlepšili své rozpoznávací schopnosti. Pravěký ještěr totiž svou kořist nedokázal „spatřit“, pokud se nehýbala – a proto i mimikry napomáhající lepšímu splynutí s prostředím se zdokonalovaly až na samé hranice možností. Pokud pak má člověk (nebo i mnohé novodobé šelmy) najít svou kořist, musí umět zpracovat vstupní obrazový signál na lepší úrovni než pravěký dinosaurus – a základem úspěšného lovu (a přežití) je správné vyhodnocení, co vlastně vidí.
Dnes už systémy na principu AI umí poměrně snadno a rychle vyhledat „sobě podobné“ obrázky, ale s rozpoznáním, co na nich je, má občas stále problém – posuďte sami, vyhodnotíte „okamžitě“, zda na obrázku je čivava nebo muffin?
[Google: “čivava nebo muffin”]
Od chytré sponky k nenápadným digitálním asistentům
Pamatuje si dnes ještě někdo „chytrou sponku“? Jednalo se o jednoho z prvních našeptávačů od Microsoftu, který byl v MsOffice. Byl to poměrně hloupý a pro středně pokročilého uživatele velmi otravný prvek – animovaná sponka, co v první verzi radila pořád dokola to samé, dokud se nevypnula. Vezmete-li jednoduchý „rozhodovací“ počítačový program a k němu přidáme konečnou množinu možných situací a reakcí na ně, získáte základ podobného expertního systému. Kdysi se s ním se střídavě slibnými výsledky experimentovalo například v diagnostice – od poruch na zařízeních až po stanovení lékařské diagnózy. V některých oblastech se do dneška používá. Ani to ještě není žádná inteligence – i když to tak na první pohled může vypadat.
Od expertních systémů k neuronovým sítím
Na inteligenci se musí jinak. Jako velmi nadějné se ukázalo už před lety využití neuronové sítě, kde nám pro inspiraci posloužily reálné neurony a jejich vzájemné spojení (synapse) v mozku živých organismů.
Už první počítačové modely ukazovaly, že se může jednat o správnou cestu. Stačilo nasimulovat několik málo neuronů a propojit každý s každým virtuálními synapsemi, některým přidat vstupy (třeba tlačítka) a jiné propojit s výstupy (třeba na žárovky) – a postupně jim byly jako učební materiál předklány různé vstupní stavy a správné odpovědi na ně. Učením se mění „váhy synapsí“ mezi jednotlivými neurony – signál některých z nich se posílí, jinde utlumí. Síť pak dokázala někdy správně reagovat i na vstup, který jí učitel (učící program) nikdy nepředložil. A pokud se řešení jednoduchého zadání (třeba boolovské operace) naučila síť s deseti neurony, i když se jeden-dva odebraly, stále to fungovalo!
Velké pokroky se učinily v OCR (Optical Character Recognition – rozpoznávání znaků) – kde stačí výstupní signál kamery (třeba „jen“ 20×20 pixelů) předložit první vrstvě neuronů (někdy jich nemusí být 20×20 – ale redukují se třeba na polovinu) a výstupní vrstva se spojí s odpovědí – vidím číslo 1-9.
Takováto síť se dá dnes naučit během pár minut (max hodin), aby poznávala s velkou úspěšností i poškozené nebo naškrábané znaky.
Kam směřují technologie?
„Mezi hlavní problémy v rámci výzkumu umělé inteligence patří uvažování, znalosti, plánování, učení, zpracovávání přirozeného jazyka (komunikace), vnímání a schopnost se pohybovat či manipulovat s předměty.“ [wiki]
Před třiceti lety to po prvních zdánlivě velkých úspěších vypadalo, že nic nebrání tomu, abychom si už v roce 2000 mohli popovídat s umělou inteligencí – I filmy Terminátor nebo úsměvný příběh oživlého bojového robota „Číslo 5 žije“ nám naznačovaly, že to může být brzy. Chtěl jsem zmínit i pojem „Deep learning“ – jeho možnosti a problémy při dosažení dalšího posunu, ale je to zřejmě nad rámec jednoho krátkého článku. Podobně „Big data“ a propojení internetu věcí (IoT) s dalšími moderními technologiemi – Virtuální a rozšířená realita…..
Neznám podrobnosti, ale umělé inteligenci byly předloženy všechny písně od Beatles (zřejmě texty – jednotlivá slova – a hudba zvlášť) a zadání znělo: “Slož něco podobného” – a zde je výsledek Daddy’s Car:
V současné době je na první pohled patrné praktické nasazování „fragmentů na bázi AI“ především v oblasti komunikace: jedním z průkopníků je Google, jehož vyhledávač už není jen obyčejnou databází s expertním systémem, ale učící se stroj. K rozpoznávání písma přibylo pokročilejší rozpoznání obrazů a obličejů (zaregistrovali jste možná první nedávné testy v Číně, kde rozsáhlá síť kamerových systémů po celé zemi slibuje nalézt kohokoli za několik minut; možná znáte seriál Lovci zločinců).
Poměrně daleko jsme i v rozpoznání hlasu (anglicky se dá už diktovat text přímo do počítače s 98% a větší úspěšností) a asistentka Alexa od Amazonu se dá propojit s řadou přístrojů v domácnosti, které pak lze mluvenou řečí ovládat.
Zlepšuje se syntetický hlasový výstup z počítače – i ten je zdokonalován pomocí učících algoritmů – a někdy je od lidského hlasu skoro k nerozeznání (pozor na call centra – s kým mluvíte)
Málokdo si plně uvědomuje, co s lidmi za posledních dvacet let provedl internet, sociální sítě a chytré telefony. Svět kolem nás se mění. Nejenom naše počítače a naše mobily. Mění se technologie, přibývají z velké části robotizované továrny, inteligentní drony, samořiditelná auta (např. Tesla).
Naši digitální asistenti se tu zjevili, jako tajemný džin vypuštěný z lahve. Je zatím jen na nás, k čemu ho budeme chtít používat. Snad se jednou ve velkém rozsahu nevymkne naší kontrole.
Pokud neznáte, koukněte se na některé díly seriálu „Black mirror“ – leccos tam je opravdu výstižně naznačeno.
Autor:
Ing. Jan Čopák – vystudoval obor technická kybernetika na ČVUT FEL, diplomová práce „Stochastické chování deterministických systémů“ byla první, svého druhu v ČR. Bezprostředně po škole chvíli spolupracoval při vývoji neuronových sítí, kde teoreticky posuzoval vliv chaosu/šumu a chyb učitele na strojové učení.
Nyní se ve společnosti Octopus-engine zabývá moderními technologiemi – kam patří: Virtuální a augmentovaná realita, kryptoměny, internet věcí a big data vizualizaton + AI. Více na: http://octopusengine.org