Strojové učení - Terminologie

« Duben 2025 »

DPS 4/2023 | Články
Autor: RNDr. Karel Jurák, Ph.D., Ing. Zuzana Nejezchlebová, CSc.

Strojové učení je častou podmínkou pro funkčnost umělé inteligence systému. Dnes mohou systémy/zařízení s AI postupně získávat data a následně generovat text, obrázky, hudbu či zdrojový kód. AI systémy nahrazují postupně vybrané činnosti, kde se nevyžaduje kritické, resp. tvůrčí myšlení. Mnoho pozornosti je nyní věnováno AI v souvislosti s autorskými právy, etickými problémy, vysoce rizikovými systémy atp. Článek navazuje na předchozí terminologická témata: Umělá inteligence a Inteligentní systémy. Text vychází z dokumentů Evropské unie, normalizačních komisí CEN/CLC/JTC 21, ISO/IEC JTC 1/SC 42, webů českých škol a z článků české a anglické wikipedie.

Strojové učení (Machine Learning, ML) ‒ postup, při kterém se funkční jednotka / počítačový algoritmus zlepšuje získáváním nových dat (zkušeností).
Hluboké učení (Deep Learning, DL) ‒ varianta strojového učení, která se zabývá využitím algoritmů (především neuronových sítí) s velkým počtem vrstev (layers) reprezentujících data.
Umělá inteligence (Artificial Intelligence, AI) ‒ soubor algoritmů řešících komplexní úlohy z téměř všech oblastí vědy a technologie. Obr. 1 ukazuje úzký vztah mezi pojmy AI, ML a DL.

Další související termíny

Algoritmy strojového učení (machine learning algorithms) ‒ matematické modely založené na trénovacích datech (training data) pro vytváření predikcí, resp. rozhodnutí. Modely nejsou pro tento účel explicitně programovány.
AI inženýrství ( AI engineering) je zaměřeno na všechny aspekty vývoje a rozvoje AI systémů, tj. systémů, které zahrnují AI komponenty. AI inženýrství je zejména rozšířením softwarového inženýrství, avšak zahrnuje rovněž další metody a technologie.
Bard ‒ chatbot spuštěný v březnu 2023 společností Google; odpovídá pouze anglicky a využívá znalosti z wikipedie atp.
Craiyon ‒ AI model typu text-obraz, tj. generuje obrázky z textu. Jde o volnější verzi původně nazvanou DALL-E Mini. Uživatel zadá textový promt, např. „Greenhouse“ (skleník), klikne na „Run“ a program vygeneruje tabulku variant 3 × 3 zadaných obrázků, viz obr. 3.
GAN (Generative Adversarial Networks; generativní kontradiktorní sítě) ‒ třída systémů strojového učení, kde soutěží dvě neuronové sítě ve hře s nulovým součtem (zero-sum game). GAN je jednou z možností, jak generovat umělá trénovací data.
GPT (Generative Pre-trained Transformer) ‒ autoregresivní jazykové modely, které jsou schopny hlubokého učení textu při trénování např. pomocí internetových dat. Společnost OpenAI oznámila verzi GPT-4 v březnu 2023.
ChatGPT ‒ chatbot spuštěný 11/2022 společností OpenAI, který vychází z jazykového modelu GPT-3 resp. GPT-4; umí česky.
Microsoft Azure ‒ platforma společnosti Microsoft, která nabízí mj. nástroje pro AI a ML.
OpenAI ‒ společnost, kterou založil Elon Musk v roce 2015. Jde o americkou společnost pro výzkum AI, která sestává z mateřské společnosti OpenAI Inc. a neziskové společnosti OpenAI LP. Společnost je zaměřena na otevřenou spolupráci s dalšími institucemi a zejména na propagaci a vývoj open-source AI aplikací.
OpenMusic ‒ vizuální programovací prostředí pro skládání hudby.
Sphinx/CMU Sphinx ‒ zahrnuje skupinu systémů pro rozpoznávání řeči (speech recognition) vypracovaných na Carnegie Melon University. Jde o řadu systémů pro rozpoznávání řeči (Sphinx 2 až Sphinx 4) a trenéra akustického modelu (acoustic model trainer).
Transformer ‒ model hlubokého strojového učení zveřejněný v roce 2017 společností Google Brain.
Umělý neuron (artificial neuron) ‒ základní prvek umělé neuronové sítě (neural network). Jde o řadu variant funkce N proměnných (viz obr. 2). Pro hluboké strojové učení se používá řada vrstev těchto neuronů a rozsáhlý objem trénovacích dat.Generativní gramatika (generative grammar) ‒ napodobuje způsob, jak se děti naučí používat jazyk svých rodičů, tj. napodobuje postup při osvojování přirozeného jazyka.

Klasifikace souvisejících termínů
Algoritmy strojového učení lze klasifikovat podle řady kritérií, např.:

učení s učitelem (supervised learning),
učení bez učitele (unsupervised learning),
učení bez/s učitele/m (semi-supervised learning),
učení posilováním (reinforcement learning).

Studium související problematiky

ČVUT v Praze, Fakulta informačních technologií (Faculty of Information Technology), katedra aplikované matematiky, bakalářské předměty:
- Strojové učení,
- Základy umělé inteligence.

Masarykova univerzita v Brně, Fakulta informatiky, umělá inteligence, specializace:
- Bioinformatika a systémová biologie (Bioinformatics and Systems Biology),
- Strojové učení a umělá inteligence (Machine Learning and Artificial Intelligence),
- Zpracování a analýza rozsáhlých dat (Big Data Processing and Analysis),
- Zpracování přirozeného jazyka (Natural Language Processing).

Karlova univerzita v Praze, MFF, kurz 2022/23 AI v kontextu:
- AI a paměť,
- AI v kontextu hudby,
- AI v kontextu archeologie,
- AI v kontextu autorského práva,
- AI v kontextu generovaného obrazu,
- AI v kontextu generovaného textu,
- AI v sexuálním průmyslu,
- AI v kontextu architektury,
- AI v kontextu filozofie.

Související EU legislativa: COM(2021)206: Návrh nařízení, Akt o umělé inteligenci (Artificial Intelligence Act).

Definice: Systém umělé inteligence (pro účely dokumentu COM(2021)206) ‒ software, který byl vyvinut pomocí jedné nebo více technik a přístupů uvedených v příloze I a který může pro danou sadu cílů definovaných člověkem generovat výstupy, jako je například obsah, predikce, doporučení nebo rozhodnutí ovlivňující prostředí, s nimiž komunikují.
Příloha I, Techniky a přístupy AI ( AI techniques and approaches)
- Přístupy strojového učení, včetně učení s učitelem, bez učitele a posilovaného učení, používající celou řadu metod, včetně hlubokého učení,
- Přístupy založené na logice a znalostech, včetně reprezentace znalostí, induktivního (logického) programování, znalostních základen, inferenčních a deduktivních mechanismů, (symbolického) uvažování a expertních systémů,
- Statistické přístupy, bayesovské odhadování, metody vyhledávání a optimalizace.

Příloha III, Vysoce rizikové systémy AI (High risk AI systems):
- Biometrická identifikace a kategorizace fyzických osob,
- Řízení a provozování kritické infrastruktury,
- Vzdělávání a odborná příprava,
- Zaměstnanost, správa pracovníků a přístup k samostatné výdělečné činnosti.

Související normalizační komise

CEN/CLC/JTC 21 Artificial Intelligence,
ISO/IEC JTC 1/SC 42 Artificial Intelligence,
IEEE Computer Society, Artificial Intelligence Standards Committee.

Související terminologické normy

ČSN ISO/IEC 2382-28:1999, IT – Slovník Část 28: Umělá inteligence – Základní pojmy a expertní systémy:
- základní pojmy (basic concepts),
- znalostní struktury (knowledge structures),
- reprezentace znalostí (knowledge representation),
- usuzování a řešení problémů (reasoning and problem solving),
- expertní systémy (expert systems).
ISO/IEC 22989:2022, AI concepts and terminology (pojmy a terminologie): definuje termíny z oblasti:
- umělá inteligence,
- data (data),
- strojové učení,
- neuronové sítě,
- důvěryhodnost (trustworthiness),
- zpracování přirozeného jazyka (natural language processing),
- počítačové vidění (computer vision).

Literatura:
AI hudba s lidským srdcem, https://prg.ai/ai-hudba-s-lidskym-srdcem/
Tvorba českého jazykového modelu pro systém rozpoznávání řeči Sphinx4, K. Kufová, bakalářská práce, MU FI, 2015
ChatGPT vs. Bard:What is the difference Elena Alston, March 2023, https://zapier.com/blog/chatgpt-vs-bard/
GATE project [online], http://lsd.fi.muni.cz/gate/about
Laboratoř vyhledávání a dialogu, Lsd.fi.muni
[FI MUNI] Fakulta informatiky Masarykovy univerzity, http://fi.muni.cz
OpenAI_generování obrázků_https://platform.openai.com/overview
[csWiki] csWikipedia:

ChatGPT
Generativní gramatika
GPT-3
Hluboké učení
Umělá inteligence
Umělá neuronová síť

[DPS-AZ]

Umělá inteligence, DPS-AZ, č.4/2022
Inteligentní systémy, DPS-AZ, č.1/2021

[enWiki] enWikipedia:

Artificial Intelligence
Ethics of artificial intelligence
Category: Artificial intelligence
Category: Artificial intelligence applications
Glossary of artificial intelligence
Neural network
Transformer (machine learning model)

[WikiComm] Wikimedia Commons: (obr. 1, 2 a 3)

Fig-y Part of ML as subfield of AI or AI as subfield of ML.jpg, autor: Yakoove
NeuronModel.jpg, autor: Jeanlagi
Generated greenhouses.png, autor CMadeo (WMF)