česky english Vítejte, dnes je pondělí 23. prosinec 2024

Strojové učení - Terminologie

DPS 4/2023 | Články
Autor: RNDr. Karel Jurák, Ph.D., Ing. Zuzana Nejezchlebová, CSc.
Bez názvu.png

Strojové učení je častou podmínkou pro funkčnost umělé inteligence systému. Dnes mohou systémy/zařízení s AI postupně získávat data a následně generovat text, obrázky, hudbu či zdrojový kód. AI systémy nahrazují postupně vybrané činnosti, kde se nevyžaduje kritické, resp. tvůrčí myšlení. Mnoho pozornosti je nyní věnováno AI v souvislosti s autorskými právy, etickými problémy, vysoce rizikovými systémy atp. Článek navazuje na předchozí terminologická témata: Umělá inteligence a Inteligentní systémy. Text vychází z dokumentů Evropské unie, normalizačních komisí CEN/CLC/JTC 21, ISO/IEC JTC 1/SC 42, webů českých škol a z článků české a anglické wikipedie.

 

  • Strojové učení (Machine Learning, ML) ‒ postup, při kterém se funkční jednotka / počítačový algoritmus zlepšuje získáváním nových dat (zkušeností).
  • Hluboké učení (Deep Learning, DL) ‒ varianta strojového učení, která se zabývá využitím algoritmů (především neuronových sítí) s velkým počtem vrstev (layers) reprezentujících data.
  • Umělá inteligence (Artificial Intelligence, AI) ‒ soubor algoritmů řešících komplexní úlohy z téměř všech oblastí vědy a technologie. Obr. 1 ukazuje úzký vztah mezi pojmy AI, ML a DL.

Další související termíny

  • Algoritmy strojového učení (machine learning algorithms) ‒ matematické modely založené na trénovacích datech (training data) pro vytváření predikcí, resp. rozhodnutí. Modely nejsou pro tento účel explicitně programovány.
  • AI inženýrství ( AI engineering) je zaměřeno na všechny aspekty vývoje a rozvoje AI systémů, tj. systémů, které zahrnují AI komponenty. AI inženýrství je zejména rozšířením softwarového inženýrství, avšak zahrnuje rovněž další metody a technologie.
  • Bard ‒ chatbot spuštěný v březnu 2023 společností Google; odpovídá pouze anglicky a využívá znalosti z wikipedie atp.
  • Craiyon ‒ AI model typu text-obraz, tj. generuje obrázky z textu. Jde o volnější verzi původně nazvanou DALL-E Mini. Uživatel zadá textový promt, např. „Greenhouse“ (skleník), klikne na „Run“ a program vygeneruje tabulku variant 3 × 3 zadaných obrázků, viz obr. 3.
  • GAN (Generative Adversarial Networks; generativní kontradiktorní sítě) ‒ třída systémů strojového učení, kde soutěží dvě neuronové sítě ve hře s nulovým součtem (zero-sum game). GAN je jednou z možností, jak generovat umělá trénovací data.
  • GPT (Generative Pre-trained Transformer) ‒ autoregresivní jazykové modely, které jsou schopny hlubokého učení textu při trénování např. pomocí internetových dat. Společnost OpenAI oznámila verzi GPT-4 v březnu 2023.
  • ChatGPT ‒ chatbot spuštěný 11/2022 společností OpenAI, který vychází z jazykového modelu GPT-3 resp. GPT-4; umí česky.
  • Microsoft Azure ‒ platforma společnosti Microsoft, která nabízí mj. nástroje pro AI a ML.
  • OpenAI ‒ společnost, kterou založil Elon Musk v roce 2015. Jde o americkou společnost pro výzkum AI, která sestává z mateřské společnosti OpenAI Inc. a neziskové společnosti OpenAI LP. Společnost je zaměřena na otevřenou spolupráci s dalšími institucemi a zejména na propagaci a vývoj open-source AI aplikací.
  • OpenMusic ‒ vizuální programovací prostředí pro skládání hudby.
  • Sphinx/CMU Sphinx ‒ zahrnuje skupinu systémů pro rozpoznávání řeči (speech recognition) vypracovaných na Carnegie Melon University. Jde o řadu systémů pro rozpoznávání řeči (Sphinx 2 až Sphinx 4) a trenéra akustického modelu (acoustic model trainer).
  • Transformer ‒ model hlubokého strojového učení zveřejněný v roce 2017 společností Google Brain.
  • Umělý neuron (artificial neuron) ‒ základní prvek umělé neuronové sítě (neural network). Jde o řadu variant funkce N proměnných (viz obr. 2). Pro hluboké strojové učení se používá řada vrstev těchto neuronů a rozsáhlý objem trénovacích dat.Generativní gramatika (generative grammar) ‒ napodobuje způsob, jak se děti naučí používat jazyk svých rodičů, tj. napodobuje postup při osvojování přirozeného jazyka.

Klasifikace souvisejících termínů
Algoritmy strojového učení lze klasifikovat podle řady kritérií, např.:

  • učení s učitelem (supervised learning),
  • učení bez učitele (unsupervised learning),
  • učení bez/s učitele/m (semi-supervised learning),
  • učení posilováním (reinforcement learning).

Studium související problematiky

  • ČVUT v Praze, Fakulta informačních technologií (Faculty of Information Technology), katedra aplikované matematiky, bakalářské předměty:
    • Strojové učení,
    • Základy umělé inteligence.
  • Masarykova univerzita v Brně, Fakulta informatiky, umělá inteligence, specializace:
    • Bioinformatika a systémová biologie (Bioinformatics and Systems Biology),
    • Strojové učení a umělá inteligence (Machine Learning and Artificial Intelligence),
    • Zpracování a analýza rozsáhlých dat (Big Data Processing and Analysis),
    • Zpracování přirozeného jazyka (Natural Language Processing).
  • Karlova univerzita v Praze, MFF, kurz 2022/23 AI v kontextu:
    • AI a paměť,
    • AI v kontextu hudby,
    • AI v kontextu archeologie,
    • AI v kontextu autorského práva,
    • AI v kontextu generovaného obrazu,
    • AI v kontextu generovaného textu,
    • AI v sexuálním průmyslu,
    • AI v kontextu architektury,
    • AI v kontextu filozofie.

Související EU legislativa: COM(2021)206: Návrh nařízení, Akt o umělé inteligenci (Artificial Intelligence Act).

  • Definice: Systém umělé inteligence (pro účely dokumentu COM(2021)206) ‒ software, který byl vyvinut pomocí jedné nebo více technik a přístupů uvedených v příloze I a který může pro danou sadu cílů definovaných člověkem generovat výstupy, jako je například obsah, predikce, doporučení nebo rozhodnutí ovlivňující prostředí, s nimiž komunikují.
  •  Příloha I, Techniky a přístupy AI ( AI techniques and approaches)
    • Přístupy strojového učení, včetně učení s učitelem, bez učitele a posilovaného učení, používající celou řadu metod, včetně hlubokého učení,
    • Přístupy založené na logice a znalostech, včetně reprezentace znalostí, induktivního (logického) programování, znalostních základen, inferenčních a deduktivních mechanismů, (symbolického) uvažování a expertních systémů,
    • Statistické přístupy, bayesovské odhadování, metody vyhledávání a optimalizace.
  • Příloha III, Vysoce rizikové systémy AI (High risk AI systems):
    • Biometrická identifikace a kategorizace fyzických osob,
    • Řízení a provozování kritické infrastruktury,
    • Vzdělávání a odborná příprava,
    • Zaměstnanost, správa pracovníků a přístup k samostatné výdělečné činnosti.

Související normalizační komise

  • CEN/CLC/JTC 21 Artificial Intelligence,
  • ISO/IEC JTC 1/SC 42 Artificial Intelligence,
  • IEEE Computer Society, Artificial Intelligence Standards Committee.

Související terminologické normy

  • ČSN ISO/IEC 2382-28:1999, IT – Slovník Část 28: Umělá inteligence – Základní pojmy a expertní systémy:
    • základní pojmy (basic concepts),
    • znalostní struktury (knowledge structures),
    • reprezentace znalostí (knowledge representation),
    • usuzování a řešení problémů (reasoning and problem solving),
    • expertní systémy (expert systems).
  • ISO/IEC 22989:2022, AI concepts and terminology (pojmy a terminologie): definuje termíny z oblasti:
    • umělá inteligence,
    • data (data),
    • strojové učení,
    • neuronové sítě,
    • důvěryhodnost (trustworthiness),
    • zpracování přirozeného jazyka (natural language processing),
    • počítačové vidění (computer vision).

Literatura:
AI hudba s lidským srdcem, https://prg.ai/ai-hudba-s-lidskym-srdcem/
Tvorba českého jazykového modelu pro systém rozpoznávání řeči Sphinx4, K. Kufová, bakalářská práce, MU FI, 2015
ChatGPT vs. Bard:What is the difference Elena Alston, March 2023, https://zapier.com/blog/chatgpt-vs-bard/
GATE project [online], http://lsd.fi.muni.cz/gate/about
Laboratoř vyhledávání a dialogu, Lsd.fi.muni
[FI MUNI] Fakulta informatiky Masarykovy univerzity, http://fi.muni.cz
OpenAI_generování obrázků_https://platform.openai.com/overview
[csWiki] csWikipedia:

  • ChatGPT
  • Generativní gramatika
  • GPT-3
  • Hluboké učení
  • Umělá inteligence
  • Umělá neuronová síť

[DPS-AZ]

  • Umělá inteligence, DPS-AZ, č.4/2022
  • Inteligentní systémy, DPS-AZ, č.1/2021

[enWiki] enWikipedia:

  • Artificial Intelligence
  • Ethics of artificial intelligence
  • Category: Artificial intelligence
  • Category: Artificial intelligence applications
  • Glossary of artificial intelligence
  • Neural network
  • Transformer (machine learning model)

[WikiComm] Wikimedia Commons: (obr. 1, 2 a 3)

  • Fig-y Part of ML as subfield of AI or AI as subfield of ML.jpg, autor: Yakoove
  • NeuronModel.jpg, autor: Jeanlagi
  • Generated greenhouses.png, autor CMadeo (WMF)