Verfahren und Vorrichtung zum Lernen einer Strategie und Betreiben der Strategie

Steven Adriaenssen; Andre Biedenkapp; Frank Hutter; Gresa Shala; Marius Lindauer; Noor Awad

Details

Originalsprache	Deutsch
Veröffentlichungsnummer (amtliches Aktenzeichen)	DE102020209281
IPC	G06N 3/ 08 A I
Prioritätsdatum	23 Juli 2020
Publikationsstatus	Veröffentlicht - 27 Jan. 2022

Abstract

Verfahren (20) zum Lernen einer Strategie (π), welche zumindest einen Parameter (σ) eines Evolutionären Algorithmus optimal anpasst. Das Verfahren umfasst die folgenden Schritte: Initialisieren der Strategie, welche abhängig von Zustandsinformationen (S) eine Parametrisierung (A) des Parameters (σ) ermittelt. Erlernen der Strategie (π) mittels bestärkendem Lernen (engl. reinforcement learning), wobei aus Interaktionen des CMA-ES Algorithmus mit einer Parametrisierung, bestimmt mittels der Strategie abhängig von den Zustandsinformationen (S), mit einer Probleminstanz (14) und einem Belohnungssignal (R) gelernt wird, welche Parametrisierung für mögliche Zustandsinformationen optimal ist.

Zitieren

Verfahren und Vorrichtung zum Lernen einer Strategie und Betreiben der Strategie. / Adriaenssen, Steven (Erfinder*in); Biedenkapp, Andre (Erfinder*in); Hutter, Frank (Erfinder*in) et al.
Patent Nr.: DE102020209281. Jan. 27, 2022.

Publikation: Schutzrecht/Patent › Patent

Adriaenssen, S, Biedenkapp, A, Hutter, F, Shala, G, Lindauer, M & Awad, N Jan.. 27 2022, Verfahren und Vorrichtung zum Lernen einer Strategie und Betreiben der Strategie, Patent Nr. DE102020209281.

Adriaenssen, S., Biedenkapp, A., Hutter, F., Shala, G., Lindauer, M., & Awad, N. (2022). Verfahren und Vorrichtung zum Lernen einer Strategie und Betreiben der Strategie. (Patent Nr. DE102020209281).

Adriaenssen S, Biedenkapp A, Hutter F, Shala G, Lindauer M, Awad N, Erfinder/-innen. Verfahren und Vorrichtung zum Lernen einer Strategie und Betreiben der Strategie. DE102020209281. 2022 Jan 27.

Adriaenssen, Steven (Erfinder*in) ; Biedenkapp, Andre (Erfinder*in) ; Hutter, Frank (Erfinder*in) et al. / Verfahren und Vorrichtung zum Lernen einer Strategie und Betreiben der Strategie. Patent Nr.: DE102020209281. Jan. 27, 2022.

Download

@misc{8bfcc7711f764733ad3a0b2d2afb0ca5,

title = "Verfahren und Vorrichtung zum Lernen einer Strategie und Betreiben der Strategie",

abstract = "Verfahren (20) zum Lernen einer Strategie (π), welche zumindest einen Parameter (σ) eines Evolution{\"a}ren Algorithmus optimal anpasst. Das Verfahren umfasst die folgenden Schritte: Initialisieren der Strategie, welche abh{\"a}ngig von Zustandsinformationen (S) eine Parametrisierung (A) des Parameters (σ) ermittelt. Erlernen der Strategie (π) mittels best{\"a}rkendem Lernen (engl. reinforcement learning), wobei aus Interaktionen des CMA-ES Algorithmus mit einer Parametrisierung, bestimmt mittels der Strategie abh{\"a}ngig von den Zustandsinformationen (S), mit einer Probleminstanz (14) und einem Belohnungssignal (R) gelernt wird, welche Parametrisierung f{\"u}r m{\"o}gliche Zustandsinformationen optimal ist.",

author = "Steven Adriaenssen and Andre Biedenkapp and Frank Hutter and Gresa Shala and Marius Lindauer and Noor Awad",

year = "2022",

month = jan,

day = "27",

language = "Deutsch",

type = "Patent",

note = "DE102020209281; G06N 3/ 08 A I",

}

Download

TY - PAT

T1 - Verfahren und Vorrichtung zum Lernen einer Strategie und Betreiben der Strategie

AU - Adriaenssen, Steven

AU - Biedenkapp, Andre

AU - Hutter, Frank

AU - Shala, Gresa

AU - Lindauer, Marius

AU - Awad, Noor

PY - 2022/1/27

Y1 - 2022/1/27

N2 - Verfahren (20) zum Lernen einer Strategie (π), welche zumindest einen Parameter (σ) eines Evolutionären Algorithmus optimal anpasst. Das Verfahren umfasst die folgenden Schritte: Initialisieren der Strategie, welche abhängig von Zustandsinformationen (S) eine Parametrisierung (A) des Parameters (σ) ermittelt. Erlernen der Strategie (π) mittels bestärkendem Lernen (engl. reinforcement learning), wobei aus Interaktionen des CMA-ES Algorithmus mit einer Parametrisierung, bestimmt mittels der Strategie abhängig von den Zustandsinformationen (S), mit einer Probleminstanz (14) und einem Belohnungssignal (R) gelernt wird, welche Parametrisierung für mögliche Zustandsinformationen optimal ist.

AB - Verfahren (20) zum Lernen einer Strategie (π), welche zumindest einen Parameter (σ) eines Evolutionären Algorithmus optimal anpasst. Das Verfahren umfasst die folgenden Schritte: Initialisieren der Strategie, welche abhängig von Zustandsinformationen (S) eine Parametrisierung (A) des Parameters (σ) ermittelt. Erlernen der Strategie (π) mittels bestärkendem Lernen (engl. reinforcement learning), wobei aus Interaktionen des CMA-ES Algorithmus mit einer Parametrisierung, bestimmt mittels der Strategie abhängig von den Zustandsinformationen (S), mit einer Probleminstanz (14) und einem Belohnungssignal (R) gelernt wird, welche Parametrisierung für mögliche Zustandsinformationen optimal ist.

M3 - Patent

M1 - DE102020209281

ER -

Research@Leibniz University

Verfahren und Vorrichtung zum Lernen einer Strategie und Betreiben der Strategie

Erfinder/-innen

Organisationseinheiten

Details

Abstract

Zitieren

Von denselben Autoren

AMLTK: A Modular AutoML Toolkit in Python

AutoML in Heavily Constrained Applications

Verfahren zum Trainieren eines Algorithmus des maschinellen Lernens durch ein bestärkendes Lernverfahren

Interactive Hyperparameter Optimization in Multi-Objective Problems via Preference Learning

AutoML: advanced tool for mining multivariate plant traits