Verfahren und Vorrichtung zum Lernen einer Strategie und Betreiben der Strategie

Publikation: Schutzrecht/PatentPatent

Erfinder/-innen

  • Steven Adriaenssen (Erfinder*in)
  • Andre Biedenkapp (Erfinder*in)
  • Frank Hutter (Erfinder*in)
  • Gresa Shala (Erfinder*in)
  • Marius Lindauer (Erfinder*in)
  • Noor Awad (Erfinder*in)

Organisationseinheiten

Forschungs-netzwerk anzeigen

Details

OriginalspracheDeutsch
Veröffentlichungsnummer (amtliches Aktenzeichen)DE102020209281
IPCG06N 3/ 08 A I
Prioritätsdatum23 Juli 2020
PublikationsstatusVeröffentlicht - 27 Jan. 2022

Abstract

Verfahren (20) zum Lernen einer Strategie (π), welche zumindest einen Parameter (σ) eines Evolutionären Algorithmus optimal anpasst. Das Verfahren umfasst die folgenden Schritte: Initialisieren der Strategie, welche abhängig von Zustandsinformationen (S) eine Parametrisierung (A) des Parameters (σ) ermittelt. Erlernen der Strategie (π) mittels bestärkendem Lernen (engl. reinforcement learning), wobei aus Interaktionen des CMA-ES Algorithmus mit einer Parametrisierung, bestimmt mittels der Strategie abhängig von den Zustandsinformationen (S), mit einer Probleminstanz (14) und einem Belohnungssignal (R) gelernt wird, welche Parametrisierung für mögliche Zustandsinformationen optimal ist.

Zitieren

Verfahren und Vorrichtung zum Lernen einer Strategie und Betreiben der Strategie. / Adriaenssen, Steven (Erfinder*in); Biedenkapp, Andre (Erfinder*in); Hutter, Frank (Erfinder*in) et al.
Patent Nr.: DE102020209281. Jan. 27, 2022.

Publikation: Schutzrecht/PatentPatent

Adriaenssen, S, Biedenkapp, A, Hutter, F, Shala, G, Lindauer, M & Awad, N Jan.. 27 2022, Verfahren und Vorrichtung zum Lernen einer Strategie und Betreiben der Strategie, Patent Nr. DE102020209281.
Adriaenssen, S., Biedenkapp, A., Hutter, F., Shala, G., Lindauer, M., & Awad, N. (2022). Verfahren und Vorrichtung zum Lernen einer Strategie und Betreiben der Strategie. (Patent Nr. DE102020209281).
Adriaenssen S, Biedenkapp A, Hutter F, Shala G, Lindauer M, Awad N, Erfinder/-innen. Verfahren und Vorrichtung zum Lernen einer Strategie und Betreiben der Strategie. DE102020209281. 2022 Jan 27.
Adriaenssen, Steven (Erfinder*in) ; Biedenkapp, Andre (Erfinder*in) ; Hutter, Frank (Erfinder*in) et al. / Verfahren und Vorrichtung zum Lernen einer Strategie und Betreiben der Strategie. Patent Nr.: DE102020209281. Jan. 27, 2022.
Download
@misc{8bfcc7711f764733ad3a0b2d2afb0ca5,
title = "Verfahren und Vorrichtung zum Lernen einer Strategie und Betreiben der Strategie",
abstract = "Verfahren (20) zum Lernen einer Strategie (π), welche zumindest einen Parameter (σ) eines Evolution{\"a}ren Algorithmus optimal anpasst. Das Verfahren umfasst die folgenden Schritte: Initialisieren der Strategie, welche abh{\"a}ngig von Zustandsinformationen (S) eine Parametrisierung (A) des Parameters (σ) ermittelt. Erlernen der Strategie (π) mittels best{\"a}rkendem Lernen (engl. reinforcement learning), wobei aus Interaktionen des CMA-ES Algorithmus mit einer Parametrisierung, bestimmt mittels der Strategie abh{\"a}ngig von den Zustandsinformationen (S), mit einer Probleminstanz (14) und einem Belohnungssignal (R) gelernt wird, welche Parametrisierung f{\"u}r m{\"o}gliche Zustandsinformationen optimal ist.",
author = "Steven Adriaenssen and Andre Biedenkapp and Frank Hutter and Gresa Shala and Marius Lindauer and Noor Awad",
year = "2022",
month = jan,
day = "27",
language = "Deutsch",
type = "Patent",
note = "DE102020209281; G06N 3/ 08 A I",

}

Download

TY - PAT

T1 - Verfahren und Vorrichtung zum Lernen einer Strategie und Betreiben der Strategie

AU - Adriaenssen, Steven

AU - Biedenkapp, Andre

AU - Hutter, Frank

AU - Shala, Gresa

AU - Lindauer, Marius

AU - Awad, Noor

PY - 2022/1/27

Y1 - 2022/1/27

N2 - Verfahren (20) zum Lernen einer Strategie (π), welche zumindest einen Parameter (σ) eines Evolutionären Algorithmus optimal anpasst. Das Verfahren umfasst die folgenden Schritte: Initialisieren der Strategie, welche abhängig von Zustandsinformationen (S) eine Parametrisierung (A) des Parameters (σ) ermittelt. Erlernen der Strategie (π) mittels bestärkendem Lernen (engl. reinforcement learning), wobei aus Interaktionen des CMA-ES Algorithmus mit einer Parametrisierung, bestimmt mittels der Strategie abhängig von den Zustandsinformationen (S), mit einer Probleminstanz (14) und einem Belohnungssignal (R) gelernt wird, welche Parametrisierung für mögliche Zustandsinformationen optimal ist.

AB - Verfahren (20) zum Lernen einer Strategie (π), welche zumindest einen Parameter (σ) eines Evolutionären Algorithmus optimal anpasst. Das Verfahren umfasst die folgenden Schritte: Initialisieren der Strategie, welche abhängig von Zustandsinformationen (S) eine Parametrisierung (A) des Parameters (σ) ermittelt. Erlernen der Strategie (π) mittels bestärkendem Lernen (engl. reinforcement learning), wobei aus Interaktionen des CMA-ES Algorithmus mit einer Parametrisierung, bestimmt mittels der Strategie abhängig von den Zustandsinformationen (S), mit einer Probleminstanz (14) und einem Belohnungssignal (R) gelernt wird, welche Parametrisierung für mögliche Zustandsinformationen optimal ist.

M3 - Patent

M1 - DE102020209281

ER -

Von denselben Autoren