Details
Originalsprache | Deutsch |
---|---|
Veröffentlichungsnummer (amtliches Aktenzeichen) | DE102020209281 |
IPC | G06N 3/ 08 A I |
Prioritätsdatum | 23 Juli 2020 |
Publikationsstatus | Veröffentlicht - 27 Jan. 2022 |
Abstract
Verfahren (20) zum Lernen einer Strategie (π), welche zumindest einen Parameter (σ) eines Evolutionären Algorithmus optimal anpasst. Das Verfahren umfasst die folgenden Schritte: Initialisieren der Strategie, welche abhängig von Zustandsinformationen (S) eine Parametrisierung (A) des Parameters (σ) ermittelt. Erlernen der Strategie (π) mittels bestärkendem Lernen (engl. reinforcement learning), wobei aus Interaktionen des CMA-ES Algorithmus mit einer Parametrisierung, bestimmt mittels der Strategie abhängig von den Zustandsinformationen (S), mit einer Probleminstanz (14) und einem Belohnungssignal (R) gelernt wird, welche Parametrisierung für mögliche Zustandsinformationen optimal ist.
Zitieren
- Standard
- Harvard
- Apa
- Vancouver
- BibTex
- RIS
Patent Nr.: DE102020209281. Jan. 27, 2022.
Publikation: Schutzrecht/Patent › Patent
}
TY - PAT
T1 - Verfahren und Vorrichtung zum Lernen einer Strategie und Betreiben der Strategie
AU - Adriaenssen, Steven
AU - Biedenkapp, Andre
AU - Hutter, Frank
AU - Shala, Gresa
AU - Lindauer, Marius
AU - Awad, Noor
PY - 2022/1/27
Y1 - 2022/1/27
N2 - Verfahren (20) zum Lernen einer Strategie (π), welche zumindest einen Parameter (σ) eines Evolutionären Algorithmus optimal anpasst. Das Verfahren umfasst die folgenden Schritte: Initialisieren der Strategie, welche abhängig von Zustandsinformationen (S) eine Parametrisierung (A) des Parameters (σ) ermittelt. Erlernen der Strategie (π) mittels bestärkendem Lernen (engl. reinforcement learning), wobei aus Interaktionen des CMA-ES Algorithmus mit einer Parametrisierung, bestimmt mittels der Strategie abhängig von den Zustandsinformationen (S), mit einer Probleminstanz (14) und einem Belohnungssignal (R) gelernt wird, welche Parametrisierung für mögliche Zustandsinformationen optimal ist.
AB - Verfahren (20) zum Lernen einer Strategie (π), welche zumindest einen Parameter (σ) eines Evolutionären Algorithmus optimal anpasst. Das Verfahren umfasst die folgenden Schritte: Initialisieren der Strategie, welche abhängig von Zustandsinformationen (S) eine Parametrisierung (A) des Parameters (σ) ermittelt. Erlernen der Strategie (π) mittels bestärkendem Lernen (engl. reinforcement learning), wobei aus Interaktionen des CMA-ES Algorithmus mit einer Parametrisierung, bestimmt mittels der Strategie abhängig von den Zustandsinformationen (S), mit einer Probleminstanz (14) und einem Belohnungssignal (R) gelernt wird, welche Parametrisierung für mögliche Zustandsinformationen optimal ist.
M3 - Patent
M1 - DE102020209281
ER -