Processing

Please wait...

PATENTSCOPE will be unavailable a few hours for maintenance reason on Saturday 31.10.2020 at 2:00 PM JST
Settings

Settings

Goto Application

1. WO2020208444 - FAIRNESS IMPROVEMENT THROUGH REINFORCEMENT LEARNING

Publication Number WO/2020/208444
Publication Date 15.10.2020
International Application No. PCT/IB2020/052465
International Filing Date 18.03.2020
IPC
G06N 20/00 2019.01
GPHYSICS
06COMPUTING; CALCULATING OR COUNTING
NCOMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS
20Machine learning
CPC
G06N 20/00
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
NCOMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS
20Machine learning
G06N 3/08
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
NCOMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS
3Computer systems based on biological models
02using neural network models
08Learning methods
Applicants
  • INTERNATIONAL BUSINESS MACHINES CORPORATION [US]/[US]
  • IBM (CHINA) INVESTMENT COMPANY LTD. [CN]/[CN] (MG)
  • IBM DEUTSCHLAND GMBH [DE]/[DE] (MG)
Inventors
  • CHALOULOS, Georgios
  • FLOETHER, Frederik
  • GRAF, Florian
  • LUSTENBERGER, Patrick
  • RAVIZZA, Stefan
  • SLOTTKE, Eric
Agents
  • KLETT, Peter
Priority Data
16/377,72708.04.2019US
Publication Language English (EN)
Filing Language English (EN)
Designated States
Title
(EN) FAIRNESS IMPROVEMENT THROUGH REINFORCEMENT LEARNING
(FR) AMÉLIORATION D'ÉQUITÉ PAR APPRENTISSAGE PAR RENFORCEMENT
Abstract
(EN)
A computer-implemented method for improving fairness in a supervised machine-learning model may be provided. The method comprises linking the supervised machine-learning model to a reinforcement learning meta model, selecting a list of hyper-parameters and parameters of the supervised machine-learning model, and controlling at least one aspect of the supervised machine-learning model by adjusting hyper-parameters values and parameter values of the list of hyper-parameters and parameters of the supervised machine-learning model by a reinforcement learning engine relating to the reinforcement learning meta model by calculating a reward function based on multiple conflicting objective functions. The method further comprises repeating iteratively the steps of selecting and controlling for improving a fairness value of the supervised machine-learning model.
(FR)
L'invention concerne un procédé mis en œuvre par ordinateur pour améliorer l'équité dans un modèle d'apprentissage machine supervisé. Le procédé comprend la liaison du modèle d'apprentissage machine supervisé à un méta-modèle d'apprentissage de renfort, la sélection d'une liste d'hyper-paramètres et de paramètres du modèle d'apprentissage machine supervisé, et la commande d'au moins un aspect du modèle d'apprentissage machine supervisé par ajustement de valeurs d'hyper-paramètres et de valeurs de paramètre de la liste d'hyper-paramètres et de paramètres du modèle d'apprentissage machine supervisé par un moteur d'apprentissage par renforcement relatif au méta-modèle d'apprentissage par renforcement par calcul d'une fonction de récompense sur la base de multiples fonctions objectives conflictuelles. Le procédé comprend en outre la répétition itérative des étapes de sélection et de commande pour améliorer une valeur d'équité du modèle d'apprentissage machine supervisé.
Latest bibliographic data on file with the International Bureau