(EN) This disclosure relates to a method for generating simulated communication data. A processor trains a model on historical communication data. The model comprises a probability distribution to model time, sender, and recipients and a parameter vector that jointly encodes information from the input event sequence of time value, the sender and the recipients. The probability distribution is based on the parameter vector. The processor generates a collection of simulated communication messages by sampling from the probability distribution to determine a time value, a sender, and recipients of the simulated communication message, wherein the recipients are dependent on the sender of the simulated message. The processor generates a simulated natural language text for the message, which is part of a simulated conversation between the sender and the recipients.
(FR) La présente invention concerne un procédé de génération de données de communication simulées. Un processeur exécute un modèle sur des données de communication historiques. Le modèle comprend une distribution de probabilité pour modéliser le temps, l'expéditeur et les destinataires et un vecteur de paramètres qui code conjointement des informations à partir de la séquence d'événements d'entrée de la valeur temporelle, de l'expéditeur et des destinataires. La distribution de probabilité est basée sur le vecteur de paramètre. Le processeur génère une collection de messages de communication simulés par échantillonnage à partir de la distribution de probabilité pour déterminer une valeur temporelle, un expéditeur et des destinataires du message de communication simulé, les destinataires étant dépendants de l'expéditeur du message simulé. Le processeur génère un texte en langage naturel simulé pour le message, qui fait partie d'une conversation simulée entre l'expéditeur et les destinataires.