Actions

Algèbre avec des Mots: Difference between revisions

From Algolit

(Created page with "par Algolit L'algèbre est généralement définie comme une généralisation de l'arithmétique dans laquelle des lettres représentant des numéros sont combinées selon le...")
 
Line 1: Line 1:
 
par Algolit
 
par Algolit
  
L'algèbre est généralement définie comme une généralisation de l'arithmétique dans laquelle des lettres représentant des numéros sont combinées selon les règles de l'arithmétique. Dans le traitement automatique du langage naturel, l'ordre est inversé: les mots sont représentés par des numéros qui sont générés par les circonstances du texte et de l'algorithme qui les traite.  
+
'Word embeddings' sont des techniques de modélisation du langage qui, par de multiples opérations mathématiques, tracent des mots dans un espace vectoriel multidimensionnel. Lorsque les mots sont 'embedded' ou intégrés, ils se transforment de symboles distincts en objets mathématiques, qui peuvent être multipliés, divisés, ajoutés ou soustraits.
Cette exploration utilise gensim, une boîte à outils open source, pour créer des espaces de vecteurs et des modèles thématiques, implémentée en Python. Elle manipule le texte selon les relations mathématiques qui émergent entre les mots, une fois qu'ils ont été tracés dans l'espace de vecteurs.
+
 
 +
En distribuant les mots le long des nombreuses lignes diagonales de l'espace vectoriel multidimensionnel, leurs nouveaux placements géométriques deviennent impossibles à percevoir par les humains. Cependant, ce que l'on gagne, ce sont des façons multiples et simultanées d'organisation des mots. Les opérations algébriques rendent les relations entre les vecteurs à nouveau compréhensibles.
 +
 
 +
Cette installation utilise [https://radimrehurek.com/gensim/index.html gensim], une boîte à outils open source pour le language de programmation Python, qui permet de créer des espaces de vecteurs et des modèles thématiques. Elle manipule le texte selon les relations mathématiques qui émergent entre les mots, une fois qu'ils ont été tracés dans l'espace de vecteurs.

Revision as of 15:40, 9 March 2019

par Algolit

'Word embeddings' sont des techniques de modélisation du langage qui, par de multiples opérations mathématiques, tracent des mots dans un espace vectoriel multidimensionnel. Lorsque les mots sont 'embedded' ou intégrés, ils se transforment de symboles distincts en objets mathématiques, qui peuvent être multipliés, divisés, ajoutés ou soustraits.

En distribuant les mots le long des nombreuses lignes diagonales de l'espace vectoriel multidimensionnel, leurs nouveaux placements géométriques deviennent impossibles à percevoir par les humains. Cependant, ce que l'on gagne, ce sont des façons multiples et simultanées d'organisation des mots. Les opérations algébriques rendent les relations entre les vecteurs à nouveau compréhensibles.

Cette installation utilise gensim, une boîte à outils open source pour le language de programmation Python, qui permet de créer des espaces de vecteurs et des modèles thématiques. Elle manipule le texte selon les relations mathématiques qui émergent entre les mots, une fois qu'ils ont été tracés dans l'espace de vecteurs.