Actions

Rencontres Algolittéraires: Difference between revisions

From Algolit

Line 5: Line 5:
  
 
==Oeuvres Algolittéraires==
 
==Oeuvres Algolittéraires==
 +
Une sélection d'oeuvres de membres d'Algolit présentées précédemment dans d'autres contextes.
 
* [[Oulipo recipes]] = [[Recettes Oulipo]]  
 
* [[Oulipo recipes]] = [[Recettes Oulipo]]  
 
* [[i-could-have-written-that]] = [[i-could-have-written-that FR]]  
 
* [[i-could-have-written-that]] = [[i-could-have-written-that FR]]  
Line 11: Line 12:
  
 
==Explorations Algolittéraires==
 
==Explorations Algolittéraires==
 +
Ce chapitre présenté une partie de la recherche d'Algolit de 2016-2017.
 
=== Ce que la machine écrit: mise au point sur la sortie===
 
=== Ce que la machine écrit: mise au point sur la sortie===
 +
Deux réseaux neuronaux sont présentés, quels contenus produisent-ils?
 
* [[CHARNN text generator]] = [[Générateur de texte CHARNN]]  
 
* [[CHARNN text generator]] = [[Générateur de texte CHARNN]]  
 
* [[You shall know a word by the company it keeps]] = [[Vous connaîtrez un mot par la compagnie qu'il tient]]
 
* [[You shall know a word by the company it keeps]] = [[Vous connaîtrez un mot par la compagnie qu'il tient]]
Line 18: Line 21:
  
 
====Ensemble de données ====
 
====Ensemble de données ====
 +
Travailler avec des réseaux neuronaux inclut la collection de grandes quantités de données pour l'entraînement. Voici une comparaison avec la collection des mots de la Bibliothèque de St-Gilles.
 
* [[Many many words]] = [[Beaucoup, beaucoup de mots]]  
 
* [[Many many words]] = [[Beaucoup, beaucoup de mots]]  
* [[The data (e)speaks]] = [[La donnée (e)parle]] - needs to be completed
 
  
=====Ensembles de données publics communs=====
+
=====Ensembles de données publics=====
 +
Les ensembles de données publics les plus utilisées sont rassemblés sur [https://aws.amazon.com/public-datasets/ Amazon].
 +
Nous avons regardé de près les deux jeux suivants:
 
* [[Common Crawl]] = [[Common Crawl FR]]
 
* [[Common Crawl]] = [[Common Crawl FR]]
 
* [[WikiHarass]] = [[WikiHarass FR]]
 
* [[WikiHarass]] = [[WikiHarass FR]]
  
 
=====Ensembles de données Algolittéraires =====
 
=====Ensembles de données Algolittéraires =====
 +
Travailler avec des textes littéraires comme entrées génère une certaine beauté poétique dans la lecture/l'écriture des algorithmes. Voici une petite collection utilisé pour les expérimentations.
 +
* [[The data (e)speaks]] = [[La donnée (e)parle]] - needs to be completed
 
* [[Frankenstein]] = [[Frankenstein FR]]
 
* [[Frankenstein]] = [[Frankenstein FR]]
 
* [[Learning from Deep Learning]] = [[Apprendre de l'apprentissage profond]]
 
* [[Learning from Deep Learning]] = [[Apprendre de l'apprentissage profond]]
Line 32: Line 39:
  
 
====Des mots aux nombres ====
 
====Des mots aux nombres ====
 +
Comme l'apprentissage automatique est basé sur la statistiques et les maths, le texte doit être transformé en nombres afin de pouvoir le travailler. Dans cette section, nous présentons trois techniques de transformation.
 
* [[A Bag of Words]] = [[Un sac de mots]]
 
* [[A Bag of Words]] = [[Un sac de mots]]
 
* [[A One Hot Vector]] = [[Un vecteur one-hot]]  
 
* [[A One Hot Vector]] = [[Un vecteur one-hot]]  
Line 48: Line 56:
  
 
===Comment une machine pourrait parler ===
 
===Comment une machine pourrait parler ===
 +
Si un modèle d'apprentissage automatique pouvait parler, que dirait-il?
 
* [[We Are A Sentiment Thermometer]] = [[Nous sommes un thermomètre sentimental]]
 
* [[We Are A Sentiment Thermometer]] = [[Nous sommes un thermomètre sentimental]]
  
 
== Sources ==
 
== Sources ==
 +
Les scripts que nous avons utilisés et une sélection de textes qui nous ont accompagnés.
 
* [[Algoliterary Toolkit]] = [[Boîte à outils Algolittéraire]]
 
* [[Algoliterary Toolkit]] = [[Boîte à outils Algolittéraire]]
 
* [[Algoliterary Bibliography]] = [[Bibliographie Algolittéraire]]
 
* [[Algoliterary Bibliography]] = [[Bibliographie Algolittéraire]]

Revision as of 09:57, 2 November 2017

Á Propos

Oeuvres Algolittéraires

Une sélection d'oeuvres de membres d'Algolit présentées précédemment dans d'autres contextes.

Explorations Algolittéraires

Ce chapitre présenté une partie de la recherche d'Algolit de 2016-2017.

Ce que la machine écrit: mise au point sur la sortie

Deux réseaux neuronaux sont présentés, quels contenus produisent-ils?

Comment la machine lit: dissection des réseaux neuronaux

Ensemble de données

Travailler avec des réseaux neuronaux inclut la collection de grandes quantités de données pour l'entraînement. Voici une comparaison avec la collection des mots de la Bibliothèque de St-Gilles.

Ensembles de données publics

Les ensembles de données publics les plus utilisées sont rassemblés sur Amazon. Nous avons regardé de près les deux jeux suivants:

Ensembles de données Algolittéraires

Travailler avec des textes littéraires comme entrées génère une certaine beauté poétique dans la lecture/l'écriture des algorithmes. Voici une petite collection utilisé pour les expérimentations.

Des mots aux nombres

Comme l'apprentissage automatique est basé sur la statistiques et les maths, le texte doit être transformé en nombres afin de pouvoir le travailler. Dans cette section, nous présentons trois techniques de transformation.

Exploration de paysages Multidimensionnels: le plongement lexical

Différents portraits du plongement lexical
Inspection de la technique

Comment une machine pourrait parler

Si un modèle d'apprentissage automatique pouvait parler, que dirait-il?

Sources

Les scripts que nous avons utilisés et une sélection de textes qui nous ont accompagnés.