Rencontres Algolittéraires: Difference between revisions
From Algolit
Line 5: | Line 5: | ||
==Oeuvres Algolittéraires== | ==Oeuvres Algolittéraires== | ||
+ | Une sélection d'oeuvres de membres d'Algolit présentées précédemment dans d'autres contextes. | ||
* [[Oulipo recipes]] = [[Recettes Oulipo]] | * [[Oulipo recipes]] = [[Recettes Oulipo]] | ||
* [[i-could-have-written-that]] = [[i-could-have-written-that FR]] | * [[i-could-have-written-that]] = [[i-could-have-written-that FR]] | ||
Line 11: | Line 12: | ||
==Explorations Algolittéraires== | ==Explorations Algolittéraires== | ||
+ | Ce chapitre présenté une partie de la recherche d'Algolit de 2016-2017. | ||
=== Ce que la machine écrit: mise au point sur la sortie=== | === Ce que la machine écrit: mise au point sur la sortie=== | ||
+ | Deux réseaux neuronaux sont présentés, quels contenus produisent-ils? | ||
* [[CHARNN text generator]] = [[Générateur de texte CHARNN]] | * [[CHARNN text generator]] = [[Générateur de texte CHARNN]] | ||
* [[You shall know a word by the company it keeps]] = [[Vous connaîtrez un mot par la compagnie qu'il tient]] | * [[You shall know a word by the company it keeps]] = [[Vous connaîtrez un mot par la compagnie qu'il tient]] | ||
Line 18: | Line 21: | ||
====Ensemble de données ==== | ====Ensemble de données ==== | ||
+ | Travailler avec des réseaux neuronaux inclut la collection de grandes quantités de données pour l'entraînement. Voici une comparaison avec la collection des mots de la Bibliothèque de St-Gilles. | ||
* [[Many many words]] = [[Beaucoup, beaucoup de mots]] | * [[Many many words]] = [[Beaucoup, beaucoup de mots]] | ||
− | |||
− | =====Ensembles de données publics | + | =====Ensembles de données publics===== |
+ | Les ensembles de données publics les plus utilisées sont rassemblés sur [https://aws.amazon.com/public-datasets/ Amazon]. | ||
+ | Nous avons regardé de près les deux jeux suivants: | ||
* [[Common Crawl]] = [[Common Crawl FR]] | * [[Common Crawl]] = [[Common Crawl FR]] | ||
* [[WikiHarass]] = [[WikiHarass FR]] | * [[WikiHarass]] = [[WikiHarass FR]] | ||
=====Ensembles de données Algolittéraires ===== | =====Ensembles de données Algolittéraires ===== | ||
+ | Travailler avec des textes littéraires comme entrées génère une certaine beauté poétique dans la lecture/l'écriture des algorithmes. Voici une petite collection utilisé pour les expérimentations. | ||
+ | * [[The data (e)speaks]] = [[La donnée (e)parle]] - needs to be completed | ||
* [[Frankenstein]] = [[Frankenstein FR]] | * [[Frankenstein]] = [[Frankenstein FR]] | ||
* [[Learning from Deep Learning]] = [[Apprendre de l'apprentissage profond]] | * [[Learning from Deep Learning]] = [[Apprendre de l'apprentissage profond]] | ||
Line 32: | Line 39: | ||
====Des mots aux nombres ==== | ====Des mots aux nombres ==== | ||
+ | Comme l'apprentissage automatique est basé sur la statistiques et les maths, le texte doit être transformé en nombres afin de pouvoir le travailler. Dans cette section, nous présentons trois techniques de transformation. | ||
* [[A Bag of Words]] = [[Un sac de mots]] | * [[A Bag of Words]] = [[Un sac de mots]] | ||
* [[A One Hot Vector]] = [[Un vecteur one-hot]] | * [[A One Hot Vector]] = [[Un vecteur one-hot]] | ||
Line 48: | Line 56: | ||
===Comment une machine pourrait parler === | ===Comment une machine pourrait parler === | ||
+ | Si un modèle d'apprentissage automatique pouvait parler, que dirait-il? | ||
* [[We Are A Sentiment Thermometer]] = [[Nous sommes un thermomètre sentimental]] | * [[We Are A Sentiment Thermometer]] = [[Nous sommes un thermomètre sentimental]] | ||
== Sources == | == Sources == | ||
+ | Les scripts que nous avons utilisés et une sélection de textes qui nous ont accompagnés. | ||
* [[Algoliterary Toolkit]] = [[Boîte à outils Algolittéraire]] | * [[Algoliterary Toolkit]] = [[Boîte à outils Algolittéraire]] | ||
* [[Algoliterary Bibliography]] = [[Bibliographie Algolittéraire]] | * [[Algoliterary Bibliography]] = [[Bibliographie Algolittéraire]] |
Revision as of 09:57, 2 November 2017
Á Propos
Oeuvres Algolittéraires
Une sélection d'oeuvres de membres d'Algolit présentées précédemment dans d'autres contextes.
- Oulipo recipes = Recettes Oulipo
- i-could-have-written-that = i-could-have-written-that FR
- The Weekly Address, A model for a politician = The Weekly Address, Un modèle pour un politicien
- In the company of CluebotNG = En compagnie de CluebotNG - decide on link to False Positive page
Explorations Algolittéraires
Ce chapitre présenté une partie de la recherche d'Algolit de 2016-2017.
Ce que la machine écrit: mise au point sur la sortie
Deux réseaux neuronaux sont présentés, quels contenus produisent-ils?
- CHARNN text generator = Générateur de texte CHARNN
- You shall know a word by the company it keeps = Vous connaîtrez un mot par la compagnie qu'il tient
Comment la machine lit: dissection des réseaux neuronaux
Ensemble de données
Travailler avec des réseaux neuronaux inclut la collection de grandes quantités de données pour l'entraînement. Voici une comparaison avec la collection des mots de la Bibliothèque de St-Gilles.
Ensembles de données publics
Les ensembles de données publics les plus utilisées sont rassemblés sur Amazon. Nous avons regardé de près les deux jeux suivants:
Ensembles de données Algolittéraires
Travailler avec des textes littéraires comme entrées génère une certaine beauté poétique dans la lecture/l'écriture des algorithmes. Voici une petite collection utilisé pour les expérimentations.
- The data (e)speaks = La donnée (e)parle - needs to be completed
- Frankenstein = Frankenstein FR
- Learning from Deep Learning = Apprendre de l'apprentissage profond
- nearbySaussure
- astroBlackness
Des mots aux nombres
Comme l'apprentissage automatique est basé sur la statistiques et les maths, le texte doit être transformé en nombres afin de pouvoir le travailler. Dans cette section, nous présentons trois techniques de transformation.
Exploration de paysages Multidimensionnels: le plongement lexical
Différents portraits du plongement lexical
- Word embedding Projector = Projecteur de plongement lexical
- The GloVe Reader = Le Lecteur GloVe - Decide on Link to GloVe page...
Inspection de la technique
Comment une machine pourrait parler
Si un modèle d'apprentissage automatique pouvait parler, que dirait-il?
Sources
Les scripts que nous avons utilisés et une sélection de textes qui nous ont accompagnés.