Rencontres Algolittéraires: Difference between revisions
From Algolit
Line 32: | Line 32: | ||
=====Ensembles de données Algolittéraires ===== | =====Ensembles de données Algolittéraires ===== | ||
Travailler avec des textes littéraires comme entrées génère une certaine beauté poétique dans la lecture/l'écriture des algorithmes. Voici une petite collection utilisé pour les expérimentations. | Travailler avec des textes littéraires comme entrées génère une certaine beauté poétique dans la lecture/l'écriture des algorithmes. Voici une petite collection utilisé pour les expérimentations. | ||
− | * [[The data (e)speaks]] = [[La donnée (e)parle]] | + | * [[The data (e)speaks]] = [[La donnée (e)parle]] |
* [[Frankenstein]] = [[Frankenstein FR]] | * [[Frankenstein]] = [[Frankenstein FR]] | ||
* [[Learning from Deep Learning]] = [[Apprendre de l'apprentissage profond]] | * [[Learning from Deep Learning]] = [[Apprendre de l'apprentissage profond]] |
Revision as of 10:04, 2 November 2017
Á Propos
Oeuvres Algolittéraires
Une sélection d'oeuvres de membres d'Algolit présentées précédemment dans d'autres contextes.
- Oulipo recipes = Recettes Oulipo
- i-could-have-written-that = i-could-have-written-that FR
- The Weekly Address, A model for a politician = The Weekly Address, Un modèle pour un politicien
- In the company of CluebotNG = En compagnie de CluebotNG - decide on link to False Positive page
Explorations Algolittéraires
Ce chapitre présenté une partie de la recherche d'Algolit de 2016-2017.
Ce que la machine écrit: mise au point sur la sortie
Deux réseaux neuronaux sont présentés, quels contenus produisent-ils?
- CHARNN text generator = Générateur de texte CHARNN
- You shall know a word by the company it keeps = Vous connaîtrez un mot par la compagnie qu'il tient
Comment la machine lit: dissection des réseaux neuronaux
Ensemble de données
Travailler avec des réseaux neuronaux inclut la collection de grandes quantités de données pour l'entraînement. Voici une comparaison avec la collection des mots de la Bibliothèque de St-Gilles.
Ensembles de données publics
Les ensembles de données publics les plus utilisées sont rassemblés sur Amazon. Nous avons regardé de près les deux jeux suivants:
Ensembles de données Algolittéraires
Travailler avec des textes littéraires comme entrées génère une certaine beauté poétique dans la lecture/l'écriture des algorithmes. Voici une petite collection utilisé pour les expérimentations.
- The data (e)speaks = La donnée (e)parle
- Frankenstein = Frankenstein FR
- Learning from Deep Learning = Apprendre de l'apprentissage profond
- nearbySaussure
- astroBlackness
Des mots aux nombres
Comme l'apprentissage automatique est basé sur la statistiques et les maths, le texte doit être transformé en nombres afin de pouvoir le travailler. Dans cette section, nous présentons trois techniques de transformation.
- A Bag of Words = Un sac de mots
- A One Hot Vector = Un vecteur one-hot
- Exploration de Paysages Multidimensionels: Sur le plongement lexical
- Plongement lexical: un cas d'étude
Différents portraits du plongement lexical
- Word embedding Projector = Projecteur de plongement lexical
- The GloVe Reader = Le Lecteur GloVe - Decide on Link to GloVe page...
Inspection de la technique
Comment une machine pourrait parler
Si un modèle d'apprentissage automatique pouvait parler, que dirait-il?
Sources
Les scripts que nous avons utilisés et une sélection de textes qui nous ont accompagnés.