En compagnie de CluebotNG: Difference between revisions
From Algolit
(One intermediate revision by the same user not shown) | |||
Line 12: | Line 12: | ||
Wikipédia s'appuie sur l'assistance par machine lorsqu'il s'agit de maintenance. L'une de ses applications les plus actives est [https://en.wikipedia.org/wiki/User:ClueBot_NG CluebotNG], un bot anti-vandaliste opérant sur le Wikipédia anglais depuis décembre 2010. | Wikipédia s'appuie sur l'assistance par machine lorsqu'il s'agit de maintenance. L'une de ses applications les plus actives est [https://en.wikipedia.org/wiki/User:ClueBot_NG CluebotNG], un bot anti-vandaliste opérant sur le Wikipédia anglais depuis décembre 2010. | ||
− | CluebotNG utilise une série de classificateurs bayésiens différents, qui mesurent le poids des mots pour attribuer un score de probabilité de vandalisme à une modification. Les résultats sont transmis à un réseau neuronal artificiel qui attribue en outre aux modifications un nombre compris entre 0 et 1, où | + | CluebotNG utilise une série de classificateurs bayésiens différents, qui mesurent le poids des mots pour attribuer un score de probabilité de vandalisme à une modification. Les résultats sont transmis à un réseau neuronal artificiel qui attribue en outre aux modifications un nombre compris entre 0 et 1, où 1 présente par 100% la probabilité qu'une modification soit mal intentionnée. |
− | Afin d'établir le point à partir duquel une contribution est considérée comme vandaliste, un seuil doit être choisi par l'opérateur de l'application. Celui-ci est calculé par rapport au taux de faux positifs qu'il génère: plus un seuil est bas, plus le nombre de | + | Afin d'établir le point à partir duquel une contribution est considérée comme vandaliste, un seuil doit être choisi par l'opérateur de l'application. Celui-ci est calculé par rapport au taux de [https://en.wikipedia.org/wiki/False_positives_and_false_negatives faux positifs] qu'il génère: plus un seuil est bas, plus le nombre de faux positifs est élevé. L'algorithme attrape la plupart des instances de vandalisme sur la plate-forme quand il fait le plus d'erreurs. La valeur de seuil pour CluebotNG a causé beaucoup de débats sur Wikipédia, où un équilibre entre haute efficacité est établi par rapport au nombre d'éditeurs qui sont accusés à tort. |
Si un faux positif se produit, c'est au responsable du code de l'examiner et de l'ajouter à une liste d'exceptions afin que l'algorithme puisse apprendre de la mauvaise classification. Cela implique une attention constante du mainteneur. | Si un faux positif se produit, c'est au responsable du code de l'examiner et de l'ajouter à une liste d'exceptions afin que l'algorithme puisse apprendre de la mauvaise classification. Cela implique une attention constante du mainteneur. |
Latest revision as of 13:40, 2 November 2017
Type: | Oeuvre Algolittéraire |
Données: | Modifications Wikipédia |
Technique: | Apprentissage automatique supervisé, classificateurs bayésiens naïfs |
Developpé par: | User:Cobi, User:Crispy1989, Cristina Cochior |
Wikipédia s'appuie sur l'assistance par machine lorsqu'il s'agit de maintenance. L'une de ses applications les plus actives est CluebotNG, un bot anti-vandaliste opérant sur le Wikipédia anglais depuis décembre 2010.
CluebotNG utilise une série de classificateurs bayésiens différents, qui mesurent le poids des mots pour attribuer un score de probabilité de vandalisme à une modification. Les résultats sont transmis à un réseau neuronal artificiel qui attribue en outre aux modifications un nombre compris entre 0 et 1, où 1 présente par 100% la probabilité qu'une modification soit mal intentionnée.
Afin d'établir le point à partir duquel une contribution est considérée comme vandaliste, un seuil doit être choisi par l'opérateur de l'application. Celui-ci est calculé par rapport au taux de faux positifs qu'il génère: plus un seuil est bas, plus le nombre de faux positifs est élevé. L'algorithme attrape la plupart des instances de vandalisme sur la plate-forme quand il fait le plus d'erreurs. La valeur de seuil pour CluebotNG a causé beaucoup de débats sur Wikipédia, où un équilibre entre haute efficacité est établi par rapport au nombre d'éditeurs qui sont accusés à tort.
Si un faux positif se produit, c'est au responsable du code de l'examiner et de l'ajouter à une liste d'exceptions afin que l'algorithme puisse apprendre de la mauvaise classification. Cela implique une attention constante du mainteneur.
Grâce à un bot de reconstitution qui passe par chacune des éditions de CluebotNG et les affiche sur un moniteur, la réplication séquentielle de ses éditions tisse un récit de voix non-humaines qui passent généralement inaperçues sur les plateformes médiatiques. Chaque micro-interaction du bot est intrinsèquement réalisée en lien avec un éditeur humain, que l'algorithme contrôle. Au fur et à mesure que le programme taxidermique s'exécute, une corporalité émerge pendant la durée nécessaire au bot pour arriver au terme de ses modifications.