• Slidy
  • Cultures Numeriques::Alphabet

    De Ustensile
    Aller à : navigation, rechercher
    Sesame-street-z.png

    Ce module prend le digital au clavier. De l'ASCII, au go en passant par la machine à écrire, quels sont les alphabets, syntaxes et sémantiques en jeux dans l'écriture numérique?

    → Télécharger le pdf des visuels traversés lundi 10 novembre.


    Le mot "alphabet" provient de "alpha" et "bêta", les deux premières lettres de l’alphabet grec, dérivé de l'alphabet phénicien.

    Alpha-beta proto-sinaitiques latin.jpeg

    Cours 1 — 10/11/2014

    Codages

    Alphabet morse → signaux maritimes → sémaphore → alphabet international n°1 → cartes perforées.

    Encodage

    MairChineseTypewriter.png

    Aperçu d'une machine à écrire chinoise (années 70). À voir aussi en vidéo ici.

    Le standard Unicode permet de représenter tous les caractères spécifiques aux différentes langues. De nouveaux codes sont régulièrement attribués pour de nouveaux caractères: caractères latins (accentués ou non), grecs, cyrillics, arméniens, hébreux, thaï, hiragana, katakana... L'alphabet Chinois Kanji comporte à lui seul 6879 caractères.

    Visiter la liste des caractères proposés, non approuvés par le standard.

    decodeunicode


    ASCII (American Standard Code for Information Interchange) fait partie des prédécesseurs d'Unicode. C'est une norme de codage de caractères informatiques composées de 128 caractères numérotés de 0 à 127.

    ASCII Code Chart-Quick ref card.png

    L'ASCII a limité pendant longtemps le nombre de caractères disponibles, notamment sur internet (noms de domaine, adresses mails) et dans l'écriture de programmes informatiques.


    L'UTF-8 (Universal Character Set Transformation Format - 8 bits) est un « format de transformation », il rassemble l'efficacité de l'ASCII et l'étendue de l'Unicode. C'est l'encodage le plus pratique pour échanger des textes constitués de caractères Unicode.

    Un texte en UTF-8 est partout en ASCII, et dès qu'on a besoin d'un caractère appartenant à Unicode, on utilise un caractère spécial qui signale que le caractère suivant est en Unicode.

    Par exemple, le "é" ne faisant pas partie du code ASCII. Il est traduit en UTF-8 par "é"


    Pour aller plus loin visiter la leçon d'Open classrooms sur l'encodage

    ASCII / typewriter art

    Black Tambourine, Beck

    2 générateurs ASCII en ligne : Picascii, text-image.com


    Ecriture générative

    Les contraintes Oulipiennes

    I am that I am de Brion Gysin, 1960 est l'un des premiers poèmes combinatoires assistés par ordinateur. Plusieurs des permutations de Brion Gysin ont été produites à l'aide d'un générateur aléatoire informatique programmé à l'époque par Ian Sommerville.

    Outils langages

    Permutation Software de Josef More

    GNU grep, documentation en ligne

    tesseract-ocr

    OCR Test


    Code Poetry

    Code Poetry Slam 2.0

    Cours 2 avec Madeleine Aktypi — 17/11/2014

    Alphabets : les lettres comme matière plastique

    Cette séance présente un ensemble de documents témoignant d'un usage diversifié de lettres de l'alphabet (grec, puis latin) en tant que matière plastique, visuelle et/ou sonore. Au programme des poèmes, mais aussi des typos et des lettrines, couvrant une large période historique, qui commence au 3ème siècle avant notre ère et arrive jusqu'à aujourd'hui.

    Fichier:Simmias de Rhodes - Les Ailes.jpg Juan Diaz Rengifo, Aquinas Arte Poetica Espanola Barcelona, 1726.jpg Ilse et Pierre Garnier Extensions 1964.jpg

    [Takashi Ohashi, Channeler, 2012]

    [Blackalicious, Alphabet Aerobics]

    Exercice pratique

    Une pile de journaux du jour est mise à disposition (+ ciseaux, colle)

    — individuellement ou par groupe (maximum 5 personnes), chacun choisit un article et le prend en photo

    — à partir de cet article, le groupe définit et teste une (ou des) contrainte(s) d'écriture et recompose le texte de l'article, suivant ces contraintes. La composition est réalisée en copier/coller manuel avec papier et ciseaux (photocopies à la demande).

    — la composition produite est photographiée (ou scannée) et passée à travers un programme de reconnaissance de caractères (station OCR mise à disposition sur la machine de Ludi et installable ici) ou en ligne sur free OCR. Le résultat texte obtenu est imprimé et transmis à un autre groupe qui définit de nouvelles contraintes d'écriture et propose une deuxième version du texte.


    → Le travail de chaque groupe consiste à rédiger le "script" définissant les contraintes et le processus appliqué au texte de la manière la plus claire et concise possible. Cette "recette" peut faire appel à des variables et s'inspirer de la syntaxe des langages de programmation visités pendant le cours (grep, python). Elle est écrite en texte seul et suit une mise en page minimale (indentations, espaces, sauts de lignes) qui participe à sa compréhension.

    Pour documenter les différentes étapes du projet, une photo (ou scan) est réalisée avant chaque transformation (article d'origine, texte produit (version1), texte après OCR, texte produit (version 2). Chaque groupe documente le parcours du texte de l'article qu'il a choisi à l'origine et le parcours du texte reçu d'un autre groupe.