Catégories
amusant critiques lectures offline

Fontes et Codages

Temps de lecture / Reading time : 5 minutes.

Je reçois de nombreux livres. Mon boulot à JDN Dev inclut la tâche de parler de deux livres toutes les deux semaines. Ces livres ne sont pas choisis par moi à la librairie du coin, mais au sein des nouveautés qui nous sont gracieusement envoyées par les services de presse de certains éditeurs (surtout Eyrolles, O’Reilly, CampusPress et Dunod, en ce qui me concerne). À moi d’en choisir quelques-uns dans la pile de la semaine, et d’en faire une review. Celle-ci doit faire dans les 8 lignes, et vanter les mérites de l’ouvrage (aucun intérêt à casser un livre).

Par exemple, cette semaine, j’ai reçu « Eclipse 3 » de Berthold Daum chez Dunod, et « PHP 5 & MySQL 5 » de Luke Welling & Laura Thompson chez CampusPress/PearsonEd.

Forcément, le choix d’un livre est biaisé : non seulement celui-ci doit entrer dans le cadre JDN Développeurs (donc, couvrir un sujet touchant aux thèmes du site), mais également m’intéresser (même lu en diagonale, un livre sur les processeurs Itanium reste un peu lourd, désolé aux auteurs). Oui, les livres sont lus en diagonale, car cette lecture s’ajoute à mon quota hebdomadaire de 2 tutoriels, 2 pratiques, 1 « ma question », 5 news, et d’autres choses encore. Bref.

Certains de ces ouvrages, dès la review rédigée, corrigée et validée, vont dans la bibliothèque du Benchmark. Je m’en ressers parfois/souvent pour vérifier une information ou apprécier un point de vue différent du mien, bref construire. Une fois par an, nombre de ces ouvrages sont donnés à une association qui peut en avoir besoin. D’autres, je l’avoue, atterrissent chez moi, où j’apprends, encore, toujours (je remercie d’ailleurs Eyrolles qui ne manque pas d’envoyer certains livres en deux, trois, voire parfois quatre exemplaires, ce qui me permet d’en emprunter un sans me sentir coupable).

D’autres, enfin, trouvent une place à portée de main, sous mon bureau. Ce sont ceux qui m’ont plu au point de vouloir les lire entièrement, et que j’apprécie comme on apprécie un bon roman. Étant donné que je ne peux pas décemment lire un roman pendant mes pauses-mains (RSI Guard powah), je lis ceux-là, par intermittence, et au maximum pendant 7 minutes et 17 secondes. C’est peu, donc je n’avance pas vite, surtout si la section que je lis est intéressante (et donc, que je ne saute aucun paragraphe).

Fontes et CodagesLe livre sur lequel je tourne en ce moment (erm, en fait, le livre qui a fait que j’ai commencé à pratiquer cette lecture-de-pause au boulot) s’intitule « Fontes et Codages » de Yannis Haralambous, chez O’Reilly. J’en ai fait un commentaire, mmmh, impossible de retrouver la page, donc ça doit faire une paye. C’est un livre formidable, ou en tout cas que j’aime beaucoup. Sous-titré « Glyphes et caractères à l’ère du numérique« , c’est une somme de connaissances assez incroyable, « condensée » en 990 pages et rédigée par une sommité du genre, professeur d’informatique à l’ENST Bretagne, chercheur en typographie numérique et codéveloppeur du logiciel Ω (extension et successeur voulu de TeX).
Un livre que j’aime beaucoup, donc, car même si je n’en suis pas bien loin dans ma lecture séquentielle (seulement la page 300!), j’ai l’impression de me plonger tout à la fois dans un dictionnaire, une encyclopédie, un livre d’histoire, un article polémique et un mode d’emploi technique. Ah, et aussi dans une bande dessinée.

Je ne peux bien sûr parler que de l’infime partie que j’ai lue (et encore, j’ai sauté des parties qui m’intéressaient moins), mais j’explique ici ces différents points.
Dictionnaire et encyclopédie : mmmh, oui, bon, les deux sont redondants, mais comprenez-moi. Je mélange les deux, car le livre lui-même me semble tendre autant vers le détail qui ne servira qu’à 5% du lectorat (dictionnaire), que vers les grandes lignes qui entraînent tout le monde (encyclopédie). Des détails dans de grandes lignes, au final je pourrais presque croire que je sors d’un déjeuner avec Donald Knuth.

Livre d’histoire : c’est un corolaire sympathique à l’aspect dico/encyclo : de nombreuses pages sont consacrées à la genèse d’Unicode, et ce qui l’a précédé. Plomb, ASCII/EBCDIC, ISO 2022, ISO 8859-[1-16], Shift-JIS et d’autres sont présentés dans les grandes lignes, grille de caractères à l’appui et petit historique. L’auteur y place d’ailleurs nombre d’anecdotes parfois sympathiques sur les querelles et les prises de décisions.

Article polémique : ces anecdotes sont parfois polémiques. Rappelong que l’auteur, Yannis Haralambous, est d’origine grecque, chercheur en langues orientales de surcroît, et enfin n’a pas sa langue dans sa poche. Il ne manque donc pas de donner son avis sur certaines décisions, notamment sur la langue grecque et son évolution au fil du temps et au sein d’Unicode. Cela donne également des passages amusants, comme page 98 :

– Sc (symbole monétaire). Exemple : le caractère du dollar « $ », dont le glyphe est parfois utilisé également pour le caractère « s », comme dans « Micro$oft » ou « U$A »;

Quelle finesse.

Mode d’emploi technique : restons simple : l’ouvrage comporte des chapitres entiers sur l’utilisation d’Unicode sous WinXP/OS X/X Window, sur le fonctionnement de TeX, LaTeX et Ω, sur les usages avec XHTML… Et je n’en suis qu’au tiers.

Bande dessinée : les glyphes, leurs imbrications, leurs collaborations… Un monde merveilleux où les langues copulent joyeusement et de manière très visuelle, grâce aux innombrables représentations de glyphes données en exemple.

Et là, vous vous demandez, mais boudiou, quelle est la différence entre une fonte, une police, un glyphe et un caractère. Moi, je le sais (j’ai le bouquin sous les yeux), mais je ne voudrais pas vous gâcher le plaisir de la découverte.

Je vais cependant vous mentionner deux parties intéressantes de la lecture, ci-après.

La première concerne les algorithmes bidirectionnels, permettant la typographie dans les deux directions (pp.130-133). J’ai découvert ce problème par ce bouquin, car bien que je connaissais les différentes méthodes d’écritures (gauche-droite/occidental et droite-gauche/moyen-oriental), je n’avais pas imaginé la possibilité citée : l’intégration d’un texte arabe au sein d’un texte occidental (et vice-versa). Une bonne illustration valant quatre-cent-soixante-quinze-mille-milliards de mots, voici-voilà quelques scans, réalisés sans permission, mais c’est du fair use et je fais de la pub au bouquin alors bon :

Deux exemples bidirectionnels

Voici donc deux manières de présenter cette insertion : dans la première, le texte arabe est imbriqué, c’est-à-dire que le texte arabe inséré dans la continuité du texte occidental. La deuxième manière est une découverte : l’arrangement séquentiel permet de combiner textes gauche-droite et droite-gauche de telle manière que les deux modes soient plus lisibles. Cela requiert cependant un travail certain, comme le montre le scan suivant :

Parcours bidirectionnel

Comme l’indique l’auteur : « bel exercice de mobilité oculaire ! » Unicode prend en compte le problème, mais le problème lui-même est tellement élégant que j’en ai été soufflé.

La seconde partie qui m’a fait lever le sourcil, relève plus de la cocasserie (hohoho), et est bien éloignée de l’admiration que peut procurer la réflexion nécessaire aux algorithmes bidirectionnels.
Les langues idéographiques (extrême Orient et voisins) sont mutantes : malgré l’insertion de plus de 70 000 idéogrammes au sein d’Unicode, de nouvelles combinaisons se font tous les jours, au besoin du temps qui passe. Unicode a donc mis au point des caractères de commandes permettant à l’utilisateur de combiner lui-même des idéogrammes simples en un idéogramme plus compliqué (p. 147) :

Caractères de commande

Et l’auteur de nous donner quelques exemples simples :

Exemples de combinaisons

On admire alors toute la beauté de cette écriture, qui forme des mots grâce à des combinaisons plus ou moins logiques. Femme+9 mois ? Grossesse, bien sûr ! Toit + femme ? Euh, « tranquillité « , ah, d’accord. Boite+grand = cause, allons bon. Promenade+rivière = patrouille, admettons, on mettra ça sur les traumatismes du Vietnam.

Puis l’auteur donne deux exemples composés, dont celui-ci :

Femme+femme+femme=bruit

Résumons donc :
– Femme + 9e mois, grossesse. Ok.
– Toit + femme, tranquillité. Genre tu peux aller au bar, madame reste à sa place. Surpris de ne pas trouver Cuisine + femme, mais ça doit faire partie des coutumes occidentales…
– Femme + femme + femme, bruit. Je crois que cet idéogramme parle pour lui-même.

C’était donc une nouvelle fois l’occasion de sourire le long de cette lecture passionnante. Le texte foisonne littéralement de références à droite et à gauche, donnant ainsi vie à ce qui ne serait autrement qu’un n-ième encodage, Unicode. Ce livre me permet d’apprécier à leur juste valeur les geeks allant jusqu’à se faire un poster de tous les caractères d’Unicode, et me donne presque envie d’en faire de même…

« Fontes et Codages » de Yannis Haralambous. A lire.

3 réponses sur « Fontes et Codages »

Trocs et astuces

Y aurait-il une lueur d’espoir de trouver une version « 2nd hand » de ce bouquin, pour étudiant fauché ?
Oui, je sais, commentaire n’est pas annonce. Oh. Mais en désespoir de cause… On fait des choses folles.

Les commentaires sont fermés.