http://alliancegeostrategique.org/
Compresser
pour Régner – Acte III- Epilogue
Ce troisième volet requiert de
la part du lecteur un peu plus d'attention que les deux premiers,
c'est normal, c'est le plus profond des trois....
Tout ne se compresse
pas !
Nous considérons ici toutes les
techniques de compression de l'information sans perte, présentes
et à venir , et allons montrer sans gros effort mathématique
qu'il existe des informations incompressibles quels que soient les
algorithmes appliqués (existants ou pas encore inventés,
c'est ce qui fait le charme de ce résultat profond).
Partons du fait que toute information
finie peut s'écrire, via une convention de codage fixée,
sous la forme d'un mot binaire (une suite finie de 0 et de 1)
Par exemple, M= 001011100001, je ne
sais pas ce que ce mot signifie, mais il fait partie de l'ensemble
des 2^12 mots binaires de longueur 12; il y a en effet 2 choix pour
chaque bit d'information donc 2x2x.....X2 possibilités.Considérons maintenant un mot binaire quelconque de longueur n.
Il existe 2^n mots binaires différents de longueur n; chacun de ces mots peut a priori être compressible; si un tel mot M est compressible, alors sa compression est de taille strictement inférieure à n, c'est-à-dire n-1, ou n-2, ...., ou 1 ou 0; il y a donc au plus :
2^0 + 2^1 + ..... + 2^(n-1) mots de compression possibles pour mon mot M fixé.
cette somme est la somme des termes d'un suite géométrique et un résultat classique de lycée me dit qu'elle vaut (2^n – 1)/(2-1) soit 2^n – 1 mots possibles !
Voyez-vous le problème ? D'un coté j'ai 2^n mots à compresser mais de l'autre je n'ai que 2^n – 1
possibilités (au plus) de codage compressif ....
Il reste donc un mot de longueur n parmi les 2^n qui n'admet aucune compression !
C'est mon mot totalement incompressif, je le tiens ! ou plutôt, je viens de prouver son existence car je suis dans l'incapacité absolue de vous dire de quel mot il s'agit... c'est purement un théorème d'existence comme les aiment les mathématiciens.
Que peut-on en faire ? En premier lieu,
on peut affirmer que quel que soit le futur logiciel de compression
sans perte à venir mis en vente, il ne faudra pas croire le
vendeur qui vous affirmera sans sourciller que son produit compresse
tout : ce sera faux, profondément faux!
Le hasard ne se résume
pas...
Il faut rapprocher l'existence de ce
mot particulier de l'aléatoire qui est si mal modélisé
par les probabilités et si bien par la théorie
algorithmique de l'information (celle de Kolmogorov).On y est !, l'aléatoire se cache derrière cette incompressibilité de l'information :
« Est aléatoire ce qui est incompressible ! » (tel sera mon premier tweet)
ou encore : « Le hasard ne se résume pas ! ».
Ce principe quasi philosophique se démontre sans peine, nous l'avons fait en quelques lignes;
il induit de nombreux résultats utilisables lorsque l'on cherche à mieux comprendre un phénomène aléatoire.
On peut à présent
s'interroger sur la proportion d'incompressible par rapport au
compressible
Effectuons un simple dénombrement
: il existe 2^n mots binaires de longueur n , regardons ensuite ceux
qui se compressent en une représentation plus courte de
longueur n-q (plus q est élévé et plus je
compresse). Il y en a au plus 2^n-q , si bien que la proportion des
mots binaires de longueur n compressibles en mots binaires de
longueur n-q vaut 2^n-q / 2^n soit 1/2^q. Ce qui est très très
faible, dès que q augmente un peu !! ;
Ce simple calcul nous montre que le compressible sans perte est rare dans la nature, et qu'il existe beaucoup plus d'incompressible (d'aléatoire donc) que de compressible.
On peut relativiser cette dernière constatation en précisant que l'information qui nous atteint (presse,
radio, tv, internet, etc) et que nous manipulons quotidiennement est très structurée, très organisée et donc en général bien compressible sans perte.
L'incompressible se trouve dans la
partie aléatoire de l'information :
Imaginons que je joue à pile ou
face avec une pièce de monnaie non truquée, et que je
répète ce jeux 200 fois de suite en notant chaque
résultat sous la forme 1 pour Face et 0 pour Pile.A l'issue de mon jeu, j'aurai une chaine binaire de longueur 200 du type :
M = 110100011011110.......00.
Imaginons ensuite que je souhaite transmettre mon résultat en le twittant :
je suis limité à 140 caractères , il faut donc que je compresse sans perte mon mot M pour passer d'une longueur de 200 à 140.
J'applique alors mon petit calcul rédigé plus haut :
je me retrouve avec une probabilité de 1/2^(200-140)= 1/2^60 soit 0,0000... avec 19 zeros suivis de 867 chance de pouvoir twitter mon résultat sans le dégrader, 10^-19 c'est quasiment l'évènement IMPOSSIBLE.
Moralité : mon mot M ne peut pas passer par twitter !!! car il contient a priori bien trop d'aléatoire.
Pour cloturer ces résultats déconcertants, il faut préciser que le niveau de compression sans perte maximal possible pour un mot binaire donné est en fait lié à sa complexité de Kolmogorov, c'est-à-dire à la longueur du plus court programme fonctionnant sur une machine de Turing fixée , donnant ce mot M en sortie et s'arrêtant.
Les gros mots sont lachés , mais c'est la réalité : la complexité de Kolmogorov se cache irrémédiablement derrière ces problèmes de compressions de données et d'alèatoires, c'est elle le réel maître du jeu !
Que pensent les
philosophes de la compression ?
Les citations de cette section sont
empruntées au bel article de Patrick Williams sur les formats
courts publié dans Philosophie Magazine – Juin 2012.Il y a clairement deux écoles : La première affirme (en simplifiant un peu) que le format court est quasiment incompatible avec une pensée profonde :
« La pensée a besoin de place pour dérouler son chemin, déployer ses arguments et former une image dans l'esprit du lecteur . On imagine mal l'Ethique de Spinoza résumée en quelques formules chocs, sans sa série de propositions, de scolies, de démonstrations, qui lentement, très lentement infuse dans l'esprit de celui qui lit » selon Gilles Finchelstein auteur de « La dictature de l'urgence - Fayard 2011 »
Un défaut souvent exposé du format compressé est qu'il implique une profusion, un papillonage qui étourdit notre attention.
Selon le philosophe William James, « L'attention est la prise de possession par l'esprit, sous une forme claire et vive, d'un objet ou d'une suite de pensées parmi plusieurs qui semblent possibles.
Elle implique le retrait de certains objets afin de traiter plus efficacement les autres. »
C'est ce retrait qui pose problème dans le cas d'une information compressée.
Et puis, on trouve un autre courant de
pensée concernant les formats brefs :
Le philosophe Anglais Alain de Botton
affirme avec un brin de malice qu'un bon nombre d'essais
philosophiques ont une fâcheuse tendance à délayer
leur pensée, alors même que l'essentiel de leur thèse
pourrait se résumer aux quelques lignes qui ornent la
quatrième de couverture...« Nous sommes habitués à l'idée qu'un concept n'est valable que s'il prend 400 pages pour se déployer! Mais la vérité est que l'immense majorité des livres d'idées qui sortent aujourd'hui pourraient être réduits à un tiers de leur taille sans en souffrir. J'attends avec impatience le jour où l'on pourra présenter une thèse de doctorat sous la forme d'aphorismes! »
D'autres philosophes affirment, (comme le disait Jean-François Lyotard) que « Le postmodernisme est marqué par la fin des grands récits ; d'un simple point de vue psychologique, il n'existe plus un idéal du moi suffisamment fort qui permette un Kant ou un Hegel »
Sans oublier que Kant ou Hegel n'étaient pas stimulés par un bombardement incessant d'informations et de propositions hétérogènes et que ce calme informationnel était propice à la rédaction d'écrits plus longs.
La compression de l'information semble
être un moment inévitable de la pensée
occidentale; il ne découle pas seulement des nouveaux outils
technologiques mais correspond à une phase de l'histoire
où nous ne pouvons plus « faire
le long ».Alain de Botton explique : « Les fragments et les maximes se révèlent idéaux pour exprimer des vérités ambigues. Et parce que tant de nos vérités actuelles semblent ambigues, la forme courte est parfaitement adaptée à notre époque »
Roland Jaccard défend avec vigueur la pensée concise : pour lui, l'aphorisme est un art de vivre, un acte autant moral qu'esthétique témoignant d'un respect scrupuleux porté aux autres et à soi-même;
il ajoute : « s'étendre sur un sujet est une forme d'impolitesse », j'espère ne pas être impoli avec ces 3 articles ???
« Dans un monde flottant, l'aphorisme est une bouée de sauvetage. La forme révèle le fond mieux que n'importe quelle démonstration : Ce qui est bref et bon est deux fois bon ! »
Il conclut par « L'art de l'aphorisme relève de la guérilla. La philosophie classique, elle, n'est jamais qu'une forme dévoyée de la religion. Elle appartient au monde d'avant. De là vient son charme un peu suranné . L'aphorisme est une clef pour ouvrir les psychismes »
Alain de Botton met en pratique tout ce qui précède et publie sur tweeter des maximes en 140 caractères afin de les tester grâce aux réactions de ses followers : il trouve un écho instantané à ses intuitions et oriente son travail en fonction des réactions.
Enfin, il y a cette interrogation :
serions-nous au début d'une nouvelle époque ?
D'après Luis de Miranda, « les
pensées qui s'expriment en bref sont les éléments
d'une série à venir,comme des briques, l'expression
d'une recherche de système qui n'est pas encore là. La
brièveté est un moment nécessaire qui
annoncerait le début de nouveaux mythes, d'un nouveau cycle
long : un Platon 2.0 verra-t-il le jour ? »
A titre personnel, je rejoins et adhère
à la thèse de Miranda : je suis convaincu que cette
montée en puissance des formats compressés résulte
d'une auto–organisation des quantums d'information circulant sur
notre planète. L'information se restructure d'elle-même,
évolue dans sa forme vers une morphologie plus riche, plus
dense , et finalement compatible avec l'émergence d'une
conscience globale , une intelligence numérique
unitaire.
Pardon de n'avoir pas compressé
tout cela....Les "portes du code" - Matrix