PROFDINFO.COM

Votre enseignant d'informatique en ligne

Chapitre 1 - Bits, binaire et unités de mesure

À la base de l'ordinateur: le bit

Toute l'information écrite ou lue sur un disque dur, une disquette ou un CD-Rom, placée en mémoire, traitée par le processeur ou envoyée sur un réseau n'est qu'une longue chaîne de bits.  Un ordinateur ne comprend que des bits.

Un bit est un nombre binaire ayant deux valeurs possibles:  0 ou 1.  Lorsque l'on compte avec des bits, on utilise le système binaire.  Ce système a le gros avantage de pouvoir être représenté facilement physiquement, puisque chaque nombre n'a que deux états (un 0 ou un 1, un trou ou un plein, du courant à haut voltage ou du courant à faible voltage, un champ magnétique positif ou négatif, etc...).  Le bit est tout ce que l'ordinateur connaît, tout ce qu'il peut manipuler.

L'octet: un paquet de bits

Le bit est donc théoriquement l'unité de base d'un ordinateur.  Évidemment, si on exprimait tout en termes de bits, on devrait jongler avec des nombres extrêmement grands inutilement – ça correspondrait à calculer le kilométrage d'une automobile en millimètres...

C'est pourquoi plusieurs autres unités de mesure ont été définies.  La première est l'octet (en anglais byte), qui est un groupe de 8 bits comme ceux avec lesquels on vient de travailler.  En réalité, même si le bit est plus petit que l'octet, c'est en pratique l'octet qui est utilisé comme unité de base – c'est bien rare qu'on se rende jusqu'au bit.

Un octet est souvent également appelé un "caractère".  Pourquoi?  À cause du code ASCII.  ASCII signifie "American Standard Code for Information Interchange".  C'est une norme qui a été définie en 1964 et qui attribue à chaque caractère un nombre de 0 à 255.  Par exemple, le A majuscule correspond au code ASCII 65.  (Visitez asciitable.com pour la liste complète des 256 caractères.)

Comme un octet permet de représenter un nombre de 0 à 255, il permet donc du même coup de représenter un caractère.  Par exemple, le A majuscule correspondra à 01000001 (65 en binaire sur un octet).

Plus récemment, la norme Unicode a été développée afin de mettre en place un nouveau standard pour les caractères de toutes les langues du monde (des langues latines à l'Hébreu, en passant par le Chinois, le Russe, le Japonais et même le Braille!).  Ils utilisent pour cela deux octets consécutifs pour représenter un seul caractère, ce qui permet d'avoir jusqu'à 65 536 caractères, chacun avec leur numéro unique.  (Voyez unicode.org/charts pour les tables de caractères et tous les détails.)

La norme du passé: le kilooctet

L'unité suivante est le kilooctet (abrégé à Ko).  En anglais, on dira kilobyte (abrégé à Kb) et on utilisera souvent le terme "K" en langage parlé.  Un kilooctet ne contient pas, comme pourraient le croire les habitués du système décimal que nous sommes, 1000 octets.  N'oublions pas que tout fonctionne en binaire dans un ordinateur.  Le kilooctet est donc plutôt un paquet de 1024 octets, 1024 étant la puissance de 2 la plus proche du 1000 que le kilo représente habituellement (210).

Un Ko, c'est donc 8192 bits (n'oublions pas qu'un octet comprend 8 bits).  En supposant 73 bits par ligne et 53 lignes par page, écrire le contenu d'un kilooctet tiendrait sur un peu moins d'une page recto-verso! Ce qui signifie que la mémoire disponible des premiers ordinateurs personnels aurait tenu sur environ 9 pages...

Le kilooctet qui autrefois servait à mesurer la taille de la mémoire d'un PC, est maintenant généralement utilisé pour mesurer la taille des fichiers sur un disque dur.   Toutefois, de nos jours il n'est pas rare que des fichiers mesurent plusieurs milliers de Ko...  Le besoin d'une autre unité de mesure s'est vite fait sentir.

Encore plus grand: le mégaoctet

Toujours en utilisant le même principe, lorsqu'on a 1024 kilooctets, on obtient un mégaoctet.  Le mégaoctet a comme abréviation officielle Mo (en anglais, le terme megabyte est abrégé à Mb) mais on utilise couramment le terme "meg", dans une langue ou dans l'autre.

1 Mo = 1024 Ko = 1 048 576 octets = 8 388 608 bits

Pour continuer avec notre analogie du papier, un mégaoctet correspondrait à environ 2168 pages remplies de 0 et de 1 comme celles que l'on vient de voir.  En supposant qu'on utilise des feuilles recto-verso, ça donnerait un paquet de 1084 feuilles (les paquets de feuilles standard que l'on achète pour une imprimante ou un photocopieur en contiennent habituellement 500).

Pour pouvoir utiliser Windows XP, il fallait avoir 128 Mo de mémoire mais pour s'éviter des problèmes 256 Mo est un minimum utile.

Une disquette 3 ½", appartenant à un passé pas si lointain, contenait normalement 1.44 Mo de données (à moins qu'elle fut en basse densité auquel cas elle ne contenait que 720 Ko).  De son côté, le CD-Rom contient soit 650 ou 700 Mo. 

La taille d'un gros fichier comme une chanson en mp3 fait autours de 4 Mo, un film en format mpeg basse qualité tient dans 700 Mo.

Le gigaoctet

En continuant d'augmenter, 1024 mégaoctets forment un gigaoctet (abrégé à Go).  Le gigaoctet (en anglais gigabyte, abrégé à Gb) est communément appelé "gig" (que certains prononcent "gigue" et d'autres "guigue").

Tel que vous l'aurez deviné:

1 Go = 1024 Mo = 1 048 576 Ko = 1 073 741 824 octets = 8 589 934 592 bits

Ça commence à faire beaucoup de 1 et de 0.  Toujours en terme de papier, on peut imaginer un gigaoctet comme étant une pile de 1 110 016 feuilles remplies de 1 et de 0 des deux côtés...  Sachant qu'un paquet standard de 500 feuilles mesure cinq centimètres de haut, notre pile d'un gigaoctet mesurerait environ 111 mètres – la hauteur d'un édifice de 25 à 30 étages.

La majorité des ordinateurs de nos jours ont au moins 4 Go de mémoire de mémoire vive...  La taille des disques durs d'il y a quelques années se mesuraient en gigaoctets, de 500 à 1000 Go.  Le dernier cri des téléphones portable iPhone (tout comme le meilleur iPod Touch) peut contenir 64 Go...  Le plus spacieux iPod Classique contient 160 Go. Quand on pense qu’Apollo 11 est allé sur la lune avec 69 Ko de mémoire...  Son programme entre près d'un million de fois dans un iPhone!  Parions qu’Apollo 13 aurait bien aimé avoir un iPhone à bord…

Un DVD-Rom comme ceux que l'on peut acheter vierges et graver nous-mêmes peut contenir jusqu'à 4.7 Go de données.  Les DVD produits par les compagnies de cinéma peuvent contenir jusqu'à 15.9 Go. Un fichier contenant un film HD peut peser d'un à une quinzaine de Go. Pour utiliser Windows 7 ou 8, il faut 1 ou 2 Go de mémoire vive.

Le teraoctet

La prochaine étape est le teraoctet (To) ou terabyte (Tb).

1 To = 1024 Go = 1 048 576 Mo = 1 073 741 824 Ko = 1 099 511 627 776 octets = 8 796 093 022 208 bits

Notre pile de feuilles recto-verso atteint maintenant les 113,7 kilomètres, soit approximativement la distance de l'aller-retour Montréal – St-Jérôme.

Plusieurs gros serveurs d'entreprises, particulièrement celles qui abritent des gigantesques bases de données, mesurent leur espace-disque en teraoctets depuis belle lurette.  Pour les particuliers, les disques durs de 1 To et de 2 To sont en magasin depuis relativement peu de temps.

Dans les décennies à venir, nous aurons certainement à utiliser le pétaoctet, puis l'exaoctet, le zettaoctet et le yottaoctet...  Notre langage sera bien amusant à ce moment-là.

Voici un tableau récapitulatif des différents préfixes utilisés pour mesurer des capacités en informatique.  Ajoutez "octet" ou "byte" à un préfixe pour obtenir le terme français ou anglais.  Ajoutez "o" ou "b" au symbole pour obtenir l'abréviation. 

 

Préfixe

Symbole

Appellation courante

Quantité (bits)

Utilisation courante en informatique

kilo

K

Ka

210

Taille des petits fichiers, mémoire des premiers PC

méga

M

Meg

220

Taille des fichiers moyens,  disquettes, CD-Rom, taille des premiers disques durs

giga

G

Gig ou Guig

230

Mémoire des PC récents, taille des disques durs des dernières années, taille des gros fichiers, clés USB, DVD

tera

T

Téra

240

Taille des disques durs récents

péta

P

Aucune encore

250

Aucune encore

exa

E

Aucune encore

260

Aucune encore

zetta

Z

Aucune encore

270

Aucune encore

Yotta

Y

Aucune encore

280

Aucune encore