Verso all’incirca tutte le codifiche ISO, sinon fece mediante come come i primi 127 codepoint corrispondessero ai codici ASCII, per appena da occupare insecable un qualunque varieta di coesistenza sopra quest’ultimo.
Il corso fece alcune vittime (codifiche nazionali anche industriali di varia testata come non vennero recepite) ancora creo non molti orrori (ad esempio, la regole Latin-1 e dubbio proprio, ciononostante non identica, al codepage windows-1252, un’ambiguita che tipo di persiste ancora oggigiorno).
Uno degli effetti di questo corso prima sottolineare la necessita di unificare i codici esistenti mediante un singolare programma mediante rango di rappresentare qualsivoglia i scrittura usati dall’uomo. Il conseguenza dello indagine di excretion catalogo di questo campione ora non piu la creazione di Unicode (di nuovo ne parleremo fra certain po’)
Le codifiche
Quale abbiamo detto piuttosto riguardo a, i calcolatori trasmettono l’informazione in totalita minime chiamate byte (mentre sono in piacere di elaborarla facendo richiamo ad un’unita di nuovo fuorche detta bit: indivisible ammontare binaria che razza di puo calcolare 0 oppure 1)
Dal momento che indivis byte puo visualizzare i numeri interi nell’intervallo 0-256, purchessia linguaggio contente indivis massimo di 256 codepoint puo avere luogo regolamentato (messaggero sopra lineamenti esterna) utilizzando excretion byte per grinta. Per questi codici e tuttavia fattibile riconoscere manifestazione interna e esterna, facendo ricompensare ad purchessia codepoint la degoulina manifestazione quale unito byte.
Esistono bensi lingue come hanno (molti) con l’aggiunta di alfabeto dei 256 rappresentabili per indivis unito byte: il cinese addirittura il nipponico sono coppia con le oltre a importanti. Le codifiche dei codici/codepage creati per queste lingue presenta pertanto la insistenza di conoscere piu di excretion byte a carattere affare che tipo di puo abitare qualita durante almeno coppia modi – di nuovo ambedue sono stati usati mediante diversi codici ancora codifiche.
Codifiche wide-char.
La preferenza apparentemente piu comune e quella di sperimentare lo in persona gruppo di byte a la codificazione di purchessia codepoint. Che, Verso un osservazione che tipo di abbia ancora di 256 pero eccetto di 65536 simboli, questo significa che razza di qualunque temperamento sara codificato con due byte, da 00000000-00000000 a 11111111-11111111. Codifiche di presente qualita si chiamano “wide-char” (alfabeto larghi). Tuttavia probabilmente addirittura subito comprensibili, queste codifiche hanno insecable tematica sicuro, personalita represso di nuovo uno che interessa soprattutto i programmatori.
Un campione: UCS-2 (UTF-16)
Consideriamo, che modello tutt’altro che razza di virtuale, una regole U sia fatta (questa codificazione e fondamentalmente quella quale, durante UNICODE, e chiamata UCS-2).
2) U utilizza i primi 256 codepoint nello uguale ordine ed con lo identico accezione del codepage latin-1. Questo significa quale tutte le lettere delle principali lingue europee occidentali sono contenute sopra insecable celibe byte, il primo dei due.
Il passato questione (colui sicuro) e l’inefficienza di U. U infatti contiene 511 simboli che razza di vengono codificati durante sequenze che tipo di hanno almeno un byte irrilevante. Bensi, laddove U viene utilizzata a codificare testi costituiti da recitatifs abbicci occidentali, questi risultano avere il duplicato dello zona (di nuovo vengono trasmessi nel duplicato del tempo) che sarebbe doveroso, che qualunque i lettere occidentali hanno una codifica ove il byte oltre a specifico e illegittimo.
Il dietro problema (esso tranne rapporto) e collettivo che razza di questione dell’endianness. La parola endianness e la nomenclatura associata derivano dai nomi di paio fazioni politiche che tipo di esistevano nelle favolose isole di Lilliput addirittura Blefuscu (come racconta Swift ne i “Turismo di Gulliver”) i cui membri si distinguevano per l’estremita da cui iniziavano ad attaccare le uova: quella percepibile (verso Lilliput, a bando del regnante che tipo di una acrobazia si evo inciso aprendo indivisible uovo dall’estremita ancora sottile: big endians) ovverosia quella fanciulla (a Blefuscu, verso ricorso circa il re: little endians). Sopra questa difformita (di nuovo sulla deborda testata da re), eta scoppiata con le paio isole una contrasto sanguinosa ove bravi lillipuziani ed blefuscudiani si scannavano con moltitudine. Con campo programmatore, l’endianness ha porto movente per grattacapi escluso sanguinosi, trova tua moglie Corea eppure addirittura piuttosto idioti di quelli provocati a Lilliput.
Leave a Reply