CalculatoareTehnologia informației

Codificarea informațiilor de text în computer

Computer - un dispozitiv sofisticat , cu care puteți crea, converti și stoca informații. Cu toate acestea, calculatorul nu funcționează mod foarte ușor de înțeles pentru noi - grafică, text și datele numerice sunt stocate ca matrici binare numere. În acest articol ne vom uita la modul în care codificarea informațiilor de text.

Ceea ce pentru noi este textul unui calculator - o secvență de caractere. Fiecare simbol reprezintă un anumit set de zerouri și cele. Sub simbolurile însemnat nu numai majuscule și minuscule litere ale latin alfabetul, dar , de asemenea , semne de punctuație, semne aritmetice, caractere speciale, simboluri speciale și chiar spațiu.

codificare binară de informații textuale

Prin apăsarea unei anumite taste de pe controlerul intern trimite un semnal electric , care este convertit într - un cod binar. Codul se potrivește cu un anumit simbol, care este afișat pe ecran. Pentru depunerea la alfabetul latin într - un sistem de codificare internațional ASCII format digital a fost creat. Este nevoie de 1 octet pentru înregistrarea unui simbol, astfel, este format din secventa de opt simboluri de zerouri și cele. Intervalul de înregistrare - 00000000 - 11111111, și anume codarea informațiilor text utilizând acest sistem ne permite să reprezinte 256 de caractere. În cele mai multe cazuri, acest lucru este suficient.

ASCII este împărțit în două părți. Primele 127 de caractere (de la 00000000 la 01111111) sunt internaționale și sunt simboluri și litere ale alfabetului englezesc specifice. A doua parte - extensia (10000000-11111111) - este destinat să reprezinte alfabetul național, al cărui scriere este diferită de latină.

Codificarea informațiilor de text în ASCII este construit pe principiul creșterii secvenței, adică, cu cât numărul de secvență de litere, cu atât mai mare valoarea sa de cod ASCII. Figurile și partea rusă a tabelului sunt construite pe același principiu.

Cu toate acestea, în lume există mai multe tipuri de codificare pentru litere chirilice. Cele mai frecvente - este KOI-8 (codificare de opt biți, care a fost folosit în anii '70 în sistemul de operare primul ruifitsirovannyh Unix), ISO 8859-5 (dezvoltat de către Biroul Internațional de Standardizare), CP 1251 (datele text de codificare utilizat în modern, sistem de operare Windows), precum și codare 2-octet de Unicode, care poate fi folosit pentru a introduce 65.536 de caractere. O astfel de varietate de codificări, datorită faptului că acestea au fost elaborate la momente diferite, pentru diferite sisteme de operare și considerente diferite. Din acest motiv, de multe ori au dificultăți atunci când transferul de text dintr-un mediu în altul - de la o nepotrivire care codifică utilizatorul va vedea un set de pictograme confuze. Cum pot rezolva această situație? În Word, de exemplu, atunci când este deschis un document, un mesaj despre probleme cu afișaj text și oferă mai multe opțiuni pentru transcodare.

Astfel, codificarea și prelucrarea informațiilor textuale în intestinele computerului - procesul este dificil și organizat consumatoare de timp. Toate simbolurile oricărui alfabet sunt doar o anumită secvență de cifre ale sistemului binar, o singură celulă - acesta este un octet de informații.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 ro.birmiss.com. Theme powered by WordPress.