Enligt den internationella telekommunikationsunionen, i2016, Internet med en viss regelbunden haft tre och en halv miljarder människor. De flesta av dem tror inte ens att några meddelanden som skickas av dem via datorer eller mobila prylar, såväl som texter som visas på alla typer av bildskärmar, är faktiskt kombinationer av 0 och 1. En sådan representation av information kallas kodning. Det ger och underlättar avsevärt genomförandet av lagring, bearbetning och överföring. 1963 utvecklades den amerikanska kodningen av ASCII, vilken är föremål för denna artikel.
Ur synvinkel av någon elektronisk databehandlingMaskintexten är en uppsättning enskilda tecken. De innehåller inte bara bokstäver, inklusive bokstäver, men också skiljetecken, siffror. Dessutom används speciella symboler "=", "&", "(" och mellanslag.
Den uppsättning tecken som utgör texten,kallas alfabetet, och deras nummer är kraften (betecknad som N). För att bestämma det, använd uttrycket N = 2 ^ b, där b är antalet bitar eller informationsvikten för en viss symbol.
Det är bevisat att ett alfabet med en kapacitet på 256 tecken låter dig representera alla nödvändiga symboler.
Eftersom 256 är den 8: e kraften hos två, är vikten av varje symbol 8 bitar.
En enhet på 8 bitar kallas en 1 byte, så det är vanligt att säga att binärkoden för alla tecken i den text som lagras på datorn upptar en minnesbyte.
Alla texter skrivs in i minnet av en personligdator med tangenter på tangentbordet på vilka siffror, bokstäver, skiljetecken och andra symboler skrivs. I RAM, överförs de i binär kod, dvs varje tecken matchas med den vanliga mänskliga decimalkoden, från 0 till 255, vilket motsvarar en binär kod - från 00000000 till 11111111.
Byte-byte teckenkodning tillåterProcessorn som utför bearbetningen av texten, åtkomst till varje symbol separat. Samtidigt är 256 tecken tillräckliga för att representera någon teckeninformation.
Denna förkortning på engelska står för amerikansk standardkod för informationsutbyte.
I början av datoriseringen blev det uppenbart attDu kan komma med ett brett utbud av sätt att koda information. För att överföra information från en dator till en annan var det dock nödvändigt att utveckla en enda standard. Så, 1963 i USA fanns det ett ASCII kodningstabell. I det tilldelas någon symbol på datorns alfabet sitt serienummer i den binära representationen. Initialt användes ASCII-kodningen endast i USA och blev sedan den internationella standarden för datorn.
ASCII-koderna är indelade i 2 delar. Den internationella standarden är bara den första halvan av denna tabell. Den innehåller symboler med ordinarie tal från 0 (kodad som 00000000) till 127 (kod 01111111).
Sekvensnummer N | ASCII-textkodning | symbol |
0 - 31 | 0000 0000 - 0001 1111 | Symboler med N från 0 till 31 kallas förvaltare. Deras funktion är att "vägleda" processen att skriva ut text till en bildskärm eller en skrivare, ge en ljudsignal etc. |
32 - 127 | 0010 0000 - 0111 1111 | Symboler med N från 32 till 127 (standarddelentabeller) - Övre och små bokstäver i latin alfabetet, 10 siffror, skiljetecken, samt olika parenteser, kommersiella och andra symboler. Symbolen 32 betecknar ett utrymme. |
128 - 255 | 1000 0000 - 1111 1111 | Symboler med N från 128 till 255 (alternativ deltabeller eller kodsidor) kan ha olika varianter, som alla har sitt eget nummer. Kodssida används för att ange de nationella alfabeten, som skiljer sig från latin. I synnerhet är det med hjälp att ASCII kodas för ryska tecken. |
I kodningstabellen följer versaler och små bokstäver varandra i alfabetisk ordning, och siffrorna är i stigande ordning. Denna princip bevaras också för det ryska alfabetet.
ASCII-kodningstabellen skapades ursprungligenför mottagning och överföring av information på en enhet som inte har använts under en längre tid, som en teletyp. I detta avseende inkluderades icke-utskrift, som användes som kommandon för att styra denna enhet, i teckenuppsättningen. Liknande kommandon användes i sådana förberedande meddelandemetoder som Morse-kod etc.
Den vanligaste "teletyp" -symbolen är NUL (00, "noll"). Den används fortfarande i de flesta programmeringsspråk, som betecknar den slutliga karaktären.
Amerikansk standardkod behövs inte baraför att ange textinformation från tangentbordet. Den används också i grafik. Speciellt, i ASCII Art Maker-programmet, representerar bilder av olika tillägg en rad ASCII-teckensymboler.
Liknande produkter finns i två typer: Utföra funktionen av grafiska redaktörer genom att konvertera bilder till text och konvertera "ritningar" till ASCII-grafik. Till exempel är en välkänd smiley ett levande exempel på en kodningssymbol.
ASCII kan också användas när du skapar ett HTML-dokument. I det här fallet kan du ange en viss uppsättning tecken, och när du visar sidan visas en symbol på skärmen som motsvarar den här koden.
ASCII behövs också för att skapa flerspråkiga webbplatser eftersom tecken som inte ingår i en specifik nationell tabell ersätts med ASCII-koder.
För att koda textinformation i ASCII-kodning användes 7 bitar initialt (en var tom), men idag fungerar den som en 8-bitars en.
Bokstäverna i kolumnerna på toppen och botten skiljer sig endast från enbart en enda bit. Detta minskar avsevärt kontrollens komplexitet.
Om det behövs den här typen av textkodningInformation kan användas i Microsofts textredigerare, till exempel Anteckningar och Office Word. Men när du skriver, är det i det här fallet omöjligt att använda vissa funktioner. Till exempel kan du inte göra ett urval i fetstil, eftersom ASCII-kodningen behåller endast meningen med informationen, och ignorerar dess allmänna utseende och form.
ISO har antagit ISO 8859 standarder. Denna grupp definierar åtta bitars kodningar för olika språkgrupper. I synnerhet är ISO 8859-1 Extended ASCII, som är en tabell för USA och länderna i Västeuropa. Och ISO 8859-5 är ett bord som används för Cyrillic, inklusive ryska.
Av ett antal historiska skäl användes inte ISO 8859-5-standarden mycket länge.
För det ryska språket just nu används kodning verkligen:
Den största fördelen med den första standarden CP866var bevarande av pseudo-grafiska symboler i samma positioner som i Extended ASCII. Detta gjorde det möjligt att köra oförändrade textprogram, utländsk produktion, till exempel den berömda Norton Commander. För närvarande används CP866 för program som utvecklats under Windows som arbetar i textläge i helskärm eller i textfönster, inklusive FAR Manager.
Datortexter, skrivna i CP866-kodningen, har nyligen varit sällsynta, men används för ryska filnamn i "Vindous".
För tillfället är den mest utbreddafått denna speciella kodning. Unicode-koder är indelade i regioner. Den första (från U + 0000 till U + 007F) innehåller tecknen i ASCII-uppsättningen med koder. Följ sedan områdena med tecken på olika nationella skript, samt skiljetecken och tekniska symboler. Dessutom är en del av Unicode-koderna reserverade om det finns behov av att inkludera nya symboler i framtiden.
Nu vet du det i ASCII-kodningen, var och ensymbolen representeras som en kombination av 8 nollor och en. För icke-specialister kan den här informationen vara onödig och ointressant, men vill du inte veta vad som händer i din hjärnans "hjärnor"?
</ p>