КампутарыІнфармацыйныя тэхналогіі

Што такое магутнасць алфавіту? Як знаходзіць магутнасць алфавіту: формула

Сучасныя камп'ютэрныя тэхналогіі, інфарматыка, магутнасць алфавіту, сістэмы вылічэння і многія іншыя паняцці маюць самыя непасрэдныя сувязі паміж сабой. Вельмі нешматлікія карыстальнікі сёння дастаткова добра разбіраюцца ў гэтых пытаннях. Паспрабуем растлумачыць, што такое магутнасць алфавіту, як яе вылічаць і прымяняць на практыцы. У далейшым гэта, па-за ўсякім сумневам, можа спатрэбіцца на практыцы.

Як вымяраецца інфармацыя

Перш чым прыступіць да вывучэння пытання аб тым, якая магутнасць алфавіту, і наогул, што гэта такое, варта пачаць, так бы мовіць, з асноў.

Напэўна ўсім вядома, што сёння існуюць спецыяльныя сістэмы вымярэння якіх-небудзь велічынь, на аснове эталонных значэнняў. Напрыклад, для адлегласцяў і аналагічных велічынь гэта метры, для масы і вагі - кілаграмы, для часовых прамежкаў - секунды і г.д.

Але як жа вымераць інфармацыю ў сэнсе аб'ёму тэксту? Менавіта для гэтага і было ўведзена паняцце магутнасці алфавіту.

Што такое магутнасць алфавіту: пачатковае паняцце

Такім чынам, калі прытрымлівацца агульнапрынятаму правілу, што канчатковае значэнне якой-небудзь велічыні ўяўляе сабой параметр, які вызначае, якая колькасць раз эталонная адзінка выкладзеная ў вымяранай велічыні, можна зрабіць выснову: магутнасць алфавіту ёсць поўнае колькасць знакаў, якія выкарыстоўваюцца для той ці іншай мовы.

Каб было больш зразумела, пакінем пакуль пытанне аб тым, як знаходзіць магутнасць алфавіту, у баку, і звернем увагу на самі сімвалы, натуральна, з пункту гледжання інфармацыйных тэхналогій. Груба кажучы, поўны спіс выкарыстоўваюцца сімвалаў ўтрымлівае літары, лічбы, разнастайныя дужкі, адмысловыя знакі, знакі прыпынку, і г.д. Аднак, калі падыходзіць да пытання аб тым, што такое магутнасць алфавіту менавіта кампутарным спосабам, сюды варта ўключыць яшчэ і прабел (адзінкавы разрыў паміж словамі ці іншымі сімваламі).

Возьмем у якасці прыкладу рускую мову, дакладней, клавіятурную раскладку. Зыходзячы з вышэйсказанага, поўны пералік змяшчае 33 літары, 10 лічбаў і 11 спецыяльных знакаў. Такім чынам, поўная магутнасць алфавіту роўная 54.

Інфармацыйны вага сімвалаў

Аднак агульнае паняцце магутнасці алфавіту не вызначае сутнасці вылічэнняў інфармацыйных аб'ёмаў тэксту, які змяшчае літары, лічбы і сімвалы. Тут патрабуецца асаблівы падыход.

У прынцыпе, задумайцеся, ну вось якім можа быць мінімальны набор з пункту гледжання кампутарнай сістэмы, колькі сімвалаў ён можа ўтрымліваць? Адказ: два. І вось чаму. Справа ў тым, што кожны знак, няхай гэта будзе літара або лічба, мае свой інфармацыйны вага, па якім машына і распазнае, што менавіта перад ёй. Але кампутар разумее толькі ўяўленне ў выглядзе адзінак і нулёў, на чым, уласна, і заснаваная ўся інфарматыка.

Такім чынам, любы знак можна прадставіць у выглядзе паслядоўнасцяў, якія змяшчаюць лічбы 1 і 0, гэта значыць, мінімальная паслядоўнасць, якая пазначае літару, лічбу або сімвал, складаецца з двух кампанентаў.

Сам жа інфармацыйны вага, прыняты за стандартную інфармацыйную адзінку вымярэння, называецца бітам (1 біт). Адпаведна, 8 біт складаюць 1 байт.

Прадстаўленне знакаў у двайковым кодзе

Такім чынам, што такое магутнасць алфавіту, думаецца, ужо трохі зразумела. Цяпер паглядзім на іншы аспект, у прыватнасці, практычнае ўяўленне магутнасці з выкарыстаннем двайковага кода. У якасці прыкладу для прастаты возьмем алфавіт, які змяшчае ўсяго 4 сімвала.

У двухзначнай двайковым кодзе паслядоўнасць і іх інфармацыйнае прадстаўленне можна апісаць наступным чынам:

Парадкавы нумар

1-шы

2-ой

3-ці

4-ты

двайковы код

00

01

10

11

Адсюль - найпросты выснову: пры магутнасці алфавіту N = 4 вага адзінкавага сімвала складае 2 біта.

Калі выкарыстоўваць трохзначны двайковы код для алфавіту, напрыклад, з 8 сімваламі, колькасць камбінацый будзе наступным:

Парадкавы нумар

1-шы

2-ой

3-ці

4-ты

5-ты

6-ай

7-ы

8-ы

двайковы код

000

001

010

011

100

101

110

111

Іншымі словамі, пры магутнасці алфавіту N = 8 вага аднаго сімвала для трохзнакавага двайковага кода будзе роўны 3 бітам.

Як знаходзіць магутнасць алфавіту і выкарыстоўваць яе ў кампутарным выразе

Зараз паспрабуем паглядзець на залежнасць, якую выказвае колькасць знакаў у кодзе і магутнасць алфавіту. Формула, дзе N - алфавітная магутнасць алфавіту, а b - колькасць знакаў у двайковым кодзе, будзе выглядаць так:

N = 2 b

Гэта значыць, 2 п 1 = 2, 2 2 = 4, 2 п 3 = 8, 2 4 = 16 і г.д. Груба кажучы, шуканае колькасць знакаў самага двайковага кода і ёсць вага знака. У інфармацыйным выразе гэта выглядае так:

Магутнасць алфавіту, N

2

4

8

16

Колькасць знакаў кода, b

1 біт

2 біта

3 біта

4 біта

Вымярэнне інфармацыйнага аб'ёму

Аднак гэта былі ўсяго толькі найпростыя прыклады, так бы мовіць, для пачатковага разумення таго, што такое магутнасць алфавіту. Пяройдзем непасрэдна да практыкі.

На дадзеным этапе развіцця кампутарнай тэхнікі для набору тэксту з улікам загалоўных, вялікіх і малых літар, кірылічных і лацінскіх літар, знакаў прыпынку, дужак, знакаў арыфметычных дзеянняў і г.д. выкарыстоўваецца 256 знакаў. Зыходзячы з таго, што 256 гэта 2 8, няцяжка здагадацца, што вага кожнага сімвала ў такім алфавіце роўны 8, гэта значыць, 8 бітам або 1 байце.

Калі зыходзіць з усіх вядомых параметраў, можна з лёгкасцю атрымаць патрэбнае нам значэнне інфармацыйнага аб'ёму любога тэксту. Напрыклад, у нас ёсць кампутарны тэкст, які змяшчае 30 старонак. На адной старонцы размяшчаецца 50 радкоў па 60 любых знакаў ці знакаў, уключаючы і прабелы.

Такім чынам, адна старонка будзе ўтрымліваць 50 х 60 = 3 000 байт інфармацыі, а ўвесь тэкст - 3000 х 50 = 150000 байт. Як бачым нават невялікія тэксты вымяраць у байтах нязручна. А што казаць пра цэлых бібліятэках?

У дадзеным выпадку лепш перакладаць аб'ём у больш магутныя велічыні - кілабайты, мегабайты, гігабайты і г.д. Зыходзячы з таго, што, напрыклад, 1 кілабайт роўны 1024 байта (2, 10), а мегабайт - 2 10 кілабайт (1024 кілабайта), няцяжка палічыць, што аб'ём тэксту ў інфармацыйна-матэматычным выразе для нашага прыкладу складзе 150000/1024 = 146, 484375 кілабайт ці прыблізна 0,14305 мегабайт.

замест послеловия

У агульным і цэлым, гэта сцісла і ўсё, што тычыцца разгляду пытання, што такое магутнасць алфавіту. Застаецца дадаць, што ў дадзеным апісанні быў выкарыстаны чыста матэматычны падыход. Само сабой зразумела, што сэнсавая нагрузка тэксту ў дадзеным выпадку не ўлічваецца.

Але, калі падыходзіць да пытанняў разгляду менавіта з пазіцыі, якая дае чалавеку нешта для асэнсавання, набор бессэнсоўнага спалучэння або паслядоўнасцяў знакаў у гэтым плане будзе мець нулявую інфармацыйную нагрузку, хоць, з пункту гледжання паняцці інфармацыйнага аб'ёму, вынік усё роўна можна вылічыць.

У цэлым жа, веды аб магутнасці алфавіту і спадарожных паняццях не так ужо і складаныя для разумення і элементарна могуць прымяняцца ў сэнсе практычных дзеянняў. Пры гэтым любы карыстальнік практычна кожны дзень сутыкаецца з гэтым. Дастаткова прывесці ў прыклад папулярны рэдактар Word або любы іншы такога ж узроўня, у якім выкарыстоўваецца такая сістэма. Але не блытайце яго з звычайным «Нататнікам». Тут магутнасць алфавіту ніжэй, паколькі пры наборы тэксту не выкарыстоўваюцца, скажам, вялікія літары.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 be.delachieve.com. Theme powered by WordPress.