Общеизвестным является тот факт, что информация внутри компьютера является цифровой, то есть такой, которая может быть описана с помощью цифр. Например, текстовый документ, звуковой или графический файл являются определенной совокупностью чисел. В таком числовом виде информация размещается на жестких дисках, дискетах, CD и DVD, а также других носителях. Однако способ представления этих чисел в ПК, на первый взгляд, несколько необычный...
Нули и единицы
Наиболее распространенная форма представления чисел основана на десятичной системе исчисления: десять единиц формируют десяток, десять десятков — сотню, десять сотен — тысячу и так далее. Такой способ счета является наиболее логичным, исходя хотя бы из анатомических особенностей человеческого организма (наличия десяти пальцев на руках). В то же время в основу работы электронных вычислительных машин была положена другая система вычисления — двоичная. Здесь каждый разряд числа может принимать только два значения — 0 и 1. И, соответственно, каждый следующий разряд больше предыдущего не в 10 раз, как в десятичной системе, а всего в 2 раза.
Такой необычный подход связан с электронной структурой внутренностей компьютера. Дело в том, что с помощью электрических импульсов очень неудобно передавать все десять цифр (от 0 до 9), так как для этого потребовалось бы 10 различных вариантов электросигнала. Вместо этого используются всего два сигнала — 0 вольт для обозначения нуля и 5 вольт для обозначения единицы.
Таким образом, один электрический импульс может передать элементарную частичку информации, которая в компьютерах является основной и носит название бит (bit, от английского binary digit — «двоичная цифра»). Однако один бит — это слишком мало, поэтому для кодирования информации обычно используются не отдельные биты, а их комбинации. Исторически сложилось, что в качестве единицы значимой информации стали использовать комбинацию из восьми бит — байт.
Понятия «бит» и «байт» являются ключевыми для характеристики объемов информации в ПК
Хранение информации на различных носителях, используемых в ПК, тесно связано с использованием двоичной системы. Например, магнитные пластины, которые находятся внутри жестких дисков и дискет, на своей поверхности имеют бесчисленное множество специальным образом намагниченных и не намагниченных мест, каждое из которых содержит 1 бит информации. А различные участки поверхности компакт-диска по-разному отражают считывающий лазерный луч, что также позволяет CD-приводу определять, какое значение (0 или 1) имеет каждый записанный бит.
Больше чем миллион
Современные накопители позволяют сохранять достаточно большие объемы информации, которые не совсем удобно исчислять в байтах, а уж тем более в битах. Для характеристики размера данных, исчисляемых тысячами, миллионами и миллиардами байт, используют термины «килобайт», «мегабайт» и «гигабайт» соответственно. Наиболее распространенное сокращение этих терминов выглядит следующим образом: Кбайт, Мбайт и Гбайт. Такая форма записи позволяет отличать их от терминов «килобит», «мегабит» и «гигабит», которые записывают как «Кбит», «Мбит» и «Гбит» соответственно. В различной литературе также встречаются и другие сокращения. Например, мегабайты обозначают как МБ, а мегабиты — Мб и т. д.
Однако исторически сложилось так, что названия этих терминов не совсем верно отображают их суть. Дело в том, что в 1 Кбайте на самом деле не тысяча, а 1024 байт. Аналогично, в 1 Мбайте — 1024 Кбайт или 1024x1024 = 1048576 байт (а не 1 миллион, как могло бы показаться). Точно так же обстоит дело и с гигабайтами, значение которых на самом деле превышает отметку в 1 миллиард байт.
Такие большие величины используются для обозначения объема информации, хранимой на ПК, а также для характеристики емкости тех или иных устройств, предназначенных для хранения информации. Объем информации, который может быть записан на носитель, обычно приводится в соизмеримых величинах. Например, если на одной дискете есть место для хранения 1 457 664 (или около того) байт, то ее емкость записывают как 1,44 Мбайт, а не 1423,5 Кбайта или 0,0014 Гбайта.
Скорость информации
Для характеристики объемов хранимой информации в памяти ПК, флэш-картах и других носителях также используют байт и производные от него величины. Однако когда речь идет о передаче информации по каким-либо каналам связи, то для характеристики ее объемов используются биты.
Это связано с тем, что информация в ПК передается по проводам в виде электрических импульсов. Причем за один раз передается 1 бит информации. Для передачи информации одновременно используется несколько проводов, объединенных вместе (как правило, их число кратно восьми) — чем больше их количество, тем больше бит может быть передано за единицу времени.
Для характеристики скорости передачи данных используют такие величины как бит, килобит или мегабит за секунду (бит/с, Кбит/с, и Мбит/с). Например, скорость подключения к Интернету посредством модема и телефонной линии как правило составляет 36,6 или 56 Кбит/с, а скорость обмена данными в локальных сетях может достигать 10 или 100 Мбит/с. Аналогичные показатели используются для определения пропускной способности информационных шлейфов (проводов для передачи данных) внутри ПК, скорости считывания данных с различных носителей информации.
Скорость записи информации на CD также можно измерять в килобитах в секунду. Однако для маркировки «болванок» обычно используют другое обозначение. Максимально допустимую скорость записи указывают как соотношение скорости CD к базовой скорости записи — 1200 Кбит/с. Например диск, поддерживающий поток записи 48 000 Кбит/с, обозначают как 40-скоростной (пишется 40х) и т. п.
Боды и биты
Когда речь идет о скорости передачи данных через модем, очень часто путают такие показатели, как боды и биты в секунду. Скорость передачи сигнала, выраженная в бодах, показывает, сколько раз в секунду меняется состояние сигнала (фаза или частота) в процессе его передачи от одного устройства к другому. Например, если состояние сигнала меняется 400 раз в секунду, то скорость передачи будет равна 400 бод.
При этом важно иметь в виду, какое количество информации передается путем одного изменения состояния сигнала. Если каждое состояние сигнала передает один бит, то скорость передачи данных будет равна 400 бит/с. Если, например, два бита — то скорость в битах будет выше в два раза. В современных модемах каждому состоянию сигнала соответствует несколько бит, поэтому фактическая скорость передачи данных в бодах будет значительно меньше скорости, выраженной в битах в секунду.
Компьютерная арифметика
Каждый из битов байта может пребывать в двух состояниях:— «включенном» (1) и «выключенном» (0). Каждому «включенному» биту двоичного числа соответствует определенное десятеричное число, которое этот бит кодирует. Первый бит показывает, есть ли в числе разряд единиц, второй — есть ли разряд двоек, третий — четверок и так далее. Разряды в двоичных числах размещены справа налево, как и в десятичных числах. Биты, отвечающие за меньшие разряды, называются младшими, а те, которые обозначают большие разряды, — старшими. Соответственно, самым старшим битом будет самый левый (восьмой бит), а самым младшим — правый. Десятичное значение каждого бита представлено в следующей таблице:
00000000 - 0
00000001 - 1
00000010 - 2
00000100 - 4
00001000 - 8
00010000 - 16
00100000 - 32
01000000 - 64
10000000 - 128
Значение байта, в котором все биты имеют значение 1 (в двоичной системе это число выглядит как 11111111), будет 1+2+4+8+16+32+64+128=255.
Таким образом, с помощью восьми бит (одного байта) можно закодировать целое число в диапазоне от 0 до 255. Например, двоичное число 00000011 имеет значение 3 (поскольку первый бит кодирует 1, а 10 — двойку), 00000101 уже соответствует 5, а 10100000 равен 128 (значение имеет 8 бит) + 32 (и 6 бит), т. е. 160.
256 знаков вполне достаточно для кодирования всех букв не только латинского, но и украинского и русского алфавитов, а также различных знаков пунктуации, математических и прочих служебных символов. Такой способ кодирования используется для записи информации в обычных текстовых файлах. Здесь каждый отдельный символ кодируется одним байтом.