Способы представления данных в эвм. Представление данных в эвм. Виды существования информации

Любая информация представляется в компьютере как последовательность байтов . В самих байтах нет информации о том, как их надо трактовать (числа/текстовые знаки/графическое изображение). В любом случае информация кодируется в виде последовательности 0 и 1, т.е. положительных целых двоичных чисел (число записывается с помощью двух цифр – 0/1). Их интерпретация зависит от того, какая программа и какое действие с ними совершает в данный конкретный момент. Если в программе присутствует последовательность команд, ориентированных на работу с числами, то байты рассматриваются, как числа. Если в программе предполагается действие с текстовыми данными, то байты интерпретируются, как условные числовые коды, обозначающие знаки текста.

I.Системы счисления

Любое число представляет собой кратную запись суммы (например, 168 = 100 + 60 + 8 = 1 10 2 + 6 10 1 + 8 10 0), т.е. число – последовательность коэффициентов при степенях числа 10 => если имеем число d = a 1 a 2 …a n (a 1 a 2 …a n – цифры), то d = a 1 10 n-1 + a 2 10 n-2 +…a n 10 0 .

Кратко подобные суммы записываются следующим образом: n

d = ∑ a i 10 n-i

Число 10 – основание десятичной системы счисления, если в качестве основания взять другое число, то получим другую систему записи чисел, т.е. другую систему счисления .

Система счисления задается величиной основания и множеством цифр. Цифры – специальные знаки, используемые для записи чисел. Их количество обязательно должно быть равно величине основания.

Любое число можно представить в различных системах счисления, эти представления будут строго (взаимно однозначно) соответствовать друг другу.

К примеру, определим 16-ричную систему счисления: основание = 16 =>должно быть 16 цифр (0-15) = 1,2,3,4,5,6,7,8,9,A,B,C,D,E,F. Здесь A-F – цифры 10,11,12,13,14,15. Такие обозначения используют в связи с тем, что цифры нельзя записывать с помощью других цифр, иначе возникнет путаница в чтении чисел. Запишем, как будет выглядеть в этой системе счисления десятичное число 168, имея в виду общий закон записи числа, а также то, что здесь основанием является 16, имеем: 168 (10) = А 16 1 + 8 16 0 => А8 (16).

Арифметические действия в любой системе счисления выполняются аналогично тому, как это делается в 10-ричной системе счисления. Следует лишь величину основания.

К примеру, в 8-ричной системе счисления + 15 = 1 8 1 + 5 8 0 => + 13

14 = 1 8 1 + 4 8 0 => = 12

В компьютере все данные представляются в двоичной системе счисления. Например, число 5 в двоичной форме запишется как 101. Аналогично двоичное число 1111 соответствует десятичному числу 15: 1111 (2) = 1 2 3 + 1 2 2 + 1 2 1 + 1 2 0


Т.е. четырьмя битами можно представить не более 16 десятичных чисел (0-15).

В качестве краткой записи при просмотре или исправлении двоичных данных, находящихся в памяти ЭВМ, используется 16-ричная система счисления. Программы, обеспечивающие «непосредственную» работу человека с памятью ЭВМ, при взаимодействии с ним автоматически преобразовывают двоичное представление данных в 16-ричное и обратно. Любое данное, записанное в 1 байте, представляется всего двумя 16-ричными цифрами, первая из которых соответствует первое четверке битов, а вторая цифра – второй четверке битов.

Такая форма представления двоичных чисел (данных), находящаяся в памяти ЭВМ, - компромисс между человеком и его понятиями об удобстве и компьютером, где вся информация представляется только в двоичной форме.

II.Типы данных и их представления

Одним байтом (8 бит) можно представить 256 положительных целых чисел (0-255). Такой тип данных называется однобайтовым целым без знака.

Числа, превышающие 255, требуют более одного байта для своего представления. Для работы с ними используются типы:

- двухбайтовые целые без знака – обеспечивают представление целых положительных чисел (0-65535)

- четырехбайтовые целые без знака - обеспечивают представление целых положительных чисел (0-≈4,2 млрд.)

Вышеперечисленные типы предполагают, что число должно быть только положительным => называются «без знака». Они отличаются объемом памяти, который отводится для хранения числа. Такие типы используются для числового кодирования знаков текста, цвета, интенсивности графических точек, нумерации элементов и т.д.

Для работы с целыми числами, которые могут быть не только положительными, но и отрицательными, используют типы:

- однобайтовые целые со знаком

- двухбайтовые целые со знаком

- четырехбайтовые целые со знаком

Они отличаются объемом памяти, который отводится для хранения каждого числа.

В основе представление как положительных, так и отрицательных чисел лежит следующий принцип: общее количество числовых кодов, возможных для данного количества байтов (например, для однобайтового – 256), делится пополам, одна половина используется для представления положительных чисел и нуля, другая – отрицательных чисел. Отрицательные числа представляются, как дополнение до общего количества числовых кодов. Например, для однобайтового число (-1) = 255, (-2) – 254 и т.д. до 128, которое обозначает число (-128) => однобайтовое целое со знаком позволяет работать с целыми числами от (-128) до 127, двухбайтовое – от (- 32768) до 32767, четырехбайтовое – от (≈-2,1 млрд.) до 2,1 млрд. (2147483648).

Числа со знаками используются для представления числовых данных, с которыми производятся арифметические действия.

При взаимодействии с программами используются следующие типы данных :

- целый коротк ий (SHORT)

- целый обычный (INTEGER)

- целый длинный (LONG INTEGER)

- вещественный с одинарной точностью (FLOAT/REAL)

- вещественный с двойной точностью (DOUBLEFLOAT/REAL)

- символьный (строковый, текстовый) (CHAR)

- логический (LOGIKAL)

Целый короткий, целый обычный и целый длинный – типы соответственно однобайтовое целое со знаком, двухбайтовое целое со знаком, четырехбайтовое целое со знаком.

В информатике при записи чисел в качестве знака, разделяющего дробную и целую часть, используется не запятая, а точка (например, 68.314). Эта точка фиксирует позицию, после которой указана дробная часть. Изменение местоположения точки приводит к изменению числа => такой вид записи (формат записи) вещественных чисел называется форматом с фиксированной точкой .

Вещественное число с плавающей точкой состоит из 2 частей:

- мантисса

- порядок

Они разделены специальным знаком (E,D). Мантисса представляет собой вещественное число с фиксированной точкой, порядок задается целым числом, указывающим в какую степень надо возвести число 10, чтобы при умножении на мантиссу получить число, которое имеется в виду. Например, 68.314 в таком формате можно записать как 6.8314Е+1 = 0.68314Е+2 = 683.14Е-1, что означает 6.8314 10 1 = 0.68314 10 2 = 68.314 10 -1 .

При таком виде записи местоположение точки не фиксировано, ее положение в мантиссе определяется величиной порядка. Мантисса и порядок могут иметь знак. Если мантисса по модулю <1, причем первая цифра не равна 0, то такой вид записи вещественного числа с плавающей точкой называется нормализованным (0.68314Е+2).

В компьютере вещественное число представляется в формате с плавающей точкой в нормализованном виде. Мантисса и порядок располагаются в соседних байтах, разделитель (E,D) отсутствует.

Обычно различают число с одинарной и двойной точностью . В первом случае при вводе или выводе числа в качестве разделителя мантиссы и порядка указывается E . В памяти ЭВМ такое число занимает обычно 4 байта. Во втором случае в качестве разделителя – D , в памяти ЭВМ число с двойной точностью занимает обычно 8 байтов. Этот тип обеспечивает значительно большую точность вычисления, чем одинарная точность.

Символьные данные составлены из отдельных текстовых знаков. Каждый знак представляется в памяти ЭВМ определенным числовым кодом. Для числового кодирования текстовых знаков используются специальные таблицы кодирования (однобайтовые, двухбайтовые и др.). Имеется в виду тип целого без знака, который использован для числового кодирования. Разные программы могут основываться на разных таблицах => тестовый документ, созданный с помощью одной программы, не обязательно может быть прочитан с помощью другой.

Величины логического типа принимают только два значения:

- TRUE (истина)

- FALSE (ложь)

К ним можно применять логические операции, основными из которых являются and (и), or (или), not (отрицание). And, or –к двум логическим величинам (a>c and a = b). Not – к одной логической величине (not a = b). Результатом выражения с логическими данными (логического выражения) является логическая величина. Результат операции and = TRUE только в одном случае, если обе величины = TRUE. Результат операции or = FALSE только в одном случае, если обе величины = FALSE. Операция not изменяет значение логической величины.

В смешанных выражениях приоритет у арифметических операций, затем – у сравнения, в последнюю очередь – у логических операций. Среди них наибольший приоритет у операции not, затем – and, после – or.

Файлы и их хранение

Любой информационный объект (отдельный документ, отдельная программа), хранящийся на диске и имеющий название является файлом . Информация о файлах (их название, размер, дата и время создания, место размещения на диске и т.д.) хранится в каталогах. Каталог – таблица, в каждой строке которой содержится информация о каком-либо файле или другом каталоге. Каталог = файл (кроме корневого) специального вида. При записи файлов на диск сведения о них автоматически записываются в те каталоги, которые указал пользователь. Условно для краткости речи говорят: «копировать файл из каталога в каталог», «создать каталог в каталоге», «удалить файл в каталоге» и т.п. Однако это на самом деле не происходит, поскольку в каталогах нет ни каталогов, ни файлов, там лишь сведения о них.

При формировании каждого диска на нем автоматически создается каталог, который называется корневым. Он занимает определенное место фиксируемого размера на диске. Его название состоит из 2 знаков : имя диска и двоеточие.

В корневом каталоге можно создать другие каталоги, которые называются подкаталогами или каталогами первого уровня иерархии. В свою очередь каталоги первого уровня иерархии могут создать каталоги второго уровня и т.д. Таким образом формируется иерархическая (древовидная) файловая структура данных на диске. Созданные пользователем каталоги – файлы. Каждый файл или каталог имеет название, состоящее из двух частей, разделенных точкой. Левая часть – имя , правая – расширение . Расширение вместе с точкой можно не указывать. В имени допустимо указывать не более 8 знаков (короткое имя) или не более 256 знаков (длинное имя). В расширении – не более 3 знаков. Стандартным считается использование в названии только латинских букв, цифр и знака подчеркивания. Рекомендуется для работы со списками файлы именовать с указанием расширения, а каталоги – без расширения.

Если требуется использовать какой-либо файл, необходимо указать в каком каталоге этот файл находится. Это делается с помощью указания пути (маршрута) к файлу по дереву каталога.

Маршрут (путь) – это список каталогов по мере их вложенности (от внешнего к внутреннему), разделенных знаком обратной черты (\ - обратный слеш). При указании файлов перед его названием указывается маршрут, а затем через \ - название файла (например, C:\Windows\win.com - означает, что файл win.com находится в каталоге Windows, который находится в корневом каталоге диска C). Такая запись называется полной спецификацией файла . Краткая включает в себя только название файла. Создаваемые пользователем каталоги и файлы размещаются при записи на своем месте памяти диска. Файлы могут быть записаны частями в разных местах диска. В процессе записи файл автоматически разбивается на такие части, и каждая из них записывается на то место, которое свободно в данный момент. Эти части называются кластерами . Размер кластера зависит от объема дисковой памяти, он обычно занимает несколько секторов. В связи с таким принципом записи вся область диска как бы делится на такие кластеры, и они используются для записи файлов. Считывание файлов также производится частями размером в один кластер: файл собирается из отдельных частей, записанных в разных местах диска. Такой способ хранения файлов осуществляется с помощью так называемой таблицы размещения файлов FAT. Она создается на каждом диске автоматически при его формировании и используется для запоминания мест хранения частей файла. Клетки FAT пронумерованы, начиная с «0», и соответствуют частям памяти диска размером в 1 кластер. В каждой клетке может содержаться 0 (указывает, что соответствующий кластер свободен), номер следующего кластера данного файла или специальный числовой код, обозначающий окончание цепочки кластеров для данного файла. Для представления чисел, находящихся в FAT, используются типы данных целое без знака. В зависимости от количества битов, используемых для представления каждого числа, различают 16 битовый FAT (16 разрядный), 32 битовый FAT (32 разрядный). В качестве специального кода, означающего окончание цепочки кластера, используется максимальное число, которое может быть представлено в клетке FAT. Для 16 разрядного таким числом является 65535 (в шестнадцатиричной форме – FFFFF). Программы, обеспечивающие просмотр и корректировку FAT, показывают этот код на экране в текстовой форме (E OF). В каталоге содержится информация о файле и в частности порядковый номер кластера, с которого начинается файл. Эта информация вместе с информацией, содержащейся в FAT (ссылки на следующие кластеры), используется для поиска и считывания файлов.

Компьютерные сети

I.Основные особенности

Компьютерная сеть – совокупность взаимосвязанных через каналы передачи информации компьютеров, обеспечивающих пользователей средствами обмена информации и коллективного использования ресурсов (аппаратных, программных, информационных).

Виды сетей:

- локальные – главная отличительная особенность заключается в том, что, как правило, все объединенные ею компьютеры связаны единым каналом связи. Расстояние между компьютерами – до 10 км (при использовании проводной связи), до 20 км (радиоканалы связи). Локальные сети связывают ЭВМ одного или нескольких близлежащих зданий одного учреждения.

- глобальные – для них свойственно разнообразие каналов связи и использование спутниковых каналов, позволяющих соединять узлы связи и ЭВМ, находящиеся на расстоянии 10-15 тыс. км друг от друга. Обычно имеют узловую структуру, состоят из подсетей, каждая из которых включает в себя коммуникационные узлы и каналы связи. Коммуникационные узлы обеспечивают эффективность функционирования сети, к ним подключаются компьютеры, локальные сети, большие ЭВМ и т.д.

- интрасети – объединяют пользователей, работающих в одной организации. Часть используют возможности имеющихся локальных и глобальных сетей. Такая сеть может связывать компьютеры, находящиеся как в одном здании, так и в разных местах мира.

В сети имеются общедоступные компьютеры, которые предоставляют информацию или вычислительные услуги пользователям. Сервером может называться компьютер, используемый для этой цели или место (в глобальных сетях), куда можно отправить запрос на выполнение какой-либо услуги. Таким местом может быть компьютер-сервер, локальная сеть, большая ЭВМ и т.п.

Компьютеры пользователей могут работать в сетях в двух режимах :

Режим рабочей станции – компьютер используется не только для отправки запроса к серверу и получения от него информации, но и для обработки этой информации

Режим терминала – последнее не производится: обработка информации осуществляется на сервере, а пользователю отправляется лишь результат этой обработки.

Компьютер-сервер по своим возможностям значительно превосходит рабочие станции и комплектуется множеством сетевых плат (адаптеров ), обеспечивающих подключение к сетям. Комплекс программ, которые обеспечивают работу в сети, - сетевое программное обеспечение. Оно определяет тот вид услуг, выполнение которых возможно в данной сети. В настоящее время распространены 2 основные концепции построения такого программного обеспечения:

- «концепция файлового сервера» – основана на том, что сетевое программное обеспечение должно предоставлять многим пользователем информационные ресурсы в виде файлов => сервер в такой сети называется файловым , а сетевое программное обеспечение – сетевой оперативной системой . Ее основная часть размещается на файловом сервере, а на рабочих станциях устанавливается ее небольшая часть, называемая оболочкой . Оболочка выполняет роль интерфейса между программами, обращающимися за ресурсом, и файловым сервером. Такой сервер представляет собой хранилище файлов, использующихся всеми пользователями. При этом как программы, так и файлы данных, находящиеся на файловом сервере, автоматически перемещаются на рабочую станцию, где и происходит обработка этих данных.

- «архитектура клиент-сервер» - в этом случае сетевое программное обеспечение состоит из программных систем 2 классов :

- программы-серверы – так называют программные системы, обеспечивающие работу сервера

- программы-клиенты – программные системы, обеспечивающие пользователей-клиентов

Работа систем этих классов организуется следующим образом: программы-клиенты посылают запросы программе-серверу, основная обработка данных производится на компьютере-сервере, а на компьютер пользователя посылается лишь результаты выполнения запроса.

В локальных сетях обычно используется концепция первого типа с одним файловым сервером. В глобальных основной является «архитектура клиент-сервер».

Представление информации и передача ее по сети производится в соответствии со стандартными соглашениями. Набор таких стандартных соглашений называется протоколом .

II.Типология локальной сети

Типология сети – логическая схема соединения каналами связи компьютеров (компьютеров).

Чаще всего в локальных сетях используются 3 основных типологии :

- моноканальная

- кольцевая

- звездообразная

Использование канала передачи информации, соединяющего узлы сети на физическом уровне, определяется протоколом, который называется методом доступа . Эти методы доступа реализуются соответствующими сетевыми платами (адаптерами). Такие адаптеры устанавливаются в каждом компьютере сети и обеспечивают передачу и прием информации по каналам связи.

Моноканальная типология – используется незамкнутый канал связи, к которому подключаются все компьютеры. Он называется моноканал-шиной (общей шиной).


Терминатор

Терминал служит для подключения к открытым кабелям сети, предназначен для поглощения передаваемого сигнала. В такой типологии, как правило, используется метод доступа с предварительным прослушиванием канала для определения свободен ли он.

Ethernet (скорость – 10 Мбит/сек) – название метода доступа. Может быть использован метод доступа Fast Ethernet (скорость – 100Мбит/сек)

Устойчивость к неисправностям отдельных узлов

Основные недостатки типологии:

Обрыв кабеля приводит к неработоспособности всей сети

Существенное уменьшение пропускной способности сети при значительных объемах трафика (- информация, передаваемая по сети)

Кольцевая типология


Использует в качестве канала связи замкнутое кольцо, состоящее из сегментов. Сегменты соединяются специальными устройствами – репитерами (повторителями). Репитер предназначен для соединения сегментов сети.

Основным методом доступа здесь является Token Ring – метод доступа с передачей маркера.

Имеется центральный узел коммуникации, объединяющий все компьютеры сети. Активный центр полностью управляет компьютерами сети. Метод доступа обычно также основан на использовании маркера (например, Arcnet со скоростью передачи информации 2 Мбита/сек). Кроме этого могут быть реализованы методы доступа Ethernet и Fast Ethernet.

Основные достоинства типологии:

Удобство с точки зрения управления взаимодействием компьютеров

Простота изменения и наращивания сети

Основные недостатки сети:

При отказе активного центра выходит из строя вся сеть

III.Структура глобальной сети

Между сетями возможен обмен информацией, для обеспечения такой связи используются средства межсетевого взаимодействия, называемые мостами , маршрутизаторами и шлюзами . Это специальный компьютер, в котором установлено два и более сетевых адаптеров, каждый из которых обеспечивает связь с одной сетью. Мост используется для связи сетей с однотипными внутрисетевыми каналами связи. Маршрутизатор связывает сети одного и того же вида, но различными внутрисетевыми каналами связи. Шлюзы используются для обеспечения связи сетей разного вида, для связи сетей с различными компьютерными системами (например, локальная сеть – большая ЭВМ, локальная сеть – глобальная сеть, конкретный персональный компьютер – глобальная сеть).

Глобальная сеть включает в себя подсети связи, к которым подключены локальные сети, рабочие станции и терминалы пользователей, а также компьютеры-серверы. Подсеть связи состоит из каналов передачи информации и коммуникационных узлов. Коммуникационные узлы предназначены для быстрой передачи информации по сети, выбора оптимального маршрута передачи информации и т.п., т.е. обеспечивают эффективность функционирования сети в целом. Такой узел – это либо специальное аппаратное устройство, либо специализированный компьютер с соответственным программным обеспечением.

Серверы и пользователи подключаются к глобальным сетям чаще всего через поставщиков услуг доступа к сети – провайдеров .

IV.Основные особенности глобальной сети Internet

Каждый пользователь и сервер обязательно имеют уникальный адрес. Сообщение, передаваемое по сети, снабжается адресами получателя и отправителя и в процессе передачи автоматически разбивается сетевым адаптером на части фиксированной длины, называемые пакетами . При этом каждый пакет (также автоматически) снабжается адресами отправителя и получателя. На принимающем компьютере пакеты собираются в единое сообщение.

Каждый сервер или пользовательский компьютер в сети имеют адреса 3 уровней :

- локальный адрес – адрес сетевого адаптера. Такие адреса назначаются производителями оборудования и являются уникальными, т.к. их назначение централизовано. Этот адрес используется только в пределах локальной сети.

- IP-адрес – представляет собой четырехбайтовую последовательность (4 однобайтовых целых без знака чисел) и состоит из 2 частей:

Первые 2 байта характеризуют сеть

Вторые 2 байта – конкретный узел

Такой адрес назначается администратором сети независимо от локального адреса. Если сеть должна работать как составная часть Internet, то номер сети (первые 2 байта) назначаются по рекомендации специальной организации ICANN. В противном случае, номер сети выбирается администратором произвольно. Номер узла (вторые 2 байта) назначаются администратором сети (например, 192.100.2.15). Узел может входить в несколько сетей. В этом случае он должен иметь несколько IP-адресов => IP-адрес характеризует не отдельный компьютер, а одно сетевое соединение. Сообщение, передаваемое по сети, снабжается IP-адресами получателя и отправителя.

- доменный адрес (доменное имя) – пользователю неудобно использовать IP-адреса в текущей работе => в Internet существует т.н. доменная система имен (DNS). В этой системе даются удобные для пользователя текстовые имена (идентификаторы), называемые доменными, за ними скрываются соответствующие IP-адреса. Пользователь работает с доменными именами, а соответствующее программное обеспечение с помощью специальных DNS-серверов автоматически преобразует их в адреса, которыми и снабжает передаваемые пакеты. Полное доменное имя (DNS-адрес) представляет собой последовательность имен, разделенных точкой. Первое слева – имя конкретного компьютера, затем – доменное имя организации, региона и т.д., последнее справа – имя т.н. корневого домена . Имена корневых доменов указывают на государство (например, ru – Россия, us – США, kz – Казахстан и т.д.) или на принадлежность к организации определенного типа (com - коммерческий, edu - образовательный, gov - правительственный, mil - военный, net - сетевой, org - организация). Позднее были определены и другие подобные корневые домены (arts – искусство, культура, firm – бизнес, info – информация, nom – индивидуальный).

Имена компьютеров, имеющих доступ в Internet через узел (например, сервер локальной сети), отделяются от последующей части в полном имени не точкой, а знаком @ («эт»). Например, [email protected].

V.Виды услуг в Internet

Предоставление услуг в Internet построено на основе модели «клиент-сервер». Для подключение компьютера к Internet достаточно иметь телефонную линию, провайдера, имеющего шлюз в Internet и модем (мо дулятор-дем одулятор) – специальный адаптер для подключения к глобальной сети через телефонную связь. Компьютер провайдера, используемый пользователями для работы в Internet, называется хостом . К наиболее известным услугам, предоставляемым серверами сети Internet , относятся:

- электронная почта (e-mail) – представляет собой процесс передачи сообщений между компьютерами

- передача файлов (FTP-система) – предназначена для пересылки файлов со специальных FTP-серверов любому пользователю, для получения файла следует указать полное имя сервера и полную спецификацию файла

- просмотр ресурсов (GOPHER-система) – обеспечивает поиск файлов на GOPHER-серверах по содержанию (тема, ключевое слово, фраза т.п.)

- телеконференции – предназначены для проведения дискуссий и обмена новостями, позволяют читать и посылать сообщения в открытые по разным темам информационные группы. Самой крупной является система телеконференций UseNet (пользователь может «подписаться» на любую из имеющихся тем, просматривать новости, посылать сообщения). Другой крупной системой телеконференций является IRC (Internet Relay Chat) (позволяет общаться участникам групп в реальном режиме времени (интерактивный режим), в этом случае пользователь видит на экране постоянно поступающую информацию и одновременно с этим может помещать свои сообщения, которые тут же поступают на экраны всех остальных участников группы)

- всемирная паутина www (world wide web) – представляет собой попытку объединить в одном информационном инструменте возможности указанных выше средств, добавив к ним передачу графических изображений, звуков, видео. В основе лежит принцип гипертекста (- система информационных объектов с перекрестными ссылками, в документах содержатся ссылки на другие документы, связанные по смыслу). Ранее применялся только для текстовых документов, в настоящее время гипертекстовый документ называется гипермедиа-документом . Объекты, на которые созданы ссылки, могут находиться на удаленных компьютерах. Гипермедиа-документы создаются с помощью специального языка HTML (язык разметки гипертекста) и хранятся на специальных серверах (www-сервер, web-сервер). Часто такие документы называют Web-страницами или Web-сайтами. Соответствующие программы-клиенты называются браузерами (от англ. browser) – поисковая система. Большинство современных браузеров обеспечивают доступ не только к страницам web-серверов, но и к другим видам услуг. При этом, обращаясь к различным ресурсам, используется т.н. URL-адреса (унифицированный указатель ресурсов). Он имеет следующий формат: код ресурса://спецификация запроса. Код ресурса определяет вид услуги, с которой необходимо работать: http – работа с web-серверами, для просмотра web-сайтов, ftp – ftp-система, gopher – gopher-система, news – связь с use-net, mailto – электронная почта и т.д.

Источниками и носителями информации могут быть сигналы любой природы: текст, речь, музыка и т.д. Однако хранение и перера­ботка инфор­мации в ее естест­венном виде неудобна, а иногда и невозможна. В таких слу­чаях применяется коди­рование. Ко­дом называется правило, по ко­торому со­поставляются различные алфавиты и слова (они появились в глу­бокой древно­сти в виде тайнописи, когда ими пользо­вались для засекречивания важ­ного со­общения ). Исторически пер­вый уни­версальный код, предназначенный для передачи со­обще­ний, связан с именем изобре­тателя телеграфного аппарата Морзе и известен как аз­бука Морзе, где каждой букве или цифре соответст­вует своя последовательность из крат­ковременных, называемых точками, и длительных - тире сигналов, разделяе­мых пау­зами.

Компьютер, как из­вестно, может обрабатывать информацию, представ­ленную в чи­словой форме. Существуют различные способы записи чисел. Совокупность прие­мов записи и наименования чисел называется сис­темой счисления. Можно ука­зать два основных класса, на которые разделя­ются системы счис­ления - пози­ционные и непо­зиционные . Примером по­зи­цион­ной системы счисле­ния явля­ется десятичная, непозиционной - римская сис­тема счисления.

В непозиционных системах количественное значение разряда определя­ется только его изображением и не зависит от его места (позиции ) в числе. В ней вводится ряд символов для представления основных чисел, а остальные числа - результат их сложения и вычитания. Основные символы для обозна­чения десятичных разрядов в римской системе счисления: I – один, X – де­сять, C – сто, M – тысяча и их половины V – пять, L – пятьдесят, D – пять­сот. Натуральные числа записываются при помощи повторения этих цифр (например, II – два, III – три, XXX – тридцать, CC – двести ). Если же боль­шая цифра стоит перед меньшей цифрой, то они складываются, если на­обо­рот – вычитаются (например, VII – семь, IX – девять ). В непозиционных системах счисления не представля­ются дробные и отрица­тель­ные числа, по­этому нас будут интересовать только по­зицион­ные системы счисле­ния.

Система счисления называется позиционной, если значение числа в ней оп­ределяется как символами, принятыми в системе, так и положением (пози­цией ) этих символов в числе. Напри­мер:

123,45 = 1∙10 2 + 2∙10 1 + 3∙10 0 + 4∙10 –1 + 5∙10 –2 ,

или, в общем виде:

X (q) = x n -1 q n -1 + x n -2 q n -2 + … + x 1 q 1 + x 0 q 0 + x -1 q -1 + x -2 q -2 + … + x -m q –m .

Здесь X (q) – запись числа в системе счисления с основанием q ;

x I – натуральные числа меньше q, т.е. цифры;

n – число разрядов целой части;



m – число разрядов дробной части.

Записывая слева направо цифры число, мы получим закодированную за­пись числа в q -ичной системе счисления.

X (q) = x n-1 x n-2 x

1 x 0 , x -1 x -2 x -m .

В информатике, вследствие применения электронных средств вычисли­тельной техники, большое значение имеет двоичная система счисления, q = 2. На ранних этапах развития вычислительной техники арифметические операции с действительными числами производились в двоичной системе ввиду про­стоты их реализации в электронных схемах вычислительных машин. Отметим, что принци­п действия базовых элементов цифровых вычислительных машин осно­ван на двух устойчивых со­стояниях - проводится или нет электрический ток, или в каком направлении намагничен магнитный носитель и т.д. и для записи двоичного числа достаточно использовать только две цифры 0 и 1, соответствующих каждому из состояний. Таблица сложения и таб­лица ум­но­жения в двоичной системе будет иметь по четыре пра­вила. И для реализации поразрядной арифметики в компьютере потребуется вместо двух таблиц по сто правил в десятичной системе счисления две таб­лицы по четыре правила в двоичной.

0 + 0 = 0 0 * 0 = 0
0 + 1 = 1 0 * 1 = 0
1 + 0 = 1 1 * 0 = 0
1 + 1 = 10 1 * 1 = 1

Соответственно на аппаратном уровне вместо двухсот электронных схем – восемь. Однако запись числа в двоичной системе счисления значи­тельно длиннее записи того же числа в десятичной системе счисления. Это гро­моздко и неудобно для использования, так как обычно человек может од­но­временно воспринять не более пяти-семи еди­ниц информации. Поэтому, на­ряду с двоичной системой счисления, в инфор­матике имеют хождение вось­меричная (в ней запись числа в три раза короче, чем в двоичной системе счисления ) и шестнадцатеричная системы счисления (в ней запись числа в четыре раза короче, чем в двоичной ).

Так как десятичная система для нас удобна и привычна, все арифмети­ческие действия мы делаем в ней, и преобразование чисел из произвольной недесятичной (q ≠ 10) на основе разложения по степеням q . Преобразование из десятичной в прочие системы счисления производится с помощью правил умножения и деления. При этом целая и дробная части переводятся отдельно.

АЛФАВИТ 2-чной системы счисления: 0 1

АЛФАВИТ 8-ричной системы счисления: 0 1 2 3 4 5 6 7

АЛФАВИТ 10-чной системы счисления: 0 1 2 3 4 5 6 7 8 9

АЛФАВИТ 16-ричной системы счисления: 0 1 2 3 4 5 6 7 8 9 A B C D E F

Для перевода числа из десятичной системы счисления в любую другую систему счисления нужно делить «до упора» это число на основание той системы (основание системы – это количество символов в ее алфавите ), в которую переводим число, а потом прочесть остатки справа на­лево. Для пе­ревода числа из любой системы счисления в десятичную нужно умножить содержимое каждого разряда на основание системы в степени рав­ной поряд­ковому номеру разряда и всё сложить. Перевод числа из восьмеричной сис­темы в двоичную осуществляется заменой слева направо восьмеричной цифры тремя двоичными цифрами. Перевод числа из двоичной системы счисления в восьмеричную осуще­ствляется заменой справа налево каждой триады двоичных цифр на одну восьмеричную цифру.

Для перевода числа из десятичной системы счисления в любую другую систему счисления можно воспользоваться стандартной программой Каль­кулятор .

Набрав число и щелкнув на одном из переключателей Hex , Dec , Oct или Bin , получим представление этого числа в соответствующей системе.

Как отмечалось, двоичная сис­тема счисле­ния, будучи естественной для ЭВМ, не удобна для восприятия чело­ве­ком. Большое количе­ство разря­дов двоичного числа по сравнению с соответ­ст­вующим десятичным, однооб­раз­ное чередование единиц и нулей является ис­точником ошибок и затруд­нений чтения двоичного числа. Для удобства записи и чтения двоичных чи­сел (но не для работы цифровых вычислительных машин! ), необходима бо­лее удоб­ная для записи и чтения система счис­ления. Такими являются сис­темы с ос­нова­нием 2 3 = 8 и 2 4 = 16, т.е. восьмеричная и шестнадцатеричная сис­темы счисления. Названные системы удобны тем, что в них, с одной сто­роны, обеспечивается чрезвычайно лег­кий перевод из двоичной сис­темы (а также обратный перевод ), т.к. основание системы – степень числа 2, с дру­гой - со­храняется компактный вид числа. Восьмеричная система широко ис­пользо­валась для записи машин­ных программ в ЭВМ 1 и 2 поколений. В на­стоящее время используется, в ос­нов­ном,

шестнадцатеричная система. Приведем пример соответствия шестна­дца­теричной и двоичной системы:

Пример для тетрад :

0000 = 0; 0001 = 1; 0010 = 2; 0011 = 3; 0100 = 4; 0101 = 5; 0110 = 6; 0111 = 7; 1000 = 8; 1001 = 9; 1010 = A; 1011 = B; 1100 = C; 1101 = D; 1110 = E; 1111 = F.

В ЭВМ используется представление информации в виде «машин­ного слова», длина которого равна некоторому числу бит, характерному для дан­ного типа ЭВМ. В ЭВМ первых поколений использовались ма­шинные слова различной длины, например 45 бит и т.д., то есть не равные це­лому числу байт. В современных компьютерах длина слова обычно 4 или 8 байт (в пер­вых моделях персональных компьютеров было 1 или 2 байта ).

Слово в машинной памяти

15 14 13 12 11 10 9 8 7 6 5 4 3 2 1 0

старший байт младший байт

5.1 Проблемы представления данных

Для физического представления чисел необходимы элементы, способные находиться в одном из нескольких устойчивых состояний.

Если для построения ЭВМ выбрана десятичная система счисления, то таких состояний должно быть десять. Для восьмеричной системы счисления таких состояний должно быть 8, для шестнадцатеричной - 16 и т.д. Число состояний всегда должно быть равно основанию системы счисления.

Естественно, такое количество состояний вызывает трудности при их реализации.

В середине сороковых годов прошлого столетия группа математиков, в которую входил и фон Нейман, предложила использовать для представления информации в ЭВМ двоичную систему счисления.

Для двоичной системы счисления устойчивых состояний должно быть два (грубо говоря - выключатель включен (этому состоянию логически соответствует 1) и выключатель выключен (этому состоянию логически соответствует 0).

Совершенно очевидно, что наиболее простыми с точки зрения технической реализации являются так называемые двухпозиционные элементы, способные находиться в одном из двух устойчивых состояний, например: электромагнитное реле замкнуто или разомкнуто, ферромагнитная поверхность намагничена или размагничена и т.д.

Простота технической реализации двухпозиционных элементов обеспечила наибольшее распространение в ЭВМ двоичной системы счисления.

Кроме того, в информатике используется также восьмеричная и шестнадцатеричная системы счисления. Основания этих систем соответствуют целым степеням 2, поэтому для них исключительно просты правила перевода в двоичную систему счисления и наоборот.

Любая информация представляется в ЭВМ в виде двоичных кодов. Отдельные элементы двоичного кода, принимающие значение 0 или 1 называются разрядами или битами.

n

Хранит информацию блок машины называемой памятью. Условно блок памяти изобразим прямоугольником. Память делится на байты. Наименьшей неделимой единицей информации, которой можно присвоить адрес является байт(в современных ЭВМ под байт отводят 8 разрядов). Номера начинаются с нуля и заканчиваются некоторым числом «n». Значение n зависит от типа ЭВМ.

Память хранит:

n данные (так называемая область данных)

n программы (область программ)

n служебную информацию (она называется системной, и область также называется системной, таких областей в памяти две).

Память «начинается» системной областью и «заканчивается» системной областью.

Итак, память подразделяется на ячейки(разрядные сетки) обратиться к которым можно по их адресам.

Каждый байт памяти подразделяется на разряды или биты.

Условно разрядную сетку можно изобразить в виде узкого прямоугольника с делениями для разрядов (битов).

M

Разрядная сетка

Каждому разряду (биту) соответствует один физический элемент. Логически это 1, либо 0.

Представление числовой информации в памяти ЭВМ неразрывно связано с таким понятием современных проблемно – ориентированных языков, как тип данных. Современные языки достаточно строго отслеживают тип переменных, которые используются в программе. Тип переменной определяет возможный набор значений данной переменной, размер её внутреннего представления и множество операций, которые могут выполняться над переменной. Для числовых значений существенным моментом является диапазон допустимых значений.

Понятие типа данных носит двойственный характер. С точки зрения размерности микропроцессор аппаратно поддерживает следующие основные типы данных:

Байт - восемь последовательно расположенных битов, пронумерованных от 0 до 7, при этом бит 0 является самым младшим значащим битом.

Двойной байт (слово в 16/32-битной архитектуре)- последовательность из двух байт, имеющих последовательные адреса. Размер слова - 16 бит; биты в слове нумеруются от 0 до 15. Байт, содержащий нулевой бит, называется младшим байтом, а байт, содержащий 15‑й бит - старшим байтом. Микропроцессоры Intel имеют важную особенность - младший байт всегда хранится по меньшему адресу. Адресом двойного байта считается адрес его младшего байта. Адрес старшего байта может быть использован для доступа к старшей половине двойного байта.

Полуслово - последовательность из четырех байт (32 бита), расположенных по последовательным адресам. Нумерация этих бит производится от 0 до 31. Двойной байт, содержащий нулевой бит, называется младшим двойным байтом, а двойной байт, содержащий 31-й бит - старшим двойным байтом. Младший двойной байт хранится по меньше­му адресу. Адресом полуслова считается адрес его младшего байта. Адрес старшего двойного байта может быть использован для доступа к старшей половине полуслова.

Слово (тип, резрядность которого соответствует разрядности архитектуры)- последовательность из восьми байт, имеющих последовательные адреса. Размер слова - 64 бита; биты в слове нумеруются от 0 до 63. Полуслово, содержащее нулевой бит, называется младшим полусловом, а полуслово, содержащее 63-й бит - старшим полусловом. Микропроцессоры Intel имеют важную особенность - младшее полуслово всегда хранится по меньшему адресу. Адресом слова считается адрес его младшего байта. Адрес старшего полуслова может быть использован для доступа к старшей половине слова.

Двойное слово - последовательность из шестнадцати байт (128 бита), расположенных по последовательным адресам. Нумерация этих бит производится от 0 до 127. Слово, содержащее нулевой бит, называется младшим словом, а слово, содержащее 127-й бит, - старшим словом. Младшее слово хранится по меньшему адресу. Адресом двойного слова считается адрес его младшего слова. Адрес старшего слова может быть использован для доступа к старшей половине двойного слова.

Кроме трактовки типов данных с точки зрения их разрядности, микропроцессор на уровне команд поддерживает логическую интерпретацию этих типов.

Целый тип без знака - двоичное значение без знака, размером 8, 16, 32, 64 или 128бит.

  • байт - от 0 до 255;
  • два байта - от 0 до 65 535;
  • полуслово - от 0 до 232–1;
  • слово - от 0 до 264–1;
  • двойное слово - от 0 до 2128–1.

Целый тип со знаком - двоичное значение со знаком, размером 8, 16, 32, 64 или 128бит. Знак в этом двоичном числе содержится в старшем бите.

Числовые диапазоны для этого типа данных следующие:

  • 8-разрядное целое - от -128 до +127;
  • 16-разрядное целое - от -32 768 до +32 767;
  • 32-разрядное целое - от -231 до +231 – 1;
  • 64-разрядное целое - от -263 до +263 – 1;
  • 128-разрядное целое - от -2127 до +2127 – 1.

Действительный тип кодирует действительное число в экспоненциальной форме:

Закодированное число вычисляется по формуле:

N = мантиса · 2 порядок ;

  • 32-разрядное действительное - от 3,4·10-38 до 3,4·1038;
  • 64-разрядное действительное - от 1,7·10-308 до 1,7·10308;
  • 80-разрядное действительное - от 3,4·10-4932 до 1,1·104932.

Следует отметить, что помимо разрядности, определённой типом процессора необходимо учитывать и язык программирования (конкретно возможности компилятора). Например, язык программирования Турбо Паскаль поддерживает тип данных real, для этого типа данных отведено 48 разрядов.

Повторим, что минимальной адресуемой единицей информации, обрабатываемой в ЭВМ, является байт. Байт состоит из восьми двоичных разрядов.

Рассмотрим подробно представление чисел в памяти ЭВМ.

5.2 Формы представления чисел в ЭВМ.

Для представления чисел в ЭВМ применяются две различные формы: с фиксированной точкой (запятой) - для целых чисел и с плавающей точкой (запятой) для действительных чисел.

Целые числа могут быть представлены со знаком и без знака.

Возьмем разрядную сетку из 8 бит (т.е. байт) и попробуем разобраться, как представляются целые числа без знака. Самое маленькое число, которое можно поместить в один байт без знака - это ноль.

Число 0 без знака.

Самое большое число, которое можно представить в одном байте без знака - это (в двоичном виде) 111111112

Переведем это число в десятичную систему счисления (для простоты счета переведем сначала в 8-ную).

Итак, в один байт без знака можно поместить максимальное десятичное число 255.

Аналогично можно вычислить максимальное число, которое можно поместить в два байта (т.е. 16 бит).

11111111111111112=6553510.

Для чисел со знаком самый левый разряд отводится под знак. Для положительного числа этот разряд равен 0, для отрицательного - 1.

Число +12 в 8-битной разрядной сетке будет записано следующим образом: 1210=11002.

Знак ‘+’

Обратите внимание на расположение чисел в разрядной сетке: между знаковым разрядом и первым значащим разрядом числа располагаются нули.

Вычислим максимальное положительное число, которое помещается в 8 бит со знаком, т.е. под число отводится 7 бит.

11111112=1778=1.82+7.81+1.80=64+56=127.

Теперь вычислим максимальное положительное число, которое помещается в 16-ти разрядную сетку со знаком.

1111111111111112=7FFF16=716.163+F16.161+F16.161+F16.160=7.163+15.162+15.161+15.1=32767.

Представление отрицательных чисел существенно отличается от представления положительных чисел. Предварительно рассмотрим некоторые понятия, а именно введем определение прямого, обратного и дополнительного кодов.

5.3 Прямой, обратный и дополнительный коды.

1) Положительные числа.

Для положительных чисел прямой код равен обратному коду и равен дополнительному коду.

Прямой код Xпр двоичного числа X содержит двоичные цифровые разряды, слева записывается знак числа.

Разместить в разрядной сетке из восьми разрядов положительное число 97.

Это же число разместим в разрядной сетке из 16 разрядов.

2) Отрицательные числа.

Отрицательные числа хранятся в памяти ЭВМ либо в обратном, либо в дополнительном кодах.

Обратный код Xобр двоичного отрицательного числа X получается следующим образом: в знаковый разряд числа записывается единица, в цифровых разрядах нули заменяются единицами, а единицы - нулями.

Запишем число -4 в обратном коде в 8-ми разрядной сетке. Двоичный код модуля исходного числа равен 1002. Обратный код получается инверсией каждого разряда двоичного кода модуля исходного числа, записанного в 8-ми разрядную сетку.

Двоичный код модуля исходного числа равен 00000100. Выполним инверсию каждого разряда.

Обратный код числа -4 записывается следующим образом:

Знаковый разряд

Дополнительный код Xдоп отрицательного числа X получается из обратного кода Xобр путем прибавления единицы к самому правому разряду (он называется младшим).

Итак, Xдоп=Xобр + 00000001, т.е.

1
(знак.разряд)

(сложение производим в двоичной системе счисления 12+12=102)

2726252423222120

Теперь приведем полученное число в десятичную систему счисления

128+64+32+16+8+4=252

Мы получили, что дополнительный код числа –4 в десятичной системе счисления равен 252. Сложим ê-4ê+252=256. 256=28. Количество разрядов сетки было равно 8. Число 252 «дополнило» число ç–4ç до 28 = 1000000010.

Теперь сложим два двоичных числа – двоичный код числа ç-4ç в 8-разрядной сетке и дополнительный код числа –4:

1 000000002 мы получили 28

Запишем общее правило получения дополнительного кода некоторого целого числа х.

2k - |x|, x<0, где k – количество разрядов сетки.

Есть еще одно очень простое правило получения дополнительного кода некоторого отрицательного числа.

Для получения дополнительного кода, необходимо инвертировать все разряды прямого кода модуля исходного числа начиная с самого левого разряда исключая последнюю единицу и стоящие за ней нули.

00000 100 прямой код ç-4ç

11111 100

инверсия разрядов

Определим наименьшее отрицательное число, которое можно положить в один байт со знаком. Прямой код такого числа равен -1111111. Самый левый разряд отведён под знак числа. Найдём дополнительный код числа А. Адоп = 10000000 .

Следовательно, самое маленькое отрицательное число, которое можно записать в 8-ми разрядной сетке - 27 = -128. Рассуждая таким же образом, получим, что для 16-ти разрядной сетки самое маленькое отрицательное число равно 215 или-32768.

Прямой, обратный и дополнительный коды введены для упрощения операции вычитания(или алгебраического сложения). При помощи обратного и дополнительного кодов операция вычитания сводится к операции арифметического сложения. При этом операнды представляются либо в обратном, либо в дополнительном коде. Рассмотрим конкретные примеры. Для упрощения будем рассматривать четырехразрядную сетку.

а) Вычислить х-у, где х=+6, у=-3, при этом результат является положительным числом.

хпр=хобр=хдоп=0.110; уобр=1.100; удоп=1.101

Сложение в обратных кодах:

уобр=1.100

В данном случае единица, не поместившаяся в разрядную сетку (единица переноса из знакового разряда), циклически прибавляется к правому разряду суммы кодов. Ответом является положительное двоичное число 0.0112=310.

удоп=1.101

При сложении в дополнительных кодах левая единица, вышедшая за границы разрядной сетки отбрасывается. Результатом является положительное число 310.

б) Рассмотрим второй случай: числа имеют разные знаки, но в результате получаем отрицательное число.

х=-610=-1102 и у=+310=+0112.

Хобр=1.001, хдоп=1.010, упр=уобр=удоп=0.011.

Сложение в обратных кодах:

упр= 0.011

В данном случае получен обратный код алгебраической суммы, необходимо перейти от обратного кода к прямому:

(х+у)обр=1.100, следовательно, (х+у)пр=-0112=-310(единица в знаковом разряде дает минус, все остальные разряды инвертируются).

Сложение в дополнительных кодах:

упр=0.011

Ответ представлен в дополнительном коде, необходимо получить прямой код алгебраической суммы.

(1.101)доп ® (1.100)обр ® -0112=-310.

в) Третий случай: оба числа отрицательные.

Х=-6=-1102, у=-3=-0112.

Хобр=1.001, хдоп=1.010,

Уобр=1.100, удоп=1.101.

Рассмотрим алгебраическое сложение в дополнительных кодах:

В данном случае имеет место так называемое отрицательное переполнение, так как возник перенос только из знакового разряда суммы. Следовательно, результат получился отрицательный и превышающий предельно допустимое значение для данной разрядной сетки. Сдвинем полученный результат на 1 разряд вправо, тогда(х+у)доп=(1.0111)доп. Перейдем от дополнительного кода к прямому:

(1.0111)доп ® (1.0110)обр ® (1.1001)пр = -910.

Следует отметить, что в процессе выполнения расчетов на ЭВМ может образоваться как «положительный», так и «отрицательный» ноль, причем только в дополнительном коде он имеет единственное представление. Действительно,

(+0)пр=0.00…00; (-0)пр = 1.00…00,

в обратном коде

(+0)обр=0.00…00; (-0)обр = 1.11…11,

в дополнительном коде

(+0)доп=0.00…00; (-0)доп = 0.00…00.

Следует также иметь в виду, для разрядной сетки данной длины дополнительным кодом представляется на единицу больше отрицательных чисел, чем положительных.

По этим причинам в ЭВМ для представления отрицательных чисел чаще используется дополнительный код.

И последнее очень существенное замечание:

При сложении может возникнуть ситуация, когда старший разряд суммы не помещается в отведенной под результат разрядной сетке и он «захватывает» знаковый разряд, естественно значение суммы искажается.

Пример. Пусть дана 4-х разрядная сетка со знаком, в которой должен разместиться результат от суммирования двух положительных чисел х=5 и у=7.

хпр = 0.101, упр = 0.111

Так как знаковый разряд равен единице, то результат воспринимается как дополнительный код и, если попробовать вывести значение суммы, допустим на экран, процессор перейдет к прямому коду:

(1.100)доп ® (1.011)обр ® -1002=-410.

Посмотрим, что получится, если под результат отвести шесть разрядов:

(х+у)пр=(0.01100)пр=+12.

Сумма двух чисел вычислена верно.

Выполнить самостоятельно :

1. Найти дополнительные коды для чисел:-45, 123, -98, -А516, -111, -778. Формат представления данных один байт со знаком.

2. Найти дополнительные коды для чисел: -11100018, 234, -456, -АС0916, -32324, СС7816, -110012,. Формат представления данных два байта со знаком.

5.4 Представление чисел с плавающей точкой.

Математическая запись числа две целых четыре сотых выглядит так 2,04 но возможна и такая запись 0,204×10, или такая 20,4×10-1, или такая 0,0204×102… Этот ряд можно продолжать сколь угодно долго. На что вы обратили внимание? - запятая перемещается («плавает») влево или вправо, и, чтобы не изменить значение числа, мы умножаем его на 10 в отрицательной или положительной степени.

Для представления вещественных чисел в памяти ЭВМ используется формат с плавающей точкой. При этом необходимо помнить, что система вещественных чисел представимых в ЭВМ является дискретной и конечной.

В общем случае любое число N, представляемое в форме с плавающей точкой, является произведением двух сомножителей: .

m - будем называть мантиссой числа (модуль целой части мантиссы изменяется в диапазоне от 1 до S-1 (включая эти числа), где S- основание системы счисления),

p - целочисленный порядок,

S ¾ основание системы счисления.

Различают нормализованную и экспоненциальную формы записи числа. Если мантисса является правильной дробью, у которой первая цифра после точки отлична от нуля, то число называется нормализованным.

При представлении числа в экспоненциальной форме обязательно присутствует целая часть, содержащая не более одной цифры отличной от нуля, фактически эта форма представления совпадает со стандартной математической формой записи числа.

Вещественное число в ПЭВМ представлено в экспоненциальной форме.

Следовательно, при представлении чисел с плавающей точкой необходимо записать в разрядной сетке ЭВМ со своими знаками мантиссу и порядок. Знак числа при этом совпадает со знаком мантиссы. Запишем число 314.6789 в экспоненциальной форме:314.6789= 3.1467890000E+2. Число разрядов, выделенных для изображения порядков, определяет диапазон представимых в ЭВМ чисел с плавающей точкой.

Кроме того, этот диапазон зависит также от основания S принятой системы счисления.

Значение произвольного числа вещественного типа представляется в ПЭВМ лишь с некоторой конечной точностью, которая зависит от внутреннего формата вещественного числа, точность представления чисел повышается с увеличением числа разрядов мантиссы.

Для того, чтобы упростить операции над порядками их сводят к действиям над целыми положительными числами путем использования так называемого смещенного порядка, который всегда положителен. смещенный порядок получается путем прибавления к порядку р некоторого целого положительного числа, значение которого зависит от конкретного формата данных.

Десятичная точка подразумевается перед левым (старшим) разрядом мантиссы, но при действиях с числом ее положение смещается влево или вправо в зависимости от двоичного порядка.

Рассмотрим представление чисел в разрядной сетке длиной 4 байта (так называемая одинарная точность) для ПЭВМ типа РС. Изобразим разрядную сетку, состоящую из 32 разрядов и посмотрим, как эти разряды распределены.

0 1 2 3 4 5 6 7 8 … 31

знак мантиссы порядок мантисса

Пусть необходимо представить число –13,75 в разрядной сетке с одинарной точностью. Для этого необходимо выполнить следующие действия:

1. перевести число в двоичную систему счисления;

2. представить его в экспоненциальной форме;

3. получить исходный порядок и мантиссу;

4. получить смещенный порядок.

1) 13.7510=1101.112

75/100=3/4=3/22=0.112

2) Представим двоичное число 1101.11 в экспоненциальной форме 1101.11=1.10111E+3.

3) Исходный порядок равен 3.

Следует отметить, что целая часть двоичного числа представленного в экспоненциальной форме, всегда равна 1, поэтому в целях экономии разрядов (а следовательно увеличения диапазона представления чисел)целая часть числа не записывается в разрядную сетку.

4) Вычислим смещенный порядок (в формате с одинарной точностью к исходному порядку добавляется число 127)

Pсм=3+127=130=128+2=27+2=100000002+102=1000 00102

Рсм=100000102

Мантисса=.101112

Знак числа положительный, следовательно, самый левый разряд равен 0.

0 10000010 10111000000000000000000

знак порядок мантисса

представим полученное число в шестнадцатеричной системе счисления

0100 0001 0101 1100 0000 0000 0000 0000

Итак, мы получили шестнадцатеричное число 415С0000.

Решим обратную задачу.

Значение переменной А Представлено в формате с плавающей точкой в шестнадцатеричной системе счисления А=ВЕ200000. Тип переменной А-single для языка Паскаль. Найти десятичное значение переменной А.

Для решения обратной задачи необходимо выполнить следующие действия:

1) Перевести шестнадцатеричное число в двоичную систему счисления.

2) Выделить знак мантиссы(знак мантиссы совпадает со знаком числа).

3) Выделить смещенный порядок.

4) Вычислить исходный порядок.

5) Записать число, не забыв указать его целую часть, в экспоненциальной форме.

6) Перевести число из экспоненциальной формы в обычную форму записи.

7) Перевести число из двоичной системы счисления в десятичную.

Выполним перечисленные действия.

ВЕ200000=1011 1110 0010 0…0000

1 01111100 0100…0

знак порядок мантисса

Число отрицательное так как левый разряд равен 1.

Вычислим исходный порядок:

Р=Р-127=1111100-127=124-127=-3.

Запишем искомое число в экспоненциальной форме в двоичной системе счисления:

А=-1.01Е-3. Не забывайте указывать целую часть.

Представим искомое число в обычной форме записи в двоичной системе счисления:

А=-1.01Е-3=-0.001012=-0.2816=-0.15625.

Операция алгебраического сложения чисел, представленных в форме с плавающей точкой, производится несколько сложнее, чем для чисел, представленных в форме с фиксированной точкой. При выполнении ее сначала выравниваются порядки слагаемых, В результате сравнения порядков порядок меньшего по модулю числа принимается равным порядку большего, а его мантисса сдвигается вправо на число шестнадцатеричных разрядов, равное разности порядков.

В процессе сдвига мантиссы меньшего слагаемого происходит потеря младших разрядов, что вносит определенную погрешность в результат выполнения данной операции.

После выравнивания порядков производится алгебраическое сложение мантисс.

Подведём некоторые итоги по представлению числовой информации в памяти ЭВМ.

Представление числовой информации в цифровом автомате, как правило, влечёт за собой появление погрешностей, величина которых зависит от формы представления чисел и от длины разрядной сетки автомата.

Необходимо помнить о том, что для записи числа в любой форме представления отводится конечное число разрядов. Для целых чисел это обстоятельство привело к понятию наибольшего и наименьшего целого числа. Однако для каждого целого числа, не превышающего по модулю наибольшего, имеется ровно одно представление в машинном коде и, если не происходит переполнения, результат выполнения операции над целыми числами будет точным., так как дискретные множества исходных чисел однозначно отображаются на дискретное множество результатов.

Другое дело – вещественные числа. Вещественные числа образуют непрерывное множество. В памяти ЭВМ вещественные числа заменяются их кодами, которые образуют конечное дискретное множество, поэтому:

· строгие отношения между числами непрерывного множества превращаются в нестрогие для их компьютерных кодов;

· результаты вычислений содержат неизбежную погрешность, так как код вещественного числа в памяти ЭВМ является приблизительным представителем многих чисел из интервала, оценка погрешности самостоятельная и далеко не тривиальная задача;

· наряду с понятием наибольшего вещественного числа появляется понятие наименьшего числа или машинного нуля. Конкретное значение числа, которое воспринимается в вычислительной машине как машинный ноль, зависит от типа данных используемых в том или ином языке программирования.

Выполнить самостоятельно:

1) Найти представление десятичного числа А в шестнадцатеричной системе счисления в формате с плавающей точкой. Тип числа single.

А=-357.2265626; А=-0.203125; А=998.46875;

А=–657.4375; А=998.8125; А=-905,34375; А=897.5625

А=637.65625; А=56.53125; А=-4.78125.

2) Значение переменной А представлено в формате с плавающей точкой в шестнадцатеричной системе счисления. Тип переменной А-single для языка Паскаль. Найти десятичное значение переменной А.

А=C455C200; A=43D09400; A=443F9000; A=C2FF8000;

А=44071С00; A=435D2000; А=C401F000; А= С403ЕС00;

A=C3D87400; A=C3D40000; A=C411FA00; A=3F700000.

5.5 Кодирование текстовой и графической информации.

Теория кодирования информации является одним из разделов теоретической информатики. В задачи данного курса не входят вопросы теории кодирования. Коротко и упрощённо рассмотрим кодирование текстовой и графической информации.

Кодирование текстовой информации.

Кодирование текстовой информации заключается в том, что каждому текстовому символу ставится в соответствие код - целое положительное число. В зависимости от числа разрядов, отведённых под кодирование символов, все виды кодировок делятся на две группы: 8 – разрядные и 16 – разрядные. Для каждого вида кодировки символы вместе с их кодами образуют кодировочную таблицу. В кодировочной таблице первая половина кодов отводится под кодирование управляющих символов, а также цифр и букв английского алфавита. Оставшаяся часть под кодирование символов национального алфавита.

К 8 – разрядным кодировкам, включающим в себя кодировку символов русского алфавита, относятся: ASCII, ДКОИ-8, Win 1251.

16 – разрядная кодировка Unicode позволяет представить 216 различных символов. В кодовой таблице Unicode присутствуют символы всех современных национальных языков. Символы первых 128 кодов совпадают с таблицей кодов ASCII.

Кодирование изображений.

Рассмотрим растровое кодирование изображений.

Введём обозначения:

К – количество разных цветов, используемых при кодировании изображения;

n – количество битов, необходимое для кодирования цвета одной точки изображения. К и n связаны следующим образом:

Количество битов, необходимое для хранения одной точки изображения, называется глубиной цвета.

Окраска одной точки экрана формируется с помощью трёх базовых цветов: красного, зелёного, синего. Эти три цвета являются основой модели RGB. С их помощью можно получить 23 разных цветов. В данном случае для кодирования каждого из трёх базовых цветов достаточно одного бита. Однако каждый базовый цвет характеризуется не только его наличием, но и интенсивностью. Яркость каждого цвета кодируется восьмиразрядным двоичным числом, т.е. глубина цвета равна 8. Следовательно, число оттенков одного базового цвета равно 28. Это означает, что из трёх базовых цветов можно получить (256)3 =

16 777 216 цветов и их оттенков. Информация о каждом пикселе в видеопамяти займёт

n = 8 × 3 = 24 бита = 3 байта.

Таким образом, для хранения одного образа экрана потребуется объём памяти, равный произведению ширины экрана на высоту экрана и на глубину цвета. Ширина и высота задаются в пикселах.

В общем случае объём памяти, необходимый для хранения растрового изображения, рассчитывается по формуле:

V = W × H×n (битов),

где W – ширина изображения в точках;

H - высота изображения в точках;

V – объём памяти, необходимый для хранения растрового изображения.

ЛЕКЦИЯ №1 «Понятие информации, общая характеристика процессов сбора, передачи, обработки и накопления информации»

Информация. Виды существования информации. Свойства информации. Представление данных в ЭВМ. Система счисления. Позиционные системы счисления. Перевод чисел из одной системы счисления в другую. Кодирование информации. Единицы измерения информации. Передача информации. Обработка информации. Хранение информации. Магнитная память. Оптическая память.

Информация

Термин "информация" происходит от латинского слова "informatio" , что означает сведения, разъяснения, изложение. Несмотря на широкое распространение этого термина, понятие информации является одним из самых дискуссионных в науке. В настоящее время наука пытается найти общие свойства и закономерности, присущие многогранному понятию информация , но пока это понятие во многом остается интуитивным и получает различные смысловые наполнения в различных отраслях человеческой деятельности.

В обиходе, например, информацией называют любые данные или сведения, которые кого-либо интересуют. "Информировать" в этом смысле означает "сообщить нечто , неизвестное раньше" .

Современное научное представление об информации очень точно сформулировал Норберт Винер, "отец" кибернетики. А именно: Информация – это обозначение содержания, полученного из внешнего мира в процессе нашего приспособления к нему и приспособления к нему наших чувств.

Люди обмениваются информацией в форме сообщений. Сообщение – это форма представления информации в виде речи, текстов, жестов, взглядов, изображений, цифровых данных, графиков, таблиц и т.п.

В случаях, когда говорят об автоматизированной работе с информацией посредством каких-либо технических устройств, обычно в первую очередь интересуются не содержанием сообщения, а тем, сколько символов это сообщение содержит.

Применительно к компьютерной обработке данных под информацией понимают некоторую последовательность символических обозначений (букв, цифр, закодированных графических образов и звуков и т.п.), несущую смысловую нагрузку и представленную в понятном компьютеру виде. Каждый новый символ в такой последовательности символов увеличивает информационный объём сообщения.



Виды существования информации

Информация может существовать в виде:

Текстов, рисунков, чертежей, фотографий;

Световых или звуковых сигналов;

Радиоволн;

Электрических и нервных импульсов;

Магнитных записей; и т.д.

Предметы, процессы, явления материального или нематериального свойства, рассматриваемые с точки зрения их информационных свойств, называются информационными объектами.

Информацию можно:

Все эти процессы, связанные с определенными операциями над информацией, называются информационными процессами.

Свойства информации

Информация достоверна, если она отражает истинное положение дел . Недостоверная информация может привести к неправильному пониманию или принятию неправильных решений.

Достоверная информация со временем может стать недостоверной, так как она обладает свойством устаревать, то есть перестаёт отражать истинное положение дел.

Информация полна , если её достаточно для понимания и принятия решений. Как неполная, так и избыточная информация сдерживает принятие решений или может повлечь ошибки.

Точность информации определяется степенью ее близости к реальному состоянию объекта, процесса, явления и т.п.

Ценность информации зависит от того, насколько она важна для решения задачи, а также от того, насколько в дальнейшем она найдёт применение в каких-либо видах деятельности человека.

Только своевременно полученная информация может принести ожидаемую пользу. Одинаково нежелательны как преждевременная подача информации (когда она ещё не может быть усвоена), так и её задержка.

Если ценная и своевременная информация выражена непонятным образом, она может стать бесполезной.

Информация становится понятной , если она выражена языком, на котором говорят те, кому предназначена эта информация.

Информация должна преподноситься в доступной (по уровню восприятия) форме. Поэтому одни и те же вопросы по разному излагаются в школьных учебниках и научных изданиях.

Информацию по одному и тому же вопросу можно изложить кратко (сжато, без несущественных деталей) или пространно (подробно, многословно). Краткость информации необходима в справочниках, энциклопедиях, учебниках, всевозможных инструкциях.

Представление данных в ЭВМ

Вся информация в ЭВМ хранится в виде наборов бит, то есть комбинаций 0 и 1. Числа представляются двоичными комбинациями в соответствии с числовыми форматами, принятыми для работы в данной ЭВМ, а символьный код устанавливает соответствие букв и других символов двоичным комбинациям.

Для чисел имеется три числовых формата:

Двоичный с фиксированной точкой;

Двоичный с плавающей запятой;

Двоично-кодированный десятичный (BCD).

Числа с плавающей запятой обрабатываются на специальном сопроцессоре (FPU - floating point unit), который, начиная с МП I486, входит в состав БИС микропроцессора. Данные в нем хранятся в 80-разрядных регистрах.

Система счисления.

Способ представления изображения произвольных чисел с помощью некоторого конечного множества символов назовем системой счисления.

В повседневной практике мы пользуемся, как правило, десятичной системой счисления.

Системы счисления принято подразделять на…

1. Позиционные.

2. Непозиционные.

3. Символические.

Символические . В этих системах каждому числу ставится в соответствие свой символ. Эти системы не находят широкого применения в силу естественной их ограниченности (алхимия, кодированные сообщения) - бесчисленного множества символов, которое требуется для изображения всех возможных чисел. Поэтому эти системы из рассмотрения опустим.

История развития ЭВМ

Первая IBM PC была аналитическая ЭВМ. Была спроектирована на механических узлах. Работала на языке Ада. Следующей машиной стала Mark 1. В качестве элементов памяти использовалось реле, поэтому у машины было низкое быстродействие (одно действие одновременно).

Mark 2. Работала на триггерах. (1946 год) Она выполняла сотню операций в секунду.

Первая отечественная машина была разработана Лебедевым. МЭСМ – малая электронная счётная машина. Позднее было выдумано Main Freim – универсальная машина для решения мирного круга задач.

Супер ЭВМ – самые дорогие и самые быстрые машины, которые работают в реальном времени.

Используется водяное или газовое охлаждение. Используется язык Assembler, на нём работает ядро процессора.

IBM 360-390 – построена также на языке Assembler. В ней была заложена идея современных микропроцессоров.

Процессор – устройство обработки информации. Состоит из множества микропроцессоров.

Микропроцессор – процессор в использовании СБИС (Сверхбольшой интегральной схемы).

Программа – последовательность команд, выполняемых в процессоре.

Команда – указание к выполнению определённого действия.

Первый микропроцессов был создан в 1970 году, он был 4-х разрядный. Назывался он MP 880.

Следующий процессор 88.36.

Основные характеристики микропроцессора:

1) Разрядность данных – определяет объём памяти, подключённых к процессору.

2) Тактовая частота – определяется внутренним быстродействием процессора, которое зависит также и от тактовой частоты шины системной платы.

3) Объем кеша памяти – устанавливается на подложке микропроцессора.

Бывает двухуровневая:

1) L1 – находится внутри основных схем ядра, которая всегда работает на максимальной частоте.

2) L2 – память второго уровня связана с ядром микропроцессора (внутренней шиной).

4) Состав инструкций – перечень, вид и тип команд, которые автоматически исполняются в микропроцессоре.

5) Рабочее напряжение питания (потребляемая мощность)

Конструктивные особенности

Стоимость

Закон фон-Неймана

Принципы:

1) Данные и команды передаются в двоичном коде

2) Программы выполняются линейно

3) Адрес последующей команды отличается от предыдущего на +1

4) Память для хранения данных – оперативная и внешняя связанная с пользователем с одной стороны и с ОС с другой стороны.

ПОСЛЕДОВАТЕЛЬНЫЙ И ПАРАЛЛЬЕЛЬНЫЙ КОД

При последовательном коде передача информации (n-разрядов) осуществляется последовательно, разряд за зарядом по одному проводнику. Время передачи данных пропорционально числу разрядов. T=t*n .

При параллельной передаче всех разрядов они передаются по n-проводникам. Время передачи равняется одному разряду, а оборудование равняется в N- раз.

T=t*n+t*n+…t*n

СТРУКТУРНЫЕ СХЕМЫ ЭВМ

В состав ЭВМ входит ряд устройств, которые могут соединятся между собой с помощью магистралей: адреса, данных и управления. Реально эти магистрали представляются в виде интерфейса(кабелей или шин). Существует несколько способов соединения устройств между собой.

Структура фон-Неймона- магистральный способ построения или с общей шины.

Интерфейс - стык сопряжений, обеспечивающий подключение устройств, друг к другу с помощью аппаратных или программных средств.

Память - предназначается для хранения исходных данных, промежуточных и конечных результатов.

Устройство Управления - предназначается для выборки всех управляющих сигналов поступающий на другие устройства ЭВМ, при обработке информации в соответствии с программами. УУ и АЛУ вместе составляют процессор- устройство обработки информации.

ПЗУ -постоянное запоминающее устройство. Служит только для считывания информации и хранения информации без потребления энергии.

ОЗУ - принимает участие процессе обработки информации в АЛУ. В котором, выполняются действия на числами и командами.

ЭВМ - обрабатывает информацию в соответствии с программой.

Представление данных в ЭВМ

Данные команды представлены в ЭВМ в двоичном коде, то есть вся информация представляет собой однородную среду и данные команды записываются в разрядной сетке, которая является отражением физических размеров памяти в ЭВМ. В частности регистры 32-х разрядных ЭВМ составляют 32 разряда. Один двоичный разряд – бит, 8 двоичных разрядов – байт, 4 полуразряда – полубайт.

Числа могут быть представлены в следующих разрядных сетках:

1) Полуслова – 2 байта

2) Слово – 4 байта или 32 разряда

3) Двойное слово – 8 байт или 64 разряда

4) Строка – число слов может достигать 2 32 то есть 4 гб

Упакованный формат

1) 2 одинарных слова

2) 2 двойных слова

Данные в современных ЭВМ представляются в разрядной сетке с физической точкой и с плавающей точкой.

Числа с фиксированной точкой числа обрабатываются целочисленным АЛУ. Фиксированная точка может фиксироваться в начале разряда и в конце.

Числа с плавающей точкой содержит мантиссу и порядок, каждый из которых содержит свой разряд.

Память

Предназначена для хранения данных и программ.

Основные характеристики:

1) Ёмкость памяти – количество бит байт слов, хранимых одновременно в ЭВМ.

Кило – 1024

Мега – 10 6

Гига – 10 9

Тера – 10 12

Пета – 10 15

2) Время доступа к памяти – время, в течении которого происходит обращение к памяти с целью записи или считывания информации.

3) Энергозависимость или энергонезависимость при хранении информации

1) Энергонезависимая память –ФЗУ

2) Энергозависимая память – оперативная, регистровая, кеш и т.д.

4) Время хранения информации

5) Стоимость хранения одного бита

Организация памяти

Является одним их основных параметров в ЭВМ. Имеет два значения.

1) Количество слов, умноженное на количество разрядов.

2) Память может быть одномерной, двумерной и трехмерной.

а) Одномерная память (D)- биты записываются последовательно друг за другом на носитель информации. Пример: магнитная лента.

б) Двумерная память - это матричная память где элементы расположены на пересечении шин Х и У.

в) Трехмерная память - это куб состоящий из матриц. Где число ячеек N располагаются на оси Z.

Современные ЗУ полупроводниковые, имеют организацию 3D располагаются в кристальных, интегральных микросхемах.

В продолжение темы:
Устройства

Как поставить запятую сверху при наборе текста? Ответить на данный вопрос мы постараемся далее. Дело все в том, что написание текстов от руки не доставляет столько хлопот, как...

Новые статьи
/
Популярные