У дома Детска стоматология Решете го с помощта на оперативния метод. Как да решим система от диференциални уравнения с помощта на операционния метод? §1

Решете го с помощта на оперативния метод. Как да решим система от диференциални уравнения с помощта на операционния метод? §1

Ориз. 2.1. Организиране на данни в ГИС

Данните, използвани в ГИС, включват описателна информация, която се съхранява в база данни за обекти (точка, линия, полигон), разположени на картата. Нарича се описателна информация атрибут.

Атрибутни данни– непозиционна част от данните, характеризиращи свойствата на обектите (данни за свойствата и характеристиките на пространствените обекти, с изключение на информацията за тяхното пространствено местоположение).

Формално всички обекти се представят чрез тяхното описание чрез набор от характеристики, а тяхното съхранение е в съответните графични и параметрични бази данни. Има три групи признаци (характеристики) за описание на обекти: идентификация, класификация, изход.

Идентификационни характеристикислужат за недвусмислено определяне на местоположението на обект на картата и идентифицирането му. Те включват името на географския обект, координатите, вида на обекта и др.

Класификационни характеристикислужат за количествено и качествено описание на обект и ги използват за получаване на информация за обектите. Те са основа за получаване на производни характеристики чрез математическа обработка (качествени и количествен анализ, моделиране и др.).

Изходни характеристикисъдържат информация за източниците и датите на получаване на съответните данни за всяка от характеристиките за всеки обект. Целта на тази група функции е да предостави възможност за определяне на надеждността на входящата информация.

Една от основните идеи, въплътени в традиционните ГИС, е запазването на връзката между пространствените и атрибутивните данни, когато се съхраняват отделно и се обработват частично отделно.

Когато изпълнявате пространствени заявки, атрибутите помагат за по-точното идентифициране на обект. Предпочитание в ГИС се дава на две форми на атрибути за заявки: SQL език за заявки (Structured Query Language) и шаблон. Записите, съответстващи на тези заявки, са маркирани: QBE (Query By Example) Можете да организирате избора на обекти на картата чрез заявки към таблицата с атрибути, тъй като изборът на графични обекти е свързан с избора на техните записи на атрибути.

Идентификаторите са предназначени да свързват картографски и атрибутивни данни, тъй като в повечето ГИС тези характеристики на обекти се обработват отделно. Потребителят може да посочи обект, например с курсор, и системата ще определи неговия идентификатор, чрез който ще намери една или повече бази данни, свързани с обекта, и обратно, ще определи графичен обект въз основа на информацията в базата данни.

Както беше отбелязано, пространствените данни в съвременните ГИС се представят в две основни форми: векторна и растерна.

Векторен моделданните се основават на представянето на картата под формата на точки, линии и плоски затворени фигури.

Растерен моделданните се основават на представянето на картата с помощта на правилна мрежа от елементи с еднаква форма и площ.

Има два типа структура на данните топологияИ слоеве.

Топологияизползва се за подчертаване на пространствени връзки между обекти. Топологията осигурява връзки между точки, линии и полигони и обикновено не се променя от оператора. Слоевесъщо се използва за структураданни.

Топология– процедура точно определениеи използването на пространствени отношения, присъщи на геометрията на обектите. Покритието поддържа три основни топологични връзки: свързаност, дефиниране на области и съседство. Покритията определят топологията и тези връзки се записват точно в специални файлове.

Топологичната информация описва как обектите са разположени един спрямо друг в пространството и обикновено не се променя от оператора. ГИС изисква точна дефиниция на топологията, за да се извърши пространствен анализ

Топологията включва информациякакви символи съответстват на определени обекти, как точките са свързани една с друга и какви точки и линии образуват многоъгълници. Топологичната информация позволява на потребителя на ГИС да извлича информация, като например колко припокриване имат определени полигони, дали дадена линия е вътре в полигон и колко близо е една характеристика до друга

Манипулирането и анализът на данни, извършвани от нетопологични ГИС системи (като CAD системи), са ограничени.

Повечето ГИС ви позволяват да разделите картографската информация в логически категории, наречени картографски слоеве. Слоевете обикновено съдържат информация само за един тип характеристика, като типа почва на парцел, или малка група от свързани характеристики, като линии на обществения транспорт (телефонни, електрически и газови линии).

Данните са разделени на слоеве на картата, така че да могат да бъдат манипулирани и анализирани пространствено, поотделно или във връзка с други слоеве. За да се получат по-значими аналитични резултати, слоевете в ГИС трябва да бъдат свързани един с друг чрез обща системакоординати на база данни.

Базите данни се делят на йерархичен, мрежаИ релационни.

База данни (БД)– набор от взаимосвързани данни, организирани по определени правила

Йерархични бази данниустановяват строго подчинение между записите и се състоят от подреден набор от дървета (подреден набор от няколко екземпляра от един и същи тип дърво). Дървовидният тип се състои от един „коренен“ тип запис и подреден набор от нула или повече типове поддърво (всеки от които е тип дърво като цяло е йерархично организиран набор от типове записи (Фигура 2.2).

Тук Кварталът е родоначалник на Парцела, а Парцелът е потомък на Парцела е родоначалник на Частта от Парцела, а Частта от Парцела е потомък на Парцела. Поддържат се връзки между типовете записи. Целостта на връзките между предци и потомци се поддържа автоматично.


Типичен представител на йерархичните системи е Information Management System (IMS) на IBM. Първата версия се появява през 1968 г. Много бази данни все още се поддържат в тази система, което създава значителни проблеми при прехода, както към нова технологияДБ, и за ново оборудване.

Ориз. 2.2. Пример за дървовиден тип (йерархична схема на база данни)

Мрежови бази данниизползва се, ако структурата на данните е по-сложна от обикновена йерархия, т.е. простотата на йерархичната структура на базата данни се превръща в неин недостатък. Организацията на мрежовите и йерархичните бази данни трябва да бъде твърда. Набори от релации и структура на записите трябва да бъдат определени предварително.

Типичен представител на мрежовите системи е Интегрираната система за управление на бази данни (IDMS) от CuHinet Software, Inc., предназначена за използване на основни машини на IBM, работещи с повечето операционни системи. Архитектурата на системата се основава на предложения от Работната група за бази данни (DBTG) на Комитета по езици за програмиране на Конференцията за езици за системи за данни (CODASYL).


Мрежовият подход към организацията на данните е разширение на йерархичния. В йерархичните структури дъщерният запис трябва да има точно един предшественик; в мрежова структура от данни детето може да има произволен брой предци. Мрежовата база данни се състои от набор от записи и набор от връзки между тези записи. Типът връзка се определя за два типа записи: предшественик и потомък (фиг. 2.3).

Ориз. 2.3. Пример за мрежова диаграма на база данни

Промяната на структурата на базата данни включва възстановяване на цялата база данни и за да получите отговор на запитване, трябва да имате специална програма за търсене на данни. Следователно прилагането на персонализирани заявки отнема много време.

Недостатъците на йерархичния и мрежовия модел доведоха до появата на релационна база данни. Релационният модел беше опит за опростяване на структурата на базата данни. Всички данни са представени във формуляра прости маси, разделена на линииИ колони.

В релационна база данни информацията е организирана в таблици, разделени на редове и колони, в пресечната точка на които се съдържат стойностите на данните. Всяка таблица има уникално име, което описва нейното съдържание. Структурата на таблицата е показана на фигура 2.4. Всеки хоризонтален ред на тази таблица представлява отделен физически обект - един административен регион, който също е представен на картата като отделен графичен обект. Всички редове на таблицата представляват всички области от един регион. Всички данни, съдържащи се в определен ред на таблицата, се отнасят до областта, която е описана от този ред.

Всички стойности, съдържащи се в една и съща колона, са от един и същи тип данни. Например колоната District Center съдържа само думи, колоната Area съдържа десетични числа, а колоната ID съдържа цели числа, представляващи дефинирани от потребителя кодове на функции. Връзката между таблиците се осъществява чрез полета.



Ориз. 2.4. Структура на таблицата на релационна база данни

Всяка маса има собствен, предварително дефиниран набор именувани колони(полета). Полетата на таблицата обикновено съответстват на атрибути на обекти, които трябва да се съхраняват в базата данни. Броят на редовете (записите) в таблицата не е ограничен и всеки запис носи информация за даден обект.

Понятието „тип данни” в релационния модел на данни е напълно адекватно на понятието „тип данни” в езиците за програмиране. Обикновено съвременните релационни бази данни позволяват съхранението на знаци, числови данни, битови низове, специализирани числови данни (като „пари“), както и специални „времеви“ данни (дата, час, интервал от време). Доста активно се развива подход за разширяване на възможностите на релационните системи с абстрактни типове данни (например системите от семейството Ingres / Postgres имат съответните възможности). В нашия пример имаме работа с три типа данни: символни низове, цели числа и „пари“.

Релационните бази данни са най-популярната структура за съхраняване на данни, тъй като съчетават яснотата на представянето на данните с относителната лекота на манипулирането им.

Файлова система и формати за представяне

Графични данни

От гледна точка на приложението файле наименована област от външната памет, в която могат да се записват и четат данни. Правилата за именуване на файлове, как се осъществява достъп до данните, съхранени във файл, и структурата на тези данни зависят от конкретната система за управление на файлове и нейния тип. . Системата за управление на файлове разпределя външна памет, картографира имената на файловете към съответните адреси на външна памет и осигурява достъп до данни.

Географските информационни системи използват следните методи за именуване на файлове:

1. Метод изолиранфайлови системи. Много системи за управление на файлове изискват всеки архив от файлове (пълно дърво на директории) да бъде разположен изцяло на един дисков пакет (или логическо устройство, част от физически дисков пакет, който е представен с помощта на инструменти на операционната система като отделен диск). В този случай пълното име на файла започва с името на дисковото устройство, на което е инсталиран съответният диск. Този метод на именуване се използва във файловите системи DEC, а файловите системи на персонални компютри са много близки до това.

2. Метод централизиранфайлова система. С този метод цялата колекция от директории и файлове се представя като едно дърво. Пълното име на файла започва с името на основната директория и от потребителя не се изисква да се грижи за инсталирането на конкретни дискове на дисковото устройство. Самата система, търсейки файл по името му, поиска инсталирането на необходимите дискове. Тази опция е внедрена във файловите системи на операционната система Muitics. В много отношения централизираните файлови системи са по-удобни от изолираните: системата за управление на файлове поема повече рутинна работа. Но в такива системи възникват значителни проблеми, ако поддърво на файловата система трябва да бъде преместено в друга компютърна инсталация.

3. Смесениначин. Този метод поддържа изолирани файлови архиви на основно ниво в тези файлови системи. Един от тези архиви е деклариран като основна файлова система. След като системата стартира, можете да "монтирате" основната файлова система и няколко изолирани файлови системи в една обща файлова система. Това решение се използва във файлови системи UNIX OS. Технически това става чрез създаване на специални празни директории в главната файлова система. Специално системно извикване на куриер на UNIX OS ви позволява да свържете основната директория на посочения файлов архив към една от тези празни директории. След като се монтира споделена файлова система, именуването на файлове се извършва по същия начин, както ако е било централизирано от самото начало. Като се има предвид, че файловата система обикновено се монтира по време на завъртане на системата, потребителите на UNIX OS дори не се замислят за оригиналния произход на споделената файлова система.

Тъй като файловите системи са споделено хранилище на файлове, принадлежащи на различни потребители, системите за управление на файлове трябва да предоставят разрешение за достъп до файлове. IN общ изгледПодходът е, че по отношение на всеки регистриран потребител на дадена компютърна система, за всеки съществуващ файл, се посочват действия, които са разрешени или забранени за този потребител. Има опити този подход да се приложи изцяло. Но това причини твърде много разходи, както при съхраняването на излишна информация, така и при използването на тази информация за контрол на допустимостта на достъпа.

Следователно в повечето модерни системиУправлението на файлове използва подход към защитата на файловете, въведен в UNIX. В тази система всеки регистриран потребител е свързан с двойка целочислени идентификатори: идентификаторът на групата, към която този потребител принадлежи, и неговият собствен идентификатор в групата. Съответно, за всеки файл се съхранява пълният идентификатор на потребителя - създателя на този файл и се отбелязва какви действия той самият може да извършва с файла, какви действия са достъпни за други потребители от същата група и какви потребители на други групи могат да направят с файла. Тази информация е много компактна, изисква няколко стъпки по време на проверката и този метод за контрол на достъпа е задоволителен в повечето случаи.

Ако операционната система поддържа многопотребителски режим, тогава е напълно възможно двама или повече потребители едновременно да се опитат да работят с един и същ файл. Ако всички тези потребители ще четат само файла, това няма да е проблем. Но ако поне един от тях промени файла, е необходима взаимна синхронизация, за да работи тази група правилно.

Възможен Области на използванефайлове:

· за съхраняване на текстови данни: документи, програмни текстове и др. Такива файлове обикновено се създават и модифицират с помощта на различни текстови редактори. Структурата на текстовите файлове обикновено е много проста: това е или поредица от записи, съдържащи редове с текст, или поредица от байтове, сред които има специални знаци (например знаци за край на ред);

· за генериране на входни текстове за компилаторите, които от своя страна генерират файлове, съдържащи обектни модули (файлове с програмни текстове). Обектните файлове също имат много проста структура - поредица от записи или байтове. Системата за програмиране наслагва тази структура с по-сложна и специфична за системата обектна модулна структура;

· за съхраняване на файлове, съдържащи графична и аудио информация, както и файлове, генерирани от редактори на връзки и съдържащи изображения на изпълними програми. Логическата структура на такива файлове остава известна само на редактора на връзките и товарача - програмата на операционната система.

Файловите системи обикновено осигуряват съхранение на полуструктурирана информация, оставяйки по-нататъшното структуриране на приложните програми. Това има положителен ефект, защото при разработването на всяка нова приложна система (базирана на прости, стандартни и сравнително евтини инструменти на файловата система) е възможно да се внедрят онези структури за съхранение, които най-естествено отговарят на спецификата на тази област на приложение.

Формата на записване на информация във файл във всяка конкретна географска информационна система не е еднаква. Исторически компаниите, специализирани в компютърна графика, създават свои собствени формати за графични данни, които им се струват най-успешни.

Файлов форматнаречен шаблон, чрез който е създаден. Шаблонът описва какви данни (низове, единични знаци, цели числа, дроби, разделители) и в какъв ред трябва да бъдат въведени във файла.

Характеристиките на формата са: скорост на четене/запис; количеството на възможното компресиране на файлове; пълнота на описанието на информацията.

Някои формати са приети като стандартни въз основа на решения на комисиите по стандартизация. Така беше приет форматът SDTS, който има статут на национален стандарт на САЩ международна организация ISO стандартизация.

Необходимо е да се прави разлика между вътрешни системни формати и формати за обмен, т.е. формати, използвани за обмен на информация между различни потребители, включително тези, работещи в различни системи. Способността на ГИС да импортира данни от файлов формат на друга система и да ги интерпретира правилно и, обратно, да въвежда свои собствени данни в този формат, позволява обмен на данни между системите.

Поддръжката за импорт/експорт на голям брой стандартни формати за обмен е важна в ГИС, тъй като обемите на вече въведените графики са големи в резултат на трудоемка работа по въвеждане на информация. Също така е възможно пространствените данни да се въвеждат в независима входна система, която има собствен формат, различен от използвания ГИС формат. Не е препоръчително да се отказвате от работеща и позната система, по-лесно е да прехвърлите получените данни в ГИС формат и обратно. Можете да въвеждате данни във ваш собствен формат и да ги обменяте, превеждайки ги в желания формат. В този случай е налице следното условие: форматът за съхранение трябва да бъде достатъчно пълен; защото, за разлика от координатите, които могат лесно да бъдат преобразувани от цели числа в дроби, е невъзможно да се преобразуват липсващите атрибути и описания във формата, където са необходими.

Управление на бази данни

Ефективно използванецифровите данни изискват наличието на софтуер, който предоставя функции за тяхното съхранение, описание, актуализиране и др. В зависимост от видовете и форматите на тяхното представяне, от нивото на ГИС софтуера и някои характеристики на средата и условията за тяхното използване, е възможно различни опцииорганизация на съхранение и достъп до пространствени данни, като методите на организация се различават по своята позиционна (графична) и семантична част.

Простият ГИС софтуер не включва специфични средстваорганизация на съхранение, достъп до данни и манипулиране, или тези функции се изпълняват от операционната система в рамките на нейната файлова организация.

Повечето съществуващи ГИС софтуерни инструменти използват сложни и ефективни подходи за тези цели, базирани на организиране на данни под формата на бази данни, управлявани от софтуерни инструменти, наречени системи за управление на бази данни(СУБД). СУБД обикновено се разбира като набор от програми и езикови инструменти, предназначени да създават, поддържат и използват бази данни.

Съвременните СУБД, включително тези, използвани в ГИС софтуера, се различават по типовете поддържани модули за данни, сред които са йерархични, мрежови и релационни и съответните им софтуерни инструменти за СУБД. Широко приложениеПри разработването на ГИС софтуер бяха използвани релационни СУБД.

Системите за управление на обърнати списъци, йерархични и мрежови бази данни бяха предшествениците на релационните СУБД. Общите характеристики на ранните системи включват следното:

1. Тези системи са били в активна употреба в продължение на много години, по-дълго от която и да е от релационните СУБД. Те са натрупали големи бази данни и затова един от неотложните проблеми на информационните системи е използването им заедно със съвременните системи.

2. Системите не са базирани на никакви абстрактни модели. Абстрактните представяния на ранните системи се появяват по-късно въз основа на анализ и идентифициране на общи черти между тях различни системизаедно с релационен подход.

3. Достъпът до базата данни е осъществен на ниво запис. Потребителите на тези системи навигират в базата данни, използвайки езици за програмиране, подобрени с функции на СУБД. Интерактивният достъп до базата данни се поддържаше само чрез създаване на подходящи приложни програми със собствен интерфейс.

4. След появата на релационните системи повечето ранни системи бяха оборудвани с релационни интерфейси. Въпреки това, в повечето случаи това не ги прави наистина релационни системи, тъй като все още е възможно да се манипулират данните по техния естествен начин.

Някои от най-известните системи, базирани на обърнати списъци, включват Datacom/DB от Apptied Data Research, Inc. (ADR), фокусиран върху използването на масови компютри от IBM и Adabas от Software AC.

Достъпът до данни се основава на обърнати списъци, което е присъщо на почти всички съвременни релационни СУБД, но в тези системи потребителите нямат директен достъп до обърнати списъци (индекси). Вътрешните интерфейси на системите, базирани на обърнати списъци, са много близки до потребителските интерфейси на релационните СУБД.

Предимствата на СУБД, базирани на обърнати списъци, са разработването на инструменти за управление на данни във външна памет, възможността за ръчно изграждане на ефективни приложни системи, възможността за пестене на памет чрез разделяне на подобекти (в мрежови системи).

Недостатъците на тези СУБД са сложността на използване, необходимостта от информация за физическата организация, от която зависят приложните програми, и претоварването на системната логика с подробности за организиране на достъпа до базата данни.

Предимствата на релационния подход за организиране на СУБД включват:

· наличието на малък набор от абстракции, които правят възможно моделирането на най-често срещаните предметни области по сравнително прост начин и позволяват точни формални дефиниции, като същевременно остават интуитивни,

· наличието на прост и в същото време мощен математически апарат, базиран главно на теорията на множествата и математическата логика и осигуряващ теоретичната основа за релационния подход за организиране на бази данни,

· възможност за манипулиране на ненавигационни данни, без да е необходимо да се знае специфичната физическа организация на базите данни във външна памет.

СУБД от релационен тип ви позволяват да представяте данни за пространствени обекти (точки, линии и полигони) и техните характеристики (атрибути) под формата на релация или таблица, чиито редове (индексирани записи) съответстват на набор от стойности на атрибути на обекти, а колоните (колони) обикновено задават типа на атрибута, неговия размер и име. Атрибутите не включват геометрични атрибути, които описват тяхната геометрия и топология. Векторните записи на координатите на обекта се подреждат и организират с помощта на специални средства. Връзката между геометричното описание на обектите и тяхната семантика в релационната таблица се осъществява чрез уникални числа – идентификатори.

Понастоящем основните недостатъци на релационните СУБД са някои ограничения (пряко следствие от опростеността) при използване в така наречените нетрадиционни области (най-честите примери са системите за автоматизация на проектирането), които изискват изключително сложни структури от данни, невъзможността за адекватно отразяват семантиката на предметната област, тъй като знанията за репрезентациите са много ограничени.

Съвременните СУБД могат да бъдат класифицирани според използвания модел на данни [йерархичен, мрежов, релационен, обектен, хибриден (елементи на обектен и релационен)], в зависимост от обема на поддържаните бази данни и броя на потребителите [високо ниво, средно ниво, ниско ниво, десктоп СУБД ( Фиг. 2.5)].

Най-високо нивоСУБД поддържат големи бази данни (стотици и хиляди GB или повече), обслужващи хиляди потребители, например ORACLE7, ADABAS 532, SQL SERVER11.

Релационна СУБД Oracle7, corp. Oracle има широка гама от функционалности, включително поддръжка за двуфазов комит, репликация на данни, съхранени процедури, тригери и онлайн архивиране. Тази СУБД поддържа база данни, която заема няколко физически диска, съхранява нови типове данни и използва почти всички хардуерни и софтуерни платформи, както и протоколи за трансфер на данни.

SQL Server 10, комп. Sybase е продукт, който поддържа процеси на обработка и вземане на решения в реално време. Това е СУБД на същото ниво като Oracle7, но има някои ограничения по отношение на скалируемостта и използва ограничен брой хардуерни и софтуерни платформи. Средното ниво на СУБД поддържа бази данни до няколкостотин GB и обслужва стотици потребители. Представители: InterBase 3.3, Informix-OnLme7.0, Microsoft SQL Server 6 0.

Сред релационните СУБД Informix-OnLine 7.0, comp. Софтуерът поддържа такива модерни технологиикато репликация на данни, синхронизиране на разпределени бази данни и петна. Може да се използва за стартиране на OLTP (високоскоростна обработка на транзакции) приложения, но скоростта на обработка в този случай е по-бавна от продуктите от най-висок клас. Инсталирането е възможно на ограничен брой платформи.


Ориз. 2.5. Класификация на съвременните системи за управление на бази данни

Microsoft SQL Server 6.0, corp. Microsoft е добра СУБД, която е интегрирана с Windows NT, като го допълва. Недостатъци: недостатъчна скалируемост, малък брой поддържани софтуерни платформи.

По-ниското ниво на СУБД се състои от системи, които поддържат бази данни до 1 GB и имат по-малко от 100 потребители. Обикновено се използват в малки единици. Представители: NetWare SQL 3.0, Gupta SQL-Base Server.

Настолна СУБДпредназначен за един потребител, използван за поддържане на настолна база данни или като клиент за свързване към сървър на база данни. Те имат много ограничени възможностиза обработка на данни, а също така се характеризират с липсата на възможност за инсталиране в мрежата. Представители: FoxPro 2.6, congr. Microsoft, Paradox 5.0, comp Bortand.

Когато се използва конкретна СУБД, трябва да се вземат предвид три ключови фактора: архитектурата на взаимодействие клиент/сървър; начин или метод за изпълнение на основните функции; ниво на поддръжка за разпределени бази данни.

Едно от основните условия, определящи необходимостта от използване на технология за база данни при създаване на ГИС, е поддръжката на съвременни СУБД за възможности за мрежово съхранение и използване на технологии локални мрежи(LAN) и отдалечени мрежи в така наречените разпределени бази данни. Това гарантира оптимално използване на изчислителните ресурси и възможност за колективен потребителски достъп до заявените бази данни.

Блокът за анализ на данни, който е един от трите големи ГИС модула (вход, обработка и изход), представлява ядрото на географските информационни технологии; всички други операции гарантират, че системата може да изпълнява основните си аналитични и моделиращи функции. Съдържанието на аналитичния блок от съвременни софтуерни инструменти се формира в процеса на внедряване на конкретна ГИС под формата на установен набор от операции или групи от операции, наличието, отсъствието или ефективността (неефективността) на които в рамките на ГИС може да служи като показател за неговото качество.

Числата в компютъра се съхраняват в съответствие с формата. Форматът е конвенция или правила за представяне на число като последователност от битове.

Минималната единица за съхранение на данни в компютъра е 1 байт. Съществуват следните формати за представяне на цели числа: байт (половин дума), дума (включва 2 байта), двойна дума (4 байта), разширена дума (8 байта). Битовете, които съставят тези формати, се наричат ​​битове. Така един байт има 8 бита, една дума има 16 бита, а двойната дума има 32 бита. Отляво са старшите цифри, а отдясно са второстепенните. Всеки от тези формати може да бъде със знак (Фигура 5.1), за да представи положителни и отрицателни числа, или без знак (Фигура 5.2), за да представи положителни числа.

Ориз. 5.1. Целочислени формати със знак

Най-значимата цифра е значима. На фиг. 5.1, цифрата на знака е обозначена със символа S. Ако е равна на 0, тогава числото се счита за положително, а ако цифрата е равна на 1, тогава числото се счита за отрицателно.

Ориз. 5.2. Целочислени формати без знак

Като цяло диапазонът от стойности, представени от формати със знак за представяне на цели числа (Таблица 5.1), се определя от формулата

–2 n–1 £ X £ 2 n–1 – 1,

а за беззнаковия формат се определя по формулата

0 £ X £ 2 n – 1,

където n е броят на цифрите във формата.

Таблица 5.1. Формати за представяне на цели числа в компютър

5.1.2. Директни и допълнителни кодове
представяне на двоични числа

В директния код най-значимият бит кодира знака на числото (0 за положителен, 1 за отрицателен), а останалите битове кодират модула на числото.

Пример 5.1. Числото 11 в директния код ще бъде представено като 0|1011 p, а числото –11 – като 1|1011 p

В кода на комплемента на двата положителното число се кодира по същия начин, както в директния. За да представите отрицателно число в допълнение от две, има два начина. При представяне на числа в кода на допълване на две се използва операцията на инверсия - замяна на бит с неговата противоположност, тоест 0 с 1 и 1 с 0.

Правило 5.1. (побитово представяне на отрицателно число в допълнение от две) Представяне на модула на отрицателно число в директен код и обръщане на всички цифри вляво от най-малко значимата (вдясно).

Пример 5.2. Представете числото –11 в допълнение от две, като използвате побитова нотация.

Решение. Нека преобразуваме модула на това число в двоичната система: 11 = 1011 2 и го представим в директен код: 0|1011 p. Най-малката единица е последната, така че я оставяме непроменена и обръщаме останалите битове отляво ( Фиг. 5.3).

В резултат на това получаваме 1|0101 d – представянето на числото –11 в допълнителен код. □

Ориз. 5.3. Представяне на числото –11 в допълнение от две

Правило 5.2. (аритметично представяне на отрицателно число в допълнителен код) Добавете 2 m към отрицателното число, където m е броят на цифрите в двоичното представяне или този формат, и преобразувайте полученото число в двоичната бройна система. За байт 2 8 = 256, за дума 2 16 = 65 536, за двойна дума 2 32 = 4 294 967 296.

От тези правила можем да заключим, че положителните числа, в случай на увеличаване на броя на цифрите, се допълват отляво с нули, а отрицателните числа с единици.

Пример 5.3. Представете числото –11 в допълнение от две, като използвате аритметичен запис.

Решение. Нека е необходимо да се получи m = 5 бита допълнителен код. Нека изчислим члена 2 m = 2 5 = 32. Нека съберем и преобразуваме в двоичната бройна система:

–11 + 32 = 21 = 10101 2 .

Полученият резултат съответства на представянето на числото –11 в допълнителен код.

За m = 8, 2 8 = 256:

–11 + 256 = 245 = 11110101 2 .

Представянето на числото –11 беше допълнено с единици отляво до 8 цифри. □

Възможно е и обратното преобразуване на отрицателни числа, записани в допълнение от две.

Правило 5.3. (побитово определяне на стойността на отрицателно число, записано в допълнителен код за две) Алгоритъмът за определяне на стойността на отрицателно число в допълнителен код за две се състои от следните стъпки.

1. Обърнете всички цифри вляво от най-малко значимата (вдясно) единица.

2. Преобразувайте число от двоичната бройна система в десетичната система съгласно правило 4.1.

3. Умножете резултата по –1.

Пример 5.4. Определете кое десетично число е кодирано от числото 1|0101 d, като използвате побитовата дефиниция.

Решение. Нека обърнем цифрите на числото:

1010|1 d ® 0101|1 p.

Нека преобразуваме числото от двоичната бройна система в десетичната бройна система:

Умножете резултата по –1 и получете числото –11. □

Правило 5.4. (аритметична дефиниция на отрицателно число, записано като допълнение от две) Преобразувайте двоичното число в десетичната бройна система и извадете числото 2 m от полученото число, където m е броят на цифрите в двоичното представяне.

Пример 5.5. Определете кое десетично число е кодирано от числото 1|0101 d с помощта на аритметична дефиниция.

Решение. Нека преобразуваме числото от двоичната бройна система в десетичната бройна система:

Нека извадим числото 2 m = 2 5 = 32 от получения резултат от превода, тъй като двоичното число се състои от 5 цифри:

21 – 32 = –11.

Резултатът е десетичното число –11. □

Числата в знакови формати се записват в код на допълване на две, а в беззнакови формати - в директен код.

За добавяне и изваждане на положително и се изисква нотация с допълнение от две отрицателни числабез трансформации.

Пример 5.6. Добавете 21 и –11 в двоична бройна система.

Решение. Нека преведем термините в допълнителен код:

21 = 0|10101 d; –11 = 1|10101 d.

Ще използваме правилата на двоичната аритметика:

1 + 0 = 0 +1 = 1;

1 + 1 = 10 (с единица, пренесена към следващата цифра).

Нека добавим две двоични числа в колона, като вземем предвид, че прехвърлянето на едно от знаковия бит се игнорира:

110101 2

Резултатът е числото 10 - сумата от 21 и -11 без допълнителни трансформации. □

Думата и двойната дума в целочислен формат се съхраняват в паметта на компютъра обратен ред, тоест първо ниския байт и след това високия байт. Например, думата B5DE 16 ще бъде разположена в паметта, както е показано на фиг. 5.4.

Ориз. 5.4. Местоположение на думата B5DE 16 в компютърната памет

Тази подредба на байтовете е удобна за операции с числа, тъй като изчисленията започват с най-малко значимите цифри, така че те се намират първи.

5.2. Представяне на реални числа
на компютъра

Реалните числа се представят под формата на число с плаваща запетая (точка) във формата:

където M е мантисата (значима част от числото); n – основа на бройната система; P – ред на номера.

Пример 5.7. Числото 2,5 × 10 18 има мантиса 2,5 и показател 18. □

Мантисата се нарича нормализирана, ако нейната абсолютна стойност е в диапазона:

1/n £ |M|< 1,

където n е основата на бройната система.

Това условие означава, че първата цифра след десетичната запетая не е нула и абсолютната стойност на мантисата не надвишава единица.

Число с нормализирана мантиса се нарича нормализирано.

Пример 5.8. Представете числата –245,62 и 0,00123 във форма с плаваща запетая.

Решение. Числото –245,62 може да бъде представено под формата на число с ред –245,62 × 10 0. Мантисата на това число не е нормализирана, така че я разделяме на 10 3, увеличавайки реда:

–0,24562 × 10 3 .

В резултат на това числото –0,24562 × 10 3 се нормализира.

Числото 0,00123 под формата на число с ред 0,00123 × 10 0 не е нормализирано, тъй като мантисата не е нормализирана. Умножете мантисата по 10 2, намалявайки реда:

0,123 × 10 –2.

В резултат на това числото 0,123 × 10 –2 се нормализира. □

В този пример, за нормализиране на мантисата, запетаята беше изместена надясно или наляво. Следователно такива числа се наричат ​​числа с плаваща запетая. За разлика от числата с фиксирана запетая, те значително ускоряват аритметичните операции и мантисата на числата с плаваща запетая трябва да се нормализира всеки път.

За представяне на реално число в компютър, базиран на стандарта IEEE-754, се използват m + p + 1 бита, разпределени както следва (фиг. 5.5): 1 бит от знака на мантисата; p цифри на поръчката; m цифри на мантисата.

Ориз. 5.5. Структура на общия формат на числа с плаваща запетая

Това представяне се нарича (m, p)-формат.

Обхватът на представяне на числата във формат X (m, p) се определя от неравенството:

£ X £ (1 – 2 – m –1) » .

В този случай редът на числото P трябва да отговаря на условието
–2 p – 1 + 1 £ P £ 2 p – 1 – 1

За реални числа стандартът IEEE-754 използва (23,8) и (52,11) формати, наречени съответно единични и двойни реални формати (Таблица 5.2).

За да се даде представа за значението на тези порядъци, броят на секундите, изминали от формирането на планетата Земя, е само 10 18.

Правило 5.5. (превод на десетични числа в (m, p)-формат) Алгоритъмът за преобразуване на десетично число X в (m, p)-формат се състои от следните стъпки.

1. Ако X = 0, тогава вземете знаковата цифра, реда и мантисата за нула и завършете алгоритъма.

2. Ако X > 0, приемете знаковия бит 0, в противен случай приемете 1. Знаковият бит се формира.

3. Превеждам цели и дробна частабсолютна стойност на числото X в двоичната бройна система. Ако числото е дробно, тогава вземете m + 1 цифри. Приемете ред равен на нула.

Таблица 5.2. Сравнителна характеристика
реални формати

4. Ако X ³ 1, преместете запетаята наляво до най-значимата цифра и увеличете реда, в противен случай преместете запетаята надясно до първата различна от нула (единична) цифра и намалете реда.

5. Ако броят на цифрите на дробната част е по-малък от m, тогава допълнете дробната част с нули отдясно до m цифри. Отстранете един от цялата част. Оформя се мантисата.

6. Добавете отместването 2 p – 1 – 1 към реда и преобразувайте реда в двоичната бройна система. Поръчката е оформена. Кодът, в който е представена поръчката, се нарича отместване. Изместеният ред улеснява сравняването, добавянето и изваждането на редове в аритметичните операции.

7. Напишете знаковия бит, реда и мантисата в съответните битове на формата.

Пример 5.9. Представете числото –25,6875 в един реален формат.

Решение. В пример 4.7 абсолютната стойност на числото –25,6875 е преобразувана в двоичната система и са получени 9 цифри:

25,6875 = 11001,1011 2 .

Ние нормализираме числото, като преместваме десетичната запетая наляво и увеличаваме реда:

1,10011011 2 × 2 4 .

След изхвърляне на целочислената част остават 23 бита от дробната част (според формата (23,8)), записана като мантиса:

10011011000000000000000.

Редът е 4 (степен на две след изместване на десетичната запетая наляво). Нека го преместим и преобразуваме в двоичната бройна система:

4 + 127 = 131 = 10000011 2 .

Числото –25.6875 е отрицателно, следователно знаковият бит е 1.

Всичко е готово за представяне на числото –25.6875 в единичен реален формат, използвайки схемата знак + експонента + мантиса:

1 10000011 10011011000000000000000.

Нека разделим това число на 8 бита, образуваме байтове и ги запишем в шестнадесетични числа:

C1 CD

Така числото –25,6875 може да бъде записано като C1CD8000. □

Подобно на целочислените формати, форматите на реални числа се съхраняват в компютърната памет в обратен ред на байтовете (първо нисък ред, след това висок ред).

Аритметичните операции с числа с плаваща запетая се извършват в следния ред.

При събиране (изваждане) на числа с еднакъв ред техните мантиси се добавят (изваждат) и на резултата се присвоява ред, общ за оригиналните числа. Ако редовете на оригиналните числа са различни, тогава първо тези редове се изравняват (число с по-нисък ред се редуцира до число с по-висок ред), а след това се извършва операцията за добавяне (изваждане) на мантисите. Ако възникне препълване по време на добавяне на мантиса, сумата от мантисите се измества наляво с едно място и редът на сумата се увеличава с 1.

Когато числата се умножават, техните мантиси се умножават и редовете им се добавят.

При деление на числа мантисата на делителя се дели на мантисата на делителя и за да се получи редът на частното, редът на делителя се изважда от реда на делителя. Освен това, ако мантисата на дивидента е по-голяма от мантисата на делителя, тогава мантисата на частното ще бъде по-голяма от 1 (възниква препълване) и запетаята трябва да се измести наляво, като едновременно с това се увеличава редът на частното.

Представяне на символи в компютър

В компютъра всеки знак (например буква, цифра, препинателен знак) е кодиран като двоично цяло число без знак. Кодирането на знаци е конвенция, според която всеки знак има едно-към-едно съответствие на едно цяло двоично число без знак, наречено код на знака.

Има няколко кодировки за руската азбука (Таблица 5.3).

Таблица 5.3. Кодиране на букви от руската азбука

В кодировките 866, 1251, KOI-8 и Unicode, първите 128 знака (цифри, главни и малки латински букви, препинателни знаци) с кодови стойности от 0 до 127 са еднакви и се определят от стандарта ASCII (Американски стандарт Код за обмен на информация). Числата 0, 1, ..., 9 имат съответно кодове 48, 49, ..., 57; главни латински букви A, B, ..., Z (общо 26 букви) – кодове 65, 66, ..., 90; малки латински букви a, b, ..., z (общо 26 букви) - кодове 97, 98, ..., 122.

Вторите 128 знака с кодови стойности от 128 до 255, кодировки 866, 1251, KOI-8 съдържат псевдографски знаци, математически операции и знаци от азбуки, различни от латиница. освен това различни символиразличните азбуки имаха един и същ код. Например в кодирането 1251 символът на руската азбука B има същия код като знака Á в стандартното ASCII кодиране. Тази неяснота причини проблеми с кодирането на текста. Затова беше предложено двубайтовото Unicode кодиране, което позволява кодиране на знаци от много нелатинични азбуки.

Десетичните стойности на кодовете на буквите от руската азбука в кодировки 866, 1251 и Unicode са дадени в таблица. 5.4.

Таблица 5.4. Значения на буквените кодове на руската азбука

В кодирането KOI-8 (Таблица 5.5) кодовете на буквите от руската азбука са подредени не по местоположението на буквите в азбуката, а по тяхното съответствие с буквите на латинската азбука. Например кодовете на латинските букви A, B, C имат десетични стойности съответно 65, 66, 67, а руските букви A, B, C имат стойности 225, 226, 227.

Таблица 5.5. Значения на буквените кодове на руската азбука
в кодиране KOI-8

А ДА СЕ х А Да се х
б Л ° С b л ц
IN М з V м ч
Ж н Ш Ж н w
д ОТНОСНО SCH д О sch
д П Комерсант д П ъ
д Р Y д Р с
И СЪС b и с b
З T д ч T ъъъ
И U Ю И при Ю
Y Е аз th f аз

Има два формата за представяне на графична информация:

l растер;

l вектор.

В растерния формат изображението се съхранява във файл като мозаечен набор от много точки, съответстващи на пикселите на изображението, показано на екрана на дисплея. Създаденият от скенера файл е в растерен формат в паметта на компютъра (т.нар. bitmap). Не е възможно да редактирате този файл с помощта на стандартни текстови и графични редактори, тъй като те не работят с мозаечно представяне на информация.

Във векторен формат информацията се идентифицира чрез характеристиките на шрифтове, кодове на символи, абзаци и т.н. Стандартните текстообработващи програми са проектирани да работят точно с това представяне на информация.

Фундаменталната разлика между векторните формати и растерните формати може да бъде показана със следния пример: във векторен формат окръжността се идентифицира по радиуса, координатите на центъра, дебелината и вида на линията; Растерният формат просто съхранява последователни редове от точки, които геометрично образуват кръг.

Растерни графични формати

PSD формат– собствен програмен формат Адобе Фотошоп, редактиране на изображения (поддържа всички цветови модели, слоеве без ограничения, като всеки слой може да съдържа до 24 алфа канала).

BMP формат(растерно изображение) или DIB(device-independent bitmap) - формат за съхранение на графични изображения. Дълбочина на цвета от 1 до 48 бита на пиксел - предназначен за Windows, позволява използването на палитри от 2, 16, 256 или 16 милиона цвята. Има няколко разновидности на този формат:

Обикновен, с разширение .bmp;

Компресиран, разширен .rle; компресията се извършва без загуби, но се поддържа
само 4- и 8-битов цвят;



Независимо от устройството растерно изображение с разширение .dib.

TGA формат(Truevision Graphic Adapter) - за видео изображения, максимално адаптирани към телевизионните стандарти, както и за запис на графики на компютри с операционна система MS DOS, поддържа 32-битов цвят.

TIFF формат(Tagged Image File Format) е универсален графичен файлов формат за цифрови изображения, най-широката гама от възпроизвеждане на цветовете от монохромен до 24-битов RGB модел и 32-битов CMYK модел и е преносим към различни платформи. формат TIFFподдържа LZW- уплътняване без загуба на информация.

JPEG формат(Joint Photographic Experts Group) - най-популярният формат за съхранение на фотографски изображения, включително стандарт за Интернет, осигурява компресия на растерни изображения до 100 пъти (почти 5 до 15 пъти).

GIF формат(Graphics Interchange Format) - формат за обмен на графична информация, осигурява малък размер на файла, използва се в Интернет и е на второ място след формата по отношение на степента на компресия JPEG. Форматът е ограничен до 256 цветова палитра и не е много подходящ за съхраняване на фотографски изображения.

PNG формат(Portable Network Graphics) – преносим мрежова графика, базиран на вариант на алгоритъма за компресия без загуби (за разлика от GIFкомпресира растерни изображения както хоризонтално, така и вертикално), поддържа цветна графика с дълбочина на цвета до 48 бита, позволява ви да съхранявате пълна информацияза степента на прозрачност на всяка точка от изображението под формата на така наречения алфа канал.

Формат Flashpix (FPX).– графичен формат, който ви позволява да запазвате изображения с различни разделителни способности за представяне на CD-ROM или в Интернет, което ви позволява да работите с висококачествени изображения, без да използвате значително количество памет и дисково пространство. някои цифрови фотоапаратизапишете снимки в този формат.

Растерното изображение изисква много голямо количество памет за съхраняването му. Така растерно изображение от един лист на документ А4 (204297 mm) с резолюция 10 точки/mm и без предаване на полутонове (линейно изображение) заема около 1 MB памет, а при възпроизвеждане на 16 нюанса на сивото - 4 MB, когато възпроизвеждане на висококачествено цветно изображение (стандарт HighColor - 65 536 цвята) - 16 MB.

За да намалите количеството памет, необходимо за съхраняване на растерни изображения, различни начиникомпресиране на информация. Най-разпространеният алгоритъм за растерна компресия, предложен от Международния консултативен комитет по телеграф и телефония CCITTGroup 4, дава съотношение на компресия на информацията до 40:1 (в зависимост от съдържанието на файла - графиките се компресират много по-добре от текста).

Други използвани формати за компресиране: CTIFF(CompressedTagged Image File Format) Група 3, семейство MPEG (Multimedia Photographics Experts Group), JPEG (Joint Photographics Experts Group), GIF (Graphics Interchange Format) и други.

Некомпресирани формати: Некомпресиран TIFF (Tagged Image File Format), BMP(BitMaP) и други.

Скенерът обикновено се използва заедно с програми за разпознаване на изображения - OCR (Optical Character Recognition). OCR системата разпознава битовите (мозаечни) контури на символи, прочетени от скенера от документ и ги кодира с ASCII кодове, превеждайки ги във формат, удобен за текстови редактори.

Някои OCR системи трябва първо да бъдат обучени - шаблони и прототипи на разпознати знаци и съответните им кодове трябва да бъдат въведени в паметта на скенера. Трудности възникват при разграничаване на букви, които имат еднакъв стил в различни азбуки (например на латиница (английски) и на руски - кирилица) и различни набори от шрифтове. Но повечето системи не изискват обучение: разпознатите символи вече се съхраняват в тяхната памет. Така един от най-добрите OCR - FineReader - разпознава текстове на десетки езици (включително Basic, C++ и др. езици за програмиране), използва голям брой електронни речници, проверява правописа по време на разпознаване, подготвя текстове за публикуване в Интернет и т.н.

IN последните годиниПоявиха се интелигентни програми за разпознаване на изображения като Omnifont (например Cunei Form 2000), които разпознават знаците не по точки, а по индивидуалната топология, характерна за всеки от тях.

Ако има система за разпознаване на изображения, текстът се записва в паметта на компютъра не под формата на растерно изображение, а под формата на кодове и може да се редактира с обикновени текстови редактори.

Разумно е да съхранявате файлове в растерен формат само ако:

l документите и съответните файлове не трябва да се редактират по време на тяхното използване;

l документът трябва да се съхранява под формата на факсимилни копия на оригинала (снимки, чертежи, документи с резолюции и др.);

l има технически възможности за съхранение и преглед на голям брой огромни (1–20 MB) файлове.

Основни фактори, които трябва да имате предвид при избора на скенер:

l размерът, цветът и формата (лист, подвързани и др.) на сканираните документи трябва да отговарят на възможностите на скенера;

l разделителната способност на скенера трябва да осигурява възпроизвеждане на висококачествени копия на документи от техните електронни изображения;

l производителността на скенера трябва да е достатъчно висока с приемливо качество на полученото изображение;

l трябва да се осигури минимална грешка в размерите на полученото електронно изображение по отношение на оригинала, ако размерите на изображението от електронния документ служат като основа за извършване на изчисления;

l наличие на софтуер за компресиране на растерни файлове при съхраняването им в паметта на компютъра;

l наличие на софтуер за разпознаване на изображения (OCR) при съхраняване на векторни файлове в паметта на компютъра;

l наличие на софтуер и хардуер за подобряване на качеството на изображението в растерни файлове (увеличаване на контраста и яркостта на изображението, премахване на фоновия „шум“);

l качеството и вида на носещата хартия, в определени граници, не трябва да оказват значително влияние върху качеството на полученото електронно изображение;

l работата на скенера трябва да бъде удобна и проста и да елиминира грешки при сканиране поради неправилно зареждане на носителя;

l цена на скенера.

Скенерът може да се свърже към компютър чрез паралелен (LPT) или сериен (USB) интерфейс. За да работи със скенера, компютърът трябва да има специален драйвер, за предпочитане драйвер, който отговаря на стандарта TWAIN. В последния случай е възможно да се работи с Голям брой TWAIN-съвместими скенери и обработка на файлове с програми, които поддържат стандарта TWAIN, например обикновени графични редактори CorelDraw, Adobe Photoshop, MaxMate, Picture Publisher, Photo Finish и др.

Дигитайзери

Дигитайзерът или графичният таблет е устройство, чиято основна цел е да дигитализира изображения (фиг. 14.5).

Фиг. 14.5.Дигитайзер.

Състои се от две части: основа (таблет) и устройство за обозначаване на целта (писалка или курсор), движещи се по повърхността на основата. Когато натиснете бутона на курсора, неговата позиция върху повърхността на таблета се фиксира и координатите се прехвърлят към компютъра.

Дигитайзерът може да се използва за въвеждане на чертеж, създаден от потребителя, в компютър: потребителят премества писалката на курсора върху таблета, но изображението не се появява на хартия, а се записва в графичен файл. Принципът на работа на дигитайзера се основава на фиксиране на местоположението на курсора с помощта на решетка от тънки проводници, вградени в таблета с доста голямо разстояние между съседните проводници (от 3 до 6 mm). Механизмът за регистрация ви позволява да получите логическа стъпка за четене на информация, много по-малка от стъпката на мрежата (до 100 реда на 1 mm).

При работа с числа потребителят може да зададе различни формати за тяхното представяне. Можете да промените изходния формат на резултатите от изчисленията, като изберете командата Предпочитания за файлове. Това ще отвори диалоговия прозорец Предпочитания.

Уверете се, че командният прозорец е избран от списъка в левия панел. В този случай панелът с предпочитания на командния прозорец ще се покаже вдясно. Числовият формат се избира от падащия списък Числов формат, разположен в областта за показване на текст на този панел. Форматът по подразбиране за този падащ списък е кратък.

За да зададете различен формат за представяне на резултатите от изчисленията, изберете името му в списъка Числен формат и щракнете върху OK. Този формат ще се използва за показване на резултатите от всички следващи изчисления, докато не го промените.

Наличните формати в падащия списък Числен формат са описани в таблицата

Пример: представяне на числото 3/7 в различни формати:

Кратък формат – 0.4286

Формат дълъг – 0.42857142857143

Формат къс e – 4.2857e-001

Формат дълго e – 4.285714285714286e-001

Формат къс g – 0.42857

Формат дълго g – 0.428571428571429

Форматна банка - 0.43

Рационален формат – 3/7

Трябва да се отбележи, че числата, които са твърде големи или твърде малки, когато е зададен краткият формат, могат да бъдат показани в експоненциална форма, т.е. във формат с плаваща запетая.

Можете също да зададете числовия формат, като въведете следната команда в командния ред.

>> формат формат

Тук формате името на необходимия формат. Например, за да представите число в шестнадесетична форма, въведете следната команда в командния ред.

>> шестнадесетичен формат

И за да зададете дългото представяне на число във формат с плаваща запетая, въведете следната команда.

>> дълъг формат

Ако въведете командата в командния ред

>> помощен формат

можете да покажете в командния прозорец информация за всички налични формати в MATLAB

Промяната на формата за извеждане на числа засяга само показването на числата на екрана и по никакъв начин не засяга техните истински стойности.



Ново в сайта

>

Най - известен