Розподілені інформаційні системи та мережі

МІНОБРНАУКИ РОСІЇ

Федеральна державна бюджетна освітня установа вищої професійної освіти

"Казанський національний дослідницький технологічний університет"

(ФДБОУ ВПО КНИТУ)

Інститут управління, автоматизації та інформаційних технологій

Факультет управління та автоматизації

Кафедра «Автоматизованих систем збирання та обробки інформації»

Реферат

Тема: Загальна класифікація та характеристика технологій розподілених інформаційних систем

Казань – 2015 рік

1. Вступ…………………………………………………………………….…………..3

1.1 Передумови створення інформаційних систем…..………………………..…3

1.2. Поняття розподілених інформаційних систем……………………………4

2. Інформаційні технології у розподілених системах……………………..6

2.1. Система розподіленої обробки даних……………………………………7

2.2. Технології та моделі «Клієнт-Сервер»…………………………………………..9

2.3. Технології об'єктного зв'язування даних……………………………………..13

2.4. Технології реплікування даних………………………………………………15

3. Засоби роботи з розподіленими даними…………………………………..16

3.1. Розподілені бази даних……………………………………………………..17

3.2. Типи розподілених баз даних………………………………………………...20

3.3. Призначення та принципи роботи розподілених баз даних……………….20

4. Приклади розподілених систем…………………………………………………..22

Бібліографічний список…………………………………………………………..25

ВСТУП

Актуальність цієї теми реферату у тому, що у світовій економіці відбуваються процесу глобалізації та інформаційної інтеграції. Вони торкнулися і нашої країни, яка в силу географічного положення та розмірів змушена застосовувати розподілені інформаційні системи (ІС). Розподілені ІС забезпечують роботу з даними, розташованими на різних серверах, різних апаратно-програмних платформах і що зберігаються у різних форматах. Вони легко розширюються, засновані на відкритих стандартах та протоколах, забезпечують інтеграцію своїх ресурсів з іншими ІВ, надають користувачам прості інтерфейси.

У світі існує величезна кількість готових до використання інформаційно-обчислювальних ресурсів. Вони створювалися у час, їхньої розробки використовувалися різні підходи. Майже завжди при розробці нової інформаційної системи можна знайти підходящі за своїми функціями готові компоненти, що вже працюють. Проблема у тому, що з створенні не враховувалися вимоги несумісності. Ці компоненти не розуміють одне одного, вони можуть працювати спільно. Бажано мати механізм чи набір механізмів, які дозволять зробити такі незалежно розроблені інформаційно-обчислювальні ресурси сумісними.

У цій роботі розглянуто основні відомості про розподілену інформаційну систему: описано передумови її розвитку, засоби роботи з даними, введено поняття розподіленої бази даних, а також її типів та основних принципів. У третьому розділі представлені приклади розподілених інформаційних систем, такі як: - Informix On-Line фірми Informix Software; - Ingres Intelligent Database фірми Ingres Corp; - Oracle (version 7) фірми Oracle Corp; - Sybase System 10 фірми Sybase Inc.

Метою дослідження є вивчення теоретичних основ про розподілені інформаційні системи, а також формування знань про принципи її роботи.

Такий розподіл даних дозволяє, наприклад, зберігати у вузлі мережі ті дані, які найчастіше використовуються у цьому вузлі. Такий підхід полегшує та прискорює роботу з цими даними та залишає можливість працювати з іншими даними БД.

1. ПОНЯТТЯ РОЗПОДІЛЕНИХ ІФОРМАЦІЙНИХ СИСТЕМ

1.1. Передумови створення розподілених ІВ

З початку розвитку обчислювальної техніки утворилися два основних напрями її використання.

Перший напрямок- застосування обчислювальної техніки для виконання чисельних розрахунків, які надто довго чи взагалі неможливо проводити вручну. Становлення цього напряму сприяло інтенсифікації методів чисельного вирішення складних математичних завдань, розвитку класу мов програмування, орієнтованих зручну запис чисельних алгоритмів, становлення зворотний зв'язок із розробниками нових архітектур ЕОМ.

Другий напрямок- це використання засобів обчислювальної техніки в автоматичних чи автоматизованих інформаційних системах. Зазвичай обсяги інформації, з якими доводиться мати справу з такими системами, досить великі, а сама інформація має досить складну структуру. Одними з природних вимог до таких систем є середня швидкість виконання операцій та збереження інформації.

Але оскільки інформаційні системи вимагають складних структур даних, ці індивідуальні додаткові засоби управління даними були значною частиною інформаційних систем і повторювалися від однієї системи до іншої. Прагнення виділити та узагальнити загальну частину інформаційних систем, відповідальну за управління складно структурованими даними, і стало, судячи з усього, першою спонукальною причиною створення різних систем управління.

Незабаром стало зрозуміло, що неможливо обійтися загальною бібліотекою програм, що реалізує над стандартною базовою файловою системою складніші методи зберігання даних, наприклад, зберігання інформації в декількох файлах. Отже, усе це сприяло створенню розподілених інформаційних систем.

Фактично, якщо інформаційна система підтримує узгоджене зберігання інформації у кількох файлах, можна говорити, що вона підтримує базу даних. Якщо ж допоміжна система управління даними дозволяє працювати з кількома файлами, забезпечуючи їх узгодженість, можна назвати її системою управління базами даних. Вже лише вимога підтримки узгодженості даних у кількох файлах не дозволяє обійтися бібліотекою функцій: така система повинна мати деякі власні дані (метадані) і навіть знання, що визначають цілісність даних.

У світі існує величезна кількість готових до використання інформаційно-обчислювальних ресурсів. Вони створювалися у час, їхньої розробки використовувалися різні підходи. Майже завжди при розробці нової інформаційної системи можна знайти підходящі за своїми функціями готові компоненти, що вже працюють.

1.2. Поняття розподілених інформаційних систем

Зазвичай, розподіленою вважають таку систему, в якій функціонує більше одного сервера БД. Це застосовується зменшення навантаження на сервер і забезпечення роботи територіально віддалених підрозділів. Різна складність створення, модифікації, супроводу, інтеграції з іншими системами дозволяють поділити ІС на класи: малих,

середніх та великих розподілених систем.

Малі ІВмають невеликий життєвий цикл (ЖЦ), орієнтацію на масове використання, невисоку ціну, неможливість модифікації без участі розробників, які використовують переважно настільні системи управління базами даних (СУБД), однорідне апаратно-програмне забезпечення, що не мають засобів забезпечення безпеки.

Великікорпоративні ІС, системи федерального рівня та інші мають тривалий життєвий цикл, міграцію успадкованих систем, різноманітність апаратно-програмного забезпечення, масштабність та складність розв'язуваних завдань, перетин безлічі предметних областей, аналітичну обробку даних, територіальну розподіленість компонентів.

До функцій таких ІС слід віднести, перш за все, роботу з розподіленими даними, розташованими на різних фізичних серверах, різних апаратно-програмних платформах і що зберігаються у різних внутрішніх форматах. У цьому випадку система повинна надавати повну інформацію про себе та всі свої ресурси, легко розширюватися, бути заснована на відкритих стандартах та протоколах, забезпечувати можливість інтегрувати свої ресурси з ресурсами інших ІС. Для користувачів система повинна забезпечувати різні рівні привілеїв для користувачів та надавати прості інтерфейси доступу до інформації.

Дані з різних систем зазвичай об'єднуються в логічні групи, до якої і адресуються запити. Абстрактна система запитів передбачає, що система оперує не конкретним синтаксисом запитів, яке логічною суттю з урахуванням абстрактних атрибутів.
При побудові розподілених ІВ, як правило, використовуються дві базові архітектури: Клієнт/сервер та Internet Intranet.
Корпоративні ІС, побудовані з архітектури Клієнт/сервер , надають клієнтам широкий спектр додатків та інструментів розробки, які орієнтовані на максимальне використання обчислювальних можливостей клієнтських робочих місць. Ресурси сервера використовуються переважно для зберігання та обміну документами, а також для виходу у зовнішнє середовище. Ця архітектура дозволяє краще захистити серверну частину додатків, при цьому, надаючи можливість додаткам безпосередньо адресуватися до інших серверних додатків, або маршрутизувати запити до них. Проте, часті звернення клієнта до сервера знижують продуктивність роботи мережі. Доводиться вирішувати питання безпечної роботи в мережі, оскільки програми та дані розподілені між різними клієнтами. Розподілений характер побудови системи зумовлює складність її налаштування та супроводу

У основі ІВ з урахуванням Internet Intranet лежить принцип " відкритої архітектури " . ПО ІС реалізується у вигляді аплетів або сервлетів (програм на мові JAVA) або у вигляді модулів cgi (програм на Perl або С). ІС даної архітектури включає Web-yinh\, реалізовані за допомогою технологій CORBA Enterprise JavaBeans, ActiveX 1X"ОМ, багаторівневі програми на основі Java і XML, .Net-концепція з XML, в якій обмін між різними серверами (сховищами даних, бізнес-додатками , серверами для мобільних клієнтів та інше) виробляється за допомогою нейтрального до будь-якої архітектури XML.

Під розподіленою інформаційною базою розуміється необмежену кількість баз даних, дистанційно віддалених один від одного і мають низку загальних характеристик:

Функціонують за єдиними правилами, визначеними централізовано всім баз даних, які входять у розподілену інформаційну базу;

Обмін даними здійснюється за правилами, також визначеними централізовано.

Організація розподіленої бази необхідна для компаній, які здійснюють різні види діяльності, якщо в їхній повсякденній роботі виникає потреба вирішення наступних завдань:

Необхідність консолідації в єдиній базі даних інформації з баз даних юридичних осіб, що входять до структури компанії, для подальшого аналізу даних та отримання звітності з однієї бази, як у компанії в цілому, так і в кожній юридичній особі окремо;

Необхідність обмеження та здійснення контролю зміни даних у дистанційно віддалених підрозділах компанії (філіях).

2. ІНФОРМАЦІЙНІ ТЕХНОЛОГІЇ У РОЗПОДІЛЕНИХ СИСТЕМАХ

Технології розподілених обчислень (РВ) Сучасне виробництво потребує високих швидкостей обробки інформації, зручних форм її зберігання та передачі. Необхідно також мати динамічні способи звернення до інформації, способи пошуку даних у задані часові інтервали, щоб реалізовувати складну математичну та логічну обробку даних. Управління великими підприємствами, управління економікою лише на рівні країни вимагають участі у цьому досить великих колективів. Такі колективи можуть розташовуватися у різних районах міста, у різних регіонах країни і навіть у різних країнах. Для вирішення завдань управління, що забезпечують реалізацію економічної стратегії, стають важливими та актуальними швидкість та зручність обміну інформацією, а також можливість тісної взаємодії всіх, хто бере участь у процесі вироблення управлінських рішень. В епоху централізованого використання ЕОМ з пакетною обробкою інформації користувачі обчислювальної техніки надавали перевагу комп'ютерам, на яких можна було б вирішувати майже всі класи їх завдань. Однак складність розв'язуваних завдань обернено пропорційна їх кількості, і це призводило до неефективного використання обчислювальної потужності ЕОМ при значних матеріальних витратах. Не можна не враховувати і той факт, що доступ до ресурсів комп'ютерів був утруднений через існуючу політику централізації обчислювальних засобів в одному місці. Принцип централізованої обробки даних (рис. 5.1) не відповідав високим вимогам до надійності процесу обробки, ускладнював розвиток систем і не міг забезпечити необхідні часові параметри при діалоговій обробці даних у розрахованому на багато користувачів режимі. Короткочасний вихід із ладу центральної ЕОМ призводив до фатальних наслідків системи у цілому. I Мал. 5.1 - Система централізованої обробки даних Поява персональних комп'ютерів вимагає нового підходу до організації систем обробки даних, до створення нових інформаційних технологій.

Виникла логічно обґрунтована вимога переходу від використання окремих ЕОМ у системах централізованої обробки даних до розподіленої обробки даних.

2.1. Система розподіленої обробки даних.

Розподілена обробка даних - обробка даних, що виконується на незалежних, але пов'язаних між собою комп'ютерах, що становлять розподілену систему. В основі розподілених обчислень лежать дві основні ідеї: багато організаційно та фізично розподілених користувачів, що одночасно працюють із загальними даними - загальною базою даних (користувачі з різними іменами, які можуть розташовуватися на різних обчислювальних установках, з різними повноваженнями та завданнями); логічно і фізично розподілені дані, що становлять і утворюють загальну базу даних (окремі таблиці, записи і навіть поля можуть розташовуватися на різних обчислювальних установках або входити в різні локальні бази даних). Дня реалізації розподіленої обробки даних було створено багатомашинні асоціації, структура яких розробляється за одним із наступних напрямів: багатомашинні обчислювальні комплекси (МВК); комп'ютерні (обчислювальні) мережі. Багатомашинний обчислювальний комплекс - група встановлених поряд обчислювальних машин, об'єднаних за допомогою спеціальних засобів сполучення та виконують спільно єдиний інформаційно-обчислювальний процес. Під процесом розуміється деяка послідовність дій на вирішення завдання, обумовлена ​​програмою. Багатомашинні обчислювальні комплекси можуть бути: локальними, за умови встановлення комп'ютерів в одному приміщенні, що не потребують взаємозв'язку спеціального обладнання та каналів зв'язку; дистанційними, якщо деякі комп'ютери комплексу встановлені на значній відстані від центральної ЕОМ і передачі даних використовуються телефонні канали зв'язку.

Приклад 1. Три ЕОМ об'єднані в комплекс для розподілу завдань, що надходять на обробку. Одна з них виконує диспетчерську функцію та розподіляє завдання залежно від зайнятості однієї з двох інших обробних ЕОМ. Це локальний багатомашинний комплекс.

приклад 2.ЕОМ, що здійснює збір даних по деякому регіону, виконує їх попередню обробку і передає для подальшого використання центральну ЕОМ по телефонному каналу зв'язку. Це дистанційний багатомашинний комплекс. Комп'ютерна (обчислювальна) мережа - обчислювальна система, що включає кілька комп'ютерів, терміналів та інших апаратних засобів, з'єднаних між собою лініями зв'язку, що забезпечують передачу даних Термінал - пристрій, призначений для взаємодії користувача з обчислювальною системою або мережею ЕОМ. Складається із пристрою введення (найчастіше це клавіатура) та одного або декількох пристроїв виведення (дисплей, принтер тощо).

Розподілені бази даних Системи розподілених обчислень з'являються, передусім, через те, що у великих автоматизованих інформаційних системах, побудованих з урахуванням корпоративних мереж, який завжди вдається організувати централізоване розміщення всіх баз даних і СУБД однією вузлі мережі. Тому системи розподілених обчислень тісно пов'язані із системами управління розподіленими базами даних.

Розподілена база даних - це сукупність логічно взаємозалежних баз даних, розподілених на комп'ютерній мережі.

Система управління розподіленою базою даних - це програмна система, що забезпечує керування розподіленою базою даних та прозорість її розподіленості для користувачів. Розподілена база даних може об'єднувати бази даних, що підтримують будь-які моделі (ієрархічні, мережеві, реляційні та об'єктно-орієнтовані бази даних) у рамках єдиної глобальної схеми. Подібна конфігурація повинна забезпечувати для всіх програм прозорий доступ до будь-яких даних незалежно від їх розташування та формату. Основні принципи створення та функціонування розподілених баз даних: прозорість розташування даних для користувача (інакше кажучи, для користувача розподілена база даних повинна представлятися і виглядати так само, як і нерозподілена); ізольованість користувачів один від одного (користувач повинен "не відчувати", "не бачити" роботу інших користувачів у той момент, коли він змінює, оновлює, видаляє дані); синхронізація та узгодженість (несуперечність) стану даних у будь-який момент часу. З основних випливає ряд додаткових принципів: локальна автономія (жодна обчислювальна установка для свого успішного функціонування має залежати від будь-якої іншої установки); відсутність центральної установки (наслідок попередньої пункту); незалежність від розташування (користувачеві все одно, де фізично знаходяться дані, він працює так, ніби вони знаходяться на його локальній установці); безперервність функціонування (відсутність планових відключень системи в цілому, наприклад, для підключення нової установки або оновлення версії СУБД); незалежність від фрагментації даних (як від горизонтальної фрагментації, коли різні групи записів однієї таблиці розміщені на різних установках або в різних локальних базах, так і від вертикальної фрагментації, коли різні поля-стовпці однієї таблиці розміщені на різних установках); незалежність від реплікування (дублювання) даних (коли будь-яка таблиця бази даних (або її частина) фізично може бути представлена ​​декількома копіями, розташованими на різних установках); розподілена обробка запитів (оптимізація запитів має мати розподілений характер - спочатку глобальна оптимізація, а далі локальна оптимізація кожному з задіяних установок); розподілене управління транзакціями (у розподіленій системі окрема транзакція може вимагати виконання дій на різних установках, транзакція вважається завершеною, якщо вона успішно завершена на всіх залучених установках); незалежність від апаратури (бажано, щоб система могла функціонувати на установках, що включають комп'ютери різних типів); незалежність від типу операційної системи (система повинна функціонувати незалежно від можливої ​​різниці ОС на різних обчислювальних установках); незалежність від комунікаційної мережі (можливість функціонування у різних комунікаційних середовищах); незалежність від СУБД (у різних установках можуть функціонувати СУБД різного типу, практично обмежувані колом СУБД, підтримують SQL).

У побуті СУБД, з урахуванням яких створюються розподілені інформаційні системи, також характеризують терміном " розподілені СУБД " , і, використовують термін " розподілені бази даних " . Практична реалізація розподілених обчислень здійснюється через відступ від деяких розглянутих вище принципів створення та функціонування розподілених систем. Залежно від цього, який принцип приноситься у " жертву " (відсутність центральної установки, безперервність функціонування, узгодженого стану даних та інших.) виділилися кілька самостійних напрямів у технологіях розподілених систем:

- технології "Клієнт-сервер",

- технології реплікування,

- технології об'єктного зв'язування.

Реальні розподілені інформаційні системи, зазвичай, побудовані з урахуванням поєднання всіх трьох технологій, але у методичному плані їх доцільно розглянути окремо.

2.2. Технології та моделі «Клієнт-сервер»

Технології та моделі "Клієнт-сервер" Системи на основі технологій "Клієнт-сервер" історично виросли з перших централізованих розрахованих на багато користувачів автоматизованих інформаційних систем, що інтенсивно розвивалися в 70-х роках (системи mainframe), і набули, ймовірно, найбільш широкого поширення у сфері інформаційного забезпечення великих підприємств та корпорацій. У технологіях "Клієнт-сервер" відступають від одного з головних принципів створення та функціонування розподілених систем – відсутності центральної установки. Тому можна виділити дві основні ідеї, що лежать в основі клієнт-серверних технологій: загальні для всіх користувачів дані на одному або кількох серверах; багато користувачів (клієнтів), на різних обчислювальних установках, що спільно (паралельно і одночасно) обробляють загальні дані. Інакше кажучи, системи, засновані на технологіях "Клієнт-сервер", розподілені лише щодо користувачів, тому часто їх не відносять до "справжніх" розподілених систем, а вважають окремим класом розрахованих на багато користувачів систем.

Важливе значення у технологіях "Клієнт-сервер" мають поняття сервера та клієнта. Під сервером у сенсірозуміється будь-яка система, процес, комп'ютер, які мають будь-яким обчислювальним ресурсом (пам'яттю, часом, продуктивністю процесора тощо. буд.). Клієнтомназивається також будь-яка система, процес, комп'ютер, користувач, які запитують у сервера будь-який ресурс, що користуються яким-небудь ресурсом або сервером, що обслуговуються іншим способом. У розвитку системи " Клієнт-сервер " пройшли кілька етапів, під час яких сформувалися різні моделі систем " Клієнт-сервер " . Їх реалізація і, отже, правильне розуміння засновані на поділ структури СУБД на три компоненти: компонент уявлення, що реалізує функції введення та відображення даних, званий іноді ще просто як інтерфейс користувача; прикладний компонент, що включає набір запитів, подій, правил, процедур та інших обчислювальних функцій, що реалізує призначення автоматизованої інформаційної системи конкретної предметної області; компонент доступу до даних, що реалізує функції зберігання-вилучення, фізичного оновлення та зміни даних. Виходячи з особливостей реалізації та розподілу в системі цих трьох компонентів розрізняють чотири моделі технологій "Клієнт-сервер":

- модель файлового сервера (File Server – FS);

- модель віддаленого доступу до даних (Remote Data Access – RDA);

- модель сервера бази даних (DataBase Server – DBS);

- Модель сервера додатків (Application Server - AS).

Модель файлового сервера є найпростіший і характеризує не стільки спосіб утворення інформаційної системи, скільки загальний спосіб взаємодії комп'ютерів у локальній мережі. Один з комп'ютерів мережі виділяється та визначається файловим сервером, тобто загальним сховищем будь-яких даних. У FS-моделі всі основні компоненти розміщуються на установці клієнта. При зверненні до даних ядро ​​СУБД, своєю чергою, звертається із запитами на введення-виведення даних за сервісом до файлової системи. За допомогою функцій операційної системи оперативну пам'ять клієнтської установки повністю або частково на час сеансу роботи копіюється файл бази даних. Таким чином, сервер у цьому випадку виконує суто пасивну функцію. Перевагою цієї моделі є її простота, відсутність високих вимог до продуктивності сервера (головне, необхідний обсяг дискового простору). Слід зазначити, що програмні компоненти СУБД у разі не розподілені, тобто. ніяка частина СУБД на сервері не встановлюється і розміщується. Недоліки даної моделі - високий мережевий трафік, що досягає пікових значень, особливо в момент масового входження в систему користувачів, наприклад, на початку робочого дня. Однак більш істотним недоліком, з погляду роботи із загальною базою даних, є спеціальних механізмів безпеки файлу (файлів) бази даних з боку СУБД. Інакше кажучи, поділ даних між користувачами (паралельна робота з одним файлом даних) здійснюється лише засобами файлової системи операційної системи для одночасної роботи кількох прикладних програм з одним файлом.

Незважаючи на очевидні недоліки, модель файлового сервера є природним засобом розширення можливостей персональних (настільних) СУБД у напрямку підтримки розрахованого на багато користувачів режиму і, очевидно, в цьому плані ще зберігатиме своє значення.

Модель віддаленого доступу до даних ґрунтується на обліку специфіки розміщення та фізичного маніпулювання даних у зовнішній пам'яті для реляційних СУБД. У RDA-моделікомпонент доступу до даних у СУБД повністю відокремлений від двох інших компонентів (компонента подання та прикладного компонента) і розміщується на сервері системи. Компонент доступу до даних реалізується як самостійної програмної частини СУБД, званої SQL-сервером, і встановлюється на обчислювальної установки сервера системи. Функції SQL-сервера обмежуються низькорівневими операціями з організації, розміщення, зберігання та маніпулювання даними в дисковій пам'яті сервера. Інакше висловлюючись, SQL-сервер грає роль машини даних. У файлі (файлах) бази даних, що розміщується на сервері системи, знаходиться також і системний каталог бази даних, в якому містяться в тому числі і відомості про зареєстрованих клієнтів, їх повноваження тощо. На клієнтських установках встановлюються програмні частини СУБД, що реалізують інтерфейсні та прикладні функції. Користувач, входячи в клієнтську частину системи, реєструється через неї на центрі системи і починає обробку даних. Прикладний компонент системи (бібліотеки запитів, процедури обробки даних) повністю розміщується та виконується на клієнтській установці. При реалізації своїх функцій прикладний компонент формує необхідні SQL-інструкції, що направляються до SQL-сервера. SQL-сервер, що представляє спеціальний програмний компонент, орієнтований на інтерпретацію SQL-інструкцій та високошвидкісне виконання низькорівневих операцій з даними, приймає та координує SQL-інструкції від різних клієнтів, виконує їх, перевіряє та забезпечує виконання обмежень цілісності даних та спрямовує клієнтам результати обробки SQL- інструкцій, які представляють, як відомо, набори (таблиці) даних. Таким чином, спілкування клієнта з сервером відбувається через SQL-інструкції, а з сервера на клієнтські установки передаються лише результати обробки, тобто набори даних, які можуть бути значно меншими за обсягом усієї бази даних. В результаті різко зменшується завантаження мережі, а сервер набуває активної центральної функції. Крім того, ядро ​​СУБД у вигляді SQL-сервера забезпечує також традиційні та важливі функції щодо забезпечення обмежень цілісності та безпеки даних при спільній роботі кількох користувачів. Іншим, можливо неявною, гідністю RDA-моделіє уніфікація інтерфейсу взаємодії прикладних компонентів інформаційних систем із загальними даними. Така взаємодія стандартизована рамках мови SQL спеціальним протоколом ODBC (Open Database Connectivity - відкритий доступом до баз даних), які грають значної ролі у забезпеченні інтероперабельності (многопротокольность), тобто. незалежності від типу СУБД на клієнтських установках у розподілених системах. Інтероперабельність (багатопротокольність) СУБД - здатність СУБД обслуговувати прикладні програми, спочатку орієнтовані різні типи СУБД. Інакше кажучи, спеціальний компонент ядра СУБД на сервері (так званий драйвер ODBC) здатний сприймати, обробляти запити та спрямовувати результати їхньої обробки на клієнтські установки, що функціонують під управлінням реляційних СУБД інших, не "рідних" типів. Така можливість суттєво підвищує гнучкість у створенні розподілених інформаційних систем на базі інтеграції вже існуючих у будь-якій організації локальних баз даних під управлінням настільних чи іншого типу реляційних СУБД. До недоліків RDA-моделіможна віднести високі вимоги до клієнтських обчислювальних установок, оскільки прикладні програми обробки даних, зумовлені специфікою предметної області інформаційної системи, виконуються ними. Іншим недоліком є ​​все ж таки суттєвий трафік мережі, обумовлений тим, що з сервера бази даних клієнтам направляються набори (таблиці) даних, які в певних випадках можуть займати досить суттєвий обсяг.

Модель сервера баз даних (DBS-модель). Розвитком PDA-моделі стала модель сервера бази даних. Її серцевиною є механізм процедур, що зберігаються. На відміну від RDA-моделі, визначені для конкретної предметної області інформаційної системи події, правила та процедури, описані засобами мови SQL, зберігаються разом із даними на сервері системи та на ньому виконуються. Інакше кажучи, прикладний компонент повністю розміщується та виконується на сервері системи. Модель сервера бази даних (DBS-модель) На клієнтських установках в DBS-моделі розміщується лише інтерфейсний компонент (компонент представлення), що значно знижує вимоги до обчислювальної установки клієнта. Користувач через інтерфейс системи на клієнтській установці направляє на сервер бази даних лише виклики необхідних процедур, запитів та інших функцій обробки даних. Всі витрати на доступ і обробку даних виконуються на сервері і клієнту направляються лише результати обробки, а не набори даних, як у RDA-моделі. Цим забезпечується суттєве зниження трафіку мережіу DBS-моделі порівняно з RDA – моделлю. Слід зазначити, що у сервері системи виконуються процедури прикладних завдань одночасно всіх користувачів системи. В результаті різко зростають вимоги до обчислювальної установки сервера, причому як обсяг дискового простору і оперативної пам'яті, так і швидкодії. Це основний недолік моделі DBS. До переваг же DBS-моделіКрім розвантаження мережі, відноситься і більш активна роль сервера мережі, розміщення, зберігання та виконання на ньому механізму подій, правил і процедур, можливість більш адекватно і ефективно "налаштовувати" розподілену інформаційну систему на всі нюанси предметної області. Також більш надійно забезпечується узгодженість стану та зміни даних та, внаслідок цього, підвищується надійність зберігання та обробки даних, ефективно координується колективна робота користувачів із загальними даними.

Модель сервера додатків (AS-моделі). Щоб рознести вимоги до обчислювальних ресурсів сервера щодо швидкодії та пам'яті з різних обчислювальних установок, використовується модель сервера додатків. Суть AS-моделі полягає у перенесенні прикладного компонента інформаційної системи на спеціалізований щодо підвищених ресурсів швидкодії додатковий сервер системи. Як і DBS-моделі, на клієнтських установках розташовується лише інтерфейсна частина системи, т. е. компонент представлення. Однак виклики функцій обробки даних надсилаються на сервер додатків, де ці функції спільно виконуються всім користувачів системи. За виконанням низькорівневих операцій з доступу та зміни даних сервер додатків, як і RDA-моделі, звертається до SQL-серверу, направляючи йому виклики SQL-процедур, і отримуючи, відповідно, від нього набори даних. Як відомо, послідовна сукупність операцій над даними (SQL-інструкцій), що має окреме значення, називається транзакцією. У цьому плані сервер додатків управляє формуванням транзакцій, які виконує SQL-сервер. Тому програмний компонент СУБД, що інсталюється на сервері додатків, ще називають монітором обробки транзакцій (Transaction Processing Monitors - TRM) або просто монітором транзакцій. AS-модель, зберігаючи сильні сторони DBS-моделі, дозволяє оптимально побудувати обчислювальну схему інформаційної системи, однак, як і RDA-моделі, підвищує трафік мережі. У практичних випадках використовуються змішані моделі, коли найпростіші прикладні функції та забезпечення обмежень цілісності даних підтримуються процедурами (DBS-модель), що зберігаються на сервері, а більш складні функції предметної області (так звані правила бізнесу) реалізуються прикладними програмами на клієнтських установках (RDA-модель) або на сервері програм (AS-модель).

2.3. Технології об'єктного зв'язування даних.

Уніфікація взаємодії прикладних компонентів з ядром інформаційних систем у вигляді SQL-серверів, напрацьована для клієнт-серверних систем, дозволила виробити аналогічні рішення для інтеграції розрізнених локальних баз даних під управлінням настільних СУБД у складні децентралізовані гетерогенні розподілені системи. Такий підхід отримав назву об'єктного зв'язування даних. З вузької точки зору, технологія об'єктного зв'язування даних вирішує завдання забезпечення доступу з однієї локальної бази, відкритої одним користувачем, до даних в іншій локальній базі (в іншому файлі), можливо, знаходиться на іншій обчислювальній установці, відкритій та експлуатується іншим користувачем. Вирішення цього завдання ґрунтується на підтримці сучасними "настільними" СУБД ( MS Access, MS FoxPro, dBase та ін.) технології "об'єктів доступу до даних" - DАО.

При цьому слід зазначити, що під об'єктом розуміється інтеграція даних та методів, їх обробки в одне ціле (об'єкт), на чому ґрунтуються об'єктно-орієнтоване програмування та сучасні об'єктно-орієнтовані операційні середовища. Іншими словами, СУБД, що підтримують DАО, отримують можливість впроваджувати та оперувати в локальних базах об'єктами доступу до даних, що фізично знаходяться в інших файлах, можливо на інших обчислювальних установках та під управлінням інших СУБД. Технічно технологія DАО заснована на вже згадуваному протоколі ODBC, який прийнятий за стандарт доступу не тільки до даних на SQL-серверах клієнт-серверних систем, але і як стандарт доступу до будь-яких даних під управлінням реляційних СУБД. Безпосередньо для доступу до даних на основі протоколу ODBC використовуються спеціальні програмні компоненти, які називають драйверами ODBC (які ініціалізуються на тих установках, де знаходяться дані). Насамперед, сучасні настільні СУБД забезпечують можливість прямого доступу до об'єктів (таблиць, запитів, форм) зовнішніх баз даних "своїх" форматів. Інакше кажучи, відкриту в поточному сеансі роботи базу даних користувач має можливість вставити спеціальні посилання-об'єкти і оперувати з даними з іншої (зовнішньої, тобто не відкривається спеціально в даному сеансі) бази даних. Об'єкти із зовнішньої бази даних, вставлені в поточну базу даних, називаються пов'язаними і, зазвичай, мають спеціальні позначення на відміну внутрішніх об'єктів. При цьому слід підкреслити, що самі дані фізично файл (файли) поточної бази даних не поміщаються, а залишаються у файлах своїх баз даних. У системний каталог поточної бази даних поміщаються всі необхідні для доступу відомості про пов'язані об'єкти - внутрішнє ім'я та зовнішнє, тобто справжнє ім'я об'єкта у зовнішній базі даних, повний шлях до файлу зовнішньої бази і т.п. відрізняються від внутрішніх об'єктів. Користувач може також відкривати пов'язані в зовнішніх базах таблиці даних, здійснювати пошук, зміну, видалення та додавання даних, будувати запити за такими таблицями і т. д. таблиці. Технічно оперування зв'язаними об'єктами із зовнішніх баз даних "свого" формату мало відрізняється від оперування з даними з поточної бази даних. Ядро СУБД при зверненні до даних пов'язаного об'єкта системного каталогу поточної бази даних знаходить відомості про місце знаходження та інші параметри відповідного файлу (файлів) зовнішньої бази даних і прозоро (т. е. невидимо для користувача) відкриває цей файл (файли). Далі звичайним порядком організує в оперативній пам'яті буферизацію сторінок зовнішнього файлу даних безпосередньо доступу і маніпулювання даними. Слід також зауважити, що на основі можливостей розрахованого на багато користувачів режиму роботи з файлами даних сучасних операційних систем, з файлом зовнішньої бази даних, якщо він знаходиться на іншій обчислювальній установці, може в той же момент часу працювати і інший користувач, що і забезпечує колективну обробку загальних розподілених даних. Подібний принцип побудови розподілених систем при великих обсягах даних у зв'язаних таблицях призведе до суттєвого збільшення трафіку мережі, оскільки по мережі постійно передаються навіть не набори даних, а сторінки файлів баз даних, що може призводити до пікових перевантажень мережі. Тому представлені схеми локальних баз даних із взаємними зв'язаними об'єктами потребують подальшого ретельного опрацювання. Не менш суттєвою проблемою є відсутність надійних механізмів безпеки даних та забезпечення обмежень цілісності. Спільна робота кількох користувачів з одними й тими самими даними забезпечується лише функціями операційної системи одночасного доступу до файлу кількох додатків. Аналогічним чином забезпечується доступ до даних, що знаходяться в базах даних найбільш поширених форматів інших СУБД, таких, наприклад, як бази даних СУБД FoxPro, dBASE. При цьому доступ може забезпечуватися як безпосередньо ядром СУБД, так і додатковими спеціальними драйверами ISAM (Indexed Sequential Access Method), що входять, як правило, до складу комплекту СУБД. Об'єктне зв'язування обмежується лише безпосередньо таблицями даних, крім інших об'єктів бази даних (запити, форми, звіти), реалізація і підтримка яких залежить від специфіки конкретної СУБД. Певною проблемою технологій об'єктного зв'язування є поява "проломів" у системах захисту даних та розмежування доступу. Виклики драйверів ODBC для здійснення процедур доступу до даних окрім шляху, імені файлів та необхідних об'єктів (таблиць), якщо відповідні бази захищені, містять у відкритому вигляді паролі доступу, внаслідок чого може бути проаналізовано та розкрито систему розмежування доступу та захисту даних.

2.4. Технології реплікування даних

У багатьох випадках вузьким місцем розподілених систем, побудованих на основі технологій "Клієнт-сервер" або об'єктного зв'язування даних, є недостатньо висока продуктивність через необхідність передачі мережі великої кількості даних. Певну альтернативу побудови швидкодіючих розподілених систем надають технології реплікування даних . Реплікою називають особливу копію бази даних для розміщення іншому комп'ютері мережі з метою автономної роботи користувачів з однаковими (узгодженими) даними загального користування. Основна ідея реплікування полягає в тому, що користувачі працюють автономно з однаковими (загальними) даними, розтиражованими локальними базами даних, забезпечуючи з урахуванням відсутності необхідності передачі та обміну даними по мережі максимальну для своїх обчислювальних установок продуктивність. Тиражування (або реплікація) - створення дублюючих копій (реплікатів) об'єктів даних на різних вузлах з метою підвищення доступності та/або скорочення часу доступу до критично важливих даних. Програмне забезпечення СУБД для реалізації такого підходу відповідно доповнюється функціями тиражування (реплікування) баз даних, включаючи тиражування самих даних та їх структури, так і системного каталогу з інформацією про розміщення реплік, інакше кажучи, з інформацією про конфігурування побудованої таким чином розподіленої системи. При цьому, однак, виникають дві проблеми забезпечення одного з основних принципів побудови та функціонування розподілених систем (а саме - безперервності узгодженого стану даних): забезпечення узгодженого стану у всіх репліках кількості та значень загальних даних; забезпечення узгодженого стану у всіх репліках структури даних. Забезпечення узгодженого стану загальних даних, у свою чергу, ґрунтується на реалізації одного з двох принципів: принципу безперервного розмноження оновлень (будь-яке оновлення даних у будь-якій репліці має бути негайно розмножене); принципу відкладених оновлень (оновлення реплік можуть бути відкладені до спеціальної команди чи ситуації). Принцип безперервного розмноження оновлень є основним при побудові так званих систем реального часу, таких, наприклад, як системи керування повітряним рухом, системи бронювання квитків пасажирського транспорту тощо, де потрібна безперервна і точна відповідність реплік або інших розтиражованих даних у всіх вузлах компоненти подібних розподілених систем. Реалізація принципу безперервного розмноження оновлень полягає в тому, що будь-яка транзакція вважається успішно завершеною, якщо успішно завершена на всіх репліках системи. Насправді реалізація цього принципу зустрічає суттєві труднощі. У низці предметних областей розподілених інформаційних систем режим реального часу з погляду безперервності узгодження даних непотрібен. Такі системи автоматизують ті організаційно-технологічні структури, у яких інформаційні процеси менш динамічні. У цьому випадку оновлення реплік розподіленої інформаційної системи, якщо вона буде побудована на технології реплікування, потрібно, скажімо, лише один раз за кожну робочу годину, або за кожен робочий день. Такі інформаційні системи будуються з урахуванням принципу відкладених оновлень. Накопичені в будь-якій репліці зміни даних спеціальною командою користувача направляються для оновлення всіх інших реплік систем. Така операція називається синхронізацією реплік. Вирішення другої проблеми узгодженості даних, а саме - узгодженості структури даних, здійснюється через частковий відступ, як і в системах "Клієнт-сервер", від принципу відсутності центральної установки та ґрунтується на техніці головної репліки, тобто одна з реплік бази даних оголошується головною . При цьому змінювати структуру бази даних можна лише у головній репліці. Ці зміни структури даних тиражуються з урахуванням принципу відкладених оновлень, тобто. через спеціальну синхронізацію реплік. Частковість відступу від принципу відсутності центральної установки полягає в тому, що на відміну від суто централізованих систем, вихід з ладу головної репліки не тягне одразу загибель усієї розподіленої системи, тому що інші репліки продовжують функціонувати автономно. Більше того, на практиці СУБД, що підтримують технологію реплікування, дозволяють користувачеві з певними повноваженнями (адміністратору системи) перетворити будь-яку репліку на головну і тим самим повністю відновити працездатність усієї системи. Технології реплікації даних у тих випадках, коли не потрібно забезпечувати великі потоки та інтенсивність даних, що оновлюються в інформаційній мережі, є економічним вирішенням проблеми створення розподілених інформаційних систем з елементами централізації в порівнянні з використанням дорогих клієнт-серверних систем.

На практиці для спільної колективної обробки даних застосовуються змішані технології, що включають елементи об'єктного зв'язування даних, реплікацій та клієнт-серверних рішень. При цьому додатково до проблеми логічного проектування, тобто проектування логічної схеми організації даних (таблиці, поля, ключі, зв'язки, обмеження цілісності), додається не менш складна проблема транспортно-технологічного проектування інформаційних потоків, розмежування доступу тощо. на жаль, поки що не опрацьовано теоретико-методологічні та інструментальні підходи для автоматизації проектування розподілених інформаційних систем з урахуванням факторів як логіки, так і інформаційно-технологічної інфраструктури предметної галузі. Тим не менш, розвиток і все більш широке поширення розподілених інформаційних систем, що визначається найпоширенішою природою інформаційних потоків і технологій, є основною перспективою розвитку автоматизованих інформаційних систем.

3. ЗАСОБИ РОБОТИ З РОЗПОДІЛЕНИМИ ДАНИМИ

При виборі розподіленої інформаційної системи насамперед слід звернути увагу, які операційні системи та мережеві протоколи вона підтримує. Однак не менш важливим є і те, які методи розподілу даниху ній реалізовані.

1) Фрагментація та дублювання

Один із способів розподіленого зберігання таблиць - це фрагментація. Таблиця може бути розщеплена на частини, які будуть розміщені в різні вузли. Інший спосіб розподілу даних – це дублювання (реплікація). Можна створити дублі всієї БД або її частин та розмістити ці дублі у вузлах. Обидва методи дозволяють зберігати дані саме в тому вузлі, де вони найчастіше використовуються. Це зводить до мінімуму витрати на передачу даних через мережу і зменшує використання процесорів та інших ресурсів інших вузлів. За такої архітектури БД програми передача даних через мережу виконується досить рідко.

2) Словники даних та директорії

Після того, як дані розподілені по різних вузлах мережі, важливо знайти та використовувати ці дані. Для того, щоб знайти дані та перетворити їх у потрібний формат, використовуються глобальні словники даних та директорії. У словнику зберігається інформація про дані, їх використання, права доступу до даних, а також про програми. Директорії даних використовуються для того, щоб визначити, де зберігаються дані та як їх отримати. Словники та директорії можуть бути глобальними та локальними

3) Двофазна фіксація змін

Методи розподілу даних, звичайно, дуже важливі, проте серцем сучасних розподілених СУБД є протокол двофазної фіксації змін. Цей протокол керує виконанням транзакцій, що змінюють дані кількох вузлів. Основна ідея двофазної фіксації полягає в наступному: неприпустима ситуація, при якій транзакція, що змінює дані в декількох вузлах, виконується в одних вузлах і не виконується в інших вузлах. Транзакція повинна бути успішно виконана у всіх вузлах, або не виконана в жодному вузлі.

4) Забезпечення цілісності

Важливою характеристикою розподіленої ІВ є те, як вона забезпечує підтримку цілісності посилань між даними таблиці-майстра і даними пов'язаних з нею таблиць. Розглянемо приклад цілісності посилання. Припустимо, у розподіленій БД є три таблиці:

Таблиця, що містить інформацію про дітей співробітників;

Таблиця, що містить інформацію про зарплати працівників за рік;

Таблиця, що містить інформацію про теми, виконані співробітником.

Всі ці таблиці містять стовпець "ПІБ співробітника". Правила забезпечення цілісності посилань вимагають, щоб при зміні значень стовпця "ПІБ співробітника" в одній таблиці, автоматично виконувалася коригування значень цього стовпця в інших таблицях. Для забезпечення цілісності посилань використовуються 2 різних методи - тригери і декларативні обмеження цілісності стандарту ANSI.

3.1. РОЗПОДІЛЕНІ БАЗИ ДАНИХ

Основні принципи

Розподілені бази даних (РБД) - сукупність логічно взаємозалежних баз даних, розподілених на комп'ютерній мережі.

РБД складається з набору вузлів, пов'язаних комунікаційною мережею, в якій:

а) кожен вузол - це повноцінна СУБД як така;

б) вузли взаємодіють між собою таким чином, що користувач будь-якого з них може отримати доступ до будь-яких даних у мережі так, ніби вони знаходяться на його власному вузлі.

Кожен вузол сам собою є системою бази даних. Будь-який користувач може виконати операції над даними на своєму локальному вузлі так само, якби цей вузол зовсім не входив у розподілену систему. Розподілену систему баз даних можна як партнерство між окремими локальними СУБД на окремих локальних вузлах.

Фундаментальний принцип створення розподілених баз даних (правило 0):Для користувача розподілена система має виглядати так само, як нерозподілена система.

Фундаментальний принцип має наслідком певні додаткові правила чи цілі. Таких цілей лише дванадцять:

1.Локальна незалежність.Вузли в розподіленій системі мають бути незалежними, або автономними. Локальна незалежність означає, що це операції на вузлі контролюються цим вузлом.

2. Відсутність опори на центральний вузол.Локальна незалежність передбачає, що це вузли в розподіленої системі мають розглядатися як рівні. Тому не повинно бути жодних звернень до центрального або головного вузла з метою отримання деякого централізованого сервісу.

3. Безперервне функціонування.Розподілені системи повинні надавати більш високий рівень надійності та доступності.

4. Незалежність від розташування.Користувачі не повинні знати, де саме дані зберігаються фізично і повинні чинити так, якби всі дані зберігалися на їхньому власному локальному вузлі.

5. Незалежність від фрагментації.Система підтримує незалежність від фрагментації, якщо ця змінна-відношення може бути розділена на частини або фрагменти при організації її фізичного зберігання. У цьому випадку дані можуть зберігатися там, де вони найчастіше використовуються, що дозволяє досягти локалізації більшості операцій і зменшення мережного трафіку.

6.Незалежність від реплікації.Система підтримує реплікацію даних, якщо ця збережена змінна-відношення - або в загальному випадку даний фрагмент цієї змінної-відносини - може бути представлена ​​декількома окремими копіями або репліками, які зберігаються на декількох окремих вузлах.

7.Обробка розподілених запитів.

Суть у тому, що для запиту може знадобитися звернення до кількох вузлів. У такій системі може бути багато можливих способів пересилання даних, що дозволяють виконати аналізований запит.

8.Управління розподіленими транзакціями.

Існує 2 головні аспекти управління транзакціями: управління відновленням та управління паралельністю обробки. Що стосується управління відновленням, то щоб забезпечити атомарність транзакції в розподіленому середовищі, система повинна гарантувати, що все безліч агентів, що відносяться до даної транзакції (агент - процес, який виконується для даної транзакції на окремому вузлі) або зафіксувало свої результати, або виконало відкат. Що стосується управління паралельністю, то воно в більшості розподілених систем базується на механізмі блокування, так само, як і в нерозподілених системах.

9.Апаратна незалежність.

Бажано мати можливість запускати ту саму СУБД на різних апаратних платформах і, більше того, домогтися, щоб різні машини брали участь у роботі розподіленої системи як рівноправні партнери.

10. Незалежність від операційної системи.

Можливість функціонування СУБД під різними операційними системами.

11.Незалежність від мережі.

Можливість підтримувати багато різних вузлів, що відрізняються обладнанням і операційними системами, а також ряд типів різних комунікаційних мереж.

12. Незалежність від типу СУБД.

Необхідно, щоб екземпляри СУБД на різних вузлах всі разом підтримували той самий інтерфейс, і зовсім необов'язково, щоб це були копії однієї версії СУБД .

Основне завдання систем управління розподіленими базами даних полягає у забезпеченні засобу інтеграції локальних баз даних, що розташовуються в деяких вузлах обчислювальної мережі, для того, щоб користувач, що працює в будь-якому вузлі мережі, мав доступ до всіх цих баз даних як до єдиної бази даних.

3.2. Типи розподілених БД

Можливі однорідні та неоднорідні розподілені бази даних. У однорідному випадку кожна локальна база даних керується однією і тією ж СУБД. У неоднорідній системі локальні бази даних можуть належати навіть до різних моделей даних.

Крім вищезгаданих типів розподілених баз даних можна виділити такі:

1) Розподілені Бази даних

2) Мультибази даних із глобальною схемою. Система Мультибаз даних - це розподілена система, яка є зовнішнім інтерфейсом для доступу до безлічі локальних СУБД або структурується як глобальний рівень над локальними СУБД.

3) Федеративні бази даних. На відміну від мультибаз не мають глобальної схеми, до якої звертаються всі додатки. Натомість підтримується локальна схема імпорту-експорту даних. На кожному вузлі підтримується часткова глобальна схема, що описує інформацію віддалених джерел, дані з яких необхідні функціонування.

4) Мультибази із загальною мовою доступу - розподілені середовища управління з технологією "клієнт-сервер"

5) Інтероперабельні системи - це системи, у яких самі додатки, виконувані серед тієї чи іншої СУБД, відповідальні за інтерфейси між різними середовищами докладання, незалежно від цього, є вони однорідними чи неоднорідними. Системи орієнтовані головним чином обмін даними. Подальший розвиток цих систем є об'єктно-орієнтовані БД.

3.3. Призначення та принцип роботи розподіленої БД

Коли підприємство має віддалені філії, виникає необхідність у синхронізації даних між ними та головним офісом. Природно, що у основний базі підприємства мають відображатися будь-які зміни щодо філій. Таку синхронізацію можна здійснювати за допомогою механізмів розподіленої бази даних.

У головному офісі створюються початкові образи бази (для кожної філії – свій образ) і передаються у філії, де їх завантажують. При цьому задаються установки обміну, за якими відбуватиметься синхронізація між кожною з периферійних (підлеглих) баз і головною базою.

Структура підприємства може бути така, що філії, підпорядковані головному офісу, можуть мати свої віддалені підрозділи. Тоді їм виробляють процедуру аналогічну тій, що було здійснено під час настроювання філій, підпорядкованих безпосередньо головній базі .

Отже, можна підсумувати, що у розподіленої базі формуються деревоподібні зв'язку. Наприклад, на підприємстві головному офісу підпорядковано дві філії, причому перша філія має два віддалені підрозділи, а друга — три підрозділи. Виходить, що основній базі підпорядковано дві периферійні бази. Першої периферійної бази, своєю чергою, підпорядковано ще дві бази, а другий периферійної - три. Зв'язки у такій розподіленій базі представлені на рис. 1.

Рис.1.

Принцип роботи БД

Вузол 1 є кореневим для всієї розподіленої бази та головним вузлом для підлеглих йому другого та третього. Другий вузол є головним вузлом для підлеглих йому четвертого та п'ятого. Третій вузол буде головним для підлеглих йому шостого, сьомого та восьмого.

Будь-який вузол розподіленої бази даних (УРБД) "бачить" лише вузли, що безпосередньо пов'язані з ним. З такими вузлами він і здійснює обмін даними.

Внесення змін до даних інформаційної бази можливе у будь-якому вузлі УРБД, причому зміни даних передаються між будь-якими зв'язаними вузлами. На схемі напрямку, за якими передаються зміни даних, позначені зеленими стрілочками (за ними з будь-якого вузла УРБД за певну кількість кроків можна потрапити до будь-якого іншого вузол, звідси випливає, що при внесенні змін до даних будь-якого вузла ці зміни поступово перенесуться до всіх інших) .

Внесення змін до конфігурації інформаційної бази можливе лише в одному (кореневому) вузлі УРБД, причому зміни конфігурації передаються від головного вузла до підлеглих. На схемі напряму, якими передаються зміни конфігурації, позначені червоними стрілочками .

Тепер розглянемо, як здійснюється обмін даними між вузлами УРБД. При внесенні змін до даних інформаційної бази програма запам'ятовує, що було змінено і як. Для будь-якого вузла раз у певний проміжок часу запускається обробка (вручну або автоматично), яка формує спеціальні повідомлення, в яких у форматі XML відображена інформація про те, чи були зміни (якщо були, то які), і відправляє їх у певні каталоги локальною мережі або FTP, або ж на певні адреси електронної пошти. Також обробка перевіряє, чи з'явилися в цьому каталозі або електронній скриньці аналогічні повідомлення з інших вузлів, пов'язаних безпосередньо з цим вузлом, адресовані йому. Якщо з'явилися, то завантажить повідомлення, а відтак і зміни даних. Інфраструктура повідомлень підтримує нумерацію повідомлень та дозволяє отримувати підтвердження від вузла-отримувача про прийом повідомлень. Таке підтвердження міститься у кожному повідомленні, яке надходить від вузла-отримувача у вигляді номера останнього прийнятого повідомлення.

Якщо вузол-приймач ще не встиг завантажити повідомлення з каталогу обміну, вузол-джерело не викладатиме, а тим більше формуватиме файл повідомлень у каталог обміну по цьому вузлу. Мається на увазі, що після успішного завантаження файл видаляється з каталогу обміну. Це дозволяє не здійснювати зайві операції при обміні та не завантажувати канал зайвий раз.

При зміні конфігурації бази інформація про зміни поширюється на повідомлення обміну разом із змінами даних.

Обмін даними між базами здійснюється так:

1) У базі-джерелі система визначає перелік змінених об'єктів за час, що минув з попереднього сеансу розвантаження даних.

2) За цим списком система формує XML-пакет, який передається до бази-приймача.

Для того, щоб сформувати пакет, система звертається до змінених об'єктів бази даних. При зверненні система блокує ці об'єкти.

3) XML-пакет передається до бази-приймача.

У базі-приймачі XML-пакет розгортається і зміни, що містяться в ньому, вносяться до бази.

Усі зміни записуються у межах однієї транзакції, у своїй всі змінені об'єкти блокуються.

4. ПРИКЛАДИ РОЗПОДІЛЕНИХ СИСТЕМ

Сьогодні практично всі найбільші виробники систем управління базами даних пропонують рішення у сфері управління розподіленими ресурсами. Однак усі ці рішення підтримують обмеженіфункції побудови неоднорідних розподілених систем

Серед численних прототипів та науково-дослідних систем слід згадати систему SDD-1 , створену наприкінці 70-х – на початку 80-х років у науково-дослідному відділенні фірми Computer Corporation of America; систему R*яка є розподіленою версією системи System R і створена на початку 80-х років фірмою IBM; а також систему Distributed INGRES, яка є розподіленою версією системи INGRES та створена також на початку 80-х років у Каліфорнійському університеті в Берклі.

Що стосується комерційних продуктів, то в даний час у більшості реляційних систем передбачені різні види підтримки використання розподілених баз даних з різним ступенем функціональності. Серед таких систем найбільш відома система INGRES/STARвідділення Ingres Division фірми The ASK Group Inc., система ORACLEфірми Oracle Corporation, а також модуль розподіленої роботиСистеми DB2 фірми IBM.

Сьогодні багато фірм - розробників СУБД заявляють про те, що вони підтримують роботу з розподіленими БД, проте при найближчому розгляді в більшості випадків ці заяви виявляються дещо перебільшеними. Фахівці в галузі СУБД вважають, що лише кілька пакетів СУБД дозволяють до певної міри реалізувати розподілену базу даних.

Підкреслимо таке визначення розподіленої БД: " Розподілена БД – це безліч фізичних баз даних, які виглядають для користувача як одна логічна БД”.На жаль, на сьогоднішній день жодна СУБД не реалізує це визначення. Найбільш близько до його реалізації підійшли такі СУБД:

- Informix On-Line фірми Informix Software;

- Ingres Intelligent DatabaseфірмиIngres Corp;

- Oracle (version 7)фірмиOracle Corp;

- Sybase System 10фірмиSybase Inc.

Хоча жодна з цих 4 СУБД повністю не реалізує всі функції розподіленої СУБД, однак кожна з них реалізує або незабаром реалізовуватиме підтримку роботи з розподіленою БД.

Найбільш повнофункції розподіленої СУБД реалізовані в СУБД Ingres та Oracle. Коротко розглянемо можливості цих пакетів.

СУБД Ingres працює на багатьох UNIX-платформах, на платформах DEC VMS, Hewlett-Packard MPE, DOS, Microsoft Windows 3.1, OS/2, Macintosh. Вона також працює з багатьма мережевими протоколами, включаючи Open System Interconnection Transport Class 4. Ingres має засоби доступу до даних СУБД DB2, Rdb, Allbase. Основні функції розподіленої СУБД забезпечуються додатковою компонентою Ingres/Star. Вона підтримує оптимізацію розподілених запитів, дозволяє читати та оновлювати в рамках однієї транзакції дані різних вузлів, забезпечує можливість видаляти записи одночасно у кількох вузлах.

СУБД Informix-Online розроблено для середовища UNIX, але може також працювати під Novell. Informix-Online має оптимізатор запитів і реалізує ті ж функції роботи з розподіленою БД, що й Ingres, однак у Informix більш жорсткі вимоги до ресурсів комп'ютера, зокрема, йому потрібно більше оперативної пам'яті.

СУБД System 10 фірми Sybase нині перебуває у стані розробки. Вона має працювати на UNIX-платформах, на платформах OS/2, Window NT, NetWare. System 10 працюватиме з кількома мережевими протоколами та підтримуватиме зв'язок із СУБД DB2, Oracle 7, Informix-Online, Rdb. System 10 матиме оптимізатор розподілених запитів, вона дозволить читати та оновлювати дані кількох вузлів. Функції роботи з розподіленою базою даних будуть реалізовані за допомогою додаткової компоненти Replication Server.

У 7 версії СУБД Oracle реалізовано безліч функцій до роботи з розподіленої БД. Серед них слід виділити оптимізатор розподілених запитів та засіб читання та оновлення даних кількох вузлів у рамках однієї транзакції. Oracle v 7 працює на більш ніж 80 обчислювальних платформах, підтримує більшість існуючих комерційних мережевих протоколів та може обмінюватися даними з СУБД DB2, SQL/DS, Tandem Computers, NonStop SQL, Rdb, HP TurboImage. Розробляються шлюзи до 18 СУБД.

У СУБД Oracleсловник даних зберігається також, як інші дані, тому його таблиці можуть бути розподілені вузлами мережі. Усі операції з розподіленою БД "прозорі" для користувачів та розробників. В області оновлення розподіленої БД Oracle випередив усіх своїх конкурентів. Користувачі Oracle можуть за допомогою компонентів SQL*Net "прозоро" працювати з даними (не обов'язково даними Oracle), що розміщуються на різних типах комп'ютерів та різних вузлах мережі. Високопродуктивний засіб "прозорого" оновлення розподіленої БД реалізовано на основі оригінально виконаного двофазного протоколу фіксації змін.

Усі 4 розглянуті СУБД підтримують локальну автономію вузлів. Це означає, що адміністратор БД може розглядати локальну БД конкретного сайту як самостійну БД. Всі СУБД підтримують ANSI стандарт мови SQL - ANSI SQL-89 та розширення цього стандарту. Запити до БД формулюються мовою SQL. Додатково до непроцедурної мови SQL Oracle підтримує власну процедурну мову PL/SQL, а Sybase підтримує свою мову Transact-SQL.

Усі 4 СУБД забезпечують "прозорий" механізм запиту, оновлення та перегляду даних, розміщених у кількох вузлах. Вже зазначалося, що це 4 СУБД можуть обмінюватися даними з іншими СУБД. Однак тільки двофазний протокол фіксації Oracle 7 дозволяє виконувати розподілені оновлення даних різних СУБД. Проблема полягає в тому, що двофазні протоколи фіксації змін різних СУБД погано сумісні між собою.

Всі 4 пакети забезпечують виконання локального та глобального блокування даних. Однак вони реалізують це блокування на різних рівнях. Так Oracle за умовчанням реалізує блокування лише на рівні записи, інші ж СУБД - лише на рівні сторінки чи таблиці. Механізм блокувань дозволяє запобігти зміні даних, які контролюються іншими користувачами. Тим самим забезпечується цілісність та несуперечність даних. Блокування на рівні запису дозволяє одночасно оновлювати сусідні записи однієї і тієї ж таблиці. Це різко знижує час очікування, прискорює обробку даних та зменшує ймовірність виникнення взаємоблокувань.

Усі фірми-розробники розподілених СУБД мають намір у майбутньому підтримувати архітектуру розподіленої бази даних фірми IBM (Distributed Relational Database Architecture). Правда, хоча IBM вже давно оголосила про початок робіт з реалізації цієї архітектури, вона досі не закінчена. Це вочевидь пов'язані з дуже високої складністю реалізації оголошеної архітектури.

Організація розподіленої бази необхідна для компаній, які здійснюють різні види діяльності, якщо в їхній повсякденній роботі виникає потреба вирішення наступних завдань:

Необхідність оперативного отримання з баз даних дистанційно віддалених підрозділів (чи філій);

Необхідність консолідації в єдиній базі даних інформації з баз даних юридичних осіб, що входять до структури компанії, для подальшого аналізу даних та отримання звітності з однієї бази, як у компанії в цілому, так і в кожній юридичній особі окремо;

Необхідність запровадження централізованої зміни структури та правил роботи баз даних для роботи всіх дистанційно віддалених підрозділів (філій) та юридичних осіб (з неможливістю зміни певних правил безпосередньо у віддаленому підрозділі);

Необхідність обмеження та здійснення контролю зміни даних у дистанційно віддалених підрозділах компанії (філіях).

Основне завдання систем управління розподіленими базами даних полягає у забезпеченні засобу інтеграції локальних баз даних, що розташовуються в деяких вузлах обчислювальної мережі, для того, щоб користувач, що працює в будь-якому вузлі мережі, мав доступ до всіх цих баз даних як до єдиної бази даних.

p align="justify"> Таким чином, розподілені інформаційні системи є невід'ємною частиною сучасної інформаційної системи. У цьому мають забезпечуватися: простота використання системи; можливості автономного функціонування при порушеннях зв'язності мережі або за адміністративних потреб; високий рівень ефективності.

бібліографічний список

1. Розподілені бази даних. Вікіпедія.

8. Конноллі, Т., Бегг, К. Бази даних. Проектування, реалізація та супровід. Теорія та практика. 3-тє видання.: Пер. з англ. - М.: Видавничий дім "Вільямс", 2003. - 433 с.


Зміст

ВСТУП 4
1.ПОНЯТТЯ РОЗПОДІЛЕНИХ ІС 6
1.1. Передумови створення розподілених ІС 6
1.2. Поняття розподілених інформаційних систем 8
1.3. Засоби роботи з розподіленими даними 11
2. РОЗПОДІЛЕНІ БАЗИ ДАНИХ 13
2.1. Основні засади 13
2.2 Типи розподілених БД 15
2.3. Призначення та принцип роботи розподіленої БД 16
3. ПРИКЛАДИ РОЗПОДІЛЕНИХ СИСТЕМ 21
ВИСНОВОК 25
ЛІТЕРАТУРА 26

ВСТУП

Актуальність цієї теми реферату у тому, що у світовій економіці відбуваються процесу глобалізації та інформаційної інтеграції. Вони торкнулися і нашої країни, яка в силу географічного положення та розмірів змушена застосовувати розподілені інформаційні системи (ІС). Розподілені ІС забезпечують роботу з даними, розташованими на різних серверах, різних апаратно-програмних платформах і що зберігаються у різних форматах. Вони легко розширюються, засновані на відкритих стандартах та протоколах, забезпечують інтеграцію своїх ресурсів з іншими ІВ, надають користувачам прості інтерфейси.
У світі існує величезна кількість готових до використання інформаційно-обчислювальних ресурсів. Вони створювалися у час, їхньої розробки використовувалися різні підходи. Майже завжди при розробці нової інформаційної системи можна знайти підходящі за своїми функціями готові компоненти, що вже працюють. Проблема у тому, що з створенні не враховувалися вимоги несумісності. Ці компоненти не розуміють одне одного, вони можуть працювати спільно. Бажано мати механізм чи набір механізмів, які дозволять зробити такі незалежно розроблені інформаційно-обчислювальні ресурси сумісними.
У цій роботі розглянуто основні відомості про розподілену інформаційну систему: описано передумови її розвитку, засоби роботи з даними, введено поняття розподіленої бази даних, а також її типів та основних принципів. У третьому розділі представлені приклади розподілених інформаційних систем, такі як: - Informix On-Line фірми Informix Software; - Ingres Intelligent Database фірми Ingres Corp; - Oracle (version 7) фірми Oracle Corp; - Sybase System 10 фірми Sybase Inc.
Метою дослідження є вивчення теоретичних основ про розподілені інформаційні системи, а також формування знань про принципи її роботи.
Такий розподіл даних дозволяє, наприклад, зберігати у вузлі мережі ті дані, які найчастіше використовуються у цьому вузлі. Такий підхід полегшує та прискорює роботу з цими даними та залишає можливість працювати з іншими даними БД.

1.ПОНЯТТЯ РОЗПОДІЛЕНИХ ІС
1.1. Передумови створення розподілених ІВ

З початку розвитку обчислювальної техніки утворилися два основних напрями її використання. Перший напрямок - застосування обчислювальної техніки для виконання чисельних розрахунків, які надто довго чи взагалі неможливо проводити вручну. Становлення цього напряму сприяло інтенсифікації методів чисельного вирішення складних математичних завдань, розвитку класу мов програмування, орієнтованих зручну запис чисельних алгоритмів, становлення зворотний зв'язок із розробниками нових архітектур ЕОМ.
Другий напрямок - це використання засобів обчислювальної техніки в автоматичних чи автоматизованих інформаційних системах. Зазвичай обсяги інформації, з якими доводиться мати справу з такими системами, досить великі, а сама інформація має досить складну структуру. Одними з природних вимог до таких систем є середня швидкість виконання операцій та збереження інформації.
Але оскільки інформаційні системи вимагають складних структур даних, ці індивідуальні додаткові засоби управління даними були значною частиною інформаційних систем і повторювалися від однієї системи до іншої. Прагнення виділити та узагальнити загальну частину інформаційних систем, відповідальну за управління складно структурованими даними, і стало, судячи з усього, першою спонукальною причиною створення різних систем управління.
Незабаром стало зрозуміло, що неможливо обійтися загальною бібліотекою програм, що реалізує над стандартною базовою файловою системою складніші методи зберігання даних, наприклад, зберігання інформації в декількох файлах. Отже, усе це сприяло створенню розподілених інформаційних систем.
Фактично, якщо інформаційна система підтримує узгоджене зберігання інформації у кількох файлах, можна говорити, що вона підтримує базу даних. Якщо ж допоміжна система управління даними дозволяє працювати з кількома файлами, забезпечуючи їх узгодженість, можна назвати її системою управління базами даних. Вже лише вимога підтримки узгодженості даних у кількох файлах не дозволяє обійтися бібліотекою функцій: така система повинна мати деякі власні дані (метадані) і навіть знання, що визначають цілісність даних.
У світі існує величезна кількість готових до використання інформаційно-обчислювальних ресурсів. Вони створювалися у час, їхньої розробки використовувалися різні підходи. Майже завжди при розробці нової інформаційної системи можна знайти підходящі за своїми функціями готові компоненти, що вже працюють.

1.2. Поняття розподілених інформаційних систем

Зазвичай розподіленою вважають таку систему, в якій функціонує більше одного сервера БД. Це застосовується зменшення навантаження на сервер і забезпечення роботи територіально віддалених підрозділів. Різна складність створення, модифікації, супроводу, інтеграції з іншими системами дозволяють розділити ІВ на класи малих, середніх та великих розподілених систем. Малі ІС мають невеликий життєвий цикл (ЖЦ), орієнтацію на масове використання, невисоку ціну, неможливість модифікації без участі розробників, які використовують в основному настільні системи управління базами даних (СУБД), однорідне апаратно-програмне забезпечення, що не мають засобів безпеки. Великі корпоративні ІС, системи федерального рівня та інші мають тривалий життєвий цикл, міграцію успадкованих систем, різноманітність апаратно-програмного забезпечення, масштабність і складність розв'язуваних завдань, перетин безлічі предметних областей, аналітичну обробку даних, територіальну розподіл компонентів.
До функцій таких ІС слід віднести, перш за все, роботу з розподіленими даними, розташованими на різних фізичних серверах, різних апаратно-програмних платформах і що зберігаються у різних внутрішніх форматах. У цьому випадку система повинна надавати повну інформацію про себе та всі свої ресурси, легко розширюватися, бути заснована на відкритих стандартах та протоколах, забезпечувати можливість інтегрувати свої ресурси з ресурсами інших ІС. Для користувачів система повинна забезпечувати різні рівні привілеїв для користувачів та надавати прості інтерфейси доступу до інформації.
Дані з різних систем зазвичай об'єднуються в логічні групи, до якої і адресуються запити. Абстрактна система запитів передбачає, що система оперує не конкретним синтаксисом запитів, яке логічною суттю з урахуванням абстрактних атрибутів.
При побудові розподілених ІВ, зазвичай, застосовуються дві базові архітектури: Клієнт/сервер і Internet Intranet.
Корпоративні ІС, побудовані за архітектурою Клієнт/сервер, надають клієнтам широкий спектр додатків та інструментів розробки, орієнтованих на максимальне використання обчислювальних можливостей клієнтських робочих місць. Ресурси сервера використовуються переважно для зберігання та обміну документами, а також для виходу у зовнішнє середовище. Ця архітектура дозволяє краще захистити серверну частину додатків, при цьому, надаючи можливість додаткам безпосередньо адресуватися до інших серверних додатків, або маршрутизувати запити до них. Проте, часті звернення клієнта до сервера знижують продуктивність роботи мережі. Доводиться вирішувати питання безпечної роботи в мережі, оскільки програми та дані розподілені між різними клієнтами. Розподілений характер побудови системи зумовлює складність її налаштування та супроводу

У основі ІВ з урахуванням Internet Intranet лежить принцип " відкритої архітектури " . ПО ІС реалізується у вигляді аплетів або сервлетів (програм на мові JAVA) або у вигляді модулів cgi (програм на Perl або С). ІС даної архітектури включає Web-yinh\, реалізовані за допомогою технологій CORBA Enterprise JavaBeans, ActiveX 1X"ОМ, багаторівневі програми на основі Java і XML, .Net-концепція з XML, в якій обмін між різними серверами (сховищами даних, бізнес-додатками , серверами для мобільних клієнтів та інше) виробляється за допомогою нейтрального до будь-якої архітектури XML.
Під розподіленою інформаційною базою розуміється необмежену кількість баз даних, дистанційно віддалених один від одного і мають низку загальних характеристик:
- що функціонують за єдиними правилами, визначеними централізовано для всіх баз даних, що входять до розподіленої інформаційної бази;
- Обмін даними здійснюється за правилами, також визначеними централізовано.
Організація розподіленої бази необхідна для компаній, які здійснюють різні види діяльності, якщо в їхній повсякденній роботі виникає потреба вирішення наступних завдань:
- Необхідність оперативного отримання інформації з баз даних дистанційно віддалених підрозділів (або філій);
-Необхідність консолідації в єдиній базі даних інформації з баз даних юридичних осіб, що входять до структури компанії, для подальшого аналізу даних та отримання звітності з однієї бази, як по компанії в цілому, так і по кожній юридичній особі окремо;
- необхідність запровадження централізованої зміни структури та правил роботи баз даних для роботи всіх дистанційно віддалених підрозділів (філій) та юридичних осіб (з неможливістю зміни певних правил безпосередньо у віддаленому підрозділі);
- необхідність обмеження та здійснення контролю зміни даних у дистанційно віддалених підрозділах компанії (філіях).

1.3. Засоби роботи з розподіленими даними

При виборі розподіленої ІС насамперед слід звернути увагу, які операційні системи та мережеві протоколи вона підтримує. Однак не менш важливим є й те, які методи розподілу даних у ній реалізовані.
1) Фрагментація та дублювання
Один із способів розподіленого зберігання таблиць - це фрагментація. Таблиця може бути розщеплена на частини, які будуть розміщені в різні вузли. Інший спосіб розподілу даних – це дублювання (реплікація). Можна створити дублі всієї БД або її частин та розмістити ці дублі у вузлах. Обидва методи дозволяють зберігати дані саме в тому вузлі, де вони найчастіше використовуються. Це зводить до мінімуму витрати на передачу даних через мережу і зменшує використання процесорів та інших ресурсів інших вузлів. За такої архітектури БД програми передача даних через мережу виконується досить рідко.
2) Словники даних та директорії
Після того, як дані розподілені по різних вузлах мережі, важливо знайти та використовувати ці дані. Для того, щоб знайти дані та перетворити їх у потрібний формат, використовуються глобальні словники даних та директорії. У словнику зберігається інформація про дані, їх використання, права доступу до даних, а також про програми. Директорії даних використовуються для того, щоб визначити, де зберігаються дані та як їх отримати. Словники та директорії можуть бути глобальними та локальними
3) Двофазна фіксація змін
Методи розподілу даних, звичайно, дуже важливі, проте серцем сучасних розподілених СУБД є протокол двофазної фіксації змін. Цей протокол керує виконанням транзакцій, що змінюють дані кількох вузлів. Основна ідея двофазної фіксації полягає в наступному: неприпустима ситуація, при якій транзакція, що змінює дані в декількох вузлах, виконується в одних вузлах і не виконується в інших вузлах. Транзакція повинна бути успішно виконана у всіх вузлах, або не виконана в жодному вузлі.
4) Забезпечення цілісності
Важливою характеристикою розподіленої ІВ є те, як вона забезпечує підтримку цілісності посилань між даними таблиці-майстра і даними пов'язаних з нею таблиць. Розглянемо приклад цілісності посилання. Припустимо, у розподіленій БД є три таблиці:
- таблиця, що містить інформацію про дітей співробітників;
- таблиця, що містить інформацію про зарплати працівників за рік;
- таблиця, що містить інформацію про теми, виконані співробітником.
Всі ці таблиці містять стовпець "ПІБ співробітника". Правила забезпечення цілісності посилань вимагають, щоб при зміні значень стовпця "ПІБ співробітника" в одній таблиці, автоматично виконувалася коригування значень цього стовпця в інших таблицях. Для забезпечення цілісності посилань використовуються 2 різних методи - тригери і декларативні обмеження цілісності стандарту ANSI .

2. РОЗПОДІЛЕНІ БАЗИ ДАНИХ
2.1. Основні принципи

Розподілені бази даних (РБД) - сукупність логічно взаємозалежних баз даних, розподілених на комп'ютерній мережі.
РБД складається з набору вузлів, пов'язаних комунікаційною мережею, в якій:
а) кожен вузол - це повноцінна СУБД як така;
б) вузли взаємодіють між собою таким чином, що користувач будь-якого з них може отримати доступ до будь-яких даних у мережі так, ніби вони знаходяться на його власному вузлі.
Кожен вузол сам собою є системою бази даних. Будь-який користувач може виконати операції над даними на своєму локальному вузлі так само, якби цей вузол зовсім не входив у розподілену систему. Розподілену систему баз даних можна як партнерство між окремими локальними СУБД на окремих локальних вузлах.
Фундаментальний принцип створення розподілених баз даних («Правило 0»): Для користувача розподілена система має виглядати так само, як нерозподілена система.
Фундаментальний принцип має наслідком певні додаткові правила чи цілі. Таких цілей лише дванадцять:
1.Локальна незалежність. Вузли в розподіленій системі мають бути незалежними, або автономними. Локальна незалежність означає, що це операції на вузлі контролюються цим вузлом.
2. Відсутність опори на центральний вузол. Локальна незалежність передбачає, що це вузли в розподіленої системі мають розглядатися як рівні. Тому не повинно бути жодних звернень до центрального або головного вузла з метою отримання деякого централізованого сервісу.
3. Безперервне функціонування. Розподілені системи повинні надавати більш високий рівень надійності та доступності.
4. Незалежність від розташування. Користувачі не повинні знати, де саме дані зберігаються фізично і повинні чинити так, якби всі дані зберігалися на їхньому власному локальному вузлі.
5. Незалежність від фрагментації. Система підтримує незалежність від фрагментації, якщо ця змінна- відношення може бути поділена на частини або фрагменти при організації її фізичного зберігання. У цьому випадку дані можуть зберігатися там, де вони найчастіше використовуються, що дозволяє досягти локалізації більшості операцій і зменшення мережного трафіку.
6. Незалежність від реплікації. Система підтримує реплікацію даних, якщо ця збережена змінна-відношення - або в загальному випадку даний фрагмент цієї змінної-відносини - може бути представлена ​​декількома окремими копіями або репліками, які зберігаються на декількох окремих вузлах.
7. Обробка розподілених запитів. Суть у тому, що для запиту може знадобитися звернення до кількох вузлів. У такій системі може бути багато можливих способів пересилання даних, що дозволяють виконати аналізований запит.
8.Управління розподіленими транзакціями. Існує 2 головні аспекти управління транзакціями: управління відновленням та управління паралельністю обробки. Що стосується управління відновленням, то щоб забезпечити атомарність транзакції в розподіленому середовищі, система повинна гарантувати, що все безліч агентів, що відносяться до даної транзакції (агент - процес, який виконується для даної транзакції на окремому вузлі) або зафіксувало свої результати, або виконало відкат. Що стосується управління паралельністю, то воно в більшості розподілених систем базується на механізмі блокування, так само, як і в нерозподілених системах.
і т.д.................

Надіслати свою гарну роботу до бази знань просто. Використовуйте форму нижче

Студенти, аспіранти, молоді вчені, які використовують базу знань у своєму навчанні та роботі, будуть вам дуже вдячні.

ФЕДЕРАЛЬНЕ АГЕНТСТВО З ОСВІТИ

Державний освітній заклад вищого професійногоосвіти

РОСІЙСЬКИЙ ДЕРЖАВНИЙ ГУМАНІТАРНИЙ УНІВЕРСИТЕТ

Філія РДГУ у м. Калінінграді

Кафедра економічно-управлінських та правових дисциплін

Контрольна робота з «ІНФОРМАЦІЙНИХ ТЕХНОЛОГІЙ УПРАВЛІННЯ»

«Розподілені інформаційні системи»

Афанасьєв Олег Олександрович

3-го курсу заочної форми навчання

спеціальність 080507

"Менеджмент організації"

Керівник:

К.ф-м.н., доцент

Корнєв К.П.

Калінінград 2010

  • Вступ 3
  • 1. 4
  • 2. Поняття розподіленої бази даних. 6
  • 3. Методи підтримки цілісності розподіленої бази даних. 7
  • 4. Стандартизація цифрового подання документальної інформації. 8
  • 5. Стандартизація визначення архітектури документа та процесів обробки (ODA/ODIF). 13
  • 6. Стандарти подання знань. 14
  • Висновок. 18
  • Список використаної літератури. 19

Вступ

Розподілені бази даних неможливо розглядати поза контекстом більш загальної та значущої теми розподілених інформаційних систем. Процеси децентралізації та інформаційної інтеграції, що відбуваються у всьому світі, неминуче повинні рано чи пізно торкнутися нашої країни. Росія, в силу свого географічного положення та розмірів "приречена" на переважне використання розподілених систем. Наша робота присвячена вивченню архітектури розподіленої обробки даних, методам підтримки цілісності розподіленої бази даних, стандартизації визначення архітектури документа та процесів обробки, а також розглянемо різні стандарти представлення даних.

1. Розподілена обробка даних.

Розподілена обробка даних – методика виконання прикладних програм групою систем. При цьому користувач отримує можливість працювати з мережевими службами та прикладними процесами, розташованими в кількох взаємопов'язаних абонентських системах.

Розподілену обробку даних використовують розподілені системи обробки даних.

Розподілені системи – це системи типу "клієнт-сервер".

Рис.1. обробка даних в архітектурі клієнт/сервер

Отже, клієнт-серверна інформаційна система полягає у найпростішому випадку із трьох основних компонентів:

· сервер баз даних, керуючий зберіганням даних, доступом і захистом, резервним копіюванням, що відстежує цілісність даних відповідно до бізнес-правил і, найголовніше, виконує запити клієнта;

· Клієнт, що надає інтерфейс користувача, що виконує логіку програми, що перевіряє допустимість даних, посилає запити до сервера і отримує відповіді від нього;

· Мережа та комунікаційне програмне забезпечення, що здійснює взаємодію між клієнтом та сервером за допомогою мережевих протоколів.

Основні особливості архітектури «клієнт-сервер»

Одна з моделей взаємодії комп'ютерів у мережі отримала назву клієнт-сервер (Рис. 2.). Кожен із складових цю архітектуру елементів грає свою роль: сервер володіє і розпоряджається інформаційними ресурсами системи, клієнт має можливість скористатися ними.

Мал. 2. Архітектура «клієнт-сервер»

Сервер бази даних являє собою мультикористувальну версію СУБД, що паралельно обробляє запити, що надійшли з усіх робочих станцій. У його завдання входить реалізація логіки обробки транзакцій із застосуванням необхідної техніки синхронізації - підтримки протоколів блокування ресурсів, забезпечення, запобігання та/або усунення тупикових ситуацій.

У відповідь на запит користувача робоча станція отримає не «сировину» для подальшої обробки, а готові результати. Програмне забезпечення робочої станції за такої архітектури грає роль лише зовнішнього інтерфейсу (Front - end) централізованої системи управління даними. Це дозволяє суттєво зменшити мережевий трафік, скоротити час на очікування блокованих ресурсів даних у мультикористувальному режимі, розвантажити робочі станції та при досить потужній центральній машині використовувати для них дешевше обладнання.

Як правило, клієнт та сервер територіально відокремлені один від одного, і в цьому випадку вони входять до складу або утворюють систему розподіленої обробки даних.

Для сучасних СУБД архітектура клієнт-сервер стала фактично стандартом. Якщо передбачається, що проектована інформація матиме архітектуру «клієнт-сервер», це означає, що прикладні програми, реалізовані у межах, матимуть розподілений характер, т. е. частина функцій додатків буде реалізована у програмі-клієнті, інша - в програмі-сервері. Основний принцип технології «клієнт-сервер» полягає у розділенні функцій стандартного інтерактивного додатка на чотири групи:

· Функції введення та відображення даних;

· Прикладні функції, характерні для предметної області;

· Фундаментальні функції зберігання та управління ресурсами (базами даних);

· Службові функції.

2. Поняття розподіленої бази даних

Розподілена база даних (DDB – distributed database) – це сукупність логічно взаємопов'язаних баз даних, розподілених у комп'ютерній мережі. Розподілена система керування базою даних визначається як програмна система, яка дозволяє керувати розподіленою базою даних таким чином, щоб її розподіленість була прозорою для користувачів. У цьому вся визначенні слід уточнити дві відмінних архітектурних особливості. Перша з них полягає в тому, що система складається з (можливо, порожньої) множини вузлів прийому запитів (query site) і непустої множини вузлів даних (data site). Вузли даних мають засоби зберігання даних, а вузли прийому запитів - немає. У вузлах прийому запитів лише виконуються програми, що реалізують інтерфейс користувача для доступу до даних, що зберігаються у вузлах даних. Друга особливість у тому, що вузли логічно є незалежні комп'ютери. Отже, у такого вузла є власна основна і зовнішня пам'ять, встановлена ​​власна операційна система (може бути, та сама на всіх вузлах, а можливо, і ні) і є можливість виконувати додатки. Вузли пов'язані комп'ютерною мережею, а чи не входять у мультипроцессорную конфігурацію. Важливо підкреслити слабку пов'язаність процесорів, які володіють власними операційними системами та функціонує незалежно .

3. Методи підтримки цілісності розподіленої бази даних

Підтримка цілісності в реляційній моделі даних у її класичному розумінні включає 3 методи:

Перший методце підтримка структурної цілісності, яка сприймається як те, що реляційна СУБД повинна допускати роботу лише з однорідними структурами даних типу "реляційне ставлення". При цьому поняття "реляційного відношення" має задовольняти всі обмеження, що накладаються на нього в класичній теорії реляційної БД (відсутність дублікатів кортежів, відповідно обов'язкова наявність первинного ключа, відсутність поняття впорядкованості кортежів).

Другий методце підтримка мовної цілісності, яка полягає в тому, що реляційна СУБД повинна забезпечувати мови опису та маніпулювання даними не нижче стандарту SQL. Не повинні бути доступні інші низькорівневі засоби маніпулювання даними, що не відповідають стандарту.

Саме тому доступ до інформації, що зберігається у базі даних, та будь-які зміни цієї інформації можуть бути виконані лише з використанням операторів мови SQL.

Третій методце підтримка цілісності посилання (Declarative Referential Integrity, DRI), означає забезпечення одного із заданих принципів взаємозв'язку між екземплярами кортежів взаємопов'язаних відносин:

кортежі підлеглого відношення знищуються при видаленні кортежу основного відношення, пов'язаного з ними.

кортежі основного відношення модифікуються при видаленні кортежу основного відношення, пов'язаного з ними, при цьому на місці ключа батьківського відношення ставиться невизначене Null значення.

Цельність посилань забезпечує підтримку несуперечливого стану БД в процесі модифікації даних при виконанні операцій додавання або видалення.

Крім зазначених обмежень цілісності, що у загальному вигляді не визначають семантику БД, вводиться поняття семантичної підтримки цілісності.

Структурна, мовна та посилальна цілісність визначають правила роботи СУБД із реляційними структурами даних. Вимоги підтримки цих трьох видів цілісності свідчать, кожна СУБД повинна вміти це робити, а розробники повинні це враховувати під час побудови баз даних із використанням реляційної моделі.

4. Стандартизація цифрового подання документальної інформації

Правове регулювання питань роботи з електронними документами передбачає закріплення у нормативних правових актах, насамперед, поняття «електронний документ» та можливості використання електронних документів нарівні з традиційними документами у різних сферах діяльності, особливо у сфері державного управління. Застосування електронних документів потребує законодавчого забезпечення їхньої юридичної сили, тобто встановлення порядку їх посвідчення (складу та способів оформлення реквізитів), а також захисту від спотворень у процесі електронного обміну. У зв'язку з цим у сучасному законодавстві робляться спроби створення певних умов для використання з цією метою технології електронного підпису.

Технічне регулювання (стандартизація) в галузі електронного документообігу спрямоване на розробку, прийняття, застосування та виконання вимог до електронних документів та різних технологічних процесів, пов'язаних із застосуванням електронних документів, наприклад, процесів формування та перевірки електронного підпису, процедур зберігання, транспортування та експлуатації носіїв, використовуються при обробці даних та зберіганні інформації в електронному вигляді.

Стандартизація масивів метаданих про інформаційні ресурси, розвиток систем їх класифікації та каталогізації повинні стати основою створення ефективних засобів навігації в російському інформаційному просторі, а також постійно діючого моніторингу інформаційних ресурсів (насамперед державних) та інформаційної діяльності.

У зв'язку з вищевикладеним, в 1999 р. був прийнятий національний стандарт ГОСТ Р 51353, визначальний склад і зміст метаданих електронних карт у геоінформаційних системах, а в 2003 р. прийнятий безпосередньо як національний стандарт Російської Федерації міждержавний стандарт ГОСТ 7.70, що встановлює склад, зміст та подання реквізитів опису електронних інформаційних ресурсів, що є базами даних та машиночитаними інформаційними масивами. Стандарт ГОСТ 7.70 рекомендований як для реєструючих органів, що становлять каталоги інформаційних ресурсів, так і для розробників та розповсюджувачів електронних інформаційних ресурсів (на змінних носіях, у глобальних та локальних мережах).

Національні стандарти, що входять до Системи стандартів з інформації, бібліотечної та видавничої справи (СІБІД), нормативно впорядковують інформаційні процеси, що забезпечують доступ до інформаційних фондів. Наприклад, правила бібліографічного опису електронних видань встановлює державний стандарт ГОСТ 7.82, згідно з яким опис електронних ресурсів максимально наближений до опису традиційних документів, закріпленого у ГОСТ 7.1.

Створення та експлуатація комп'ютерних систем та технологій обробки документації здійснюється на основі правил, викладених у комплексі стандартів на автоматизовані системи та інших стандартах серії «Інформаційна технологія». Також на державному рівні стандартизовано питання захисту інформації та використання електронного цифрового підпису.

Зокрема, стандарт ГОСТ 34.601 виділяє вісім стадій у створенні автоматизованих систем (АС), що використовуються у різних сферах діяльності, у тому числі в управлінській: формування вимог до АС, розробка концепції АС, технічне завдання, ескізний проект, технічний проект, робоча документація, введення у дію, супровід АС.

Стандарт ГОСТ 34.602 встановлює склад, зміст, правила оформлення документа "Технічне завдання на створення (розвиток або модернізацію) системи", а також порядок його розробки, погодження та затвердження. У цьому стандарті зазначено, що вимоги, що включаються до технічного завдання, повинні «не поступатися аналогічним вимогам, що пред'являються до кращих сучасних вітчизняних і зарубіжних аналогів».

Розроблений у 2004 році національний стандарт ГОСТ Р 52294 визначає основні положення щодо створення, впровадження, експлуатації та супроводу електронного регламенту адміністративної та службової діяльності організацій. Він поширюється на автоматизовані системи обробки інформації та управління установ, підприємств та організацій незалежно від форми власності та підпорядкування. Положення цього стандарту слід враховувати під час створення нових чи вдосконалення існуючих технологій управління організацією. Стандарт ГОСТ 52294 містить визначення термінів "регламент" (це "сукупність правил, що встановлюють порядок проведення робіт або здійснення діяльності"), "робочий процес" (це "сукупність взаємопов'язаних або взаємодіючих видів діяльності, що перетворюють входи у виходи і реалізуються в межах організації") , «Операція (робота)» (це «частина робочого процесу, що створює відтворюваний результат у рамках робочого процесу»).

У національних стандартах також закріплені вимоги до управління документами, проведення уніфікації та застосування уніфікованих систем документації, оформлення організаційно-розпорядчої документації, термінології у галузі діловодства та архівної справи, термінології у галузі електронного обміну інформацією.

Слід зазначити, що галузевий термінологічний стандарт з діловодства та архівної справи ГОСТ Р 51141, що діє з 1 січня 1999 р., не повною мірою відображає нову міжнародну термінологію та не враховує нову технічну термінологію, що виникла у зв'язку із застосуванням комп'ютерних інформаційних технологій у сфері роботи з інформацією та документацією. Він вимагає актуалізації на основі використання стандартів ISO та вітчизняного досвіду роботи з документацією.

Національну систему стандартизації становлять, крім національних стандартів, загальноросійські класифікатори техніко-економічної та соціальної інформації та інші, що застосовуються в установленому порядку класифікації. Загальноросійські класифікатори - це нормативні документи, що розподіляють техніко-економічну та соціальну інформацію відповідно до її класифікації (класами, групами, видами та ін.). На відміну від національних стандартів, що застосовуються на добровільній основі, загальноросійські класифікатори є обов'язковими для застосування під час створення державних інформаційних систем та інформаційних ресурсів, а також при міжвідомчому обміні інформацією.

Затверджене Урядом РФ «Положення про розробку, прийняття, введення в дію, ведення та застосування загальноросійських класифікаторів техніко-економічної та соціальної інформації в соціально-економічній галузі» містить перелік загальноросійських класифікаторів, а також органів виконавчої влади, які забезпечують розробку, ведення та застосування кожного з класифікаторів.

Самі уніфіковані форми документів затверджуються міністерствами (відомствами) РФ – розробниками уніфікованих систем документації. Наприклад, федеральний орган державної статистики у межах первинної облікової документації веде підсистему документації з обліку праці та її оплати, розробляє і затверджує альбоми уніфікованих форм первинної облікової документації та його електронні версії.

Слід зазначити, що Росархівом та ВНІІДАД у 2007 р. розроблено та введено в дію Єдиний класифікатор документної інформації Архівного фонду Російської Федерації. Цей класифікатор встановлює і закріплює єдиний всім державних та муніципальних архівів РФ систематизований перелік найменувань і індексів об'єктів класифікації, що створює міцну основу на формування єдиного архівного інформаційного простору нашої країни.

Вимоги до електронних документів можуть містити законодавчі та інші нормативні правові акти, що визначають статус різних юридичних осіб або їхню діяльність у певній сфері. Наприклад, відповідно до Федерального закону «Про індивідуальний (персоніфікований) облік у системі державного пенсійного страхування» до Пенсійного фонду РФ може подаватися інформація як у вигляді документів у письмовій формі, так і в електронній формі (на магнітних носіях або по каналах зв'язку).

5. Стандартизація визначення архітектури документа та процесів обробки (ODA/ODIF)

ODA/ODIF - Office Document Architecture / Office Document Interchange Format (Архітектура офісних документів / Форма обміну офісними документами)

Відкритий стандарт архітектури документів і формату обміну дозволяє обмінюватися складними документами (тобто документами, що несуть у собі одночасно кілька різних типів змісту, наприклад літери, растрову графіку і геометричну [комп'ютерну] графіку).

У світі сформувалося інформаційне середовище, інфраструктура якого базується на комп'ютерах та телекомунікаціях. Це середовище, побудоване за технологією "клієнт-сервер", забезпечує можливість інтеграції різноманітних технічних та програмних рішень. Поряд з добре відомим словом Інтернет кілька років тому з'явилося поняття intranet, під яким розуміється застосування в корпоративних мережах і системах засобів і стандартів, розроблених для глобальних мереж. І для організації електронного документообігу у цих системах існують свої стандарти та програмні засоби. Ймовірно, розробники систем передачі електронних документів у бібліотеках повинні обов'язково врахувати стандарт ISO 8613 (parts 1-6) “Архітектура та обмінний формат для офісних документів” (Office Document Architecture (ODA) та Interchange Format (ODIF)). Цей стандарт визначає метод опису електронних документів і сам опис структурованої інформації у вигляді, зручному для машинної обробки та автоматизованого обміну.

Далі слід сказати, що документи або їх копії, що надаються користувачеві, можуть бути різної природи: електронні графічні копії, електронні файли в одному з текстових форматів, ксерокопії або оригінали, що видаються за МБА. Відповідно, ми повинні врахувати всі необхідні стандарти, що описують їх формати та кодування (TIFF, GIF, JPEG, PDF, PostScript, CCITT Group 3/Group4 Facsimile Standard, ISO 2022 "Information Processing - 7-bit/8-bit character sets", ISO 4873 "8-бітний код для інформаційного обміну - структура і правила для здійснення", ISO 6937 "Coded characters for Text Communication", ISO 8859 "8-бітовий 1-кодний кодований графічні характеристики", CP Windows-1251, та ін. Ми повинні також враховувати та використовувати можливості подання документів на мовах HTML ("HyperText Mark-up Language") та SGML (ISO 8859 "Information Processing - Text and Office Systems - Standard Generalized Mark-up Language") з відповідними кодовими таблицями ( UNICODE, UTF-8, ISO 10646) Технологічне забезпечення та функціональні програми електронного МБА повинні передбачати не тільки різні формати, але різні способи транспортування документів, як-от: передача даних електронною поштою, через FTP-сервер, можливо, використання яких- інших протоколів мереж передачі даних, пересилання документів факсом або звичайною поштою і т.п.

6. Стандарти подання знань

Однією з проблем у поданні знань є те, як зберігати та обробляти знання в інформаційних системах формальним способом так, щоб механізми могли використовувати їх для досягнення поставлених завдань. Приклади застосування тут експертні системи, Машинний переклад, комп'ютеризоване технічне обслуговування та системи вилучення та пошуку інформації (включаючи інтерфейси баз даних).

Для представлення знань можна використовувати семантичні мережі. Кожен вузол такої мережі представляє концепцію, а дуги використовуються визначення відносин між концепціями. Одна з найвиразніших і детально описаних парадигм уявлення знань заснованих на семантичних мережах це MultiNet (акронім для багатошарових розширених семантичних мереж англ. Multilayered Extended Semantic Networks).

Починаючи з 1960-х років, використовувалося поняття кадру знань або просто кадру. Кожен кадр має своє власне ім'я та набір атрибутів, або слотів, які містять значення; наприклад фрейм будинок міг би містити слоти колір, кількість поверхів тощо.

Використання фреймів в експертних системах є прикладом об'єктно-орієнтованого програмування з наслідуванням властивостей, що описується зв'язком «is-a». Однак, у використанні зв'язку «is-a» існувало чимало протиріч: Рональд Брахман написав роботу під назвою «Чим є і не є IS-A», в якій було знайдено 29 різних семантик зв'язку «is-a» у проектах, чиї схеми представлення знань включали зв'язок "is-a". Інші зв'язки включають, наприклад, "has-part".

Фреймові структури добре підходять для представлення знань, представлених у вигляді схем та стереотипних когнітивних патернів. Елементи подібних патернів мають різні ваги, причому великі ваги призначаються тим елементам, які відповідають поточній когнітивній схемі). Паттерн активізується за певних умов: Якщо людина бачить великого птаха, за умови, що зараз активна його «морська схема», а «земна схема» - ні, вона класифікує її швидше як морського орлана, а не сухопутного беркута.

Фреймовые уявлення объектно-центрированы у тому сенсі як і Семантична мережу: Усі факти та властивості, пов'язані з однією концепцією, розміщуються одному місці, тому не потрібно витрачати ресурси на пошук по базі даних.

Скрипт - це тип кадрів, що визначає послідовність подій у часі; Типовий приклад опису походу в ресторан. Події тут включають очікування місця, прочитати меню, зробити замовлення, і так далі.

В інформатиці (головним чином у галузі штучного інтелекту) для структурування інформації, а також організації баз знань та експертних систем було запропоновано кілька способів представлення знань. Одне - представлення даних і відомостей у межах логічної моделі баз знань, з урахуванням мови логічного програмування Пролог.

Під терміном «Подання Знань» найчастіше маються на увазі способи представлення знань, орієнтовані на автоматичну обробку сучасними комп'ютерами, і зокрема, уявлення, що складаються з явних об'єктів ("клас всіх слонів", або "Клайд - екземпляр"), і з суджень або тверджень про них ("Клайд слон", або "всі слони сірі"). Подання знань у подібній явній формі дозволяє комп'ютерам робити дедуктивні висновки із раніше збереженого знання ("Клайд сірий").

У 1970-х і на початку 1980-х були запропоновані, і зі змінним успіхом випробувані численні методи представлення знань, наприклад евристичні питання-відповідні системи, нейромережі, доказ теорем, та експертні системи. Головними областями їх застосування на той час були медична діагностика (наприклад MYCIN) та ігри (наприклад, шахи).

У 1980-х роках з'явилися формальні комп'ютерні мови уявлення знань. Основні проекти того часу намагалися закодувати (занести до своїх баз знань) величезні масиви загальнолюдського знання. Наприклад у проекті «Cyc» була оброблена велика енциклопедія, і кодувалася не сама інформація, що зберігається в ній, а знання, які знадобляться читачеві щоб зрозуміти цю енциклопедію: наївна фізика, поняття часу, причинності та мотивації, типові об'єкти та їх класи. Проект Cyc розвивається компанією Cycorp, Inc.; Більшість (але не вся) їх бази вільно доступна.

Ця робота призвела до більш точної оцінки складності завдання уявлення знань. Одночасно в математичній лінгвістиці, були створені набагато більші бази мовної інформації, і вони, разом із величезним приростом швидкості та обсягів пам'яті комп'ютерів, зробили більш глибоке уявлення знань більш реальним.

Було розроблено кілька мов програмування орієнтованих подання знань. Пролог, розроблений в 1972, але здобув популярність значно пізніше, описує висловлювання та основну логіку, і може робити висновки з відомих посилок. Ще більше націлений на подання знань мову KL-ONE (1980-ті).

В області електронних документів були розроблені мови, що явно виражають структуру збережених документів, такі як SGML а згодом XML. Вони полегшили завдання пошуку та отримання інформації, які останнім часом все більше пов'язані із завданням представлення знань. Веб-спільнота вкрай зацікавлена ​​в семантичній павутині, в якій базовані на мові XML уявлення знань, такі як RDF, Карта тем та інші використовуються для збільшення доступності комп'ютерних систем інформації, що зберігається в мережі.

Сьогодні широко використовуються гіперпосилання, проте близьке поняття семантичного заслання ще увійшло широке вживання. З часів Вавилону використовувалися математичні таблиці. Пізніше ці таблиці використовувалися для представлення результату логічних операцій, наприклад таблиці істинності використовувалися для вивчення і моделювання Булевої логіки. Табличні процесори є іншим прикладом табличного уявлення знань. Іншими методами представлення знань є дерева, за допомогою яких можна показати зв'язки між фундаментальними концепціями та їх похідними.

Висновок

Зараз перед багатьма організаціями, які мають територіально-розподілену структуру, гостро постає проблема інтеграції даних та додатків у рамках єдиного інформаційного простору. Всім набридло возити дискети на тролейбусі і мучитися, конвертуючи дані з формату одного додатка до іншого.

Виникає гостре бажання займатися своєю справою, тобто. своєчасно мати інформацію в потрібній точці в потрібний час, а не розбиратися зі змученими програмістами з приводу того, яка інформація і куди не дійшла, а також чому дані, введені в одному додатку, ніяк не хочуть потрапити в інше.

В даному випадку потрібно буде застосувати технологію Розподілених Інформаційних Систем. Ця технологія дозволяє в обмежені терміни розробляти та впроваджувати інформаційні системи компанії в рамках єдиного інформаційного простору, а також економити суттєві кошти на її супровід.

Список використаної літератури

1.Основи Web-технологій./П.Б. Храмцев, С.А. Брік, А.М. Русак, А.І. Сургін / За редакцією П.Б. Храмцова. – М.: ІНТУІТ.РУ «Інтернет-університет інформаційних технологій», 2003. -512с.

2. Глухів В.А., Лаврик О.Л. Електронна доставка документів. - М: ІНІОН РАН, 1999. - 132 с.

3. Фрідланд А.Я. Інформатика та комп'ютерні технології/А.Я. Фрідланд, Л.С. Ханамірова. - М: Астрель. 2003. - 204 с.

4. Сахаров А. А. Концепція побудови та реалізації інформаційних систем, орієнтованих на аналіз даних // СУБД. – 1996. – № 4. – С. 55-70.

5. Коровкін С. Д., Левенець І. А., Ратманова І. Д., Старих В. А., Щавельов Л. В. Вирішення проблеми комплексного оперативного аналізу інформації сховищ даних // СУБД. – 1997. – № 5-6. – С. 47-51.

6. Енсор Д., Стівенсон Й. - М: Oracle. Проектування баз даних: Пров. з англ. – К.: Видавнича група BHV, 1999. – 560 с.

Подібні документи

    Блок обробки даних: загальний пристрій, вибір елементної бази. Структура операційного автомата. Розрахунок здатності навантаження шини даних. Розрахунок тривалості такту управляючого автомата. Пам'ять: будова, контролер. Інтерфейс шини процесор-пам'ять.

    курсова робота , доданий 07.01.2015

    Інерційні системи навігації та існуючі шляхи їх реалізації. Опис архітектури програми для збору та розмітки даних, структура та взаємозв'язок компонентів. Основні функції аналізатора даних. Штучні нейронні мережі та їх призначення.

    курсова робота , доданий 04.09.2016

    Основні поняття, визначення та класифікація інформаційних систем, бази даних. Аналіз сучасних мейнфреймів компанії IВМ та їх особливості. Види зв'язку у залізничному транспорті та його призначення; інформаційні потоки у транспортних системах.

    навчальний посібник, доданий 01.10.2013

    Призначення бази даних та її основні функції. Категорії користувачів, інфологічне та датологічне проектування бази даних "Інтернет-магазин". Облік специфіки предметної галузі, обмеження та бізнес-правила. Опис інтерфейсу користувача.

    курсова робота , доданий 30.09.2011

    Компоненти апаратного забезпечення телекомунікаційних обчислювальних мереж. Робочі станції та комунікаційні вузли. Модулі, що утворюють область взаємодії прикладних процесів та фізичних засобів. Напрями методів обробки та зберігання даних.

    лекція, доданий 16.10.2013

    Функціональна схема та механізм роботи цифрового пристрою обробки даних. Синтез керуючого автомата, вибір типу тригера, опис керуючого автомата та лічильників мовою Verilog. Процес тестування та моделювання керуючого автомата.

    курсова робота , доданий 05.12.2012

    Загальні та тактико-технічні вимоги до конструкції бортової апаратури. Блок введення даних для енергонезалежного зберігання та видачі в бортову ЕОМ даних польотного завдання, а також прийому даних реєстрації. Структурна схема та розробка конструкції.

    дипломна робота , доданий 16.04.2012

    Вивчення топології локальної обчислювальної мережі - сукупності комп'ютерів та терміналів, з'єднаних за допомогою каналів зв'язку в єдину систему, що відповідає вимогам розподіленої обробки даних. Розробка ЛОМ фотолабораторії. Мережеві протоколи.

    курсова робота , доданий 02.12.2010

    Основні поняття безпеки інформаційної системи. Властивості конфіденційності, доступності та цілісності даних. Захист даних у момент їх передачі лініями зв'язку, від несанкціонованого віддаленого доступу до мережі. Основні технології безпеки.

    презентація , додано 18.02.2010

    Тензометричний метод оцінки стану рухових відділів центральної нервової системи. Структурна організація тензометричного треморографа. Основні завдання статистичної обробки ізометричних даних. Методи кореляції та основних компонентів.

Кожна організація розробляє більш менш вагому частину а не всі інформаційне наповнення своєї ГІС. Потреба даних є стимулом для користувачів отримувати нові дані найбільш ефективними і швидкими способами у тому числі набуваючи частини баз даних для своїх ГІС в інших ГІС користувачів. Таким чином, управління даними ГІС здійснюється декількома користувачами.


Поділіться роботою у соціальних мережах

Якщо ця робота Вам не підійшла внизу сторінки, є список схожих робіт. Також Ви можете скористатися кнопкою пошук


12. ГІС | РОЗПОДІЛЕНА ІНФОРМАЦІЙНА СИСТЕМА

12.1. Загальні відомості

Нині у більшості географічних інформаційних систем дані верств і таблиць надходять із різних організацій. Кожна організація розробляє більш менш вагому частину, а не всі інформаційне наповнення своєї ГІС. Зазвичай хоча б деякі шари даних надходять із зовнішніх джерел. Потреба даних є стимулом для користувачів отримувати нові дані найбільш ефективними та швидкими способами, у тому числі набуваючи частини баз даних для своїх ГІС в інших ГІС-користувачів. Таким чином, управління даними ГІС здійснюється кількома користувачами.

12.2. Можливості взаємодії

Розподілена сутність ГІС має на увазі широкі можливості для взаємодії між багатьма ГІС-організаціями та системами. Співпраця та спільна робота користувачів дуже важливі для ГІС.

ГІС-користувачі у своїй роботі давно спираються на взаємовигідну діяльність щодо обміну даними та їх спільного використання. Реальним відображенням цієї фундаментальної потреби є безперервні зусилля у сфері створення ГІС стандартів. Прихильність галузевим стандартам та загальним принципам побудови ГІС є критично важливою для успішного розвитку та широкого впровадження цієї технології. ГІС має підтримувати найважливіші стандарти та мати можливість адаптації з появою нових стандартів.

12.3. ГІС-мережі

Багато географічних наборів даних можуть компілюватися та управлятися як загальний інформаційний ресурс та спільно використовуватися спільнотою користувачів. До того ж користувачі ГІС мають власне бачення того, як можна забезпечити обмін популярними наборами даних через Web.

Ключові web-вузли, які називають порталами каталогів ГІС, надають можливість користувачам як викладати власну інформацію, так і шукати доступну для використання географічну інформацію. В результаті ГІС-системи все більшою мірою підключаються до Всесвітньої павутини та отримують нові можливості обміну та використання інформації.

Це бачення проникло у свідомість людей за останнє десятиліття і знайшло відображення у таких поняттях, як Національна інфраструктура просторових даних (NSDI) та Глобальна інфраструктура просторових даних (GSDI). Ці концепції постійно розвиваються і поступово впроваджуються, причому не лише на національному та глобальному рівнях, але також на рівні округів та муніципальних утворень. У узагальненому вигляді ці концепції включені до поняття Інфраструктури просторових даних (SDI, Spatial Data Infrastructure).

ГІС-мережа по суті є одним із методів впровадження та просування принципів SDI. Вона об'єднує безліч користувачів сайтів, сприяє публікації, пошуку та спільному використанню географічної інформації за допомогою World Wide Web.

Географічне знання спочатку є розподіленим та слабко інтегрованим. Вся необхідна інформація рідко міститься в окремому екземплярі бази даних із власною схемою даних. Користувачі ГІС взаємодіють один з одним з метою отримати відсутні частини наявних у них ГІС-даних. За допомогою ГІС-мереж користувачам простіше налагодити контакти та обмін накопиченими географічними знаннями.

До складу ГІС-мережі входять три основні будівельні блоки:

  • Портали каталогів метаданих, де користувачі можуть провести пошук і знайти ГІС-інформацію відповідно до їх потреб.
  • ГІС-вузли, де користувачі компілюють та публікують набори ГІС-інформації
  • Користувачі ГІС, які ведуть пошук, виявляють, звертаються та використовують опубліковані дані та сервіси

12.4. Каталоги ГІС-порталів

Важливим компонентом ГІС-мережі є каталог ГІС-порталу із систематизованим реєстром різноманітних місць зберігання даних та інформаційних наборів. Частина ГІС-користувачів діє як розпорядники даних, вони компілюють і публікують свої набори даних для спільного використання в різних організаціях. Вони реєструють свої інформаційні набори у каталозі порталу. Проводячи пошук за цим каталогом, інші користувачі можуть знайти потрібні їм інформаційні набори та звернутися до них.

Портал ГІС-каталогу - це Web-сайт, де користувачі ГІС можуть шукати і знаходити потрібну їм ГІС-інформацію. Можливості, що надаються, залежать від комплексу пропонованих мережевих сервісів ГІС-даних, картографічних сервісів і сервісів метаданих. Періодично сайт порталу ГІС-каталогу може проводити обстеження каталогів пов'язаних з ним сайтів-учасників з метоюопублікування та оновлення одного центрального ГІС-каталогу. Таким чином, ГІС-каталог може містити посилання на джерела даних, що є як на цьому, так і на інших сайтах. Передбачається, що буде створено серії таких каталожних вузлів, і на їх основі сформується спільна мережа – Інфраструктура просторових даних.

ГІС-дані та послуги документуються у вигляді каталожних записів у каталозі ГІС-порталу, за яким можна проводити пошук кандидатів для використання в різних ГІС-додатках.

Одним із прикладів порталу ГІС-каталогу є портал уряду США (Geospatial One-Stop, див. www.geodata.gov). Цей портал дозволить урядовим органам усіх рівнів та широкому загалу простіше, швидше та з меншими витратами звертатися до географічної інформації.

Інші схожі роботи, які можуть вас зацікавити.

4627. Інформаційна система Клініка 436.13 KB
Головна мета створення баз даних полягає в поєднанні функцій оновлення, ведення та поповнення збереженої інформації, а також довідкової функції. Основне характерне властивість бази даних - її незалежність від робочих програм, із якими вона взаємодіє.
6245. Корпоративна інформаційна система (КІС) 39.86 KB
Корпоративна інформаційна система КІС це сукупність інформаційних систем окремих підрозділів підприємства об'єднаних загальним документообігом таких, що кожна з систем виконує частину завдань з управління прийняттям рішень, а всі системи разом забезпечують функціонування підприємства відповідно до стандартів якості ISO 9000. Модульність Дозволяє розпаралелити підготовки персоналу та запуску системи в промислову експлуатацію. Ця вимога набуває...
1001. Інформаційна система у ВАТ Газпромнефть 44.35 KB
Цілі та завдання інформаційного забезпечення управління. Стратегія розвитку інформаційних систем управління. Інформаційне забезпечення управління діяльності керівника організації Про інформацію дуже багато говорять і лише деякі організації чітко і виразно формулюють вимоги до цього ресурсу необхідного для прийняття ефективних управлінських рішень.
7405. Маркетингова інформаційна система ТОВ «Рів'єра-Сочі» 1.96 MB
Об'єктом дослідження є маркетингова інформаційна система ТОВ Рів'єра-Сочі. Мета дослідження - розробка та впровадження маркетингової системи збору обробки та аналізу інформації з метою ефективного та раціонального використання ресурсів підприємства. У процесі роботи проводилися дослідження структури організації, аналіз її економічних показників. В результаті дослідження було розроблено модуль Опитування, який функціонує на сайті компанії ТОВ Рів'єра-Сочі з метою отримання необхідної інформації від споживачів.
11460. Управлінський облік як інформаційна система підприємства 64.49 KB
Перехід на МСФЗ – це новий погляд на бухгалтерський облік. Тепер дії бухгалтера вже не виконання вказівок, а власне професійне судження з усіх питань, пов'язаних з урахуванням, обмежене певними принципами, запропонованими МСФЗ.
17542. Інформаційна система товарного постачання для супермаркету 79.67 KB
У програмах зберігаються електронні дані про запаси, які постійно використовуються для швидкого вирішення стандартних питань, для чого в іншому випадку довелося б працювати безпосередньо із запасами. Для сучасних супермаркетів характерною є наступні ознаки: - значний обсяг торгової площі від 200 м2 і більше; - значна кількість відділів у яких представлена ​​різноманітна продукція м'ясні фруктово-овочеві молочні продукти хліб хлібобулочні вироби та випічка кондитерські тютюнові парфумерні...
19833. Інформаційна система. Класифікація ІВ. Структурні складові корпоративних ІС 33.24 KB
Для бізнесу такими завданнями є підвищення рентабельності, зростання продажів, зниження витрат, зниження ризиків та загальна стабілізація становища на ринку. Для держави важливо з найменшими витратами вирішити спектр соціальних економічних оборонних та інших завдань. Певний прорив стався у 2005 році, коли вперше для автоматизації бізнес-процесів було впроваджено повномасштабне комп'ютерне управління. Для прикладу можна згадати новітні інформаційні технології, які характеризуються відносно невеликими обсягами необхідних...
12160. Інформаційна система «Архіви Російської академії наук» (ІСАРАН) 17.86 KB
Короткий опис розробки. Програмне забезпечення ІСАРАН створено в популярному середовищі візуальної розробки Delphi Дельфі клієнт-серверна версія та адаптоване до специфіки відомчого Архівного фонду РАН. Переваги розробки та порівняння з аналогами. Області комерційного використання.
12142. Інформаційна система моніторингу науково-технічного потенціалу регіону 17.24 KB
Інформаційна система є програмноінформаційним комплексом призначеним для оперативного аналітичного обліку та контролю показників науковотехнічного потенціалу на основі даних різних статистичних показників аналізованих за авторською методикою. Розроблена прикладна ІС має наступні переваги: ​​адаптованість для широкого класу показників; наступність нових інформаційних технологій; автоматизація значної кількості функцій здійснюваних при оцінці науковотехнічного потенціалу. Продукт...
12060. Багатофункціональна інтегруюча інформаційна система моніторингу водних об'єктів (МІСМ ВО) 17.91 KB
Багатофункціональна інтегруюча інформаційна система моніторингу водних об'єктів МІСМ ВО розроблена на базі портальної webтехнології і дозволяє інтегрувати і обробляти дані про стан водних об'єктів ВО, що одержуються від усіх можливих джерел контролю стану ВО, включаючи автоматичні пости моніторингу АПМ на різних рівнях, окремі ВО їх гідрографічна мережа. і країни загалом комплекс ВО наприклад каскад водосховищ водний басейн для забезпечення оптимального управління.

Розподілені інформаційні системи.

Архітектура на основі Internet/Intranet з мігруючими програмами

Розподілена система

У літературі можна знайти різні визначення розподілених систем, причому жодна з них не є задовільною і не узгоджується з іншими.

Для наших завдань досить достатньо вільної характеристики.

Розподілена система- це набір незалежних обчислювальних машин, що представляється їх користувачам єдиною системою об'єднаної.

У цьому вся визначенні обумовлюються два моменти. Перший відноситься до апаратури: всі машини автономні.

Друге стосується програмного забезпечення: користувачі думають, що мають справу з єдиною системою. Важливі обидва моменти. Пізніше в цьому розділі ми повернемося до них, але спочатку розглянемо деякі базові питання, що стосуються як апаратного, так і програмного забезпечення.

Характеристики розподілених систем:

1. Від користувачів приховані відмінності між комп'ютерами та способи зв'язку між ними. Те саме стосується і зовнішньої організації розподілених систем.

2. Користувачі та додатки однаково працюють у розподілених системах, незалежно від того, де і коли відбувається їхня взаємодія.

Розподілені системи повинні також відносно легко піддаватися розширенню або масштабуванню. Ця характеристика є прямим наслідком наявності незалежних комп'ютерів, але водночас не показує, як ці комп'ютери насправді об'єднуються у єдину систему.

Розподілені системи зазвичай існують постійно, проте деякі їх частини можуть тимчасово виходити з ладу. Користувачі та додатки не повинні повідомлятися про те, що частини системи замінені або полагоджені або додані нові для підтримки додаткових користувачів.

Для того, щоб підтримати уявлення системи в єдиному вигляді, організація розподілених систем часто включає додатковий рівень програмного забезпечення, що знаходиться між верхнім рівнем, на якому знаходяться користувачі і програми, і нижнім рівнем, що складається з операційних систем.

Мал. 1.1. Розподілена система організована як служби проміжного рівня.

Відповідно, така розподілена система зазвичай називається системою проміжного рівня (middleware).Зазначимо, що проміжний рівень розподілено серед багатьох комп'ютерів.