Как получать знания. чем знания отличаются от данных и информации. Знания vs данные

Все знают, что такое базы данных и как ими пользоваться. Созданы и постоянно расширяются самые разнообразные базы данных по любой тематике, от научной периодики до художественной литературы, от произведений искусства до справочников телефонных номеров.

Но это необходимое образование постепенно начинает терять свою былую значимость. Особенно это касается научной периодики. Главная проблема научных баз данных - это их избыточность. Любой запрос, выполненный по ключевым поисковым словам, выдаст столь огромное количество ссылок, что их просмотр становится отдельной работой. При этом многие материалы различаются столь незначительно, что трудно оценить полезность одного из них на фоне другого.

Вариантом выхода из этой ситуации является создание баз знаний или баз решений: систематезированной информации, которая обрабатывается по другим поисковым алгоритмам.

В чём главное отличие баз данных и баз знаний? В базе данных идёт поиск по ключевому слову, условно говоря - это ответ на вопрос “что?”. Например, задаём поисковый запрос “нанотрубки”. База данных выдаст всё, что касается этого запроса: и синтез, и окисление, и биоразложение, и спектральные характеристики. Число ссылок перевалит за тысячи. Можно задавать поиск по двум, трём и более ключевым словам. Это сократит вал ссылок, но может отсечь нужные. В базе знаний поиск проводится по нескольким вопросам, например: “Что?”, “Чем?”, “Как?”. При этом появляется следующий момент. В настоящее время написаны миллионы статей и патентов по всем областям знания. Но решений, отвечающих принципу базы знаний, только порядка 30 - 35 тысяч. Прирост числа решений, в отличие от прироста вала статей, протекает медленно. Подавляющее большинство статей - это лишь небольшие нюансы какого-либо решения. Например: закалка металла. Решение - что: металл, чем: охлаждающий материал, как: быстро. Это решение охватывает и все металлы и сплавы, и все типы закалочных жидкостей или газов, и все способы подачи хладагента. Далее из этого запроса может быть сформирована база данных, например, по типам хладагента (вода, масло, рассолы), вторая - по способам подачи материала (насосы, окунание детали, распыление раствора), третья - по маркам сталей. Может быть сформирована дополнительная база ссылок по второстепенным процессам: окислению поверхности металла, удалению нагара после закалки, специальным методам закалки. Поиск по базе знаний отличается от поиска по базе данных, для этого используются так называемые “ресурсы”. Ресурсы в понимании баз знаний - это материалы, катализаторы, поля и воздействия, приводящие к получению решения. Базы знаний могут обрабатывать также поисковые вопросы. Например, запрос “синтезировать сложный эфир” заданный в базу данных будет истолкован только по ключевому слову “сложный эфир”. В базе знаний можно также задать термины “синтез”, “распад”, “биоразложение” и семантические алгоритмы поиска по глаголам.

Теперь немного о минусах этой системы. Базы данных - это устоявшиеся правила формирования ключевых слов, единые (с небольшими вариациями) для всех научных изданий и унифицированные с алгоритмами поиска. Базы знаний необходимо будет создавать с нуля. Это немалая работа, ведь для того, чтобы вычленить ресурсы необходимо полное понимание процессов описанных в статье или патенте, что сильно усложняется при обработке мультидисциплинарных статей и защищённых от реинжиниринга патентов. Второй минус - базы знаний сейчас создаются “под инженеров”, то есть в основном прикладной направленности. Фундаментальные исследования, таким образом, в них не попадают.

Теперь немного о плюсах. Создание базы знаний - это великолепный процесс обучения. “Побочным продуктом” является значительное повышение уровня знаний разработчиков и получение высококлассных специалистов, умеющих решать поставленныезадачи. Второй плюс - при определённом алгоритме формирования запросов база знаний может быть источником новых решений, не описанных и ещё не созданных. Например, при запросе по закалке металла база знаний может выдать список ресурсов, которые обладают необходимыми свойствами (температура, текучесть) и подтолкнуть к созданию новых решений, таких как закалка в расплавах полимеров, закалка с одновременным окислением поверхности, точечная и неравномерная закалка. Третий плюс. Вероятно, многие даже не задумывались, что суть процессов изложенных в научной статье или патенте формулируется не более чем в сотне слов. В то же время, объём статей исчисляется минимум несколькими страницами, а патентов - до нескольких сотен страниц. Переработка материала под систему базы знаний позволит в дальнейшем не тратить время на чтение малозначащих подробностей и отличий от аналогов, непременно описываемых в исходных материалах.

Небольшой итог. Базы знаний исключительно полезны для прикладных разработок, особенно на передовых рубежах науки. Они позволяют получать готовые решения для той или иной задачи. Их создание в то же время, сильно повышает профессиональный уровень разработчиков и позволяет получать отличных специалистов.

Глава 1 Основные понятия

В этой книге описываются методы обработки информации, представленной в различной форме - в виде «данных», «знаний», «структур» и т. д. В основе анализа всех этих видов информации лежат две процедуры: процедура обнаружения закономерностей, содержащихся в представленной информации, и процедура использования обнаруженных закономерностей для предсказания значения одной части информации по известным значениям другой ее части. Но прежде чем переходить к описанию этих процедур, нужно пояснить смысл употребляемых в книге терминов, в частности таких распространенных, как данные, знания, гипотеза, закономерность и т. п.

§ 1. Чем отличаются «данные» от «знаний»?

Исходная информация, которую нужно обрабатывать, чаще всего имеет вид числовых таблиц (матриц), состоящих из строк и столбцов. Строки отражают информацию об изучаемых объектах или явлениях, а столбцы отражают свойства (признаки, характеристики) этих объектов или явлений. Природа объектов может быть любой - это могут быть физические тела, живые организмы, сигналы, отдельные социальные процессы, заводы, виды спорта, месторождения и т. д. Понятно, что набор признаков, описывающих эти объекты, будет в каждом случае своим и должен отражать их наиболее важные свойства.

На пересечении -й строки и -го столбца указывается значение -го признака у -го объекта. Такой факт (например, что -й дом имеет высоту 12 м) считаем атомарной частью данных о конкретном -м объекте. Полные данные об -м объекте содержатся в совокупности всех элементов -й строки. Информация же о всех заданных свойствах всех изучаемых объектов, записанная в таблице «объект-свойство», и называется таблицей данных. Таким образом, данные представляют собой совокупность отдельных конкретных фактов.

Пусть в таблице данных представлены описания большого количества жилых домов, а нас интересуют только три свойства этих домов: из какого материала они построены, в какой цвет покрашены их стены и какой они высоты. После изучения таблицы данных мы можем обнаружить некоторые закономерности. Например, выясняется, что все панельные дома, окрашенные в серый цвет, имеют высоту от 15 до 25 м, панельные зеленые дома - от 8 до 16 м, а кирпичные, вне зависимости от цвета стен, имеют высоту меньше 10 м. Обозначим признак «вид строительного материала» через . Этот признак принимает два понятных значения: (панель) или (кирпич). Признак «цвет стен», обозначаемый через принимает значения: = серый, = зеленый или = любой. Признак «высота» может принимать любое числовое значение от нуля до 30 м. Тогда обнаруженные закономерности можно сжато записать в виде таких логических высказываний:

Эти высказывания не содержат информации в виде конкретных характеристик каждого отдельного дома, но зато отражают наши знания о некоторых обобщенных характеристиках всех домов, описанных в таблице данных.

Так выглядит переход от данных к знаниям. Знания представляют собой краткое обобщенное описание основного содержания информации, представленной в данных. Знания могут быть представлены в различной форме. В дальнейшем мы будем пользоваться приведенной выше формой в виде логических правил типа «если... то...».

Презентация без названия

Ба́за да́нных определение

Представленная в объективной форме совокупность самостоятельных материалов (статей, расчётов, нормативных актов, судебных решений и иных подобных материалов), систематизированных таким образом, чтобы эти материалы могли быть найдены и обработаны с помощью электронной вычислительной машины (ЭВМ).

База данных - совокупность данных, хранимых в соответствии со схемой данных, манипулирование которыми выполняют в соответствии с правилами средств моделирования данных.

База данных - совокупность данных, организованных в соответствии с концептуальной структурой, описывающей характеристики этих данных и взаимоотношения между ними, причём такое собрание данных, которое поддерживает одну или более областей применения.

База данных - организованная в соответствии с определёнными правилами и поддерживаемая в памяти компьютера совокупность данных, характеризующая актуальное состояние некоторой предметной области и используемая для удовлетворения информационных потребностей пользователей.

База данных - некоторый набор перманентных (постоянно хранимых) данных, используемых прикладными программными системами какого-либо предприятия.

База данных - совместно используемый набор логически связанных данных (и описание этих данных), предназначенный для удовлетворения информационных потребностей организации.

База знаний

База знаний (БЗ; англ. knowledge base, KB) в информатике и исследованиях искусственного интеллекта - это особого рода база данных, разработанная для оперирования знаниями (метаданными). База знаний содержит структурированную информацию, покрывающую некоторую область знаний, для использования кибернетическим устройством (или человеком) с конкретной целью. Современные базы знаний работают совместно с системами поиска информации, имеют классификационную структуру и формат представления знаний.

Полноценные базы знаний содержат в себе не только фактическую информацию, но и правила вывода, допускающие автоматические умозаключения о вновь вводимых фактах и, как следствие, осмысленную обработку информации. Область наук об искусственном интеллекте, изучающая базы знаний и методы работы со знаниями, называется инженерией знаний.

Иерархический способ представления в базе знаний набора понятий и их отношений называется онтологией. Онтологию некоторой области знаний вместе со сведениями о свойствах конкретных объектов также можно назвать базой знаний.

Отличия

База знаний - семантическая модель, описывающая предметную область и позволяющая отвечать на такие вопросы из этой предметной области, ответы на которые в явном виде не присутствуют в базе. База знаний является основным компонентом интеллектуальных и экспертных систем.

База данных - совокупность связанных данных, организованных по определенным правилам, предусматривающим общие принципы описания, хранения и манипулирования, независимая от прикладных программ. База данных является информационной моделью предметной области. Обращение к базам данных осуществляется с помощью системы управления базами данных (СУБД)

Основные свойства

Основные определения. Информация, с которой имеют дело ЭВМ, разделяется на процедурную и декларативную. Процедурная информация овеществлена в программах, которые выполняются в процессе решения задач, декларативная информация - в данных, с которыми эти программы работают. Стандартной формой представления информации в ЭВМ является машинное слово, состоящее из определенного для данного типа ЭВМ числа двоичных разрядов - битов. Машинное слово для представления данных и машинное слово для представления команд, образующих программу, могут иметь одинаковое или разное число разрядов. Одинаковое число разрядов в машинных словах для команд и данных позволяет рассматривать их в ЭВМ в качестве одинаковых информационных единиц и выполнять операции над командами, как над данными. Содержимое памяти образует информационную базу. Машинное слово является основной характеристикой информационной базы, т.к. его длина такова, что каждое машинное слово хранится в одной стандартной ячейке памяти, снабженной индивидуальным именем - адресом ячейки. По этому имени происходит извлечение информационных единиц из памяти ЭВМ и записи их в нее. В языках программирования высокого уровня используются абстрактные типы данных, структура которых задается программистом. Появление баз данных (БД) знаменовало собой еще один шаг на пути организации работы с декларативной информацией. В базах данных могут одновременно храниться большие объемы информации, а специальные средства, образующие систему управления базами данных (СУБД), позволяют эффективно манипулировать с данными, при необходимости извлекать их из базы данных и записывать их в нужном порядке в базу. По мере развития исследований в области ИС возникла концепция знаний, которые объединили в себе многие черты процедурной и декларативной информации. В ЭВМ знания так же, как и данные, отображаются в знаковой форме - в виде формул, текста, файлов, информационных массивов и т.п. Поэтому можно сказать, что знания - это особым образом организованные данные. В системах ИИ знания являются основным объектом формирования, обработки и исследования. База знаний, наравне с базой данных, - необходимая составляющая программного комплекса ИИ. Машины, реализующие алгоритмы ИИ, называются машинами, основанными на знаниях, а подраздел теории ИИ, связанный с построением экспертных систем, - инженерией знаний. отличия между данными и знаниями: 1. внутренняя интерпретируемость знаний (например: данные – 243849..., знания – предложения естественного языка) 2. активность знаний. Если есть знания, то появления новых знаний может привести к изменению старых знаний и появлению новых. 3. связность знаний. Знания не интересны сами по себе, они интересны в совокупности (система знаний). 4. знания динамичны, а данные как правило статичны Интенсиональные знания определяются через понятие более высокого уровня с указанием специфических

Отличия знаний от данных

Информация, данные, знания

Информация существует в трех видах: в виде данных (Data ), собственно информации (Information ) и знаний (Knowledge ).

При компьютерной обработке информации исходные данные понимаются как данные , и должны быть представлены в форме, которую можно хранить, обрабатывать, передавать.

Данные – зафиксированные наблюдения, которые в данный момент времени не оказывают воздействия на принятие решения.

Данные обычно представлены в форме, которая позволяет использовать их для компьютерной обработки и передачи, то есть, закодированы, могут храниться.

Примеры данных: словарь – упорядоченный набор текстовых данных, энциклопедия – упорядоченный набор данных, произвольный текст (статья, конспект).

Из данных можно извлечь информацию.

Информация – это обработанные данные, которые представлены в виде, пригодном для принятия получателем решения.

Примеры информации: извлеченное из словаря толкование слова, извлеченное из энциклопедии значение термина.

Информацией является содержание, значение данных, или факты, которые используются для принятия решения.

Знания – факты, сообщения об окружающей среде, процедуры и правила манипулирования фактами, а также информация о том, когда и как следует применять эти процедуры и правила.

В целом, знания – это проверенный практикой результат познания действительности, вид информации, которая отображает знания человека, специалиста в предметной области.

Знания различаются: есть декларативные (факты) и процедурные (правила). Декларативные, это знания об определенных явлениях, событиях, свойствах объектов («Я знаю, что…»). Процедурные, это знания о действиях, которые нужно предпринять для достижения какой-либо цели («Я знаю, как…»).

Отличия знаний от данных

1. Интерпретация . Хранимые данные могут быть интерпретированы только человеком или программой. Данные не несут информации. Знания содержат как данные, так и их описание (правила интерпретации).

2. Наличие связей классификации . Данные не имеют эффективного описания связей между различными типами данных. Знания структурированы, так как можно установить соответствие между единицами знаний.

3. Наличие ситуационных связей . Связи описывают множество текущих ситуаций объекта. Данные трудно поддаются анализу. Из структуры и состава знаний по ситуации возможно построение процедур анализа знаний.

Подходы к определению количества информации
(способы измерения информации)

В теории информации доказано, что информация допускает количественную оценку, то есть может быть измерена объективно.

Очевидно, что для этого нужно сделать допущения: в определенных условиях можно пренебречь качественными особенностями информации. Тогда количество информации может быть измерено числом, следовательно, можно сравнить количество информации, содержащейся в различных сообщениях.

Знание и информация – важные составляющие нашей жизни. Полностью отождествлять между собой эти термины нельзя. Рассмотрим, что подразумевается под каждым из них и чем отличается знание от информации.

Определение

Знание – систематизированные достоверные представления о предметах и явлениях действительности. Знание применяется людьми для рациональной организации своей деятельности и решения возникающих задач.

Информация – сведения о понятиях, фактах, событиях и т. д., в передаче и принятии которых могут участвовать люди или специальные устройства. Животные сообщают друг другу особую информацию с помощью сигналов. Существует также генетическая информация, передаваемая одним организмом другому.

Сравнение

Коренным фактором, позволяющим выявить отличие знания от информации, является то, что знание приобретается только через субъективное осмысление. Информация же независима и не всегда доходит до стадии осознания.

В познавательном процессе знание и информация находятся на разных ступенях. Сначала происходит восприятие информации, транслируемой определенным источником: книгой, интернетом, преподавателем… После осмысления информация результируется в знание. Обладающий знанием способен выполнять роль нового источника информации.

Таким образом, транслируется и принимается только информация, но знание передать невозможно. Для того чтобы стать обладателем знания, необходимо воспринять нужную информацию и провести ее через собственное сознание.

Например, учитель математики обладает знаниями в области своего предмета. Объясняя классу способ решения задачи, он не передает непосредственно знания, а является источником информации. У учеников смогут сформироваться знания, только когда они не просто прослушают учителя, но и поймут, осознают то, что он пытается им донести.

Рассматривая, в чем разница между знанием и информацией, следует отметить, что избытка знания быть не может. Ведь человек стремится осмыслить лишь то, что ему действительно важно и необходимо. Информация же может поступать в избытке, люди нередко чувствуют перенасыщение ею. Из всего объема информации для получения знаний используется малая часть.

Именно знания являются критерием образованности человека. Ведь недостаточно только ознакомиться с информацией – необходимо проделать и немалый умственный труд.