что такое база знаний в информатике

База знаний

База знаний (БЗ; англ. knowledge base, KB ) в информатике и исследованиях искусственного интеллекта — это особого рода база данных, разработанная для оперирования знаниями (метаданными). База знаний содержит структурированную информацию, покрывающую некоторую область знаний, для использования кибернетическим устройством (или человеком) с конкретной целью. Современные базы знаний работают совместно с системами поиска информации, имеют классификационную структуру и формат представления знаний.

Полноценные базы знаний содержат в себе не только фактическую информацию, но и правила вывода, допускающие автоматические умозаключения о вновь вводимых фактах и, как следствие, осмысленную обработку информации. Область наук об искусственном интеллекте, изучающая базы знаний и методы работы со знаниями, называется инженерией знаний.

Иерархический способ представления в базе знаний набора понятий и их отношений называется онтологией. Онтологию некоторой области знаний вместе со сведениями о свойствах конкретных объектов также можно назвать базой знаний.

Содержание

Применение баз знаний

База знаний — важный компонент интеллектуальной системы. Наиболее известный класс таких программ — это экспертные системы. Они предназначены для поиска способов решения проблем из некоторой предметной области, основываясь на записях БЗ и на пользовательском описании ситуации.

Простые базы знаний могут использоваться для создания экспертных систем хранения данных в организации: документации, руководств, статей технического обеспечения. Главная цель создания таких баз — помочь менее опытным людям найти уже существующее описание способа решения какой-либо проблемы.

Базы знаний и интеллектуальные системы

Двумя наиболее важными требованиями к информации, хранящейся в базе знаний интеллектуальной системы, являются:

Ниже перечислены некоторые из особенностей, которые могут (но не обязаны) быть у системы, оперирующей базами знаний.

Базы знаний на примере языка Пролог

В языке Пролог базы знаний описываются в форме конкретных фактов и правил логического вывода над базами данных и процедурами обработки информации, представляющих сведения и знания о людях, предметах, фактах событиях и процессах в логической форме. В ответах на простейшие запросы к базам знаний система логического программирования Пролог выдает значения «истина» и «ложь» в зависимости от наличия соответствующих фактов.

Обобщённые сведения в языке Пролог задаются с помощью правил логического вывода, выполняющих роль определения понятий, а также логических процедур, состоящих из наборов правил логического вывода. Достоверность обобщенных сведений зависит от наличия необходимых фактов и достоверности данных в базах знаний.

См. также

Литература

Ссылки

что такое база знаний в информатике. Смотреть фото что такое база знаний в информатике. Смотреть картинку что такое база знаний в информатике. Картинка про что такое база знаний в информатике. Фото что такое база знаний в информатике

что такое база знаний в информатике. Смотреть фото что такое база знаний в информатике. Смотреть картинку что такое база знаний в информатике. Картинка про что такое база знаний в информатике. Фото что такое база знаний в информатике Инженерия знаний
Общие понятияДанные · Метаданные · Знания · Метазнание · Представление знаний · База знаний · Онтология · Семантическая паутина
Жёсткие моделиПродукции · Семантические сети · Фреймы · Логическая модель
Мягкие методыНейросети · Эволюционное моделирование · Нечёткая логика
ПримененияЭкспертные системы · Интеллектуальный анализ данных · Извлечение информации · Виртуальные собеседники · Гибридные интеллектуальные системы
Искусственный интеллект · Машинное обучение · Обработка естественного языка

Полезное

Смотреть что такое «База знаний» в других словарях:

база знаний — БЗ 1. Набор знаний, касающийся определенной предметной области и записанный на каком либо языке представления знаний. 2. Информационный ресурс, позволяющий получать ответы или подсказки на плохо формализованные запросы или на запросы с неполными… … Справочник технического переводчика

База знаний — семантическая модель, описывающая предметную область и позволяющая отвечать на такие вопросы из этой предметной области, ответы на которые в явном виде не присутствуют в базе. База знаний является основным компонентом интеллектуальных и… … Финансовый словарь

БАЗА ЗНАНИЙ — Один или несколько специальным образом организованных файлов, хранящих систематизированную совокупность понятий, правил и фактов, относящихся к некоторой предметной области. Содержимое Б.З. оформляется, связывается между собой и представляется… … Словарь бизнес-терминов

База знаний — База знаний: организованное управляемое хранилище технической информации, представленной в назначенно клиаративном виде. Источник: ИНФОРМАЦИОННОЕ ОБЕСПЕЧЕНИЕ ТЕХНИКИ И ОПЕРАТОРСКОЙ ДЕЯТЕЛЬНОСТИ. ЯЗЫК ОПЕРАТОРСКОЙ ДЕЯТЕЛЬНОСТИ. ОБЩИЕ ПОЛОЖЕНИЯ.… … Официальная терминология

база знаний — 3.2 база знаний: Организованное управляемое хранилище технической информации, представленной в назначенно клиаративном виде. Источник: ГОСТ Р 43.2.1 2007: Информационн … Словарь-справочник терминов нормативно-технической документации

База знаний — совокупность систематизированных основополагающих сведений, относящихся к определённой области знания, хранящихся в памяти ЭВМ, объём которых необходим и достаточен для решения заданного круга теоретических или практических задач. В системе… … Педагогический терминологический словарь

База знаний — совокупность формализированных знаний об определенной предметной области, представленных в виде фактов и правил. (Ст.1 Закона Республики Беларусь Об информатизации ) … Право Белоруссии: Понятия, термины, определения

база знаний по безопасности — — [Интент] Тематики информационные технологии в целом EN knowledge base under security … Справочник технического переводчика

сеттлизированная база знаний — 3.1.21 сеттлизированная база знаний: Упорядоченное представление технической информации в виде базы знаний с применением моделинг ноонинга, ноон моделирования технических сведений, содержащихся в ней. Источник … Словарь-справочник терминов нормативно-технической документации

УЧЕБНАЯ БАЗА ЗНАНИЙ — (УБЗ) обучающая программная система, ориентированная на некоторую предметную область. В УБЗ предполагается наличие базы данных предметной области, содержащей описание основных понятий, стратегию и тактику решения задач, комплекс примеров или… … Профессиональное образование. Словарь

Источник

Базы знаний. Часть 1 — введение

Одной из причин слабого использования Linked Data-баз знаний в обычных, ненаучных приложениях является то, что мы не привыкли придумывать юзкейсы, видя перед собой только данные. Трудно спорить с тем, что сейчас в России производится крайне мало взаимосвязанных данных. Однако это не значит, что разработчик, создающий приложение для русскоязычной аудитории совсем уж отрезан от мира семантического веба: кое-что всё-таки у нас есть.
что такое база знаний в информатике. Смотреть фото что такое база знаний в информатике. Смотреть картинку что такое база знаний в информатике. Картинка про что такое база знаний в информатике. Фото что такое база знаний в информатике
Основными источниками данных для нас являются международные базы знаний, включающие русскоязычный контент: DBpedia, Freebase и Wikidata. В первую очередь это справочные, лингвистические и энциклопедические данные. Каждый раз когда вам в голову приходит мысль распарсить кусочек википедии или викисловаря — ущипните себя как следует и вспомните о том, что всё, что хранится в категориях, инфобоксах или таблицах, уже распарсено и доступно через API с помощью SPARQL или MQL-интерфейса.

Я попробую привести несколько примеров полезных энциклопедических данных, которые вы не найдете нигде, кроме Linked Data.

Эта статья — первая из цикла Базы знаний. Следите за обновлениями.

Городах, страны, исторические данные

Как и везде в семантической паутине мы будем получать списки объектов, связанных с другими объектами и порой указывающими на альтернативные описания в других базах данных. Мне на ум сразу приходят туристические приложения: пользователю можно предоставить не просто возможность «посмотреть достопримечательности в районе Московского проспекта», но позволить ему отфильтровать только объекты, относящиеся к неоклассицизму первой четверти XX века. А если вы задействуете дерево категорий DBPedia, но можете предложить пользователю еще и связанные стили, например, ранний модерн.

Некоторые географические точки привязаны к событиям — про них тоже можно узнать довольно многое. Так например, довольно просто получить соотношение сил и количество убитых в Куликовской или Бородинской битвах. Разумеется, не забыты и персоналии, с которыми связаны события.

Данные об институтах, организациях, госструктурах

Композиторы, музыканты, фильмы

Насчет фильмов все выглядит более чем крепко: Freebase, Dbpedia и Linkedmdb располагают очень и очень неплохими массивами данных на тему кинематографии.
ileriseviye.wordpress.com/2012/07/11/is-semantic-web-and-linked-data-good-enough-sparql-dbpedia-vs-python-imdbpy
Мы не только легко можем посмотреть, какой актер где снимался, в каком году вышел фильм и кто его выпустил, но еще и узнать, кто повлиял на актёра, когда он родился, что у него с семейным положением и занимается ли он чем-либо, кроме съемок.
что такое база знаний в информатике. Смотреть фото что такое база знаний в информатике. Смотреть картинку что такое база знаний в информатике. Картинка про что такое база знаний в информатике. Фото что такое база знаний в информатике

Например, вот этот запрос к Dbpedia выведет всех актеров, которые снимались и в фильме The Shining, и в фильме Hoffa:

что такое база знаний в информатике. Смотреть фото что такое база знаний в информатике. Смотреть картинку что такое база знаний в информатике. Картинка про что такое база знаний в информатике. Фото что такое база знаний в информатике

Самым замечательным источником данных в области музыки, пожалуй, является MusicBrainz. Конечно же, он есть и в RDF, и конечно же, вы будете использовать традиционные API чтобы получить к ним доступ. Однако Freebase и Dbpedia могут пригодиться и тут — в последней есть, например, информация о гастролях музыкальных групп. Ну и даты рождения, влияние, стили и жанры — энциклопедические данные для музыки тоже присутствуют. Собственно в обучающих материалах Freebase используется как раз музыкальный пример: доставание данных о группе The Police:

Наверное, интересно было бы использовать это в связке с API Last.fm

Персоналии: политики, спортсмены, исторические фигуры

Лингвистические приложения. Иерархия категорий

Для нужд классификации и кластеризации, а также задач математической лингвистики часто нужны иерархии понятий. Например, что палец является разновидностью части тела. Semantic Web спешит на помощь и позволяет вам не парсить категории википедии, а доставать их готовыми из Dbpedia или www.mpi-inf.mpg.de/yago-naga YAGO. Если же размер иерархии для вас менее важен, чем её качество, вы можете поглядеть на созданные вручную онтологии Dbpedia, Cyc, Umbel.

Лингвистические приложения. Викисловарь и переводы

В конце 2012 года команда Dbpedia запустила проект Wiktionary — доступ к Викисловарю как к базе данных. Сейчас можно делать запросы к английскому, немецкому, французскому, русскому, греческому и вьетнамскому языкам. Давайте попробуем вытащить переводы для какого-нибудь хорошего русского слова через SPARQL-точку Wiktionary:

что такое база знаний в информатике. Смотреть фото что такое база знаний в информатике. Смотреть картинку что такое база знаний в информатике. Картинка про что такое база знаний в информатике. Фото что такое база знаний в информатике

Среди Semantic Web энтузиастов немало лингвистов, а потому лингвистический мир имеет своё собственное облако взаимосвязанных данных.
что такое база знаний в информатике. Смотреть фото что такое база знаний в информатике. Смотреть картинку что такое база знаний в информатике. Картинка про что такое база знаний в информатике. Фото что такое база знаний в информатике

Много полезной информации по Linked и не-Linked данным можно получить c порталов Open Knowledge Foundation и нашего русского NLPub.

Как находить хорошие данные

Для Freebase на главной странице есть визуализация того, какие категории содержат наибольшее количество объектов.
что такое база знаний в информатике. Смотреть фото что такое база знаний в информатике. Смотреть картинку что такое база знаний в информатике. Картинка про что такое база знаний в информатике. Фото что такое база знаний в информатике
Для DBPedia простой способ понять, где скрываются качественные данные тоже есть. Надо обратиться к приложению Mappings.DBpedia и его статистической сводке.
Маппинги — это отличный инструмент, позволяющий пользователям DBpedia влиять на то, как работают парсеры. Я обязательно расскажу про них подробнеев последующих статьях, а пока ограничимся вот этой страницей:
что такое база знаний в информатике. Смотреть фото что такое база знаний в информатике. Смотреть картинку что такое база знаний в информатике. Картинка про что такое база знаний в информатике. Фото что такое база знаний в информатике

В ячейках написаны названия википедических шаблонов. Более красные ячейки содержат данные, распарсенные полностью автоматически, более зеленые указывают на то, что парсинг производился с участием людей, а потому качество данных должно быть выше.

Поиск

Ну а что тут сказать, поиск он и есть поиск. Мы используем движки Sig.ma, Sindice и Swoogle. Все они позволяют искать внутри одного датасета или же по всему множеству LInked Data.

В следующий раз я постараюсь описать то, как научиться строить SPARQL-запросы к базе знаний Dbpedia.

Источник

База знаний — для кого и для чего?

что такое база знаний в информатике. Смотреть фото что такое база знаний в информатике. Смотреть картинку что такое база знаний в информатике. Картинка про что такое база знаний в информатике. Фото что такое база знаний в информатике

Прежде всего, следует определить, что же понимается под базой знаний. Википедия — один из наиболее широко известных информационных ресурсов дает следующее определение: «База знаний в информатике и исследованиях искусственного интеллекта (БЗ; англ.knowledge base, KB) — это особого рода база данных, разработанная для оперирования знаниями (метаданными). Простые базы знаний могут использоваться для создания экспертных систем хранения данных в организации: документации, руководств, статей технического обеспечения. Главная цель создания таких баз — помочь менее опытным людям найти уже существующее описание способа решения какой-либо проблемы» (http://ru.wikipedia.org/wiki/База_знаний).

Определение базы знаний в управленческом смысле можно уточнить: «База знаний представляет собой четко структурированное хранилище непрерывно актуализируемой информации, необходимой для эффективной работы компании». При этом совершенно четко прослеживается место базы знаний в системе развития персонала (рис. 1).

что такое база знаний в информатике. Смотреть фото что такое база знаний в информатике. Смотреть картинку что такое база знаний в информатике. Картинка про что такое база знаний в информатике. Фото что такое база знаний в информатике

База знаний должна применяться не только как коррелирующий с моделью компетенций компании инструмент для самооценки или же самостоятельного обучения сотрудников, но и справочная база, используемая в повседневной работе.

Тогда из каких же элементов в этом случае должна состоять база знаний для решения поставленных задач — самооценка, самообучение и работа? (рис. 2).

что такое база знаний в информатике. Смотреть фото что такое база знаний в информатике. Смотреть картинку что такое база знаний в информатике. Картинка про что такое база знаний в информатике. Фото что такое база знаний в информатике

Представляются целесообразными следующие составляющие базы знаний:
• тематические учебные курсы;
• нормативно-техническая документация;
• научные публикации;
• инструкции по эксплуатации оборудования;
• итоги форумов и конференций;
• результаты научно-исследовательских работ.

Понятно, что каждый документ, поступающий в такую базу знаний, должен проходить процедуру библиографического описания. При этом важно оценивать, какому именно специалисту он необходим в профессиональной деятельности.

Рассмотрим каждый из элементов базы знаний более подробно.


ТЕМАТИЧЕСКИЕ УЧЕБНЫЕ КУРСЫ

В случае, когда в компании существует модель компетенций, содержащая, в том числе, и требования к направлениям и уровням знаний и умений специалистов, занимающих различные должностные позиции, становится возможным организовать индивидуальное, «точечное» развитие персонала. После определения текущего уровня компетентности специалистов по их профилям и сопоставления с существующими требованиями можно четко формировать программы обучения, ориентированные на каждого конкретного специалиста. В этом случае возможно весьма существенное сокращение расходов компании на обучение сотрудников (что особенно актуально для организаций, имеющих большой штат) без снижения качества персонала.

Формирование перечня курсов может осуществляться как за счет программ, заказанных у различных учебных заведений, так и за счет программ, разработанных учебными центрами самой компании, в случае, если они существуют. При этом должно обеспечиваться соблюдение единого стандарта качества подготовки специалистов.

Интересный пример можно привести из опыта общения с техническими специалистами энергетических компаний. Во время семинара обсуждался вопрос, какие знания и умения им необходимы в работе. До тех пор, пока обсуждалось обслуживание оборудования, по которому имеются учебно-методические материалы, вся группа считала, что данную тему нужно знать очень хорошо. Как только переходили к вновь вводимому оборудованию, по которому учебных и справочных материалов нет, большинство специалистов настаивало на том, что это им не нужно.

К сожалению, эта картина характерна для большинства компаний. И хотя многие говорят о техническом перевооружении, вопрос подготовки персонала под такое перевооружение почему-то возникает уже после проведения реконструкции и модернизации оборудования.

НОРМАТИВНО-ТЕХНИЧЕСКАЯ ДОКУМЕНТАЦИЯ

Здесь должны содержаться как документация федерального уровня (разумеется, имеющая отношение к деятельности соответствующей компании), так и внутренние приказы, положения и прочие документы, действующие в самой организации. Следует отметить, что для эффективности базы знаний действующие версии документов должны выделяться особо, чтобы не было путаницы с предыдущими версиями, утратившими силу. В то же время архив подобных актов, безусловно, должен сохраняться в течение определенного периода времени.

Стоит отметить, что в компаниях, имеющих сложную организационную схему (сети филиалов, различных подразделений и проч.), зачастую наблюдается противоречие между нормативными документами, издаваемыми структурами различного уровня. Сведение их в единую базу упростит выявление таких случаев.

Кроме того, некоторые нормативные документы охватывают широкий круг вопросов. При этом, к сожалению, в ряде компаний при аттестации персонала от специалиста требуют знание всего документа, хотя в его зону ответственности попадают только отдельные главы или даже пункты данного документа. Очень важно, чтобы в базу знаний такие документы попадали уже структурированно, с разделением на области знаний.


НАУЧНЫЕ ПУБЛИКАЦИИ

Квалифицированный специалист, для того, чтобы сохранять свой профессиональный уровень, должен следить за последними достижениями в сфере собственной деятельности. Однако постоянно увеличивающийся объем информации весьма затрудняет процесс отделения «зерен от плевел». Поэтому непременным элементом базы знаний должен быть блок, содержащий ссылки на публикации научных журналов, конференций, авторефераты диссертаций, причем для упрощения работы с этой информацией необходимо предусмотреть аннотирование данных материалов.

ИНСТРУКЦИИ ПО ЭКСПЛУАТАЦИИ ОБОРУДОВАНИЯ

Отдельный вопрос и, увы, зачастую серьезная головная боль для специалистов, работающих со сложным техническим оборудованием, — отсутствие грамотных описаний и инструкций по эксплуатации. Не секрет, что далеко не всегда поставщики (особенно в случае, если продажи идут через длинную цепочку зарубежный производитель—дистрибьютор—дилер) обеспечивают переведенные на русский язык инструкции. Еще чаще бывает так, что качество перевода делает документы непригодными к использованию. Поэтому специалистам приходится заниматься переводом самостоятельно.

Также необходимо учитывать, что многие инструкционные материалы однотипны для одного и того же вида оборудования, но из-за географических особенностей специалисту во Владивостоке и Калининграде приходится самостоятельно прорабатывать одну и ту же инструкцию. Наличие единой базы знаний может существенно сократить затраты времени на данную работу.


ФОРУМЫ И КОНФЕРЕНЦИИ

Элемент «живого» общения — интернет-площадки — обеспечивают обмен информацией между сотрудниками одинаковых служб. Данная составляющая базы знаний даст возможность, с одной стороны, начинающим специалистам быстрее справляться со сложными вопросами, с другой — позволит реализовать наставнический потенциал более опытным сотрудникам. Кроме того, участие в подобных профессиональных сообществах может служить весьма существенным мотивирующим фактором.

что такое база знаний в информатике. Смотреть фото что такое база знаний в информатике. Смотреть картинку что такое база знаний в информатике. Картинка про что такое база знаний в информатике. Фото что такое база знаний в информатике

Наиболее очевидными составляющими этого раздела будут «ЧаВО» — «ЧАсто задаваемые Вопросы и Ответы», а также «Задай вопрос эксперту». «ЧаВО» — площадка для организации общения между специалистами внутри компании. «Вопрос эксперту» — в случае привлечения сторонних консультантов.

Здесь уместно привести пример из практики проведения семинаров-совещаний с начальниками подстанций одной из энергетических компаний. Во время обсуждения технологических процессов молодые специалисты, работающие на одном предприятии, с удивлением узнавали, что задачу, над решением которой каждый бился самостоятельно, затрачивая несколько недель, два года назад уже решал их коллега со стажем, но нигде это решение не зафиксировано.


РЕЗУЛЬТАТЫ НАУЧНО-ИССЛЕДОВАТЕЛЬСКИХ РАБОТ

Данный раздел базы знаний также является актуальным только для крупных компаний, с одной стороны, обладающих потребностями (и возможностями) финансирования научных исследований и разработок; с другой — имеющих большое число различных подразделений, зачастую, увы, недостаточно хорошо информированных о работах, заказанных их коллегами из соседнего кабинета.

При этом также могут быть сэкономлены весьма существенные средства за счет сокращения параллельных или дублирующих друг друга исследований.

Каким образом могут быть реализованы подобные базы знаний? Здесь целесообразно говорить о кроссплатформенных решениях. Причем можно выделить, помимо самих компаний, которые создают подобный инструментарий для себя, четыре ключевые категории партнеров.

Во-первых, это профильные министерства. Так как, помимо издания нормативных документов, они непосредственно заинтересованы в повышении эффективности предприятий подведомственной сферы.

Во-вторых, компании-поставщики правовых информационных баз. На рынке существует несколько крупных игроков в этом сегменте, и любой из них готов предоставить решения, позволяющие интегрировать внутренние документы компании в существующие базы данных.

В-третьих, производители оборудования. Поддержка документации по поставляемой технике должна стать непременным условием при размещении заказа.

И, наконец, в-четвертых, профильные учебные заведения, осуществляющие обучение по соответствующим программам повышения квалификации. В данном случае речь может идти об «абонементном обслуживании» курсов, приобретенных компанией.

В заключение хотелось бы еще раз обратить внимание на тот факт, что основными требованиями к базе знаний компании являются ее структурированность и актуальность. В случае несоблюдения первого из этих условий работа с ней становится неэффективной, а при несоблюдении второго — компании может быть причинен ущерб, например, в случае, если в базе содержатся устаревшие нормативные требования.

Нашли ошибку? Выделите и нажмите Ctrl + Enter

Источник

Что такое база знаний в информатике

При обработке на ЭВМ данные трансформируются, условно проходя следующие этапы:

1. данные как результат измерений и наблюдений;

2. данные на материальных носителях информации (таблицы, протоколы, справочники);

3. модели (структуры) данных в виде диаграмм, графиков, функций;

4. данные в компьютере на языке описания данных;

5. базы данных на машинных носителях информации.

Знания основаны на данных, полученных эмпирическим путем. Они представляют собой результат мыслительной деятельности человека, направленной на обобщение его опыта, полученного в результате практической деятельности.

При обработке на ЭВМ знания трансформируются аналогично данным.

1. знания в памяти человека как результат мышления;

2. материальные носители знаний (учебники, методические пособия);

5. база знаний на машинных носителях информации.

Часто используется такое определение знаний.

Базы данных

База данных — организованная в соответствии с определёнными правилами и поддерживаемая в памяти компьютера совокупность данных, характеризующая актуальное состояние некоторой предметной области и используемая для удовлетворения информационных потребностей пользователей.

Отличия баз знаний от баз данных:

Базы знаний

База знаний, БЗ (англ. Knowledge base, KB) — это особого рода база данных, разработанная для управления знаниями (метаданными), то есть сбором, хранением, поиском и выдачей знаний. Раздел искусственного интеллекта, изучающий базы знаний и методы работы со знаниями, называется инженерией знаний.

Под базами знаний понимает совокупность фактов и правил вывода, допускающих логический вывод и осмысленную обработку информации. В языке Пролог базы знаний описываются в форме конкретных фактов и правил логического вывода над базами данных и процедурами обработки информации, представляющих сведения и знания о людях, предметах, фактах событиях и процессах в логической форме.

Классификация баз знаний

В зависимости от уровня сложности систем, в которых применяются базы знаний, различают:

• БЗ всемирного масштаба — например, Интернет или Википедия

• БЗ национальные — например, Википедия

• БЗ отраслевые— например, Автомобильная энциклопедия

• БЗ организаций — см. Управление знаниями

• БЗ экспертных систем — см. Экспертная система

Интеллект человека и искусственный интеллект

В основе систем баз знаний лежат принципы работы человеческого интеллекта. Интеллектом называется способность подходить к решению какой-либо задачи с учетом имеющегося опыта. Согласно Хармону и Кингу (Harmon & King, 1985), а также Фишлеру и Фиршейну (Fischler & Firschein, 1987), для человеческого интеллекта характерны следующие свойства:

• способность находить аналоги;

• способность создавать новые понятия на основе известных понятий эффективность обработки неоднозначных и противоречивых сообщений;

• способность определять относительную важность различных составных частей задачи;

• гибкость подхода к решению задачи;

• способность разбиения сложной задачи на составные части;

• способность моделирования воспринимаемого мира;

• понимание и способность использования символических средств.

Машинные знания — это то же, что искусственный интеллект (ИИ). Родоначальником в этой области является Алан Тьюринг, британский математик. Однако несмотря на то, что Тьюринг разработал первоначальную концепцию ИИ еще в 1937 г., официально ИИ появился только в 1956 г. Это произошло в Дартмутском колледже, во время встречи группы ученых, на которой обсуждался потенциал компьютеров в области стимуляции когнитивного процесса человека. Термин «искусственный интеллект» был предложен одним из организаторов конференции, Джоном Маккарти.

ИИ — это одна из ветвей информатики. Он связан с компьютерами, которые стимулируют процесс решения задачи путем дублирования функций человеческого мозга. ИИ включает в себя совокупность программного и аппаратного обеспечения и методов имитации свойственной человеку деятельности как умственной (мышление, принятие решений, рассуждения, решение задач, обучение и поиск данных), так и физической (сенсорные и моторные навыки). Комплексное решения задач моделируется с помощью представления когнитивного процесса человека, а когнитивное моделирование решает задачи, оценивая знания как человек.

Когнитивное моделирование и ИИ — родственные, но разные дисциплины. Когнитивное моделирование — это методика моделирования человеческого процесса познания, на котором строятся осмысленные рассуждения, а ИИ — методика моделирования разумного поведения, в котором рассуждение вовсе не обязательно. Правда, различия между двумя этими методиками постепенно стираются.

Применение баз знаний

Простые базы знаний могут использоваться для создания экспертных систем и хранения данных об организации: документации, руководств, статей технического обеспечения. Главная цель создания таких баз — помочь менее опытным людям найти существующее описание способа решения какой-либо проблемы предметной области.

Онтология может служить для представления в базе знаний иерархии понятий и их отношений. Онтология, содержащая еще и экземпляры объектов не что иное, как база знаний.

Системы основанные на знаниях реализуются на базе следующих интеллектуальных алгоритмов:

Экспертные системы

База знаний — важный компонент интеллектуальной системы. Наиболее известный класс таких программ — экспертные системы.

Экспертная система— компьютерная программа, способная частично заменить специалиста-эксперта в разрешении проблемной ситуации. Современные ЭС начали разрабатываться исследователями искусственного интеллекта в 1970-х годах, а в 1980-х получили коммерческое подкрепление.

В информатике экспертные системы рассматриваются совместно с базами знаний как модели поведения экспертов в определенной области знаний с использованием процедур логического вывода и принятия решений, а базы знаний — как совокупность фактов и правил логического вывода в выбранной предметной области деятельности.

Характерными чертами экспертной системы являются:

Структура экспертных систем

· Интеллектуальный редактор базы знаний

· Инженер по знаниям

· Рабочая (оперативная) память

· Решатель (механизм вывода)

База знаний состоит из правил анализа информации от пользователя по конкретной проблеме. ЭС анализирует ситуацию и, в зависимости от направленности ЭС, дает рекомендации по разрешению проблемы.

Как правило, база знаний экспертной системы содержит факты (статические сведения о предметной области) и правила — набор инструкций, применяя которые к известным фактам можно получать новые факты.

Главная цель создания любой Базы знаний — сократить время и трудозатраты на решение типовых инцидентов.

Пользователь – специалист предметной области, для которого предназначена система.

Инженер по знаниям – специалист в области искусственного интеллекта, выступающий в роли промежуточного буфера между экспертом и базой знаний.

Интерфейс пользователя – комплекс программ, реализующих диалог пользователя с ЭС

БЗ – ядро ЭС, совокупность знаний предметной области

Решатель – программа, моделирующая ход рассуждений эксперта на основании знаний, имеющихся в БД

Подсистема объяснений – программа, позволяющая пользователю получить ответы на вопросы : “Как была получена та или иная рекомендация?” и “Почему система приняла такое решение?”

Классификация экспертных систем и области применения

Общепринятая классификация экспертных систем отсутствует, однако наиболее часто экспертные системы различают по назначению, предметной области, методам представления знаний, динамичности и сложности:

По назначению классификацию экспертных систем можно провести следующим образом:

По предметной области наибольшее количество экспертных систем используется в военном деле, геологии, инженерном деле, информатике, космической технике, математике, медицине, метеорологии, промышленности, сельском хозяйстве, управлении процессами, физике, филологии, химии, электронике, юриспруденции.

Классификация экспертных систем по методам представления знаний делит их на традиционные и гибридные. Традиционные экспертные системы используют, в основном, эмпирические модели представления знаний и исчисление предикатов первого порядка. Гибридные экспертные системы используют все доступные методы, в том числе оптимизационные алгоритмы и концепции баз данных.

По степени сложности экспертные системы делят на поверхностные и глубинные. Поверхностные экспертные системы представляют знания в виде правил «ЕСЛИ-ТО». Условием выводимости решения является безобрывность цепочки правил. Глубинные экспертные системы обладают способностью при обрыве цепочки правил определять (на основе метазнаний) какие действия следует предпринять для продолжения решения задачи. Кроме того, к сложным относятся предметные области в которых текст записи одного правила на естественном языке занимает более 1/3 страницы.

Классификация экспертных систем по динамичности делит экспертные системы на статические и динамические. Предметная область называется статической, если описывающие ее исходные данные не изменяются во времени. Статичность области означает неизменность описывающих ее исходных данных. При этом производные данные (выводимые из исходных) могут и появляться заново, и изменяться (не изменяя, однако, исходных данных).

Если исходные данные, описывающие предметную область, изменяются за время решения задачи, то предметную область называют динамической. В архитектуру динамической экспертной системы, по сравнению со статической, вводятся два компонента:

Последняя осуществляет связи с внешним миром через систему датчиков и контроллеров. Кроме того, традиционные компоненты статической экспертной системы (база знаний и механизм логического вывода) претерпевают существенные изменения, чтобы отразить временную логику происходящих в реальном мире событий.

Наиболее известные ЭС и их применение

В настоящее время экспертные системы используются для решения различных типов задач в самых разнообразных проблемных областях, таких, как финансы, нефтяная и газовая промышленность, энергетика, транспорт, фармацевтическое производство, космос, химия, образование, телекоммуникации и связь и др.

· CLIPS — весьма популярная ЭС (public domain)

· WolframAlpha — поисковая система, интеллектуальный «вычислительный движок знаний»

· MYCIN — наиболее известная диагностическая система, которая предназначена для диагностики и наблюдения за состоянием больного при менингите и бактериальных инфекциях.

· I&W. Экспертная система помогает аналитикам из разведки предсказывать, когда и где произойдет следующее вооруженное столкновение. Система анализирует поступающие сообщения разведки, например донесения о местонахождении воинских соединений, их деятельности и передвижениях, применяя знания об обычных признаках активности войск. Знания представлены в рамках архитектуры доски объявлений, в которой для обеспечения компетентности применены как правила с прямой цепочкой рассуждений, так и фреймы. Система реализована на языке INTERLISP-D для АРМ Xerox 1100. Она разработана компанией ESL в сотрудничестве со Стенфордским университетом и доведена до уровня демонстрационного прототипа.

· ACES. Экспертная система выполняет картографические работы по нанесению обстановки на карты. Система получает в качестве исходных данных карту без обстановки и информацию, описывающую расположение объектов на местности. Система выдает карту, содержащую все желаемые условные обозначения и подписи, размещенные без взаимного наложения.

Интеллектуальные системы

Ниже перечислены интересные особенности, которые могут (но не обязаны) быть у интеллектуальной системы, и которые касаются баз знаний.

1) Машинное обучение: Это модификация своей БЗ в процессе работы интеллектуальной системы, адаптация к проблемной области. Аналогична человеческой способности «набирать опыт».

2) Автоматическое доказательство (вывод): Способность системы выводить новые знания из старых, находить закономерности в БЗ. Некоторые авторы считают, что БЗ отличается от базы данных наличием механизма вывода.

3) Интроспекция: Нахождение противоречий, нестыковок в БЗ, слежение за правильной организацией БЗ.

4) Доказательство заключения: Способность системы «объяснить» ход её рассуждений по нахождению решения, причем «по первому требованию».

Машинное обучение

Машинное обучение (англ. Machine Learning) — обширный подраздел искусственного интеллекта, изучающий методы построения алгоритмов, способных обучаться. Различают два типа обучения. Обучение по прецедентам, или индуктивное обучение, основано на выявлении закономерностей в эмпирических данных. Дедуктивное обучение предполагает формализацию знаний экспертов и их перенос в компьютер в виде базы знаний. Дедуктивное обучение принято относить к области экспертных систем, поэтому термины машинное обучение и обучение по прецедентам можно считать синонимами.

Машинное обучение находится на стыке математической статистики, методов оптимизации и дискретной математики, но имеет также и собственную специфику, связанную с проблемами вычислительной эффективности и переобучения. Многие методы индуктивного обучения разрабатывались как альтернатива классическим статистическим подходам. Многие методы тесно связаны с извлечением информации, интеллектуальным анализом данных.

Общая постановка задачи обучения по прецедентам

Имеется множество объектов (ситуаций) и множество возможных ответов (откликов, реакций). Существует некоторая зависимость между ответами и объектами, но она не известна. Известна только конечная совокупность прецедентов — пар «объект, ответ», называемая обучающей выборкой. На основе этих данных требуется восстановить зависимость, то есть построить алгоритм, способный для любого объекта выдать достаточно точный ответ. Для измерения точности ответов определённым образом вводится функционал качества.

Данная постановка является обобщением классических задач аппроксимации функций. В классических задачах аппроксимации объектами являются действительные числа или векторы. В реальных прикладных задачах входные данные об объектах могут быть неполными, неточными, нечисловыми, разнородными. Эти особенности приводят к большому разнообразию методов машинного обучения.

Способы машинного обучения

Так как раздел машинного обучения, с одной стороны, образовался в результате разделения науки о нейросетях на методы обучения сетей и виды топологий архитектуры сетей, а с другой, вобрал в себя методы математической статистики, то указанные ниже способы машинного обучения исходят из нейросетей. То есть базовые виды нейросетей, такие как перцептрон и многослойный перцептрон (а так же их модификации) могут обучаться как с учителем, без учителя, с подкреплением, и активно. Но некоторые нейросети и большинство статистических методов можно отнести только к одному из способов обучения. Поэтому если нужно классифицировать методы машинного обучения в зависимости от способа обучения, то, касательно нейросетей, не корректно их относить к определенному виду, а правильнее классифицировать алгоритмы обучения нейронных сетей.

— Метод коррекции ошибки

— Метод обратного распространения ошибки

— Метод ближайших соседей

Классические задачи решаемые с помощью машинного обучения

— Классификация как правило, выполняется с помощью обучения с учителем на этапе собственно обучения.

— Кластеризация как правило, выполняется с помощью обучения без учителя

— Регрессия как правило, выполняется с помощью обучения с учителем на этапе тестирования, является частным случаем задач прогнозирования.

— Понижение размерности данных и их визуализация выполняется с помощью обучения без учителя

— Восстановление плотности распределения вероятности по набору данных

— Одноклассовая классификация и выявление новизны

— Построение ранговых зависимостей

Типы входных данных при обучении

— Признаковое описание объектов — наиболее распространённый случай.

— Описание взаимоотношений между объектами, чаще всего отношения попарного сходства, выражаемые при помощи матрицы расстояний, ядер либо графа данных

— Временной ряд или сигнал.

— Изображение или видеоряд.

Типы функционалов качества

Практические сферы применения

Целью машинного обучения является частичная или полная автоматизация решения сложных профессиональных задач в самых разных областях человеческой деятельности.

— Машинное обучение имеет широкий спектр приложений:

— Распознавание рукописного ввода

— Прогнозирование временных рядов

— Биржевой технический анализ

— Предсказание ухода клиентов

Сфера применений машинного обучения постоянно расширяется. Повсеместная информатизация приводит к накоплению огромных объёмов данных в науке, производстве, бизнесе, транспорте, здравоохранении. Возникающие при этом задачи прогнозирования, управления и принятия решений часто сводятся к обучению по прецедентам. Раньше, когда таких данных не было, эти задачи либо вообще не ставились, либо решались совершенно другими методами.

Автоматическое доказательство

Автоматическое доказательство— доказательство, реализуемое программно. В основе лежит аппарат математической логики. Используются идеи теории искусственного интеллекта. Процесс доказательства основывается на логике высказываний и логике предикатов.

Логика высказываний (или пропозициональная логика) — это формальная теория, основным объектом которой служит понятие логического высказывания. С точки зрения выразительности, её можно охарактеризовать как классическую логику нулевого порядка. Логика высказываний является простейшей логикой, максимально близкой к человеческой логике неформальных рассуждений и известна ещё со времён античности.

Логика первого порядка (исчисление предикатов) — формальное исчисление, допускающее высказывания относительно переменных, фиксированных функций, и предикатов. Расширяет логику высказываний. В свою очередь является частным случаем логики высшего порядка.

Другие способы применения искусственного интеллекта

Наряду с системами с базой знаний существуют другие приложения ИИ, такие как игры, решение головоломок, обработка естественного языка, распознавание речи, машинное зрение, робототехника, интеллектуальное обучение, обучение машины и решение общих задач. Развитие этих направлений будет способствовать разработке более совершенных и более «похожих на человека» систем с базой знаний.

Игры и решение головоломок (например, шахматы) были первой областью приложения ИИ и инженерии знаний, где имела место имитация человеческого интеллекта и способностей по решению задач. Средства обработки естественных языков дают возможность компьютерам понимать сообщения на различных языках и осуществлять вербальные коммуникации с живыми пользователями. Они снабжены базой знаний (словарем) и в настоящее время используются для создания интерактивного интерфейса с компьютером в таких областях, как электронные таблицы, программы управления базами данных, операционные системы и системы автоматического перевода. В будущем обработка естественных языков будет использоваться для сканирования, интерпретации и обобщения массивом данных для различных прикладных систем с базой знаний. Распознавание речи и машинное зрение имитируют два наиболее важных человеческих чувства и таким образом упрощают взаимодействие живого эксперта и компьютера. Робототехника занимается копированием физических характеристик человека и их машинной реализацией. Интеллектуальное обучение применяется в основном при обучении с помощью компьютера. Обучение машины — это попытка имитации обучения человека с использованием дедуктивных и индуктивных процессов. Системы решения общих задач предназначены для решения различных видов задач, которые представлены на формальном языке, с использованием алгоритмов и эвристики.

Взгляд в будущее

Как и в других областях, настоящее инженерии знаний принадлежит реалистам, которые адаптируют технологии к удовлетворению существующих потребностей. Однако будущее инженерии знаний зависит от мечтателей, предвосхищающих появление технологий, которые будут служить людям в будущем.

В распоряжении инженеров по знаниям будет более совершенное аппаратное и программное обеспечение. Быстрое действие и большая емкость запоминающих устройств позволит использовать знания, основанные на здравом смысле, и предоставит возможность одновременно обрабатывать правила, фреймы и другие структуры знаний. Станет необходимой обработка данных с массовым параллелизмом и применение суперкомпьютеров. Программное обеспечение позволит обучение на базе опыта и обновление его базы данных. Также оно будет обладать возможностями динамического отклика на изменяющиеся входные условия или функцию. Системы с базой знаний будут полагаться на автоматизированное программное обеспечение по получению знаний. В качестве пользовательских интерфейсов будут использоваться распознавание речи и ввод рукописной информации. Коммуникации будут многоязычными, появятся возможности машинного перевода.

Приобретение знаний — это то, что ограничивает развитие систем с базой знаний. Мы сможем разработать более эффективные системы с базой знаний только в том случае, если мы лучше поймем способы обработки знаний, их хранения и поиска, свойственные человеческому разуму, а также принципы накопления человеком опыта.

У компьютера большие возможности искусственного интеллекта. Он превратится из устройства для обработки данных в устройство для обработки знаний. Обладая сенсорными связями и роботами, система с базой знаний сможет собирать и анализировать информацию, а также действовать бел вмешательства человека. Языковое программное обеспечение будет имитировать интуицию. Дополнительные технологии, такие как нейросети или «широкомасштабная» параллельная обработка, подготовят почву для появления интеллектуальных машин более высокого уровня.

СПИСОК ЛИТЕРАТУРЫ:

2. Гаврилова и др. Базы знаний интеллектуальных систем // Учебник для вузов. — СПб.: Питер, 2000.

3. Загоруйко Н. Г. Прикладные методы анализа данных и знаний. — Новосибирск: ИМ СО РАН, 2005. ISBN 5-86134-060-9.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *