четверг, 14 мая 2009 г.

Информация и ее свойства

Вопрос № 1 Информация, её свойства и виды. Понятие количества информации.
Информация (от лат. information) – сведенье, разъяснение, изложение.
Свойства информации делятся на внутренние и внешние.
Внутренние свойства – это свойства, органически присущие объекту. Они обычно “скрыты” от изучающего объекта и проявляют себя косвенным образом при взаимодействии данного объекта с другим (например: масса вещества (материи), гравитационная масса).
Внешние свойства – это свойства, характеризующие поведение объекта при взаимодействии с другими объектами.
Выделяют 2 группы внешних свойств:
1. Качество информации – обобщённая положительная характеристика информации, отражающая степень её полезности для пользователя.
2. Показатель качества – одно из важных положительных свойств информации (с позиции потребителя). Любое отрицательное свойство может быть заменено обратным ему, положительным.
3. Релевантность – способность информации соответствовать запросам потребителя
4. Полнота – свойство информации исчерпывающе (для каждого потребителя) характеризовать отображаемый объект или процесс.
5. Своевременность – способность информации соответствовать запросам потребителя в нужный момент времени.
6. Достоверность – свойство информации не иметь скрытых ошибок.
7. Защищённость – свойство, характеризующее невозможность несанкционированного использования или изменения.
8. Доступность – свойство информации, характеризующее возможность её получения данным потребителем.
9. Эргономичность – свойство, характеризующее удобство формы или объёма информации с точки зрения данного потребителя.
10. Живучесть - свойство, характеризующее способность информации сохранять своё качество с течением времени.
11. Уникальность – свойство, характеризующее способность информации существовать в единственном
12. Адекватность – свойство, характеризующее способность информации однозначно соответствовать объективные закономерности природы, общества, мышления

Виды информации:
• Политическая;
• Техническая;
• Биологическая;
• Химическая;
• Научная;
Определить понятие «количество информации» довольно сложно. Решить эту проблему помогают 2 подхода: вероятностный и объёмный.
Суть вероятностного подхода заключается в определении насколько уменьшается неопределённость после получения сообщения (информации).
Суть объёмного подхода заключается в подсчитывании количества символов, представляющих информацию.

Вопрос № 2 Распознавание образов
В последние годы распознавание образов находит все большее применение в повседневной жизни. Распознавание речи и рукописного текста значительно упрощает взаимодействие человека с компьютером, распознавание печатного текста используется для перевода документов в электронную форму.
Базовым является неопределимое понятие множества. В компьютере множество представляется набором неповторяющихся однотипных элементов. Слово "неповторяющихся" означает, что какой-то элемент в множестве либо есть, либо его там нет. Универсальное множество включает все возможные для решаемой задачи элементы, пустое не содержит ни одного.
В классической постановке задачи распознавания (странно называть классической науку, которой от силы несколько десятилетий:) универсальное множество разбивается на части-образы. Образ какого-либо объекта задается набором его частных проявлений. В случае с распознаванием текста в универсальное множество войдут все возможные знаки, в образ "Ы" - все возможные начертания этой буквы, а программа распознавания занимается тем, что на основе небольшого набора примеров начертаний каждой буквы (обучающей выборки) определяет, какую из них символизирует введенная закорючка.
Методика отнесения элемента к какому-либо образу называется решающим правилом. Еще одно важное понятие - метрика, способ определения расстояния между элементами универсального множества. Чем меньше это расстояние, тем более похожими являются символы, звуки - то, что мы распознаем. Обычно элементы задаются в виде набора чисел, а метрика - в виде функции. От выбора представления образов и реализации метрики зависит эффективность программы, один алгоритм распознавания с разными метриками будет ошибаться с разной частотой (право на ошибку для программ распознавания так же характерно, как и для людей).
Хорошо показывает принцип работы распознавания образов элементарный алгоритм на основе метода множества эталонов. На входе его имеется обучающая выборка - набор примеров A'ij для каждого образа Ai, метрика d и сам распознаваемый объект x. С помощью метрики вычисляем расстояние от x до каждого элемента обучающей выборки d(x, aij) и находим условное расстояние d(x, Ai) как расстояние от x до ближайшего элемента из Ai. Элемент x относится к образу, который окажется ближе всех.
Практически тут требуется найти минимум расстояния по каждому классу и еще раз взять минимум. Любители трогать руками могут взять в качестве представления элемента пару координат, в качестве метрики - расстояние по теореме Пифагора, и набросать программку, которая будет выполнять описанную операцию над массивом точек двухмерного пространства и отображать это в графике.
Еще один элементарный алгоритм - метод k-ближайших соседей. Как следует из названия, в нем вводится дополнительный входной параметр, целое число k. Тут все еще проще - берется k ближайших к x элементов обучающей выборки и подсчитывается, сколько из них принадлежит к какому образу. К какому образу принадлежит больше, к тому относится и x.
В обоих алгоритмах может возникнуть неопределенная ситуация - когда x будет находиться на одинаковом расстоянии от нескольких образов. В таком случае программа должна либо спросить у пользователя, к какому образу относить элемент, либо тихо бросить жребий. Это зависит от требований к точности с одной стороны, и удобству использования с другой, лучше всего реализовать оба варианта.

бритни спирс билеты

милен фармер билеты