Технические разделы

Теоретическая и эмпирическая вероятность появления на выходе источника цепочек символов

Эмпирическая вероятность - это вероятность, получаемая в результате практических испытаний. В нашем случае эмпирическая вероятность некоторой цепочки символов может быть найдена в соответствии с формулой (1)

.(4)

В частности, пусть, например, требуется определить вероятность цепочки ‘CA’. Тогда формула (4) приобретет вид

,(5)

где - количество появлений цепочки ‘CA’ в тексте; N-1- количество полных двоек со смещением в тексте.

Требуется определить вероятность цепочки ‘BBC’. Тогда формула (4) приобретет вид

,(5)

где N(‘BBC’) =5 - количество появлений цепочки ‘BBC’ в тексте; N-2- количество полных двоек со смещением в тексте.

Требуется определить вероятность цепочки ‘AABB. Тогда формула (4) приобретет вид

,(5)

где N(‘ABBC’) =5 - количество появлений цепочки ‘ABBC’ в тексте; N-3- количество полных двоек со смещением в тексте.

Теоретическая вероятность - это вероятность, определяемая с помощью формул и теорем теории вероятностей. В частности, для рассматриваемой цепочки ‘BA’ теоретическая вероятность может быть определена из формулы произведения вероятностей наступления совместных событий

(6)

где входящие в формулу значения вероятностей взяты из таблиц 1.1.1, 1.1.2.

Для рассматриваемой цепочки ‘BBC’ теоретическая вероятность может быть определена из формулы произведения вероятностей наступления совместных событий

(6)

где входящие в формулу значения вероятностей взяты из таблиц 1.1.1, 1.1.2.

Для рассматриваемой цепочки ‘ABBC’ теоретическая вероятность может быть определена из формулы произведения вероятностей наступления совместных событий

(6)

где входящие в формулу значения вероятностей взяты из таблиц 1.1.1, 1.1.2.

Следует заметить, что выполненные вычисления по формулам (5) и (6) могут не совпадать в общем случае, особенно, для редких цепочек. Это связано с недостаточно полным объёмом исходных статистических данных (ограниченной длиной текста сообщения N = 200 символов).

Расчёт количества информации содержащейся в цепочке проводится согласно определению: количество информации - это величина, определяющая число двоичных символов, необходимых для передачи цепочки, и вычисляемая в соответствии с мерой информации по К.Шеннону:

[бит/сообщ],(7)

где log - здесь и далее обозначает двоичный логарифм; - вероятность цепочки, например, эмпирическая или теоретическая.

Отметим, что количество информации не зависит от качественного содержания сообщения (цепочки), в частности от степени его важности для получателя, возможных последствий его передачи и т.д. Количество информации, содержащейся в сообщении , есть логарифмическая функция от вероятности . Количество информации в достоверном событии равно нулю, а количество информации в невозможном событии (имеющем вероятность = 0) равно бесконечности. Отсюда можно сделать вывод, что чем меньше вероятность сообщения (цепочки), тем большее количество информации оно содержит. Расчет теоретической и эмпирической вероятностей появления цепочек символов в сообщении приведен в таблице.

Перейти на страницу: 1 2

Еще статьи по технике и технологиям

Расчёт характеристик системы связи
Система связи состоит из источника дискретных сообщений, кодера источника, кодера канала, модулятора, линии связи, демодулятора, декодера канала, декодера источника и получателя сообщений. Определить характеристики системы: . Стат ...

Расчёт каскадов радиопередатчика на биполярных транзисторах
Курсовой проект представляет собой сложный комплекс вопросов принципиального, схемного, расчетного и конструкционного характера: выбор схем, транзисторов, элементов колебательных систем, способа модуляции или манипуляции, источника пит ...

© 2020 | www.techexpose.ru