вторник, 23 июня 2009 г.

О введении элементов теории вероятностей и статистики в курс информатики основной школы


В статье рассматривается ряд тем школьного курса информатики, в которые целесообразно включить вероятностно-статистический материал, приводятся примеры задач, решаемых средствами информатики, с использованием понятий теории вероятностей и статистики.

В соответствии с утвержденным в марте 2004 г. федеральным компонентом государственных стандартов начального общего, основного общего и среднего (полного) общего образования [1] в содержании предмета математика произошли существенные изменения: впервые в массовую школу были введены элементы теории вероятностей и статистики, в последнее время также стало употребляться словосочетание «элементы стохастики» (термином стохастика объединяют разделы математики, изучающие случайные явления: теорию вероятностей и математическую статистику, теорию игр, теорию случайных процессов и т. д.). При изучении этого раздела предполагается рассмотрение следующих вопросов. Решение комбинаторных задач: перебор вариантов, подсчет числа вариантов с помощью правила умножения. Представление данных в виде таблиц, диаграмм, графиков. Диаграммы Эйлера. Средние результатов измерений. Понятие и примеры случайных событий. Частота события, вероятность. Равновозможные события и подсчет их вероятности. Представление о геометрической вероятности [2].

В пользу введения в школьный курс математики элементов теории вероятностей и статистики приводятся следующие аргументы. Вероятностно-статистические представления занимают важное место в системе знаний и представлений современного человека. Без минимальных знаний по статистике и теории вероятностей сегодня трудно правильно воспринимать социальную, политическую, экономическую информацию, принимать на ее основе обоснованные решения. Современные физика, химия, биология исходят из представления, согласно которому все явления природы носят статистический характер, и законы этих наук могут получить достаточно полную и точную формулировку только в терминах теории вероятностей и статистики. Статистические методы и понятия занимают важное место в современной психологии, лингвистике, истории, археологии и других науках.

Таким образом, без минимальных знаний по теории вероятностей и статистике у учащегося не могут быть сформированы умения ориентироваться в поступающей статистической информации, правильно принимать на ее основе решения, не может сложиться адекватное представление о современной научной картине мира. Это доказывает необходимость введения элементов теории вероятностей и статистики в школьный курс математики. Но из сказанного выше также следует, что вероятностно-статистические понятия занимают важное место и в других науках, следовательно, их изучение не должно ограничиваться рамками предмета математика. Должен быть расширен круг понятий и задач, рассматриваемых и на других школьных предметах.

С этой точки зрения, следует проанализировать содержание школьного курса информатики, так как усиление межпредметных связей информатики и математики, в частности, за счет использования информационных технологий при обучении статистике и теории вероятностей, позволит повысить качество и эффективность обучения этим предметам. На основе стандарта [3] и программы [4] основного общего образования по информатике и информационным технологиям, попытаемся выделить те темы школьного курса информатики, в рамках которых целесообразно рассмотрение вероятностно-статистического материала.

Прежде всего, следует отметить, что знания по теории вероятностей, полученные на уроках математики, должны быть применены при изучении такой важной темы курса информатики, как «Представление информации». Например, при изучении измерения информации нужно учитывать, что понятия вероятность, равновероятные, независимые событий, уже могут быть известны учащимся из курса математики, в этом случае возможно использование вероятностного подхода к измерению информации, кроме того, необходимо расширить систему задач, решаемых в рамках данной темы. Это может быть сделано за счет включения задач на подсчет вероятностей.

Пример 1. Есть две корзины, содержащие по 20 шаров – 10 белых, 5 черных и 5 красных в первой и 8 белых, 8 черных и 4 красных во второй. Из каждой корзины вытаскивают по одному шару. В каком из этих двух случаев сообщение о том, какого цвета шар достали, несет больше информации? [5]

Замечания к решению. При решении задачи нужно дважды применить формулу Шеннона:

I = ???pi × log2???,

где pi – это вероятность того, что извлечен шар определенного цвета, для ее нахождения можно использовать, классическое определение вероятности.

Ответ. В первом случае сообщение содержит 1,5 бит информации, во втором – 1,522 бит.

Рассмотрим пример на вычисление условной вероятности.

Пример 2. В ящике находится 14 шаров, из которых 5 черных, а остальные – белые. Из ящика извлекается один шар, а затем еще один. Какое количество информации содержит сообщение о том, какого цвета был последний шар? [6]

Решение. Пусть первый опыт – это извлечение первого шара, для него возможны два исхода: А1 – вытащен черный, A2 – белый; второй опыт – извлечение второго шара, его исходов также будет два, обозначим из В1 и В2, тогда формула для подсчета количества информации выглядит так:

I = P(A1) × (P1 × log 1/P1 + P3 log 1/P3) + P(A2) × (P3 log 1/P3 + P4 × log 1/P4),

где P1 = P(В1/ А1), P2 = P(В1/ A2), P3 = P(В2/ А1), P4 = P(В2/ A2).

Ответ. I 0,69 бит.

Также можно привести пример, где для вычисления вероятности используется формула Бернулли Pn(m) = ???pm qn-m.

Пример 3.

Баскетболист попадает в корзину со штрафного броска с вероятностью p = 0,8. Какое количество информации несет сообщение о том, что в серии из 5 бросков он попадет ровно 4 раза?

Ответ. I = P5(4) ∙ log2(1 / P5(4)) ≈ 0,53 (бит).

В рамках темы «Формализация и моделирование» могут изучаться вероятностные (стохастические) динамические модели, в которых присутствует фактор случайности внешних воздействий, возможна также постановка случайных вычислительных экс­периментов при написании про­грамм и работе с электронными таблицами, математическими па­кетами.

Пример 4.

Известная школьникам модель броуновского движения является стохастической моделью. Она объясняется в рамках молекулярно-кинетической теории, в основе которой лежат законы теории вероятностей. В частности, теория вероятностей объясняет, почему хаотическое, беспорядочное движение отдельных молекул приводит к четким, простым закономерностям движения их больших совокупностей. Броуновское движение можно наблюдать, выпустив в тонкий слой воды на плоском стеклышке каплю чернил. Чернильное пятно будет постепенно расплываться, сохраняя округлую форму. Его окраска будет более интенсивной в центре, к краям будет ослабевать. Схематическое расположение большого числа частиц, подверженных броуновскому движению, через некоторый промежуток времени после того, как все они вышли из ближайшей окрестности начальной точки, изображено на рис. 1. Основные черты броуновского движения частицы можно наблюдать на упрощенной модели блуждания частицы на плоскости [7].

Рис. 1. Положение частиц, вышедших из начальной точки,

через некоторый промежуток времени

Пусть в начальный момент времени частица находится в начале координат и перемещается по точкам плоскости с целочисленными координатами. При этом за один шаг частица перемещается из точки с координатами (x, y) с вероятностью ¼ в одну из точек (x + 1, y), (x, y + 1), (x – 1, y), (x, y – 1), независимо от того, где находилась частица до точки (x, y). Обозначим через t количество шагов частицы, а через r – расстояние частицы от начального положения. Составим программу на Pascal, которая по введенному t, будет находить количество путей частицы из начальной точки в точку (x, y), вероятность попадания частицы в точку (x, y), используя классическое определение вероятности, а также вычислять r2.

program Example;

const c = 8; c1 = 20;

type mas = array [-c..c, -c..c] of integer;

mass = array[1..c1, 1..3] of real;

var t, i, j, l, n: integer;

r2: real; {среднее расстояния}

r: mass; {массив для хранения расстояний; числа появлений расстояния и его вероятности}

a, b: mas; {a – массив для хранения числа путей из начала координат, b – вспомогательный массив}

{---функция проверяет, сколько раз элемент d встречается в 1 строке массива r---}

function find (d: integer; var r: mass): boolean;

var i1: integer; f: boolean;

begin

f := true;

i1 := 0;

while r[i1, 1] <> 0 do

begin

if r[i1, 1] = d then

begin

r[i1, 2]:= r[i1, 2] + a[i, j];

f := false;

end;

inc(i1);

end;

find := f;

end;

begin

write('t='); read(t);

{---заполнение массива а---}

FillChar(a, sizeof(a), 0);

b := a;

a[0, 1] := 1; a[-1, 0] := 1;{ввод начальных значений для массива а, в случае t = 1}

a[1, 0] := 1; a[0, -1] := 1;

if t > 1 then

for l := 1 to t - 1 do

begin

for i := -t to t do

for j := -t to t do

b[i, j] := a[i+1, j] + a[i, j-1] + a[i-1, j] + a[i, j+1]; {увеличивая t на единицу получаем возможность попасть в четыре диагональные к данной клетки}

a := b;

end;

{----вывод массива а----}

for i := -t-1 to t+1 do

begin

for j := -t-1 to t+1 do

if a[i,j] = 0 then write(' #') else write(a[i,j]: 4);

writeln;

end;

{---нахождение числа различных путей за t шагов---}

n:=0;

for i := -t to t do

for j := -t to t do

n := n + a[i, j]; {суммируем все элементы массива а; здесь можно было заметить, что n – это перестановки из 4 по t}

writeln('n = ', n);

{---заполнение массива r---}

FillChar(r, sizeof(r), 0);

l:=1;

for i := -t to t do

for j := -t to t do

if a[i,j] <> 0 then

if find((sqr(i) + sqr(j)), r) then

begin

r[l, 1] := sqr(i) + sqr(j); {используем известную школьникам формулу для вычисления расстояния}

r[l, 2] := r[l, 2] + a[i, j];

inc(l);

end;

{---вычисление вероятностей и вывод массива r---}

for i := 1 to 3 do

begin

for j := 1 to с1 do

begin

r[j,3] := r[j,2] / n;

write(r[j, i]: 6: 2,' ');

end;

writeln;

end;

{вычисление среднего значения квадрата расстояния}

r2 := 0;

for i := 1 to с1 do

r2 := r2 + r[i, 1] * r[i, 2];

writeln('среднее расстояния', r2 / n: 4: 2);

readkey;

end.

Результаты работы программы:

1) t =3

#

#1#

#3#3#

#3#9#3#

#1#9#9#1#

#3#9#3#

#3#3#

#1#

#

n = 64

(таблица)

среднее расстояния r2ср = 3

2) t =6

#

# 1 #

# 6 # 6 #

#15 # 36 #15 #

#20 # 90 # 90 #20 #

#15#120#225#120#15#

# 6#90 #300#300#90# 6 #

#1#36#225#400#225#36#1#

# 6 #90 #300#300#90# 6 #

#15#120#225#120#15#

#20 # 90 #90 #20 #

#15 # 36 #15 #

# 6 # 6 #

# 1 #

#

n = 4096

(таблица)

среднее расстояния r2ср = 6

Заметим, что при t = 6 уже обнаруживается большое сходство с рис. 1. Следовательно, построенная модель случайного блуждания отдельной частицы хорошо соответствует наблюдениям, если считать, что частицы блуждают независимо друг от друга. Заметим также, что при всех рассмотренных t среднее квадрата расстояния r2ср = t. Можно сделать предположение, что это соотношение будет верно при любом t. То есть, корень квадратный из среднего значения квадрата расстояния, называемый в статистике средним квадратическим, равен ???. Данное утверждение, при необходимости, может быть строго обосновано математическими методами.

При реализации рассмотренной модели блуждания частицы на плоскости применяются знания, полученные на уроках информатики и математики, в том числе знания по теории вероятностей и статистике, также отрабатываются навыки программирования, показывается практическое применение полученных знаний, то есть реализуются внутрипредметные связи в математике и межпредметные связи, в том числе, с информатикой. Подобные задачи могут рассматриваться не только в рамках темы «Формализация и моделирование», но и при изучении темы «Алгоритмы и исполнители».

Кроме того, при из изучении темы «Алгоритмы и исполнители» могут решаться задачи на частотный анализ появления символов в тексте. В качестве примеров таких задач рассмотрим несколько заданий из дополнений к учебникам математики.

Рассматривая произвольную страницу текста на русском языке из произведения русского писателя, составить таблицы распределения по частотам и по относительным частотам всех букв русского алфавита [8].

Выберите какой-нибудь текст, содержащий 150 слов. Подсчитайте число слов, составленных из шести букв. Найдите относительную частоту появления слов, которые составлены из шести букв [9].

Следует отметить, что в дополнениях к учебникам математики в темах, связанных со статистикой, подобных задач довольно много. Предполагается, что такие задания учащиеся будут выполнять вручную, но использование компьютера при их решении может значительно уменьшить объем работы, сократить время их выполнения, позволит проанализировать большее количество текстов, кроме того, при выполнении подобных заданий с помощью компьютера будут отрабатываться навыки программирования. Полученные результаты могут использоваться в дальнейшем, например, в рамках профильных курсов могут быть изучены методы эффективного кодирования информации, такие как код Хаффмена, Шеннона-Фано и др.

При изучении табличного процессора, текстового редактора, баз данных также могут систематизироваться и закрепляться знания и умения по теории вероятностей и статистике. В подтверждение этого тезиса приведем цитату из пособия [10]: при изучении параграфа «Статистика – дизайн информации» авторы отмечают, что «разумно познакомить школьников с простейшими приемами статистической обработки информации с помощью редактора «Microsoft Excel».

На старшей ступени школы в рамках профильных курсов по информатике круг вопросов, связанных с теорией вероятностей и статистикой может быть существенно расширен. В том числе, за счет рассмотрения специализированных прикладных программных средств, таких, например, как интегрированная система комплексного статистического анализа и обработки данных Statistica. Возможно рассмотрение анализа эффективности алгоритмов вероятностным методом, изучение различных численных методов, связанных с теорией вероятностей и статистикой, например, метода наименьших квадратов, метода Монте-Карло и связанного с ним метода статистических испытаний.

В заключении еще раз отметим, что введение в содержание школьного курса математики вероятностно-статистического материала влечет за собой необходимость в изменении содержания школьного курса информатики. В свою очередь, включение стохастических понятий и методов в курс информатики должно способствовать не только более глубокому их пониманию, но и более качественному освоению понятий и методов самой информатики. Следовательно, реализация межпредметных связей математики и информатики посредством включения вероятностно-статистического материала, позволяет говорить о повышении эффективности и качества обучения, в том числе, этим дисциплинам.

Примечания

1. Об утверждении федерального компонента государственных образовательных стандартов начального общего, основного общего и среднего (полного) общего образования. Приказ министерства образования РФ [Текст] // Информатика и образование. 2004. № 4.

2. О введении элементов комбинаторики, статистики и теории вероятности в содержание математического образования основной школы [Текст] // Математика в школе. 2003. № 9.

3. Стандарт основного общего образования по информатике и информационным технологиям [Текст] // Информатика и образование. 2004. № 4.

4. Примерная программа основного общего образования по информатике и информационным технологиям [Текст] // Информатика и образование. 2004. № 4.

5. Яглом, А. М. Вероятность и информация [Текст] / А. М. Яглом, И. М. Яглом. М., 1957. 159 с.

6. Там же.

7. Колмогоров, А. Н. Введение в теорию вероятностей. [Текст] / А. Н. Колмогоров, И. Г. Журбенко, А. В. Прохоров. М.: Наука, 1982. 160 с.

8. Ткачева, М. В. Элементы статистики и вероятность [Текст]: Учебное пособие для учащихся 7–9-х классов общеобразовательных учреждений / М. В. Ткачева, Н. Е. Федорова. М.: Просвещение, 2004. 112 с.

9. Макарычев, Ю. Н. Алгебра: элементы статистики и теории вероятностей [Текст]: Учебное пособие для учащихся 7–9-х классов общеобразовательных учреждений / Ю. Н. Макарычев, Н. Г. Миндюк; под общ. ред. С. А. Теляковского. М.: Просвещение, 2003. 78 с.

10. Мордкович, А. Г. События. Вероятности. Статистическая обработка данных [Текст]: Дополнительные параграфы по курсу алгебры 7–9-х классов общеобразовательных учреждений / А. Г. Мордкович, П. В. Семенов. М.: Мнемозина, 2003. 112 с.



Научитесь играть в техасский холдем и станьте чемпионом мировой серии