Металловед
Основные понятия стохастического моделирования

Вопросы
1.        Моделирование в условиях неопределенности
2.        Функция распределения и плотность распределения
случайной   величины
3.        Меры положения и рассеяния кривой распределения
4. Теоретические законы распределения
4.1. Закон нормального распределения (закон Гаусса)
4.2. Экспоненциальное распределение
4.3. Равномерное распределение

1.        Моделирование в условия неопределенности

Известные закономерности, описывающие объекты в металлургии, можно условно разделить на две группы:
1.        Однозначно определенные (детерминированные);
2.        Находящиеся в условиях неопределенности.
Граница, отделяющая случайное событие от неслучайного, очень размытая. В чистом виде однозначно определенных процессов, по-видимому, нет. При описании достаточно сложных процессов закономерности всегда носят стохастический характер.
Причины появления неопределенности:
"        показатели объекта зависят от большого количества факторов, часть которых может быть неизвестна исследователю;
"        при построении модели обычно ограничиваются отбором наиболее существенных (по мнению субъекта или в силу объективных обстоятельств) переменных, что приводит к огрублению модели;
"        математические погрешности, возникающие при линеаризации модели или использовании разложения в ряд при ограничении  на число членов ряда; ошибки измерений, погрешности при проведении эксперимента и т.д.
В зависимости от полноты описания неопределенность можно разбить на три основные группы: неизвестность, недостоверность и неоднозначность.


Неизвестность - это начальная стадия описания неопределенности, при которой информация полностью отсутствует.
Недостоверность - это вторая стадия описания неопределенности, которая для различных этапов сбора информации может классифицироваться как неполнота, недостаточность, недоопределенность и неадекватность. Неполнота характеризуется тем, что собрана не вся возможная информация; недостаточность - собрана не вся необходимая информация. Недоопределенность - для некоторых элементов определены не их точные описания, а лишь множества, которым эти описания принадлежат; неадекватность - когда имеет место описание, не всегда удовлетворяющее целям исследования.
Неоднозначность - это конечная (по полноте возможного описания) степень неопределенности, когда вся возможная информация собрана, но полностью необходимое описание не получилось.
Математически неопределенность может быть описана стохастически, статистически, с позиций теории нечетких множеств, а также интервально.

Стохастическое описание используется тогда, когда неопределенные параметры имеют вероятностный (случайный) характер, при этом необходимо, чтобы был определен закон распределения таких случайных параметров.
Статистическое описание является, по существу, частным случаем стохастического описания. Эту форму описания применяют, когда заданы только выборочные оценки каких-либо характеристик случайной величины.
При описании с позиций нечетких множеств неопределенный параметр задается некоторым множеством возможных его значений, характеризующих принадлежность (с помощью функции принадлежности) объекту. Функция принадлежности может принимать значение от 1 (полная принадлежность) до 0 (полная непринадлежность).
Интервальное описание можно использовать, когда неопределенные параметры заданы только диапазонами возможных значений (верхней и нижней границами), причем параметр может принимать любое значение внутри интервала и ему нельзя приписать никакой вероятностной меры.


2. Функция распределения и плотность распределения случайной величины

Опыт - это осуществление какого-нибудь комплекса условий, который может быть воспроизведен много раз.
Под событием понимается результат опыта или наблюдения. События могут быть элементарными (неразложимыми) и составными (разложимыми).
Элементарное событие происходит в результате единичного опыта. Составное событие - это совокупность элементарных событий.

Пример 1.  Игральный кубик подбрасывается 2 раза. Пусть составное событие определено следующим образом: "сумма выпавших цифр равна 6". Тогда элементарными будут события "5+1", "4+2", "3+3", "2+4" и "1+5". Любые другие сочетания не относятся к рассматриваемому составному событию.

Генеральной совокупностью называют совокупность событий, которые могут быть реализованы в результате бесконечного числа однотипных опытов. Выборочной совокупностью или выборкой называют совокупность случайно отобранных событий из генеральной совокупности.
Объемом совокупности называют число событий N этой совокупности.
Случайной величиной называют переменную величину, которая в результате опыта может принимать различные значения. Случайные величины обычно обозначают большими буквами, например Х. Значения случайной величины, которые она принимает в результате опыта, обозначают малыми буквами   При массовых испытаниях каждое из возможных значений случайной величины   может встретиться m1, m2,…,mn раз. Эти числа называют частотами. Весь набор значений случайной величины образует генеральную совокупность Nx. Отсеянные из генеральной совокупности Nx значения грубых ошибок образуют выборку объемом N. Если всего было проведено Nx опытов, то в результате выборки получаем  , и отношение mi /N называют частостью или относительной частотой.
Вероятностью некоторого события - это мера его "благоприятствия". События называются равновозможными, если мера их "благоприятствия" одинакова. В этом случае частость W события A: W(A) определяется формулой

                                                        W(A)=n /N.                                                       (1)

Вероятность р(А) произвольного события А изменяется от 0 до 1. При этом нулевая вероятность соответствует невозможному событию (которое никогда произойти не может), а единичная - достоверному событию (которое обязательно произойдет). При больших выборках вероятность события равна его частости

                                                         р(А)?W(A).                                                        (2)

Для независимых событий вероятность произведения равна произведению их вероятностей (теорема умножения)
                                                                           (3)
Пример 2. В литейном цехе появление брака в отливках связано с различными элементами технологического процесса: из-за низкого качества литейной формы (песчаные раковины, обвалы, ужимины и др.); вследствие нарушения технологического процесса плавки и внепечной обработки металла (неметаллические включения, газовые раковины, пористость и др.); из-за нарушения режима заливки формы (шлаковые включения, корольки, спаи и др.) каждый из указанных элементов процесса независимо от другого может быть причиной окончательного брака в отливке.
Пусть вероятность получения качественной отливки без дефектов "по вине" формы р(ф)=0,98; по вине металла р(м)=0,93; по вине заливки р(з)=0,99. Необходимо оценить надежность технологического процесса в целом, т.е. определить вероятность получения бездефектной отливки р(фмз).
Решение. По формуле (3)
р(фмз)=р(ф)   р(м)   р(з)=0,98   0,93   0,99 = 0,90.

Для несовместных событий (они не могут наступить одновременно) справедлива теорема сложения вероятностей

.                                      (4)

Из этой теоремы вытекают два следствия:
1.        Для полной группы несовместных событий сумма их вероятностей равна единице:
.                                                             (5)
2.        Сумма вероятностей противоположных событий равна единице

.                                                         (6)

Пример 3. В партии поковок доля брака составляет 3%  (р(А)=0,03). Здесь событие А состоит в выборе дефектной детали. Противоположное ему событие, состоящее в выборе годной детали, будет   . По формуле (6) находим  , т.е. партия поковок содержит  97%  годных деталей.

Законом распределения случайной величины называют любое правило  (таблицу, функцию), позволяющее находить вероятности всевозможных событий.
Случайные величины бывают дискретными и непрерывными.
Дискретными случайными величинами называют такие, которые могут принимать конечное и счетное множество возможных значений.
Непрерывными случайными величинами называют такие, которые в некотором интервале могут принимать любое значение.
Число бракованных поковок в различных выборках из генеральной совокупности есть дискретная случайная величина, а размер этих изделий - непрерывная случайная величина.
Всякую непрерывную случайную величину можно задать в виде дискретной, если все возможные ее значения разбить на интервалы и задать вероятности появления этих интервалов (из-за ограниченности измерительных средств все замеры непрерывных величин задаются в дискретном виде). Случайные величины характеризуются функциями распределения вероятностей.
Распределение случайной величины X, называется интегральной функцией распределения  F(xi). Она определяет вероятность того, что случайная величина примет значения, не превосходящие  хi, т.е. попадет в интервал 

F(xi) = р(X<xi),

Задание F(xi) и определяет закон распределения случайной величины Х. В большинстве практически важных случаев распределение случайных величин может быть задано в другой форме с помощью введения функции плотности вероятностей f (x) (дифференциальной функции распределения).
Характерной особенностью случайной величины является то, что заранее неизвестно, какое из значений она примет. Возможность принятия случайной величиной Х значения из интервала (х1, х2) количественно оценивается вероятностью

                            р(x1<X x2) =f(x)dx ,                                            (7)
                       
где р(x1 < X   x2) - вероятность указанного события (x1 < X   x2);
f (х)   плотность распределения случайной величины; x2= x1+dх.
Плотность вероятности является важнейшей характеристикой, задающей распределение случайной величины, Плотность удовлетворяет двум условиям: она неотрицательна и интеграл от нее в полных пределах изменения аргумента х равен единице:
.                                            (8)
Функция распределения F(х) выражается через плотность f(х):
.                                                       (9)
С другой стороны, если плотность f(х) непрерывна в точке х, то ее значение в этой точке равно производной от функции F(х):

.                                                          (10)

Функция распределения F(x) является первообразной для плотности f(x), поэтому
                              (11)
f(x) называют также дифференциальной функцией распределения.
Свойства функции распределения: она неотрицательна, возрастающая и равна 0 и 1 при значении аргумента -  и  :

F(х) 0; F(х1 )   F(х2) при x1   х2; F(- )=0; F( )=1.

График плотности распределения f(x) называется кривой распределения случайной величины. Исходя из геометрической интерпретации интеграла как площади соответствующей криволинейной трапеции заключаем, что для произвольного  <х0<+  число F(x0) равно площади под кривой распределения, лежащей левее прямой X=х0. Аналогично интерпретируется вероятность р(x1<x x2).
Случайная величина x, для которой существует плотность распределения f(x), называется непрерывной.
Если под случайной величиной x понимать продолжительность безотказной работы объекта, то произведение f(х)dх есть вероятность отказа объекта в интервале времени (х1, х2). Значение функции распределения F(х) равно вероятности отказа объекта до момента х. В теории надежности часто употребляют такое понятие, как вероятность безотказной работы р(х), которое является дополнительным понятием к функции распределения F(x).
Значение вероятности безотказ-ной работы в точке х равно вероятности того, что случайная величина X превысит х, т. е. изделие будет работать безотказно в течение времени x:
р(х) = 1- F(х)=р{X>х}.

Функция р(х) называется также функцией надежности. Примерные графики функции распределения F(х) и функции надежности р(х) изображены на рис. 5.
3.        Меры положения и рассеяния кривой распределения

Кривая распределения плотностей вероятностей случайной величины характеризуется своим положением на оси абсцисс и рассеиванием случайной величины. Для оценки положения и рассеяния кривой распределения вводятся соответствующие критерии или  меры.
К мерам положения относятся: мода, математическое ожидание и медиана случайной величины.
К мерам рассеяния относятся: дисперсия, стандартное отклонение и размах.
Функция распределения плотности вероятностей может иметь одно или несколько максимальных значений в разных местах области (рис. 6). Значение случайной величины X, при котором f(x) принимает максимальное (наиболее вероятное) значение в окрестности какого-либо значения случайной величины х, называется модой распределения (Mо).




Математическим ожиданием дискретной случайной величины называется сумма произведений всех возможных значений случайной величины на вероятности этих значений:
                                           (12)
Математическое ожидание случайной величины X, имеющей плотность распределения f(х), вычисляется по формуле
                                                   (13)
Статистической оценкой математического ожидания является среднее арифметическое значение случайной величины

            .                                           (14)

Математическое ожидание (среднее арифметическое значение) случайной величины называют часто центром рассеяния или центром группирования случайной величины. Математическое ожидание является оценкой истинного значения измеряемой величины.

Пример 4. Найти математическое ожидание и моду случайной величины, заданной таблицей значений
x        3        5        2
p        0,1        0,6        0,3
Решение.                   

Медианой случайной величины (Ме) называется такое ее значение х, для которого

р(х < Ме) ? р(х > Ме),                       (15)

т. е. вероятность появления случайной величины меньшей, чем медиана, или большей, чем медиана, одинакова.
Геометрическая медиана - это абсцисса точки, в которой площадь, ограниченная кривой распределения, делится пополам:

Мерой рассеяния случайной величины Х около ее среднего значения   служит стандартное (или среднее квадратическое) отклонение  :

                                                      (16)

Для непрерывной случайной величины   определяется по формуле

                                    (17)

Другая мера рассеяния - дисперсия (дисперсия и означает рассеивание) характеризует разброс значений случайной величины относительно ее математического ожидания. Дисперсия увеличивается с увеличением рассеяния результатов наблюдения.  Дисперсия определяется по формуле

                                              (18)

где хi   дискретная случайная величина, и по формуле
                              (19)
где хi - непрерывная случайная величина.
Свойства дисперсии:
"        Д х  ? 0;
"        Д х •С = 0 для С = const (дисперсия неслучайной величины равна нулю);
"        Д (СХ) = С2•Дх - неслучайную величину можно выносить за знак дисперсии, возведя ее в квадрат;
"        Дх = Мx(X 2) - (Мх)2 - дисперсия равна математическому ожиданию квадрата случайной величины минус квадрат ее математического ожидания;
"        Д(Х+Y) = Дх + Дy, если Х и Y - независимые случайные величины.
Последнее свойство рассмотрим более подробно на примере двух случайных величин X и Y. По определению

.

После раскрытия  квадратных скобок и объединения каждой случайной величины со своим математическим ожиданием получим
,
откуда
,

где    - ковариация. Она характеризует связь между случайными величинами X и Y. Для независимых случайных величин ковариация равна нулю. Ковариация является неудобной характеристикой, так как по ее величине трудно судить о степени (тесноте) связи. Поэтому была введена другая величина - коэффициент корреляции, вычисляемый по формуле
.                                              (20)

Коэффициент корреляции меняется в пределах от -1 до +1 и является характеристикой тесноты линейной связи между двумя случайными величинами. Если x и y независимы, то  . Если абсолютное значение ?(ХY) окажется больше 1, то совершенно ясно, что произошла ошибка и необходимо пересчитать результат. В случае сильной положительной корреляции достигается значение, близкое к +1, а при сильной отрицательной корреляции достигается значение, близкое к -1. Таким образом, когда |?(ХY)| близок к 1, это указывает на сильную корреляцию между X и Y, а когда  |?(ХY)| близок к 0 - на слабую корреляцию.
Размах случайной величины R определяется как разность между наибольшим и наименьшим значениями случайной величины:

                                                        (21)

4.        Теоретические законы распределения

4.1. Закон нормального распределения (закон Гаусса)

Этот закон является одним из наиболее распространенных законов распределения погрешностей. Уравнение кривой нормального распределения имеет следующий вид:
                                                          (21)

Функция распределения имеет вид
             (22)

График плотности нормального распределения называется нормальной кривой или  кривой Гаусса (рис. 8). Отметим смысл характеристик этой кривой:
"          - центр группирования, характеризует распределение размеров;
"          - характеризует кучность распределения размеров (погрешностей) около  ; чем меньше  , тем кучнее распределяются размеры около  .

Кривая Гаусса имеет следующие особенности.
1. Кривая  симметрична относительно  .                                    
2. При   кривая имеет максимум:
.
3. На расстоянии ± ? от вершины кривая имеет две точки перегиба А и Б, координаты которых равны:
.

4. На расстоянии ± 3 ? от вершины кривой ее ветви так близки к оси абсцисс, что в пределах ± 3? 99,7 % всей площади ограничивается кривой. Практически принято считать, что на расстоянии ± 3 ? от вершины кривой ее ветви пересекаются с осью абсцисс, и в этих пределах заключена вся площадь кривой, т.е. 100,0 %. Погрешность в этом случае составляет 0,3 %, что допустимо при решении многих задач производства.
5. ? - это мера рассеяния, мера точности. На основании п.4 справедливо утверждение, что поле рассеяния   ? ? 6 ?.                                       
С использованием закона Гаусса вероятный процент брака вычисляется следующим образом. Считаем, что все детали партии имеют действительные размеры в пределах поля рассеяния

6 ? = xmax - xmin,

где xmax, xmin - максимальное и минимальное значения параметра (размера). При этом площадь, ограниченная кривой нормального распределения и осью абсцисс, равна единице и определяет 100 % заготовок партии. Площадь заштрихованных участков представляет собой количество деталей, выходящих по своим размерам за пределы допуска.
Для определения количества годных деталей необходимо найти площадь, ограниченную кривой и осью абсцисс на длине, равной допуску ?. При симметричном расположении поля рассеяния относительно поля допуска следует найти значение интервала, определяющего половину площади, ограниченной кривой Гаусса  и абсциссой х1 (х2).
Функция распределения для нормального закона имеет вид

.      (23)

Для случая, когда  , распределение называют стандартным  и функция распределения имеет следующий вид:
.                    (24)
Таким образом, если случайная величина Х следует закону нормального распределения, то вероятность появления случайной погрешности определяется площадью, ограниченной кривой f (x) и ее частью и осью абсцисс:
                                       (25)
Подынтегральное значение есть элемент вероятности, равный площади прямоугольника с основанием dx и абсциссами x1 и x2, называемыми квантилями.
Произведем замену переменной: t = x /  , dx =    dt:

.                                               (26)
Представим правую часть в виде суммы двух интегралов:

.
Интеграл вида
                                                 (27)
носит название нормальной функции Лапласа. Значения этого интеграла сведены в таблицу. Таким образом, указанная вероятность (25) сводится к разности нормальных функций Лапласа:
р { x1 < x < x2 } = Ф (t2) - Ф (t1) .                                   (28)

Расчет количества годных деталей сводится к установлению величины t и определению Ф(t) по таблице с последующим пересчетом полученных величин в проценты или в число штук изделий.
В общем случае, когда  , имеем следующую вероятность появления случайных погрешностей:

.                  (29)

Отметим свойства функции Лапласа: Ф(0) = 0; Ф(-х) = -Ф(х) (функция нечетная); Ф( )=1/2. Из рис. 10 видно, что кривые F(х) и Ф(x) эквидистантны.

Пример 5. На металлургическом заводе проведено контрольное определение твердости по Шору рабочего слоя большой партии однотипных листопрокатных валков. Установлено, что твердость (случайная величина x) распределена нормально с математическим ожиданием 60 ед. по Шору и средним квадратическим отклонением 5 ед. по Шору. Необходимо найти вероятность того, что значение твердости валков заключено в пределах 57…65 ед. Шора, оговоренных ГОСТ.
Решение.  Используем формулу (28). По условию задачи x1=57; x2=65;    =5, следовательно,
По таблице функции Лапласа находим: Ф(1,0)=0,3413; Ф(0,6)=0,2257. Отсюда искомая вероятность

Во многих практических задачах требуется вычислить вероятность того, что абсолютное отклонение ?X нормально распределенной случайной величины X от математического ожидания меньше заданного положительного числа ?, т.е. требуется найти вероятность выполнения неравенства

                                            (30)
На основании нечетности функции Лапласа справедливо соотношение

              (31)
Аналогично для нормированной случайной величины

                       (32)

Обозначив    , получим    .
Если t =3 и соответственно     , то


Вероятность того, что абсолютное отклонение будет меньше утроенного среднеквадратичного отклонения, равна 0,9973 и большие отклонения практически невозможны. В этом состоит "правило трех сигм": при нормальном распределении случайной величины абсолютная величина ее отклонения от математического ожидания не превышает утроенного среднего квадратичного отклонения.
Это правило применяют для проверки нормальности распределения изучаемой величины и для выявления грубых ошибок (промахов) в экспериментальных данных.

Пример 6.  Величина отбеленного рабочего слоя валов после чистовой обработки является нормально распределенной случайной величиной со средним квадратичным отклонением  x=1 мм. Необходимо определить вероятность брака валов по причине малого и большого отбела, если бракуются валы, отбел которых отклоняется от требований технических условий более, чем на 2 мм.
Решение. Используем формулу (31). По условию задачи ?=2 мм;  x=1 мм, следовательно, вероятность получения годной продукции
Вероятность получения брака равна вероятности противоположного события

4.2. Экспоненциальное распределение

Экспоненциальное распределение характерно для внезапных отказов элементов и систем. Плотность вероятности экспоненциального распределения задается уравнением
  ,   ,   ,      x > 0 ,             (33)

где     параметр распределения, являющийся строго положительной константой.
Среднее значение   и среднеквадратическое отклонение ? экспоненциального распределения совпадают и равны обратному значению параметра   =   = 1/ . Графики функций F(х) и f(x) приведены на рис. 12. Отличительной особенностью экспоненциального распределения является то, что интенсивность отказов  (х) постоянна, т.e. не зависит от аргумента  (значения случайной величины).
Основное  свойство экспоненциального закона состоит в том, что при нем вероятность безотказной работы на данном интервале не зависит от времени предшествующей работы, а зависит от длины интервала. Это значит, что будущее поведение элемента не зависит от прошлого, если в данный момент он исправлен.


4.3. Равномерное распределение

Если погрешность измерений с одинаковой вероятностью может принимать любые значения, не выходящие за некоторые границы, то такая погрешность описывается равномерным законом распределения. Распределение по закону равной вероятности встречается, когда наряду со случайными факторами, вызывающими рассеивание, действует доминирующий систематический фактор, непрерывно и равномерно изменяющий во времени положение центра группирования Mx. Графически такое распределение случайной величины отображается прямоугольником (рис. 13).
Если рассеяние размеров зависит только от переменных систематических погрешностей, от износа режущей кромки инструмента, то распределение действительных размеров партии деталей подчиняется закону равной вероятности.
Например, при установившемся износе режущего инструмента уменьшение его размеров во времени подчиняется прямолинейному закону, что соответственно увеличивает (при обработке валов) или уменьшает (при обработке отверстий) диаметры обрабатываемых заготовок. Тогда в момент времени t1 вал будет иметь размер а, в момент времени t2   b. Естественно, что изменение размеров обрабатываемых заготовок тоже происходит по закону прямой линии.
При изменении случайной величины X в интервале от a до b плотность f(x) постоянна и равна С; вне этого интервала она равна нулю. Так как площадь, ограниченная кривой распределения, равна единице
,        отсюда   .                    (34)
Плотность распределения f(x) имеет вид:
(35)

Функция распределения  имеет вид:

         (36)

Вычислим математическое ожидание и дисперсию:
,

Определяем среднее квадратическое отклонение и поле рассеяния:

;           .                                   (37)

Коэффициент асимметрии Sk = 0 (распределение симметрично). Для определения коэффициента эксцесса найдем четвертый центральный момент

.

Отсюда                                        .
Равномерное распределение наиболее характерно для неисключенных систематических погрешностей (погрешность от трения в опорах электромеханических приборов, погрешность дискретности в цифровых приборах и др.). Если отсутствуют данные о виде распределения систематической погрешности, то они принимаются равномерными, так как оцениваются границами (пределами) допускаемых погрешностей.

5.        Вопросы для самоконтроля

1.        Сформулируйте основные причины появления неопределенностей. Какие из них являются субъективными, а какие - объективными?
2.        Как описывается неопределенность математически?
3.        Приведите примеры математического описания неопределенностей в металлургии.
4.        Когда в задаче математического моделирования применяется стохастическое описание переменных?
5.        Дайте определение функции  и плотности распределения.
6.        Меры положения и рассеяния кривой распределения. Объясните различие между модой, медианой и математическим ожиданием.
7.        Что характеризуют дисперсия, стандартное отклонение, коэффициент корреляции?
8.        Дайте характеристики законам распределения: нормальному, экспоненциальному, равномерному.