Нормальное распределение для Форекс

Рейтинг лучших брокеров для торговли акциями за 2023 год:
  • Evotrade
    ☆☆☆☆☆
    ★★★★★
    Evotrade

    Бонусы для новых трейдеров до 5000$!

  • BINARIUM
    ☆☆☆☆☆
    ★★★★★
    BINARIUM

    Лучший брокер по бинарным опционам. Огромный раздел по обучению.

В этой статье раскрыты следующие темы:

Нормальное распределение для Форекс

Связь математической статистики с теорией вероятности имеет различный характер, в различных случаях. Тем не менее, теория вероятностей играет определенную роль при статистическом изучении массовых явлений. В таком случае находит себе применение – Нормальное распределение или «Распределение Гаусса». Большинство процессов в природе сходятся к нормальному распределению.

Согласно, Закона Больших чисел – совокупное действие большого числа случайных факторов, приводит, при некоторых, весьма общих условиях, приводит к результату, почти независящему от случая. Проще говоря, при очень большом количестве анализируемого события, вероятность происшествия отдельно взятого будет превалировать над другими.
Графически, это можно увидеть на гистограмме нормального распределения.

Наиболее понятный пример нормального распределения – стрельба по мишени. При достаточном количестве выстрелов, и навыках среднего стрелка (имеется ввиду попадание в мишень, но при этом не такие, чтобы в «яблочке» зияла дыра), будет отчетливо видно, что отверстий от попаданий будет больше всего в центре мишени, причем, чем дальше от центра – тем меньше. То есть, плотность вероятности попадания в мишень максимальна в центре и спадает к краям. Справедливости ради, хочу уточнить, если «облако попаданий» будет гуще во второй нижней четверти мишени, очевидно, что плотность вероятности попадания сместится от центра ко второй нижней четверти.

Естественно, что делать статистически достоверные выводы можно делать только на достаточно большом количестве данных. Поэтому итоговый анализ 500 сделок дает больше оснований для принятия решений, чем серия из 100 сделок.

Наиболее важными характеристиками распределения являются математическое ожидание и дисперсия. Пологость или крутизна распределения характеризуются разбросом значений вокруг математического ожидания. Это и есть дисперсия. Причем нормальное распределение, математическое ожидание которого равно нулю, а стандартное отклонение равно 1 (стандартное отклонение – квадратный корень из дисперсии), называют Распределением Гаусса или стандартным нормальным распределением.

Какое применение этим знаниям найдет для себя трейдер? Значение Математическое ожидания укажет нам, насколько прибыльна стратегия, используемая трейдером в своей деятельности. В свою очередь, разброс распределения покажет, насколько высок риск в торговой стратегии трейдера. Даже при положительном математическом ожидании, высокое значение стандартного отклонения будет означать, что риск слишком высок.

Математическое ожидание для данной гистограммы нормального распределения — -50,18, что уже говорит об убыточной стратегии. Причем разброс результатов в гистограмме не только достаточно большой, но и крайне не равномерен. Стоит обратить внимание на «пучок» столбцов в диапазоне от -48,69 до -194,76. Невооруженным глазом видно, что свыше 100 сделок были проведены в серьезном диапазоне убыточного отрезка.

Данная гистограмма распределения представляет нам картину очень далекую от классического нормального распределения. Но обратите внимание на то, что намного превалирующую зону оси х, занимает прибыльный отрезок всего диапазона, а столбец, намного возвышающийся над другими, располагается в диапазоне, всего лишь от -3,91 до -5,22. В совокупности с положительным математическим ожиданием — +3,22, доходность депозита составила 2,72%.

Вкупе с графиком доходности, анализ гистограммы нормального распределения дает обширную картину плюсов и минусов торговой стратегии.

Лучшие брокеры без обмана
  • Evotrade
    ☆☆☆☆☆
    ★★★★★
    Evotrade

    Бонусы для новых трейдеров до 5000$!

  • BINARIUM
    ☆☆☆☆☆
    ★★★★★
    BINARIUM

    Лучший брокер по бинарным опционам. Огромный раздел по обучению.

Безусловно, скопление красных столбцов, намного возвышающихся над зелеными, наводит на мысль об убыточной стратегии. Но в данном случае, они скорее говорят, о том, что необходима незначительная коррекция, т.к. риск на депозит достаточно велик, в силу большого разброса значений. «Спасло» этого трейдера лишь то, что большая часть данных находится в зеленом диапазоне распределения, что говорит о неплохом контроле рисков. Эти факторы и привели его к следующей картине.

В заключении, стоит сказать, что статистические методы анализа торговли, направлены на выявление слабостей трейдера, его торговой стратегии. То есть все инструменты анализа направлены не для того, чтобы просто дать характеристику стратегии, а для выявления слабых мест, для совершенствования профессионализма, повышения эффективности торговли и торгового подхода к сделке.

Copyright © 2009 — 2020. Все права защищены.

ИП Силантьев Сергей Владимирович. ОГРН 310501229800018

Закон нормального распределения

Если взять некую случайную величину, то она распределяется по закону нормального (Гауссова) распределения. И график такого распределения напоминает колокол:

Будем откладывать по оси Х рост находящихся в аудитории студентов, а по оси У- количество обладателей того или иного роста- получим тот же график — колокол. Он подтвердит тот факт, что можно встретить высокого человека так же редко, как и низкого. А основная масса студентов- среднего роста.

Тот же самый график колокола мы получим практически при любом столкновении с большим количеством случайных величин, и на рынке (фондовом, форекс и иных).

[Универсальность этого графика иллюстрирует в том числе, что общество у нас, как в России, так и во всём мире, устроено и живёт так же: под горбом распределения- живущие «как все», по нормам, преданиям, традициям и привычкам, исключения- в «хвостах» распределения, с одной стороны- усиленно деградирующие наркоманы, бомжи, извращенцы, опускающиеся и опустившиеся, с другой стороны- те, кто строит будущее своего общества, не обращая внимания на писки и визги со стороны. Увы, это так, как бы просто и/или высокопарно это ни звучало. Куда потянется горб нормального распределения в будущем — за культурным потреблением наркотиков и признанием извращений как нормы, например, или за трезвым, а затем и здоровым образом жизни — зависит от каждого из нас, от того, к какой части меньшинства во многих аспектах жизни каждый из нас решает примкнуть разумным волевым порядком, переступив инерцию образа жизни «как все», выявив и увидев недостатки и порочность этих аспектов жизни. ]

Вернёмся к финансам и фондовому рынку. Когда идёт «позитивная» информационная накачка и раздача кредитов для покупки акций и роста, статистически-предопределённо большинство народа с радостью играет в эту игру. «Позитивная» новость через подконтрольные СМИ ( а они все подконтрольные)- и 68-98% инвесторов по ЗНР бежит тариться. Когда роздано достаточно денег, и масса игроков на кредитные деньги покупать больше не хотят, а начинают сливать и фиксировать прибыль, рынок начинают «мочить», выводя маржинальщиков на маржинколы и заставляя продать купленные акции своим-пацанам дёшево. Продать должны 95-98% маржинальщиков, а купить у них- только свои (находятся с одного конца колокола) и случайные попутчики (с другого конца, есть такие: кто-то хотел продать, но нажал не на ту кнопку, кому-то босс впендюрил акции, чтоб не играл против рынка и т.д.). Если расстаются с акциями неохотно, и на хвоста к своим-пацанам прыгают лишние люди, рынок мочат дальше, ещё и ещё, пока всех не вытряхнут.

В 2008-2009 г. в Сбербанке шла смена менеджмента, и всех крупных спекулянтов попросили избавиться от своих пакетов акций (предположительно, в их число входили Керимов и Батурина). А чтоб акционеры были более сговорчивы и не требовали бонусов к стоимости покупки, их вели на принудительные продажи. И как свои-пацаны купили пакеты у бывших, акции погнали верх, откуда начинали опускать, и выше. Информационный фон кризисного года способствовал «уговорам» и формированию нужной цены, но полную ясность в происходящее может внести только понимание механизмов скидывания халявщиков через маржин-колы по закону нормального распределения.

Те же методы использовались и в акциях Газпрома ( и иных), причём в Газпроме видно, как выводили на принудительное закрытие не только купивших акции, но и открывших короткие позиции (продажа акций без покрытия). Эти моменты отмечены синими эллипсами. Ребята что-то не поняли и надеялись по аналогии со Сбером халявно «заработать»- и их ставили на место. В Газпроме долгое опускание цены ниже 100 могло привести к маржинколам у своих банков и инвест-компаний с много-миллионными убытками. Или не своих, но дружественных, а начинать межклановые войны из-за каких-то недоумков никто не хотел, посему шортовиков вынуждали не играть на понижение.

(Так наши-пацаны и работают: дёшево скупают на маржин-колах у маржинальщиков, затем дорого их впаривают шортовикам, приговаривая: не мы такие, рынок такой непредсказуемый. ) Наивно полагать, что аналитики или трейдеры на канале РБК или даже в личной беседе ответят на вопрос: «Сколько будет стоить акция Газпрома (Сбера, НорНикеля, etc.) через месяц или к концу года?» Естественно, те НЕ ЗНАЮТ, сколько народу, на каких уровнях влезет в длинные позиции на заёмные средства и на каких уровнях их от-маржинколят, сколько шортовиков и где будут вынужденно выкупать акции. Они могут только пред-полагать, тыкая фактически пальцем в небо, и если цена через месяц или к концу года совпадёт с чьим-то предположением,- это и будет «угадай-ка».

Акции Газпрома упали «всего» в 3 раза, и не смогли восстановиться до прежних уровней ( в то время как в Сбере и в других акциях верхи были обновлены). Причина- в неполной продаже кредитных пакетов и новых покупках, проще сказать- в большом наличии халявщиков. Свои-пацаны не любят возить толпу халявщиков наверх.

В применении к нашей торговле акциями: мы будем прикидываться «своими» и прыгать на хвоста. Когда все кричат о конце света и торгов- будем присматриваться и покупать, когда закрывают «длинные» позиции. Когда идёт рост из-за закрытия «коротких» позиций- ждать быстрого падения, здесь можно и нужно хотя бы частично продать акции.

Если же Вы принимаете решение ТОЛЬКО на основе ТА, ФА и свежих «новостей», то по закону Нормального распределения Вы принимаете такое же решение, как и 68-98% других игроков. А значит, пацаны-кукловоды попробуют отвести Вас на стрижку и резню, и если у Вас есть кредиты- с высокой долей вероятности у пацанов получится постричь, а то и зарезать часть ваших позиций.

Надеяться на то, что, став клиентом одной из инвестиционных компаний и подписавшись на их рассылку анализа рынка, Вы получите работающие рекомендации о покупке/продаже тех или иных акций и Вы не потеряете свои деньги- так же наивно: рассылки делаются всем клиентам, и толпой в 90-95% (по закону нормального распределения) клиенты клюют на эту приманку. Так же по ЗНР, а то и по прямому сговору инвестбанкиров, рекомендации и обзоры у брокерских компаний примерно одинаковы, и все эти рекомендации делаются для отвода глаз и просто «по-статусу-брокера-положено», чтоб было «не-хуже-других-нвесткомпаний».

Если успеете купить акции перед тем, как туда погонят толпу и продать их, пока толпу не стали резать- да, Ваш счёт станет больше. Но успеете ли? Обычно покупают перед толпой инсайдеры. Брокеры весьма долго и небезуспешно боролись против принятия закона об инсайде: в России об уголовных делах с привлечением инсайдеров к ответственности не слышно.

За отдельную плату, значительно превышающую плату за ежемесячное обслуживание и простые рассылки, Вам могут предложить «эксклюзив», гарантировав непопадание с толпой в стадо для стрижки. Конечно, рекомендации в «эксклюзиве» существенно отличаются от рекомендаций для толпы, подчас диаметрально противоположно. Уже это разделение на эксклюзивную «элиту», которую в общем-то тоже доят и стригут, но по-своему, по-«эксклюзивному», и на толпу для стрижки — недвусмысленно говорит о характере нашего «свободного» рынка и истинных намерениях брокерских контор.

Усиливающиеся в периоды кризисов выступления аналитиков и финансистов по поводу развития-рынка-ценных-бумаг, улучшения-инвестиционного-климата, развития-финансовой-грамотности, привлечения-новых-клиентов, etc.- имеют лишь одну основу: пополнить толпу под шапкой колокола ЗНР. Без притока новых клиентов с новыми деньгами в стадо для стрижки скоро начнут стричь эксклюзивную «элиту», вместе с ними- некогда успешных трейдеров, и разные брокерские компании пойдут по миру.

Нормальный закон распределения. Нормальное распределение (иногда называемое законом Гаусса) играет исключительно важную роль в теории вероятностей и математической статистике и занимает

Нормальное распределение (иногда называемое законом Гаусса) играет исключительно важную роль в теории вероятностей и математической статистике и занимает среди других законов распределения особое положение. Это объясняется целым рядом причин:

1 Многие случайные величины имеют нормальное или близкое к нормальному распределение.

2 Нормальное распределение хорошо подходит в качестве аппроксимации других распределений (например, биномиального).

3 Нормальное распределение обладает рядом математических свойств, во многом обеспечивших его широкое применение в теории вероятностей и математической статистике.

Случайная величина X называется распределенной по нормальному закону, если ее плотность распределения вероятностей задается формулой

где s > 0 и m – параметры распределения.

то приведенное выше определение корректно. (При проведении преобразований была сделана подстановка , и в результате получили интеграл Пуассона, который равен .)

Основные свойства нормального распределения:

1 Нормальное распределение полностью определяется двумя параметрами: m и s. Вероятностный смысл этих параметров таков: mматематическое ожидание, s – среднее квадратическое отклонение рассматриваемой случайной величины. То есть для нормального распределения:

2 Кривая нормального распределения имеет колоколообразную форму, симметричную относительно прямой x = m, и при x ® –¥ и x ® ¥ эта кривая асимптотически приближается к оси абсцисс.

Общий вид графика функции плотности распределения вероятностей f(x) для произвольных значений параметров m и s изображен на рисунке 19.

Рисунок 19 – График функции f(x) нормально распределенной
случайной величины

3 Как видно из графика функции f(x), для нормально распределенной случайной величины вероятность получения значений, значительно удаленных от среднего значения m, быстро уменьшается с ростом величины отклонения.

4 Медиана и мода случайной величины, распределенной по нормальному закону, совпадают и равны математическому ожиданию m, xmod = xd == M[X] = m.

5 Коэффициенты асимметрии и эксцесса нормально распределенной случайной величины равны нулю: A[X] = 0; [X] = 0.

Тот факт, что случайная величина X распределена по нормальному закону с параметрами m и s, символически записывается X

N(m; s). Этой случайной величине соответствует следующая функция распределения вероятностей

График функции распределения F(x) изображен на рисунке 20.

На рисунках 21 и 22 изображены графики функции f(x), соответствующие различным значениям параметров m и s.

Рисунок 20 – График функции распределения F(x) нормально распределенной случайной величины

Рисунок 21 – График функции f(x) нормально распределенной случайной величины Рисунок 22 – График функции f(x) нормально распределенной случайной величины

Не нашли то, что искали? Воспользуйтесь поиском:

Лучшие изречения: Да какие ж вы математики, если запаролиться нормально не можете. 8365 — | 7296 — или читать все.

188.64.173.93 © studopedia.ru Не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования. Есть нарушение авторского права? Напишите нам | Обратная связь.

Отключите adBlock!
и обновите страницу (F5)

очень нужно

Нормальное распределение. Непрерывные распределения в MS EXCEL

Рассмотрим Нормальное распределение. С помощью функции MS EXCEL НОРМ.РАСП() построим графики функции распределения и плотности вероятности. Сгенерируем массив случайных чисел, распределенных по нормальному закону, произведем оценку параметров распределения, среднего значения и стандартного отклонения.

Нормальное распределение (также называется распределением Гаусса) является самым важным как в теории, так в приложениях системы контроля качества. Важность значения Нормального распределения (англ. Normal distribution) во многих областях науки вытекает из Центральной предельной теоремы теории вероятностей.

Определение: Случайная величина x распределена по нормальному закону, если она имеет плотность распределения:

Нормальное распределение зависит от двух параметров: μ (мю) — является математическим ожиданием (средним значением случайной величины), и σ (сигма) — является стандартным отклонением (среднеквадратичным отклонением). Параметр μ определяет положение центра плотности вероятности нормального распределения, а σ — разброс относительно центра (среднего).

Примечание: О влиянии параметров μ и σ на форму распределения изложено в статье про Гауссову кривую, а в файле примера на листе Влияние параметров можно с помощью элементов управления Счетчик понаблюдать за изменением формы кривой.

Нормальное распределение в MS EXCEL

В MS EXCEL, начиная с версии 2010, для Нормального распределения имеется функция НОРМ.РАСП() , английское название — NORM.DIST(), которая позволяет вычислить плотность вероятности (см. формулу выше) и интегральную функцию распределения (вероятность, что случайная величина X, распределенная по нормальному закону, примет значение меньше или равное x). Вычисления в последнем случае производятся по следующей формуле:

Вышеуказанное распределение имеет обозначение N(μ; σ). Так же часто используют обозначение через дисперсию N(μ; σ 2 ).

Примечание: До MS EXCEL 2010 в EXCEL была только функция НОРМРАСП() , которая также позволяет вычислить функцию распределения и плотность вероятности. НОРМРАСП() оставлена в MS EXCEL 2010 для совместимости.

Стандартное нормальное распределение

Стандартным нормальным распределением называется нормальное распределение с математическим ожиданием μ=0 и дисперсией σ=1. Вышеуказанное распределение имеет обозначение N(0;1).

Примечание: В литературе для случайной величины, распределенной по стандартному нормальному закону, закреплено специальное обозначение z.

Любое нормальное распределение можно преобразовать в стандартное через замену переменной z=(x-μ)/σ. Этот процесс преобразования называется стандартизацией.

Примечание: В MS EXCEL имеется функция НОРМАЛИЗАЦИЯ() , которая выполняет вышеуказанное преобразование. Хотя в MS EXCEL это преобразование называется почему-то нормализацией. Формулы =(x-μ)/σ и =НОРМАЛИЗАЦИЯ(х;μ;σ) вернут одинаковый результат.

В MS EXCEL 2010 для стандартного нормального распределения имеется специальная функция НОРМ.СТ.РАСП() и ее устаревший вариант НОРМСТРАСП() , выполняющий аналогичные вычисления.

Продемонстрируем, как в MS EXCEL осуществляется процесс стандартизации нормального распределения N(1,5; 2).

Для этого вычислим вероятность, что случайная величина, распределенная по нормальному закону N(1,5; 2), меньше или равна 2,5. Формула выглядит так: =НОРМ.РАСП(2,5; 1,5; 2; ИСТИНА) =0,691462. Сделав замену переменной z=(2,5-1,5)/2=0,5, запишем формулу для вычисления Стандартного нормального распределения: =НОРМ.СТ.РАСП(0,5; ИСТИНА) =0,691462.

Естественно, обе формулы дают одинаковые результаты (см. файл примера лист Пример ).

Обратите внимание, что стандартизация относится только к интегральной функции распределения (аргумент интегральная равен ИСТИНА), а не к плотности вероятности.

Примечание: В литературе для функции, вычисляющей вероятности случайной величины, распределенной по стандартному нормальному закону, закреплено специальное обозначение Ф(z). В MS EXCEL эта функция вычисляется по формуле
=НОРМ.СТ.РАСП(z;ИСТИНА) . Вычисления производятся по формуле

В силу четности функции плотности стандартного нормального распределения f(x), а именно f(x)=f(-х), функция стандартного нормального распределения обладает свойством Ф(-x)=1-Ф(x).

Обратные функции

Функция НОРМ.СТ.РАСП(x;ИСТИНА) вычисляет вероятность P, что случайная величина Х примет значение меньше или равное х. Но часто требуется провести обратное вычисление: зная вероятность P, требуется вычислить значение х. Вычисленное значение х называется квантилем стандартного нормального распределения.

В MS EXCEL для вычисления квантилей используют функцию НОРМ.СТ.ОБР() и НОРМ.ОБР() .

Графики функций

В файле примера приведены графики плотности распределения вероятности и интегральной функции распределения.

Как известно, около 68% значений, выбранных из совокупности, имеющей нормальное распределение, находятся в пределах 1 стандартного отклонения (σ) от μ(среднего или математического ожидания); около 95% — в пределах 2-х σ, а в пределах 3-х σ находятся уже 99% значений. Убедиться в этом для стандартного нормального распределения можно записав формулу:

которая вернет значение 68,2689% — именно такой процент значений находятся в пределах +/-1 стандартного отклонения от среднего (см. лист График в файле примера ).

В силу четности функции плотности стандартного нормального распределения: f(x)=f(-х), функция стандартного нормального распределения обладает свойством F(-x)=1-F(x). Поэтому, вышеуказанную формулу можно упростить:

Для произвольной функции нормального распределения N(μ; σ) аналогичные вычисления нужно производить по формуле:

Вышеуказанные расчеты вероятности требуются для построения доверительных интервалов.

Примечание: Для построения функции распределения и плотности вероятности можно использовать диаграмму типа График или Точечная (со сглаженными линиями и без точек). Подробнее о построении диаграмм читайте статью Основные типы диаграмм.

Примечание: Для удобства написания формул в файле примера созданы Имена для параметров распределения: μ и σ.

Генерация случайных чисел

С помощью надстройки Пакет анализа можно сгенерировать случайные числа, распределенные по нормальному закону.

СОВЕТ: О надстройке Пакет анализа можно прочитать в статье Надстройка Пакет анализа MS EXCEL.

Сгенерируем 3 массива по 100 чисел с различными μ и σ. Для этого в окне Генерация случайных чисел установим следующие значения для каждой пары параметров:

Примечание: Если установить опцию Случайное рассеивание (Random Seed), то можно выбрать определенный случайный набор сгенерированных чисел. Например, установив эту опцию равной 25, можно сгенерировать на разных компьютерах одни и те же наборы случайных чисел (если, конечно, другие параметры распределения совпадают). Значение опции может принимать целые значения от 1 до 32 767. Название опции Случайное рассеивание может запутать. Лучше было бы ее перевести как Номер набора со случайными числами.

В итоге будем иметь 3 столбца чисел, на основании которых можно, оценить параметры распределения, из которого была произведена выборка: μ и σ. Оценку для μ можно сделать с использованием функции СРЗНАЧ() , а для σ – с использованием функции СТАНДОТКЛОН.В() , см. файл примера лист Генерация .

Примечание: Для генерирования массива чисел, распределенных по нормальному закону, можно использовать формулу =НОРМ.ОБР(СЛЧИС();μ;σ) . Функция СЛЧИС() генерирует непрерывное равномерное распределение от 0 до 1, что как раз соответствует диапазону изменения вероятности (см. файл примера лист Генерация ).

Задачи

Задача1. Компания изготавливает нейлоновые нити со средней прочностью 41 МПа и стандартным отклонением 2 МПа. Потребитель хочет приобрести нити с прочностью не менее 36 МПа. Рассчитайте вероятность, что партии нити, изготовленные компанией для потребителя, будут соответствовать требованиям или превышать их.
Решение1: = 1-НОРМ.РАСП(36;41;2;ИСТИНА)

Задача2. Предприятие изготавливает трубы, средний внешний диаметр которых равен 20,20 мм, а стандартное отклонение равно 0,25мм. Согласно техническим условиям, трубы признаются годными, если диаметр находится в пределах 20,00+/- 0,40 мм. Какая доля изготовленных труб соответствует ТУ?
Решение2: = НОРМ.РАСП(20,00+0,40;20,20;0,25;ИСТИНА)- НОРМ.РАСП(20,00-0,40;20,20;0,25)
На рисунке ниже, выделена область значений диаметров, которая удовлетворяет требованиям спецификации.

Решение приведено в файле примера лист Задачи .

Задача3. Предприятие изготавливает трубы, средний внешний диаметр которых равен 20,20 мм, а стандартное отклонение равно 0,25мм. Внешний диаметр не должен превышать определенное значение (предполагается, что нижняя граница не важна). Какую верхнюю границу в технических условиях необходимо установить, чтобы ей соответствовало 97,5% всех изготавливаемых изделий?
Решение3: = НОРМ.ОБР(0,975; 20,20; 0,25) =20,6899 или
= НОРМ.СТ.ОБР(0,975)*0,25+20,2 (произведена «дестандартизация», см. выше)

Задача 4. Нахождение параметров нормального распределения по значениям 2-х квантилей (или процентилей).
Предположим, известно, что случайная величина имеет нормальное распределение, но не известны его параметры, а только 2-я процентиля (например, 0,5-процентиль, т.е. медиана и 0,95-я процентиль). Т.к. известна медиана, то мы знаем среднее, т.е. μ. Чтобы найти стандартное отклонение нужно использовать Поиск решения.
Решение приведено в файле примера лист Задачи .

Примечание: До MS EXCEL 2010 в EXCEL были функции НОРМОБР() и НОРМСТОБР() , которые эквивалентны НОРМ.ОБР() и НОРМ.СТ.ОБР() . НОРМОБР() и НОРМСТОБР() оставлены в MS EXCEL 2010 и выше только для совместимости.

Линейные комбинации нормально распределенных случайных величин

Известно, что линейная комбинация нормально распределённых случайных величин x(i) с параметрами μ(i) и σ(i) также распределена нормально. Например, если случайная величина Y=x(1)+x(2), то Y будет иметь распределение с параметрами μ(1)+ μ(2) и КОРЕНЬ(σ(1)^2+ σ(2)^2). Убедимся в этом с помощью MS EXCEL.

С помощью надстройки Пакет анализа сгенерируем 2 массива по 100 чисел с различными μ и σ.

Теперь сформируем массив, каждый элемент которого является суммой 2-х значений, взятых из каждого массива.

С помощью функций СРЗНАЧ() и СТАНДОТКЛОН.В() вычислим среднее и дисперсию получившейся выборки и сравним их с расчетными.

Кроме того, построим График проверки распределения на нормальность (Normal Probability Plot), чтобы убедиться, что наш массив соответствует выборке из нормального распределения.

Прямая линия, аппроксимирующая полученный график, имеет уравнение y=ax+b. Наклон кривой (параметр а) может служить оценкой стандартного отклонения, а пересечение с осью y (параметр b) – среднего значения.

Для сравнения сгенерируем массив напрямую из распределения N(μ(1)+ μ(2); КОРЕНЬ(σ(1)^2+ σ(2)^2)).

Как видно на рисунке ниже, обе аппроксимирующие кривые достаточно близки.

В качестве примера можно провести следующую задачу.

Задача. Завод изготавливает болты и гайки, которые упаковываются в ящики парами. Пусть известно, что вес каждого из изделий является нормальной случайной величиной. Для болтов средний вес составляет 50г, стандартное отклонение 1,5г, а для гаек 20г и 1,2г. В ящик фасуется 100 пар болтов и гаек. Вычислить какой процент ящиков будет тяжелее 7,2 кг.
Решение. Сначала переформулируем вопрос задачи: Вычислить какой процент пар болт-гайка будет тяжелее 7,2кг/100=72г. Учитывая, что вес пары представляет собой случайную величину = Вес(болта) + Вес(гайки) со средним весом (50+20)г, и стандартным отклонением =КОРЕНЬ(СУММКВ(1,5;1,2)) , запишем решение
= 1-НОРМ.РАСП(72; 50+20; КОРЕНЬ(СУММКВ(1,5;1,2));ИСТИНА)
Ответ: 15% (см. файл примера лист Линейн.комбинация )

Аппроксимация Биномиального распределения Нормальным распределением

Если параметры Биномиального распределения B(n;p) находятся в пределах 0,1 10, то Биномиальное распределение можно аппроксимировать Нормальным распределением.

При значениях λ>15, Распределение Пуассона хорошо аппроксимируется Нормальным распределением с параметрами: μ, σ 2 =λ.

Подробнее о связи этих распределений, можно прочитать в статье Взаимосвязь некоторых распределений друг с другом в MS EXCEL. Там же приведены примеры аппроксимации, и пояснены условия, когда она возможна и с какой точностью.

СОВЕТ : О других распределениях MS EXCEL можно прочитать в статье Распределения случайной величины в MS EXCEL.

Управление эффективностью: кривая нормального распределения

Сегодня многие консультанты и специалисты в сфере HRM говорят об управлении эффективностью, дают различные советы и делают выводы «космического масштаба» о том, как ее повысить. Но какова суть эффективности, ее природа? Каким правилам и законам она подчиняется?

Чем более глубокими теоретическими знаниями мы обладаем, тем более совершенна наша практическая деятельность. Действительно, управлять эффективностью можно только в том случае, если мы глубоко понимаем природу этого феномена.

Эффективность — это результативность процесса, операции, проекта. Она определяется как отношение полученного результата (достигнутого эффекта) к затратам — расходам на его получение. Для оценки этого параметра деятельности используется специальный математический аппарат (коэффициенты, формулы, методы расчета и т. д.). Использование метрик эффективности позволяет эйчарам разработать определенный алгоритм собственной работы.

Эффективность деятельности компании в целом зависит от эффективности работы каждого ее сотрудника. В крупном коллективе работают разные люди — естественно, они демонстрируют различную результативность. Количество людей с высокой/ средней/ низкой результативностью труда — математики используют термин «распределение» — подчиняется закономерности, которую называют кривой нормального распределения.

Закон нормального распределения сформулировал немецкий математик Фридрих Гаусс еще в начале XIX века. Суть его состоит в том, что заметные отклонения встречаются значительно реже, чем средние величины. Закон Гаусса начинает действовать в группе: чем больше элементов, тем нагляднее проявляется «нормальность» распределения (шире разброс крайних значений и более выражен «горб» средних).

На рисунке 1 изображена кривая нормального распределения — гауссиана. Вся живая и неживая природа подчиняется этому закону. Например, в каждом классе любой школы (и во всех школах мира) подавляющее большинство составляют «середнячки», часть учеников учится немного лучше и немного хуже, и несколько процентов детей — очень способны (еще реже — одарены, талантливы) и столько же — плохо обучаемы и не имеют никакой мотивации к учебе.

Рис. 1. Кривая нормального распределения Гаусса

Но констатации факта, что наиболее эффективных сотрудников (в любом коллективе!) примерно столько же, сколько низкопроизводительных, а большая часть работников — «середнячки», недостаточно для того, чтобы управлять результативностью.

Следствия закона нормального распределения могут показаться парадоксальными: в любом коллективе будут лучшие и худшие. Всегда! Иначе теряет смысл само определение «лучший»… Это не значит, что если уволить лодырей, то «разленятся» другие сотрудники, скорее — повысятся критерии оценки эффективности для этого коллектива. Любая система стремится к равновесию, и смысл управления в том, чтобы устанавливать это равновесие на все более высоком «базовом» уровне…

Если мы посмотрим на результаты оценки сотрудников реальной компании (по критерию эффективности в достижении поставленных целей), то увидим, что они «выстраиваются» в гауссиану (рис. 2): в группу III входят 5% самых результативных сотрудников, в группу I — 5% самых неэффективных, а остальные (группа II) демонстрируют средние показатели.

Рис. 2. Распределение сотрудников компании по показателю «эффективность» описывается кривой нормального распределения

Далее рассмотрим графики на рисунке 3. Отсутствие «передовиков производства» (вариант на рис. 3а), «отстающих» (рис. 3б) или и тех и других одновременно (рис. 3в) — утопия. Если статистика противоречит закону Гаусса, значит, у компании есть серьезные проблемы с организацией труда, а также неудачно выстроена система оценки результативности деятельности. Скорее всего, работа на конкретных рабочих местах плохо описана, неправильно пронормированна и неэффективно стимулируется (то есть нормы выработки, рабочие задания завышены или занижены, а система оплаты не мотивирует к тому, чтобы люди прикладывали больше усилий). Возможно также, что в этих компаниях неудачно выбрана система показателей для оценки результатов (например, оценивается качество продукции, а реально оплачиваются объемы ее изготовления) и/или есть серьезные управленческие ошибки с постановкой целей и определением приоритетности задач.

Рис 3. Графики распределения сотрудников компании по показателю «эффективность»

Особый практический интерес (исходя из собственного опыта) представляет ситуация «все хорошие» (рис. 3в). Когда дело доходит до периодической оценки сотрудников, многие линейные менеджеры подходят к подчиненным «уравнительно», мотивируя свои решения «благими намерениями»: чтобы не осложнять отношения в коллективе, не провоцировать конфликты. Дело не только в том, что они не хотят задуматься над тем, что каждый человек уникален по своему, и работать одинаково «хорошо» все не могут. Это проблема качества управления: справедливая оценка ставит перед сотрудниками реалистичные цели, она сама по себе мотивирует людей, а значит, работает на повышение общей эффективности подразделения и компании в целом.

Впервые с подобным подходом я столкнулся при внедрении периодической системы оценки деятельности сотрудников одного из предприятий тяжелой промышленности: начальник одного из цехов утверждал, что у него все работают хорошо, и он не может кого-либо выделить. О каком развитии, повышении эффективности может идти речь, если руководитель не может отличить плохую работу от хорошей, а хорошую от отличной? Он сам лишает своих подчиненных возможности развиваться (и, как следствие, препятствует повышению эффективности их труда).

Нередко затратив огромные средства на внедрение системы управления эффективностью, компании не получают ожидаемого результата… Вывод один: пока линейные менеджеры не будут правильно применять инструменты и методы управления сотрудниками, которые им предлагают коллеги из службы по управлению персоналом, явного сдвига в повышении эффективности деятельности организации не будет.

Вернемся к закону Гаусса. Что можно сделать для повышения эффективности компании? Как перевести сотрудников из разряда лодырей хотя бы в разряд «середнячков»? Я предлагаю вниманию коллег проверенные на практике рекомендации:

Работать нужно со всем персоналом, повышая результативность каждого. Успеха можно добиться только в масштабах всей компании. Если сосредотачивать внимание на «воспитании» самых неэффективных работников или отдавать предпочтение лишь самым успешным, то в результате можно повысить только их личную эффективность. Затраты ресурсов и усилий в данном направлении приведут к частичным изменениям (рис. 4).

Рис. 4. Работа только с одной категорией сотрудников приведет к частичным изменениям

  1. Цель внедрения системы управления эффективностью — увеличить «норму для середнячков». Если менеджеры будут уделять внимание всему коллективу, то в итоге сохранятся и передовики, и относительно «отстающие» (для данного подразделения на этом этапе развития), но показатели результативности, которых достигают средние работники, — повысятся.

Отражение этого прогресса мы видим на рисунке 5: кривая распределения показателей эффективности сотрудников сместилась вправо по оси Х. По-прежнему 5% работников показывают лучшие в своей группе результаты, 5% — худшие, а подавляющее большинство, как и раньше, демонстрирует средние показатели. Но теперь:

самые слабые сотрудники работают на уровне «середнячков»;

«средние» уже подтянулись до уровня лидеров предыдущего периода;

лидеры достигли суперэффективности.

Рис. 5. Результат: повышение эффективности всей компании

Так все — каждый сотрудник, подразделение и компания в целом — выходят на новый уровень развития.

«Сдвинуть гору» с места, конечно, очень и очень непросто. Этого можно добиться, систематически проводя грамотную управленческую работу со всем персоналом, а не только с лучшими (кадровым резервом) или худшими. Для каждой группы сотрудников следует разрабатывать программы повышения эффективности. Непременное условие — они должны охватывать весь коллектив, тогда закон Гаусса будет работать на компанию!

Хочу также акцентировать внимание читателей на том, что управление эффективностью компании — это не разовое событие или мероприятие, а процесс, ежедневный кропотливый труд линейных руководителей и эйчаров. Поэтому топ-менеджеры каждой компании, перед тем как стать на стезю управления эффективностью, должны ответить на вопрос: «Готовы ли мы инвестировать в эффективность? Готовы ли линейные менеджеры культивировать в своих подразделениях стремление к эффективности? Готовы ли рядовые сотрудники постоянно участвовать в гонке за повышение эффективности? Готов ли весь коллектив вступить в борьбу за результативность, буквально — с мировой энтропией*?» Если ответ положительный — дерзайте!

Рост эффективности каждого отдельного сотрудника повышает эффективность подразделения, компании в целом. Как только количество высокорезультативных работников достигает критической отметки, наблюдается своего рода «квантовый скачок» повышения эффективности всей компании. Переход на качественно новый уровень происходит в соответствии с законами диалектики, которые сформулировал великий немецкий философ Фридрих Гегель. Задача менеджеров — по возможности приблизить момент «перехода количества в качество».

Этот закон замечателен своей универсальностью: ему подчиняются не только процессы развития галактик и человеческих цивилизаций, но и профессиональный рост отдельного специалиста (например, эйчара). Здесь важно наблюдать за собственной результативностью. Анализируйте ее: ежедневные результаты скажут вам об эффективности больше, чем тысяча книг, лекций, разговоров, за которыми не следует действий.
_________
* Энтропия (от греч. поворот, превращение) — 1) в теории информации: величина, характеризующая степень неопределенности системы; 2) в теории систем: величина, обратная уровню организации системы.

Накопление — Распределение на рынке Форекс — индикатор AD на основе двух «учений».

Вы знаете что я провожу — форекс бесплатное обучение онлайн, подробности по ссылке.

Добрый день, сегодня блог веб-мастера Максима расскажет вам об осцилляторе с коротким названием AD, за которым стоит словосочетание Накопление/Распределение.

Индикатор Накопления/Распределения разработал Марк Чайкин. В своей разработке он использовал индикатор On Balance Volume Джо Гранвилля. Этот индикатор легко найти в терминале Метатрейдер 4. Он расположен среди встроенных аналитических систем.

Кроме индикатора Балансового объема Марк Чайкин использовал понятие индекса Накопления/Распределения Ларри Вильямса (Accumulation/Distribution Index)

Накопление — Распределение на рынке Форекс — индикатор на основе двух «учений».

Смотреть обзорное видео

Вот, для начала смотрите обзорное видео:

Давайте сравним подходы этих ученых. В своем балансовом объеме Джо Гранвилль для добавления или уменьшения объема сравнивал цены закрытия данного периода с предыдущим, у Ларри Вильямса в его Индексе Накопления/Распределения цена закрытия сравнивалась с ценой открытия, а Чайкин сравнивает цену закрытия с серединой диапазона от минимума до максимума.

(Кстати читайте очень хорошую книгу Ларри — Краткосрочная торговля)

8,0,1,0,0

Интересен сам путь, который прошел ученый для создания индикатора Накопления/Распределения. Чайкин заменил цену открытия, которая была в формуле у Ларри Вильямса на середину диапазона. Сделал он это не потому, что считал этот подход вернее, а потому, что не нашел данных по ценам открытия. Данные брались в его время из ежедневных выпусков газет, а в них просто перестали публиковать в какой-то момент цену открытия.

Сначала этот индикатор создавали для измерения денежного потока, который направлен в акции или из акции, но теперь его успешно применяют и на Форекс. Он также выступает основой для создания разработанного позднее Осциллятора Чайкина. (Chaikin Oscillator).

Индикатора Накопления/Распределения представляет собой накопление разницы помноженной на объем между всеми движениями вверх – это и есть накопление, когда приближаясь к моменту закрытия, цена повысилась и вниз – это и есть распределение, в те дни, когда цена понизилась. Чем больше объем в этот период времени, тем больший вклад вносит такое изменение цены в направление индикатора.

Формула индикатора Накопления Распределения AD: Первое значение индикатора рассматриваемого периода высчитывается следующим образом:

Индикатор накопления и распределения формула

  • Close – цена закрытия.
  • Low – цена минимум.
  • High – цена максимум.
  • Volume – Объем торговли.
  • ADn – значение индикатора на текущей свече
  • AD n-1 – значение индикатора для предыдущей свечи.

Если инструмент, например, акция или валюта на рынке Форекс закрылись на максимальном значении внутри торгового периода, то значение расчетной точки индикатора будет равно единице, которую умножили на объем.

Если инструмент закрылся ниже середины, то есть ближе к минимуму, то на объем нужно умножить отрицательную величину между нулем и минус единицей.

Если инструмент закрывается на минимуме значении торгового периода, то расчетная величина будет равна минус единице, которую умножили на объем. Примечание. Так как на Форексе отсутствуют данные по объемам купленной валюты или проданной, то обычно в качестве Volume применяются тиковые объемы. Или, иначе говоря, количество изменений котировок в день, час или другую единицу времени.

16,1,0,0,0 Накопление/Распределение на рынке Форекс

Объем сделок – это, так называемый, весовой коэффициент, который влияет на изменение цены. Чем больше объем, тем более значительный вклад изменения цены за этот промежуток времени в конечное значение индикатора.

Таким образом, если расчет индикатора Накопление/Распределение каждое из следующих значений складывается с предыдущим, а предыдущее – это не что иное, как сумма остальных предыдущих, этим расчет индикатора похож на экспоненциальную скользящую среднюю.

Накопление-Распределение

Логика работы по индикатору Накопление/Распределение

Считается, что тренд растущий снабжает нас ценами, большая часть из которых по закрытию находятся ближе к максимуму цены торгового периода, например дня или часа.

Таким образом, данный индикатор – это хорошая мера того, какие финансовые силы стоят за рыночным трендом.

Индикатор Накопление/Распределение может применяться для фиксирования объёмов денежных потоков. Рост сигнализирует о том, что в данный момент давление покупателей выше, а падение индикатора говорит о том, что значительно большее давление продавцов.

Индикатор Накопление/Распределение может применяться для нахождения дивергенций разного рода, может применяться для фиксации силы, которая движет текущий тренд.

24,0,0,1,0

Использование Накопление/Распределение — Графический анализ

Сигналы, которые подтверждают движение. На тренде, который растет индикатор AD должен расти, а на падающем – падать. Таким образом, новый пик на ценовом графике должен подтверждаться на индикаторе.

Расхождения. Бычье расхождение говорит о том, что растущий тренд ослаб. Медвежье расхождение дает сигнал о слабости падающего тренда.

На графике индикатора Накопление/Распределение применяются те же графические техники, что и на ценовом графике. Например, пробой линии тренда на построенном индикаторе, говорит о том, что скоро будет пробой линии тренда на графике цены. Часто такие фигуры как двойные вершины и треугольник тоже пробиваются на графике индикатора, до ожидаемого пробития на ценовом графике.

Накопление — Распределение на Форекс

Индикатор не учитывает рыночные гэпы. Если актив открылся с гэпом вверх и закрылся посередине между минимумом и максимумом, то индикатор Накопление/Распределение не примет во внимание сам гэп. В случае серии гэпов, такое положение вещей внесет существенную ошибку в расчеты.

Поскольку индикатор Накопление/Распределение очень близок к ценовым движениям по своей геометрии, особенно к цене закрытия, он иногда движется так же как и актив, с которого производится расчет, поэтому может быть пропущено некоторое количество расхождений.

Иногда достаточно трудно зафиксировать едва различимые изменения в объемах. Например, скорость тренда идущего вниз может замедлиться, но об этом нельзя говорить однозначно пока индикатор Накопление/Распределение не продемонстрирует разворот.

Расхождения между индикатором и ценной говорят о том, что тренд должен перемениться. Обычно, когда расхождения имеют место быть, цены будут идти за индикатором. Значит, что если индикатор растет, а цена актива падает, то нужно ждать разворота цен.

(2 оценок, среднее: 5,00 из 5)

Нормальное распределение

Нормальное распределение
Зеленая линия соответствует стандартному нормальному распределению Плотность вероятности
Цвета на этом графике соответствуют графику наверху Функция распределения
Обозначение N ( μ , σ 2 ) <\displaystyle N\left(\mu ,\sigma ^<2>\right)>
Параметры μ — коэффициент сдвига (вещественный)
σ > 0 — коэффициент масштаба (вещественный, строго положительный)
Носитель x ∈ ( − ∞ ; + ∞ )

Плотность вероятности 1 σ 2 π exp ⁡ ( − ( x − μ ) 2 2 σ 2 ) <\displaystyle <\frac <1><\sigma <\sqrt <2\pi >>>>\;\exp \left(-<\frac <\left(x-\mu \right)^<2>><2\sigma ^<2>>>\right)>
Функция распределения 1 2 [ 1 + erf ⁡ ( x − μ 2 σ 2 ) ] <\displaystyle <\frac <1><2>>\left[1+\operatorname \left(<\frac <\sqrt <2\sigma ^<2>>>>\right)\right]>
Математическое ожидание μ

Медиана μ

Мода μ

Дисперсия σ 2 <\displaystyle \sigma ^<2>>
Коэффициент асимметрии 0

Коэффициент эксцесса 0

Дифференциальная энтропия ln ⁡ ( σ 2 π e ) <\displaystyle \ln \left(\sigma <\sqrt <2\,\pi \,e>>\right)>
Производящая функция моментов M X ( t ) = exp ⁡ ( μ t + σ 2 t 2 2 ) <\displaystyle M_\left(t\right)=\exp \left(\mu \,t+<\frac <\sigma ^<2>t^<2>><2>>\right)>
Характеристическая функция ϕ X ( t ) = exp ⁡ ( μ i t − σ 2 t 2 2 ) <\displaystyle \phi _\left(t\right)=\exp \left(\mu \,i\,t-<\frac <\sigma ^<2>t^<2>><2>>\right)>

Норма́льное распределе́ние [1] [2] , также называемое распределением Гаусса или Гаусса — Лапласа [3] — распределение вероятностей, которое в одномерном случае задаётся функцией плотности вероятности, совпадающей с функцией Гаусса:

где параметр μ — математическое ожидание (среднее значение), медиана и мода распределения, а параметр σ — среднеквадратическое отклонение ( σ ² — дисперсия) распределения.

Таким образом, одномерное нормальное распределение является двухпараметрическим семейством распределений. Многомерный случай описан в статье «Многомерное нормальное распределение».

Стандартным нормальным распределением называется нормальное распределение с математическим ожиданием μ = 0 и стандартным отклонением σ = 1 .

Содержание

Значение [ править | править код ]

Если некая величина образуется в результате сложения многих случайных слабо взаимозависимых величин, каждая из которых вносит малый вклад относительно общей суммы, то центрированное и нормированное распределение такой величины при увеличении числа наблюдений стремится к нормальному распределению.

Это вытекает из центральной предельной теоремы теории вероятностей. Таких величин в окружающем нас мире очень много, поэтому такое распределение величин и названо нормальным. Нормальное распределение играет заметную роль во многих областях науки, например в математической статистике и статистической физике.

Свойства [ править | править код ]

Моменты [ править | править код ]

Если X имеет нормальное распределение, то для неё существуют (конечные) моменты при всех p с действительной частью больше −1. Для неотрицательных целых p , центральные моменты таковы:

Здесь n — натуральное число, а запись (p − 1)!! означает двойной факториал числа p − 1 , то есть (поскольку p − 1 в данном случае нечётно) произведение всех нечётных чисел от 1 до p − 1 .

Центральные абсолютные моменты для неотрицательных целых p таковы:

Последняя формула справедлива также для произвольных p > −1 .

Бесконечная делимость [ править | править код ]

Нормальное распределение является бесконечно делимым.

Максимальная энтропия [ править | править код ]

Нормальное распределение имеет максимальную дифференциальную энтропию среди всех непрерывных распределений, дисперсия которых не превышает заданную величину [4] [5] .

Правило трёх сигм [ править | править код ]

Моделирование нормальных псевдослучайных величин [ править | править код ]

Простейшие приближённые методы моделирования основываются на центральной предельной теореме. Именно, если сложить несколько независимых одинаково распределённых величин с конечной дисперсией, то сумма будет распределена приблизительно нормально. Например, если сложить 100 независимых стандартно равномерно распределённых случайных величин, то распределение суммы будет приближённо нормальным.

Для программного генерирования нормально распределённых псевдослучайных величин предпочтительнее использовать преобразование Бокса — Мюллера. Оно позволяет генерировать одну нормально распределённую величину на базе одной равномерно распределённой.

Также существует алгоритм Зиккурат, который работает даже быстрее преобразования Бокса — Мюллера. Тем не менее, сложнее в реализации, но его применение оправдано в случаях, когда требуется генерирование очень большого числа неравномерно распределенных случайных чисел.

Нормальное распределение в природе и приложениях [ править | править код ]

Нормальное распределение часто встречается в природе. Например, следующие случайные величины хорошо моделируются нормальным распределением:

  • отклонение при стрельбе;
  • погрешности измерений (однако погрешности некоторых измерительных приборов имеют иное распределение);
  • некоторые характеристики живых организмов в популяции.

Такое широкое распространение этого распределения связано с тем, что оно является бесконечно делимым непрерывным распределением с конечной дисперсией. Поэтому к нему в пределе приближаются некоторые другие, например биномиальное и пуассоновское. Этим распределением моделируются многие недетерминированные физические процессы [6] .

Многомерное нормальное распределение используется при исследовании многомерных случайных величин (случайных векторов). Одним из многочисленных примеров таких приложений является исследование параметров личности человека в психологии и психиатрии.

Связь с другими распределениями [ править | править код ]

  • Нормальное распределение является распределением Пирсона типа XI [7] .
  • Отношение пары независимых стандартных нормально распределенных случайных величин имеет распределение Коши[8] . То есть, если случайная величина X <\displaystyle X>представляет собой отношение X = Y / Z <\displaystyle X=Y/Z>(где Y <\displaystyle Y>и Z <\displaystyle Z>— независимые стандартные нормальные случайные величины), то она будет обладать распределением Коши.
  • Если z 1 , … , z k <\displaystyle z_<1>,\ldots ,z_> — совместно независимые стандартные нормальные случайные величины, то есть z i ∼ N ( 0 , 1 ) <\displaystyle z_\sim N\left(0,1\right)> , то случайная величина x = z 1 2 + … + z k 2 <\displaystyle x=z_<1>^<2>+\ldots +z_^<2>> имеет распределение хи-квадрат с k степенями свободы.
  • Если случайная величина X <\displaystyle X>подчинена логнормальному распределению, то её натуральный логарифм имеет нормальное распределение. То есть, если X ∼ L o g N ( μ , σ 2 ) <\displaystyle X\sim \mathrm \left(\mu ,\sigma ^<2>\right)> , то Y = ln ⁡ ( X ) ∼ N ( μ , σ 2 ) <\displaystyle Y=\ln \left(X\right)\sim \mathrm \left(\mu ,\sigma ^<2>\right)> . И наоборот, если Y ∼ N ( μ , σ 2 ) <\displaystyle Y\sim \mathrm \left(\mu ,\sigma ^<2>\right)> , то X = exp ⁡ ( Y ) ∼ L o g N ( μ , σ 2 ) <\displaystyle X=\exp \left(Y\right)\sim \mathrm \left(\mu ,\sigma ^<2>\right)> .
  • Отношение квадратов двух стандартных нормальных случайных величин имеет распределение Фишера со степенями свободы ( 1 , 1 ) <\displaystyle \left(1,1\right)>.

История [ править | править код ]

Впервые нормальное распределение как предел биномиального распределения при p = 1 2 <\displaystyle p=<\tfrac <1><2>>> появилось в 1738 году во втором издании работы Муавра «Доктрина случайностей» [en] [9] . Это было первое доказательство частного случая центральной предельной теоремы. В 1809 году Гаусс в сочинении «Теория движения небесных тел» ввёл это распределение как возникающее в результате многократных измерений движения небесных тел. Однако Гаусс вывел формулу для действительных случайных величин из принципа достижения максимума совместной плотности всех измерений в точке с координатами, равными среднему всех измерений. Этот принцип впоследствии подвергался критике. В 1812 году Лаплас в теореме Муавра — Лапласа обобщил результат Муавра для произвольного биномиального распределения, то есть для сумм одинаково распределённых независимых бинарных величин [3] .

Теория вероятности, закон трех сигм и трейдинг

I.ВВЕДЕНИЕ:
1. Стоимость любого фьючерса на рынке определяется, ценой сделки здесь и сейчас. Но сам фьючерсный контракт есть договор, заключающийся на понижение цены или на ее повышение, поэтому остается важный вопрос — как изменится цена через минуту, день и месяц. То есть появляется некий диапазон ожидания цены. Каждая «японская» свеча или бар, не зависимо от таймфрейма, имеет цену открытия, цену закрытия, меридианную цену (средняя цена), то есть тоже некое математическое ожидание всего рынка.
2. Рынок состоит из множества трейдеров: крупных, средних и мелких. Крупных трейдеров на рынке не одна сотня, поэтому предугадать их настрой, отношение к информации и соответственно предугадать их намерения практически не реально, но его можно увидеть на графике используя закон трех сигм.

II. Применения закона трех сигм, для определения возможного диапазона цены.
Среднеквадратическое отклонение (сигма) измеряется в единицах измерения самой случайной величины и используется при расчёте стандартной ошибки среднего арифметического, при построении доверительных интервалов, при статистической проверке гипотез, при измерении линейной взаимосвязи между случайными величинами. Определяется как квадратный корень из дисперсии случайной величины.

Правило трёх сигм — практически все значения нормально распределённой случайной величины лежат в интервале ( среднее арифметическое+- 3*сигма). Более строго — приблизительно с вероятностью 0,9973 значение нормально распределённой случайной величины лежит в указанном интервале (при условии, что величина среднеарифметическая истинная, а не полученная в результате обработки выборки).

Среднее квадратическое отклонение доходности портфеля отождествляется с риском портфеля.

В техническом анализе среднеквадратическое отклонение используется для построения линий Боллинджера, расчёта волатильности.

На графике оранжевая линия — линия цены.
Красная — сигма 1,
Зеленая — сигма 2,
Синяя — сигма 3.

ОСНОВНЫЕ СОСТОЯНИЯ РЫНКА

Рынок в консолидации:
Это сужение расстояния между сигмами (уровнями вероятности) и практически ровный канал:

Нормальное распределение для Форекс

Связь математической статистики с теорией вероятности имеет различный характер, в различных случаях. Тем не менее, теория вероятностей играет определенную роль при статистическом изучении массовых явлений. В таком случае находит себе применение – Нормальное распределение или «Распределение Гаусса». Большинство процессов в природе сходятся к нормальному распределению.

Согласно, Закона Больших чисел – совокупное действие большого числа случайных факторов, приводит, при некоторых, весьма общих условиях, приводит к результату, почти независящему от случая. Проще говоря, при очень большом количестве анализируемого события, вероятность происшествия отдельно взятого будет превалировать над другими.
Графически, это можно увидеть на гистограмме нормального распределения.

Наиболее понятный пример нормального распределения – стрельба по мишени. При достаточном количестве выстрелов, и навыках среднего стрелка (имеется ввиду попадание в мишень, но при этом не такие, чтобы в «яблочке» зияла дыра), будет отчетливо видно, что отверстий от попаданий будет больше всего в центре мишени, причем, чем дальше от центра – тем меньше. То есть, плотность вероятности попадания в мишень максимальна в центре и спадает к краям. Справедливости ради, хочу уточнить, если «облако попаданий» будет гуще во второй нижней четверти мишени, очевидно, что плотность вероятности попадания сместится от центра ко второй нижней четверти.

Естественно, что делать статистически достоверные выводы можно делать только на достаточно большом количестве данных. Поэтому итоговый анализ 500 сделок дает больше оснований для принятия решений, чем серия из 100 сделок.

Наиболее важными характеристиками распределения являются математическое ожидание и дисперсия. Пологость или крутизна распределения характеризуются разбросом значений вокруг математического ожидания. Это и есть дисперсия. Причем нормальное распределение, математическое ожидание которого равно нулю, а стандартное отклонение равно 1 (стандартное отклонение – квадратный корень из дисперсии), называют Распределением Гаусса или стандартным нормальным распределением.

Какое применение этим знаниям найдет для себя трейдер? Значение Математическое ожидания укажет нам, насколько прибыльна стратегия, используемая трейдером в своей деятельности. В свою очередь, разброс распределения покажет, насколько высок риск в торговой стратегии трейдера. Даже при положительном математическом ожидании, высокое значение стандартного отклонения будет означать, что риск слишком высок.

Математическое ожидание для данной гистограммы нормального распределения — -50,18, что уже говорит об убыточной стратегии. Причем разброс результатов в гистограмме не только достаточно большой, но и крайне не равномерен. Стоит обратить внимание на «пучок» столбцов в диапазоне от -48,69 до -194,76. Невооруженным глазом видно, что свыше 100 сделок были проведены в серьезном диапазоне убыточного отрезка.

Данная гистограмма распределения представляет нам картину очень далекую от классического нормального распределения. Но обратите внимание на то, что намного превалирующую зону оси х, занимает прибыльный отрезок всего диапазона, а столбец, намного возвышающийся над другими, располагается в диапазоне, всего лишь от -3,91 до -5,22. В совокупности с положительным математическим ожиданием — +3,22, доходность депозита составила 2,72%.

Вкупе с графиком доходности, анализ гистограммы нормального распределения дает обширную картину плюсов и минусов торговой стратегии.

Безусловно, скопление красных столбцов, намного возвышающихся над зелеными, наводит на мысль об убыточной стратегии. Но в данном случае, они скорее говорят, о том, что необходима незначительная коррекция, т.к. риск на депозит достаточно велик, в силу большого разброса значений. «Спасло» этого трейдера лишь то, что большая часть данных находится в зеленом диапазоне распределения, что говорит о неплохом контроле рисков. Эти факторы и привели его к следующей картине.

В заключении, стоит сказать, что статистические методы анализа торговли, направлены на выявление слабостей трейдера, его торговой стратегии. То есть все инструменты анализа направлены не для того, чтобы просто дать характеристику стратегии, а для выявления слабых мест, для совершенствования профессионализма, повышения эффективности торговли и торгового подхода к сделке.

Copyright © 2009 — 2020. Все права защищены.

ИП Силантьев Сергей Владимирович. ОГРН 310501229800018

Закон нормального распределения

Если взять некую случайную величину, то она распределяется по закону нормального (Гауссова) распределения. И график такого распределения напоминает колокол:

Будем откладывать по оси Х рост находящихся в аудитории студентов, а по оси У- количество обладателей того или иного роста- получим тот же график — колокол. Он подтвердит тот факт, что можно встретить высокого человека так же редко, как и низкого. А основная масса студентов- среднего роста.

Тот же самый график колокола мы получим практически при любом столкновении с большим количеством случайных величин, и на рынке (фондовом, форекс и иных).

[Универсальность этого графика иллюстрирует в том числе, что общество у нас, как в России, так и во всём мире, устроено и живёт так же: под горбом распределения- живущие «как все», по нормам, преданиям, традициям и привычкам, исключения- в «хвостах» распределения, с одной стороны- усиленно деградирующие наркоманы, бомжи, извращенцы, опускающиеся и опустившиеся, с другой стороны- те, кто строит будущее своего общества, не обращая внимания на писки и визги со стороны. Увы, это так, как бы просто и/или высокопарно это ни звучало. Куда потянется горб нормального распределения в будущем — за культурным потреблением наркотиков и признанием извращений как нормы, например, или за трезвым, а затем и здоровым образом жизни — зависит от каждого из нас, от того, к какой части меньшинства во многих аспектах жизни каждый из нас решает примкнуть разумным волевым порядком, переступив инерцию образа жизни «как все», выявив и увидев недостатки и порочность этих аспектов жизни. ]

Вернёмся к финансам и фондовому рынку. Когда идёт «позитивная» информационная накачка и раздача кредитов для покупки акций и роста, статистически-предопределённо большинство народа с радостью играет в эту игру. «Позитивная» новость через подконтрольные СМИ ( а они все подконтрольные)- и 68-98% инвесторов по ЗНР бежит тариться. Когда роздано достаточно денег, и масса игроков на кредитные деньги покупать больше не хотят, а начинают сливать и фиксировать прибыль, рынок начинают «мочить», выводя маржинальщиков на маржинколы и заставляя продать купленные акции своим-пацанам дёшево. Продать должны 95-98% маржинальщиков, а купить у них- только свои (находятся с одного конца колокола) и случайные попутчики (с другого конца, есть такие: кто-то хотел продать, но нажал не на ту кнопку, кому-то босс впендюрил акции, чтоб не играл против рынка и т.д.). Если расстаются с акциями неохотно, и на хвоста к своим-пацанам прыгают лишние люди, рынок мочат дальше, ещё и ещё, пока всех не вытряхнут.

В 2008-2009 г. в Сбербанке шла смена менеджмента, и всех крупных спекулянтов попросили избавиться от своих пакетов акций (предположительно, в их число входили Керимов и Батурина). А чтоб акционеры были более сговорчивы и не требовали бонусов к стоимости покупки, их вели на принудительные продажи. И как свои-пацаны купили пакеты у бывших, акции погнали верх, откуда начинали опускать, и выше. Информационный фон кризисного года способствовал «уговорам» и формированию нужной цены, но полную ясность в происходящее может внести только понимание механизмов скидывания халявщиков через маржин-колы по закону нормального распределения.

Те же методы использовались и в акциях Газпрома ( и иных), причём в Газпроме видно, как выводили на принудительное закрытие не только купивших акции, но и открывших короткие позиции (продажа акций без покрытия). Эти моменты отмечены синими эллипсами. Ребята что-то не поняли и надеялись по аналогии со Сбером халявно «заработать»- и их ставили на место. В Газпроме долгое опускание цены ниже 100 могло привести к маржинколам у своих банков и инвест-компаний с много-миллионными убытками. Или не своих, но дружественных, а начинать межклановые войны из-за каких-то недоумков никто не хотел, посему шортовиков вынуждали не играть на понижение.

(Так наши-пацаны и работают: дёшево скупают на маржин-колах у маржинальщиков, затем дорого их впаривают шортовикам, приговаривая: не мы такие, рынок такой непредсказуемый. ) Наивно полагать, что аналитики или трейдеры на канале РБК или даже в личной беседе ответят на вопрос: «Сколько будет стоить акция Газпрома (Сбера, НорНикеля, etc.) через месяц или к концу года?» Естественно, те НЕ ЗНАЮТ, сколько народу, на каких уровнях влезет в длинные позиции на заёмные средства и на каких уровнях их от-маржинколят, сколько шортовиков и где будут вынужденно выкупать акции. Они могут только пред-полагать, тыкая фактически пальцем в небо, и если цена через месяц или к концу года совпадёт с чьим-то предположением,- это и будет «угадай-ка».

Акции Газпрома упали «всего» в 3 раза, и не смогли восстановиться до прежних уровней ( в то время как в Сбере и в других акциях верхи были обновлены). Причина- в неполной продаже кредитных пакетов и новых покупках, проще сказать- в большом наличии халявщиков. Свои-пацаны не любят возить толпу халявщиков наверх.

В применении к нашей торговле акциями: мы будем прикидываться «своими» и прыгать на хвоста. Когда все кричат о конце света и торгов- будем присматриваться и покупать, когда закрывают «длинные» позиции. Когда идёт рост из-за закрытия «коротких» позиций- ждать быстрого падения, здесь можно и нужно хотя бы частично продать акции.

Если же Вы принимаете решение ТОЛЬКО на основе ТА, ФА и свежих «новостей», то по закону Нормального распределения Вы принимаете такое же решение, как и 68-98% других игроков. А значит, пацаны-кукловоды попробуют отвести Вас на стрижку и резню, и если у Вас есть кредиты- с высокой долей вероятности у пацанов получится постричь, а то и зарезать часть ваших позиций.

Надеяться на то, что, став клиентом одной из инвестиционных компаний и подписавшись на их рассылку анализа рынка, Вы получите работающие рекомендации о покупке/продаже тех или иных акций и Вы не потеряете свои деньги- так же наивно: рассылки делаются всем клиентам, и толпой в 90-95% (по закону нормального распределения) клиенты клюют на эту приманку. Так же по ЗНР, а то и по прямому сговору инвестбанкиров, рекомендации и обзоры у брокерских компаний примерно одинаковы, и все эти рекомендации делаются для отвода глаз и просто «по-статусу-брокера-положено», чтоб было «не-хуже-других-нвесткомпаний».

Если успеете купить акции перед тем, как туда погонят толпу и продать их, пока толпу не стали резать- да, Ваш счёт станет больше. Но успеете ли? Обычно покупают перед толпой инсайдеры. Брокеры весьма долго и небезуспешно боролись против принятия закона об инсайде: в России об уголовных делах с привлечением инсайдеров к ответственности не слышно.

За отдельную плату, значительно превышающую плату за ежемесячное обслуживание и простые рассылки, Вам могут предложить «эксклюзив», гарантировав непопадание с толпой в стадо для стрижки. Конечно, рекомендации в «эксклюзиве» существенно отличаются от рекомендаций для толпы, подчас диаметрально противоположно. Уже это разделение на эксклюзивную «элиту», которую в общем-то тоже доят и стригут, но по-своему, по-«эксклюзивному», и на толпу для стрижки — недвусмысленно говорит о характере нашего «свободного» рынка и истинных намерениях брокерских контор.

Усиливающиеся в периоды кризисов выступления аналитиков и финансистов по поводу развития-рынка-ценных-бумаг, улучшения-инвестиционного-климата, развития-финансовой-грамотности, привлечения-новых-клиентов, etc.- имеют лишь одну основу: пополнить толпу под шапкой колокола ЗНР. Без притока новых клиентов с новыми деньгами в стадо для стрижки скоро начнут стричь эксклюзивную «элиту», вместе с ними- некогда успешных трейдеров, и разные брокерские компании пойдут по миру.

Нормальное распределение. Непрерывные распределения в MS EXCEL

Рассмотрим Нормальное распределение. С помощью функции MS EXCEL НОРМ.РАСП() построим графики функции распределения и плотности вероятности. Сгенерируем массив случайных чисел, распределенных по нормальному закону, произведем оценку параметров распределения, среднего значения и стандартного отклонения.

Нормальное распределение (также называется распределением Гаусса) является самым важным как в теории, так в приложениях системы контроля качества. Важность значения Нормального распределения (англ. Normal distribution) во многих областях науки вытекает из Центральной предельной теоремы теории вероятностей.

Определение: Случайная величина x распределена по нормальному закону, если она имеет плотность распределения:

Нормальное распределение зависит от двух параметров: μ (мю) — является математическим ожиданием (средним значением случайной величины), и σ (сигма) — является стандартным отклонением (среднеквадратичным отклонением). Параметр μ определяет положение центра плотности вероятности нормального распределения, а σ — разброс относительно центра (среднего).

Примечание: О влиянии параметров μ и σ на форму распределения изложено в статье про Гауссову кривую, а в файле примера на листе Влияние параметров можно с помощью элементов управления Счетчик понаблюдать за изменением формы кривой.

Нормальное распределение в MS EXCEL

В MS EXCEL, начиная с версии 2010, для Нормального распределения имеется функция НОРМ.РАСП() , английское название — NORM.DIST(), которая позволяет вычислить плотность вероятности (см. формулу выше) и интегральную функцию распределения (вероятность, что случайная величина X, распределенная по нормальному закону, примет значение меньше или равное x). Вычисления в последнем случае производятся по следующей формуле:

Вышеуказанное распределение имеет обозначение N(μ; σ). Так же часто используют обозначение через дисперсию N(μ; σ 2 ).

Примечание: До MS EXCEL 2010 в EXCEL была только функция НОРМРАСП() , которая также позволяет вычислить функцию распределения и плотность вероятности. НОРМРАСП() оставлена в MS EXCEL 2010 для совместимости.

Стандартное нормальное распределение

Стандартным нормальным распределением называется нормальное распределение с математическим ожиданием μ=0 и дисперсией σ=1. Вышеуказанное распределение имеет обозначение N(0;1).

Примечание: В литературе для случайной величины, распределенной по стандартному нормальному закону, закреплено специальное обозначение z.

Любое нормальное распределение можно преобразовать в стандартное через замену переменной z=(x-μ)/σ. Этот процесс преобразования называется стандартизацией.

Примечание: В MS EXCEL имеется функция НОРМАЛИЗАЦИЯ() , которая выполняет вышеуказанное преобразование. Хотя в MS EXCEL это преобразование называется почему-то нормализацией. Формулы =(x-μ)/σ и =НОРМАЛИЗАЦИЯ(х;μ;σ) вернут одинаковый результат.

В MS EXCEL 2010 для стандартного нормального распределения имеется специальная функция НОРМ.СТ.РАСП() и ее устаревший вариант НОРМСТРАСП() , выполняющий аналогичные вычисления.

Продемонстрируем, как в MS EXCEL осуществляется процесс стандартизации нормального распределения N(1,5; 2).

Для этого вычислим вероятность, что случайная величина, распределенная по нормальному закону N(1,5; 2), меньше или равна 2,5. Формула выглядит так: =НОРМ.РАСП(2,5; 1,5; 2; ИСТИНА) =0,691462. Сделав замену переменной z=(2,5-1,5)/2=0,5, запишем формулу для вычисления Стандартного нормального распределения: =НОРМ.СТ.РАСП(0,5; ИСТИНА) =0,691462.

Естественно, обе формулы дают одинаковые результаты (см. файл примера лист Пример ).

Обратите внимание, что стандартизация относится только к интегральной функции распределения (аргумент интегральная равен ИСТИНА), а не к плотности вероятности.

Примечание: В литературе для функции, вычисляющей вероятности случайной величины, распределенной по стандартному нормальному закону, закреплено специальное обозначение Ф(z). В MS EXCEL эта функция вычисляется по формуле
=НОРМ.СТ.РАСП(z;ИСТИНА) . Вычисления производятся по формуле

В силу четности функции плотности стандартного нормального распределения f(x), а именно f(x)=f(-х), функция стандартного нормального распределения обладает свойством Ф(-x)=1-Ф(x).

Обратные функции

Функция НОРМ.СТ.РАСП(x;ИСТИНА) вычисляет вероятность P, что случайная величина Х примет значение меньше или равное х. Но часто требуется провести обратное вычисление: зная вероятность P, требуется вычислить значение х. Вычисленное значение х называется квантилем стандартного нормального распределения.

В MS EXCEL для вычисления квантилей используют функцию НОРМ.СТ.ОБР() и НОРМ.ОБР() .

Графики функций

В файле примера приведены графики плотности распределения вероятности и интегральной функции распределения.

Как известно, около 68% значений, выбранных из совокупности, имеющей нормальное распределение, находятся в пределах 1 стандартного отклонения (σ) от μ(среднего или математического ожидания); около 95% — в пределах 2-х σ, а в пределах 3-х σ находятся уже 99% значений. Убедиться в этом для стандартного нормального распределения можно записав формулу:

которая вернет значение 68,2689% — именно такой процент значений находятся в пределах +/-1 стандартного отклонения от среднего (см. лист График в файле примера ).

В силу четности функции плотности стандартного нормального распределения: f(x)=f(-х), функция стандартного нормального распределения обладает свойством F(-x)=1-F(x). Поэтому, вышеуказанную формулу можно упростить:

Для произвольной функции нормального распределения N(μ; σ) аналогичные вычисления нужно производить по формуле:

Вышеуказанные расчеты вероятности требуются для построения доверительных интервалов.

Примечание: Для построения функции распределения и плотности вероятности можно использовать диаграмму типа График или Точечная (со сглаженными линиями и без точек). Подробнее о построении диаграмм читайте статью Основные типы диаграмм.

Примечание: Для удобства написания формул в файле примера созданы Имена для параметров распределения: μ и σ.

Генерация случайных чисел

С помощью надстройки Пакет анализа можно сгенерировать случайные числа, распределенные по нормальному закону.

СОВЕТ: О надстройке Пакет анализа можно прочитать в статье Надстройка Пакет анализа MS EXCEL.

Сгенерируем 3 массива по 100 чисел с различными μ и σ. Для этого в окне Генерация случайных чисел установим следующие значения для каждой пары параметров:

Примечание: Если установить опцию Случайное рассеивание (Random Seed), то можно выбрать определенный случайный набор сгенерированных чисел. Например, установив эту опцию равной 25, можно сгенерировать на разных компьютерах одни и те же наборы случайных чисел (если, конечно, другие параметры распределения совпадают). Значение опции может принимать целые значения от 1 до 32 767. Название опции Случайное рассеивание может запутать. Лучше было бы ее перевести как Номер набора со случайными числами.

В итоге будем иметь 3 столбца чисел, на основании которых можно, оценить параметры распределения, из которого была произведена выборка: μ и σ. Оценку для μ можно сделать с использованием функции СРЗНАЧ() , а для σ – с использованием функции СТАНДОТКЛОН.В() , см. файл примера лист Генерация .

Примечание: Для генерирования массива чисел, распределенных по нормальному закону, можно использовать формулу =НОРМ.ОБР(СЛЧИС();μ;σ) . Функция СЛЧИС() генерирует непрерывное равномерное распределение от 0 до 1, что как раз соответствует диапазону изменения вероятности (см. файл примера лист Генерация ).

Задачи

Задача1. Компания изготавливает нейлоновые нити со средней прочностью 41 МПа и стандартным отклонением 2 МПа. Потребитель хочет приобрести нити с прочностью не менее 36 МПа. Рассчитайте вероятность, что партии нити, изготовленные компанией для потребителя, будут соответствовать требованиям или превышать их.
Решение1: = 1-НОРМ.РАСП(36;41;2;ИСТИНА)

Задача2. Предприятие изготавливает трубы, средний внешний диаметр которых равен 20,20 мм, а стандартное отклонение равно 0,25мм. Согласно техническим условиям, трубы признаются годными, если диаметр находится в пределах 20,00+/- 0,40 мм. Какая доля изготовленных труб соответствует ТУ?
Решение2: = НОРМ.РАСП(20,00+0,40;20,20;0,25;ИСТИНА)- НОРМ.РАСП(20,00-0,40;20,20;0,25)
На рисунке ниже, выделена область значений диаметров, которая удовлетворяет требованиям спецификации.

Решение приведено в файле примера лист Задачи .

Задача3. Предприятие изготавливает трубы, средний внешний диаметр которых равен 20,20 мм, а стандартное отклонение равно 0,25мм. Внешний диаметр не должен превышать определенное значение (предполагается, что нижняя граница не важна). Какую верхнюю границу в технических условиях необходимо установить, чтобы ей соответствовало 97,5% всех изготавливаемых изделий?
Решение3: = НОРМ.ОБР(0,975; 20,20; 0,25) =20,6899 или
= НОРМ.СТ.ОБР(0,975)*0,25+20,2 (произведена «дестандартизация», см. выше)

Задача 4. Нахождение параметров нормального распределения по значениям 2-х квантилей (или процентилей).
Предположим, известно, что случайная величина имеет нормальное распределение, но не известны его параметры, а только 2-я процентиля (например, 0,5-процентиль, т.е. медиана и 0,95-я процентиль). Т.к. известна медиана, то мы знаем среднее, т.е. μ. Чтобы найти стандартное отклонение нужно использовать Поиск решения.
Решение приведено в файле примера лист Задачи .

Примечание: До MS EXCEL 2010 в EXCEL были функции НОРМОБР() и НОРМСТОБР() , которые эквивалентны НОРМ.ОБР() и НОРМ.СТ.ОБР() . НОРМОБР() и НОРМСТОБР() оставлены в MS EXCEL 2010 и выше только для совместимости.

Линейные комбинации нормально распределенных случайных величин

Известно, что линейная комбинация нормально распределённых случайных величин x(i) с параметрами μ(i) и σ(i) также распределена нормально. Например, если случайная величина Y=x(1)+x(2), то Y будет иметь распределение с параметрами μ(1)+ μ(2) и КОРЕНЬ(σ(1)^2+ σ(2)^2). Убедимся в этом с помощью MS EXCEL.

С помощью надстройки Пакет анализа сгенерируем 2 массива по 100 чисел с различными μ и σ.

Теперь сформируем массив, каждый элемент которого является суммой 2-х значений, взятых из каждого массива.

С помощью функций СРЗНАЧ() и СТАНДОТКЛОН.В() вычислим среднее и дисперсию получившейся выборки и сравним их с расчетными.

Кроме того, построим График проверки распределения на нормальность (Normal Probability Plot), чтобы убедиться, что наш массив соответствует выборке из нормального распределения.

Прямая линия, аппроксимирующая полученный график, имеет уравнение y=ax+b. Наклон кривой (параметр а) может служить оценкой стандартного отклонения, а пересечение с осью y (параметр b) – среднего значения.

Для сравнения сгенерируем массив напрямую из распределения N(μ(1)+ μ(2); КОРЕНЬ(σ(1)^2+ σ(2)^2)).

Как видно на рисунке ниже, обе аппроксимирующие кривые достаточно близки.

В качестве примера можно провести следующую задачу.

Задача. Завод изготавливает болты и гайки, которые упаковываются в ящики парами. Пусть известно, что вес каждого из изделий является нормальной случайной величиной. Для болтов средний вес составляет 50г, стандартное отклонение 1,5г, а для гаек 20г и 1,2г. В ящик фасуется 100 пар болтов и гаек. Вычислить какой процент ящиков будет тяжелее 7,2 кг.
Решение. Сначала переформулируем вопрос задачи: Вычислить какой процент пар болт-гайка будет тяжелее 7,2кг/100=72г. Учитывая, что вес пары представляет собой случайную величину = Вес(болта) + Вес(гайки) со средним весом (50+20)г, и стандартным отклонением =КОРЕНЬ(СУММКВ(1,5;1,2)) , запишем решение
= 1-НОРМ.РАСП(72; 50+20; КОРЕНЬ(СУММКВ(1,5;1,2));ИСТИНА)
Ответ: 15% (см. файл примера лист Линейн.комбинация )

Аппроксимация Биномиального распределения Нормальным распределением

Если параметры Биномиального распределения B(n;p) находятся в пределах 0,1 10, то Биномиальное распределение можно аппроксимировать Нормальным распределением.

При значениях λ>15, Распределение Пуассона хорошо аппроксимируется Нормальным распределением с параметрами: μ, σ 2 =λ.

Подробнее о связи этих распределений, можно прочитать в статье Взаимосвязь некоторых распределений друг с другом в MS EXCEL. Там же приведены примеры аппроксимации, и пояснены условия, когда она возможна и с какой точностью.

СОВЕТ : О других распределениях MS EXCEL можно прочитать в статье Распределения случайной величины в MS EXCEL.

Распределение Гаусса в вероятностной оценке прогнозов

Среднеквадратическое (или стандартное) отклонение считается одним из эффективных методов прогнозирования в ставках на спорт. Оно применяется для определения разброса значений. Расчеты сводятся к нахождению разности между обычными показателями и средними величинами группы чисел. Методика наиболее точна, так как использование только среднего значения не учитывает дисперсию в числовом ряду. На линейные параметры в значительной мере влияют резкие отклонения показаний, что снижает качество предсказаний в ставках на спорт. Среднеквадратичное отклонение (СКО) применяется в статистических расчетах для конкретизации степени точности оценок и прогнозов. Необходимые первичные показатели применяются индивидуально, как исходные величины для распределения или функциональной зависимости.

Распределение редких событий (Пуассона) и закон Гаусса в сравнительных характеристиках

Профессиональный беттинг в ставках на спорт (на футбол в частности) предполагает научный подход к игре с использованием различных стратегий. Распределение Пуассона, в частности, в комбинации со статистическими данными матчей позволяет вычислить вероятность забитых во время игры мячей. Вернее, оценить объективную возможность наступления такого события. Практика показывает, что теоретико-вероятностные расчеты с определенной долей предельной допустимости сопоставимы с реальными результатами.

Применение среднего распределения в качестве исходного параметра допускает прерывистую (дискретную) характеристику, выраженную через целое число. Поэтому закон Пуассона поможет в оценивании шансов команды забить гол, но не в самой вероятности взятия ворот соперника в какой-то игровой промежуток времени (к примеру, с 20 по 25 минуту встречи).

Закон Гаусса – его график это колоколообразная кривая. Имеет различия с моделью Пуассона по нескольким критериям. Выражается беспрерывностью процесса, базирующегося на двух основных характеристиках: квадратичном отклонении, средней величине.

Как использовать кривую Гаусса?

Немецкий ученый Гаусс обосновал, что возникающие при измерениях погрешности распределяются не в хаотическом, а в определенном порядке. И хотя сумма достаточно большого числа случайных величин зависит от различных законов распределения, но в конечном итоге приближенно подчиняется нормальному закону. Кривая распределения погрешности измерений по Гауссу имеет симметричный холмообразный вид. Чем больше элементов исследования, тем нагляднее выглядит график зависимости величин: пик средних значений (купол или холм) наиболее выражен при широком разбросе крайних показателей. Иными словам, чем дальше отклоняться от середины, тем стремительнее падение шансов. При равных временных отрезках на оси абсцисс, но с разными высотами, а стало быть, и площадями фигур под кривой, значение случайных величин отличаются. Это доказывает, что крайние значения с одной и другой стороны (наибольшее и наименьшее) встречаются редко. Но, чем ближе к середине, тем событие встречается чаще.

Прогнозирование результативности футбольного матча

Нормальный закон находит применение в предсказаниях суммы забитых мячей. Наглядный пример – анализ разницы голов по результатам футбольных поединков 22 розыгрыша Английской Премьер-лиги в сезоне 2013/2014.

Справка! Разница голов рассчитывается как общее число мячей, побывавших в воротах гостей, за минусом голов, пропущенных хозяевами футбольного поля. Нулевой показатель означает ничью.

Итог мониторинга такой:

  • Самый результативный счет на своей футбольной арене поле – 7:0 в пользу Manchester City в игре против Norwich.
  • Наибольшее число забитых мячей на поле соперника – 5:0. Liverpool в гостях обыграл Tottenham.
  • Средний показатель (разница) голов – 0,3789. При этом уровень медианы и моды (критериев, отражающих структуру данных) равен 0.
  • Фактическая величина СКО – 1,9188.
  • Полученные данные свидетельствуют о следующем.
  • В результате расчетов разницы голов чаще всего встречается ничейный результат.
  • Просматривается, практически, равноудаленное распределение с некоторым преимуществом в сторону выигрышей на поле хозяев.

Как рассчитать среднее квадратичное отклонение?

Построение криволинейного графика нормального распределения ведется по двум параметрам: средней величине и СКО. В то же время одно среднеквадратическое отклонение от средней величины относится приблизительно к 68% распределения, а уже 2 СКО – к 95 %. Привязка полученных исходов к турнирным встречам дает основание полагать, что 68 % из них закончатся с показателем от -1,5399 до 2,2977 гола (или 0,3789 + 1,9188).

Так как кривая не является дискретной, существуют определенные ограничения. В частности, разница голов с критерием -1,5399 становится недопустимой. Для прогнозирования выигрыша на своем поле ее можно использовать, откорректировав целое число 1: заменить его любым показателем в границах от 0,5 до 1,5. С учетом СКО каждое выбранное значение можно сравнить со средней величиной. Результаты допускается использовать для нового построения модели нормального распределения с информативными зонами (смотри рисунок).

Так как для кривой характерна форма купола, то под нею находятся неравнозначные по площади зоны. По краям линия характеризует наименьшую плотность, а в центральной части она максимально возвышается над осью. Это наглядный пример того, что наибольшая вероятность попадания случайной величины будет как раз возле центра. Для выбора предпочтительнее оранжевая (меньшая по площади) зона.

Синий (больший участок) под кривой демонстрирует вероятность поражения ворот с эквивалентным уровнем менее ½ гола. Т. е объективная возможность не забить даже 1 мяч составляет 52,15 %. По такому алгоритму выполняются расчеты вероятности забивания мячей ниже показателя 1,5 (это 72,05 %). Детальный расчет легко выполняется с помощью прикладных программ по обработке параметров через электронные таблицы: тот же MS Excel: = НОРМ.РАСП. (0,5;0,3789;1,9188;1). Ожидаемый результат – разность между двумя показателями в 19,53 %.

Оценивая турнир, можно предположить, что в сыгранных на нем 380 встречах победить должны хозяева арены в 74,22 матчах с перевесом в один мяч. Статистика показала: проведенные 75 матчей действительно закончились с такой результативностью. Значит, найденный эмпирическим путем показатель, практически, соответствует фактическому. Используя типовую кривую нормального распределения, выполняя необходимые действия для анализируемых случаев с разницей голов можно сопоставлять реальное и предсказуемое число игр, завершившихся с той или иной разницей мячей. Ниже дается наименьшее по значению расхождение. Оно свидетельствует о правильном подборе распределения. Существуют и другие эффективные способы проверки.

Описанный метод активно используется для изучения статистических данных 22 розыгрыша Английской Премьер-лиги по футболу. Логично допустить, что распределение Гаусса актуально и при оценивании матчей текущего футбольного сезона в Англии. Тогда игрок может делать ставки на разницу в счете, используя данные о вероятности выигрыша клуба-хозяина поля с перевесом не менее чем в один мяч. В общем виде это будет выглядеть, как 100 % – 52,52 % = 47,48 %. Формула актуальна для предсказаний исходов поединков по всей АПЛ, а не для успешной игры отдельно взятого футбольного клуба. В ставках на спорт нужен анализ отдельно каждой команды, но не первенства в целом.

Наконец, последнее. Являясь основополагающим в теории вероятности, стандартное отклонение нужно рассматривать не только как меру разброса данных по отношению к среднему параметру. При типичных условиях к нормальному закону Гаусса приближаются другие теории распределения. Закон стандартного отклонения – это конструктивный инструмент в расчетах вероятности. Его применение позволяет более точно рассчитать объективную возможность наступления события, что полезно использовать в беттинге, делая ставки на спортивные события.

Теория вероятности, закон трех сигм и трейдинг

I.ВВЕДЕНИЕ:
1. Стоимость любого фьючерса на рынке определяется, ценой сделки здесь и сейчас. Но сам фьючерсный контракт есть договор, заключающийся на понижение цены или на ее повышение, поэтому остается важный вопрос — как изменится цена через минуту, день и месяц. То есть появляется некий диапазон ожидания цены. Каждая «японская» свеча или бар, не зависимо от таймфрейма, имеет цену открытия, цену закрытия, меридианную цену (средняя цена), то есть тоже некое математическое ожидание всего рынка.
2. Рынок состоит из множества трейдеров: крупных, средних и мелких. Крупных трейдеров на рынке не одна сотня, поэтому предугадать их настрой, отношение к информации и соответственно предугадать их намерения практически не реально, но его можно увидеть на графике используя закон трех сигм.

II. Применения закона трех сигм, для определения возможного диапазона цены.
Среднеквадратическое отклонение (сигма) измеряется в единицах измерения самой случайной величины и используется при расчёте стандартной ошибки среднего арифметического, при построении доверительных интервалов, при статистической проверке гипотез, при измерении линейной взаимосвязи между случайными величинами. Определяется как квадратный корень из дисперсии случайной величины.

Правило трёх сигм — практически все значения нормально распределённой случайной величины лежат в интервале ( среднее арифметическое+- 3*сигма). Более строго — приблизительно с вероятностью 0,9973 значение нормально распределённой случайной величины лежит в указанном интервале (при условии, что величина среднеарифметическая истинная, а не полученная в результате обработки выборки).

Среднее квадратическое отклонение доходности портфеля отождествляется с риском портфеля.

В техническом анализе среднеквадратическое отклонение используется для построения линий Боллинджера, расчёта волатильности.

На графике оранжевая линия — линия цены.
Красная — сигма 1,
Зеленая — сигма 2,
Синяя — сигма 3.

ОСНОВНЫЕ СОСТОЯНИЯ РЫНКА

Рынок в консолидации:
Это сужение расстояния между сигмами (уровнями вероятности) и практически ровный канал:

Cтатистический анализ рынка Forex

Здравствуйте, уважаемые коллеги. После того, как при помощи межрыночного анализа было определено основное направление движение доллара США в сторону его укрепления, для определения стратегии и тактики работы на валютном рынке необходимо уточнить положение текущих валютных курсов относительно распределения плотности вероятности, а также сверить предполагаемое направление торговли в соответствии с открытыми позициями «толпы».

Метод оценки предполагаемого движения цены, а также «перекупленности» и «перепроданности», основан на распределении плотности вероятности в пределах среднеквадратического отклонения, при котором в диапазоне 1σ находится 68% значений, в диапазоне 2σ находится уже 95% всех значений условно-случайного процесса. Выход значений цены за пределы диапазона 1σ или даже 2σ не означает неизбежного разворота актива, однако предполагает значительное ограничение по возможному продолжению существующей тенденции. По сравнению с прошлыми обзорами я изменил оценку положения цены относительно распределения плотности вероятности, взяв за основу общепринятый 95% диапазон распределения вместо 68%, применяемого мной ранее, а также исключил из обзора непопулярные шведскую и норвежскую крону. При этом в сам обзор будет добавлен анализ гармонических паттернов и внутренних паттернов ретрейсмента Фибоначчи, если, конечно, таковые будут появляться на графиках.

Некоторые пояснения по представленной таблице

Ярко-зеленый цвет – сильная «перекупленность» на периоде, цена находится в пределах 2 и 3 сигмы.
Бледно-зеленый цвет – средняя «перекупленность» на периоде, цена находится на границе 2 сигмы.
Бесцветная ячейка – «нормальное» состояние, цена находится в середине плотности распределения.
Розовый цвет – средняя «перепроданность» на периоде, цена находится на границе 2 сигмы.
Ярко-красный цвет – сильная «перепроданность» на периоде, цена находится в пределах 2 и 3 сигмы.
Положение стрелки в ячейке текущей цены, показывает направление тренда.
σ (сигма) – в столбце указаны границы среднеквадратичного отклонения равные 1 σ. Если цена находится выше/ниже этих границ, имеется большая вероятность возврата в диапазон к среднему значению.
Рынок – в данной графе показано распределение позиций среди игроков ритейла. «Нормальными» считаются значения от 40 до 60 процентов. Слева объем позиций открытых на продажу. Справа объем открытых позиций на покупку. При значении выше/ниже нормального велика вероятность, что текущее движение на H1-H4 будет продолжено.

Средневзвешенная цена – предполагает среднее значение, на котором трейдеры открыли свои позиции. Предполагается, что данный диапазон определяет границы движения цены на ближайшую неделю.

Резюме: методика предлагает рекомендации по открытию позиций при наличии сигнала в торговой системы трейдера.

В дальнейшем обзоры ситуации на недельных таймах будут проводиться один раз в месяц, на дневных таймах один раз в две недели и на четырех часовых таймах один раз в неделю. Таблица распределения плотности вероятности будет обновляться еженедельно. В настоящем обзоре будет рассмотрена ситуация на недельном и дневном тайме евро, и британского фунта.

Анализ курса EUR/USD

Weekly – Анализ положения цены курса EUR/USD относительно распределения плотности вероятности показывает, что пара находится фактически на нижней границе 2σ (1.0597). Это ограничивает фундаментальное снижение евро. Таким образом, для преодоления данной поддержки евро необходимо получить дополнительный мощный драйвер, без чего дальнейшее снижение маловероятно. При этом обращает на себя внимание тот факт, что гармонический паттерн «бабочка», образованный в течении последних 5 лет, пока так и не был отработан соответствующей коррекцией. Цена сумела подняться только до значения 23.6%, после чего вновь опустилась до уровня 8.8%, образовав разворотный паттерн IP1, который имеет возможную цель коррекции на значении 50% (1.2250) ретрейсмента (Рис. 1). Следует отметить, что, несмотря на наличие двух графических разворотных паттернов, понижающийся тренд EUR/USD все ещё сохраняется. Это предполагает возможное обновление минимума на значении 1.0465, что приведет к расформированию указанных графических моделей. Однако в рамках свинговых долгосрочных разворотных тактик, цель, что называется, оправдывает средства, и мы не должны упускать из виду данный сценарий.

Day – Ситуация на данном тайм фрейме менее напряженная, чем на недельном формате, евро меньше перепродан, т.к. сказывается полугодовое нахождение пары в диапазонной динамике. Однако и здесь курс EUR/USD вплотную приблизился к нижней границе 1σ (1.0710) , которая выступает вероятностной поддержкой для пары. При этом пара находится в процессе отработки гармонического медвежьего паттерна AB=CD, и цена вполне может продолжить свое снижение, но чем ниже будет снижение, тем больше будет становиться вероятность разворота, которая уже сейчас составляет 68% (Рис. 2). Здесь, как и на недельном тайме, имеется бычий паттерн IP1, который может выступать предтечей глобальных событий. В данном контексте, покупки пары EUR/USD хотя и выглядят привлекательными, но все же пока будут несколько преждевременными. Такое развитие событий выглядит невероятным, но мы-то знаем, что цена учитывает все.

H4 – Как и на недельном тайме пара находится в значительной степени перепроданности и достигла зоны значений между 1 и 2 сигмами, т.е. попала в диапазон значений, когда вероятность разворота составляет 75%. Однако и здесь пока нет данных о глобальном развороте, скорее речь может идти о неких предпосылках, предшествующих развороту, т.е. о процессе, в результате которого данный разворот может быть реализован, а может быть и нет.

Позиции трейдеров – большинство трейдеров уже начало занимать по евро длинные позиции, и как я могу предположить, как обычно, они начали это делать преждевременно. Исходя из анализа ситуации, можно предположить, что, несмотря на текущую перепроданность курса EUR/USD и формирование предпосылок для разворота, евро вполне способен сформировать новый локальный или даже годовой минимум, вплоть до расформирования разворотных паттернов на недельном тайме.

Анализ курса GBP/USD

Weekly –на недельном тайме курса британского фунта складывается не менее интересная ситуация чем на евро. Здесь нет перепроданности или перекупленности и пара находится в середине распределения плотности вероятности [-1σ;+1σ], но, как и на EUR/USD, здесь наблюдается формирование разворотных моделей: нестандартного гармонического паттерна 5-0 и паттерна внутреннего ретрейсмента Фибоначчи IP3, имеющего своей целью отработку на уровень 61.8% (1.62). Отсутствие вероятностной поддержки предполагает свободное перемещение курса в рамках 95% вероятностного диапазона, верхняя граница, которого сейчас расположена на значении 1.7744. С учетом того, что фунт имеет положительную ставку, а Банк Англии не собирается увеличивать программу по выкупу активов и более того планирует вслед за ФРС увеличение ставки, фунт обладает даже большими возможностями для роста, нежели евро.

Day – на дневной тайме британский фунт оттолкнулся от нижней границы (1.5050) распределения плотности вероятности [-1σ;+1σ] и устремился внутрь диапазона. При этом на данном тайме сохранился бычий паттерн IP3, который мы могли наблюдать на недельном тайме (Рис. 5). Наличие данного паттерна в условиях отсутствия тренда представляет серьезную заявку на долгосрочный свинг. Однако если на недельном тайме предполагался выход цены на значение 1.66, то на дневном тайме, данный рост будет означать выход котировки GBP/USD за пределы распределения плотности вероятности, что пока маловероятно. Таким образом, следует уточнить цели разворота, которые, в соответствии с теорией, предполагают достижение уровня 61.8% ретейсмента Фибоначчи, что в данном случае соответствуют верхней границе 95% распределения плотности вероятности на уровне 1.6175. При этом следует учитывать, что условия для данного разворота находятся только в стадии формирования, а значит, курс фунта может опуститься ниже текущих значений, вплоть до нового теста нижней границы 1σ (1.5050).

H4 – на данном тайме отсутствуют гармонические формации и паттерны внутреннего ретрейстмента Фибоначчи. Курс находится в понижающемся тренде, и, оттолкнувшись от нижней границы 95% распределения плотности вероятности, протестировал значение 1.5240, находящееся в середине вероятностного диапазона, которое стало сопротивлением. Такое развитие ситуации предполагает дальнейшее снижение цены, что соответствует индикаторному анализу и общей динамике валютного рынка. Мнения трейдеров относительно открытия позиций разделились ровно пополам, что не ограничивает нас в выборе направления.

Как следует из анализа распределения плотности вероятности и графического анализа, вопреки царящим на рынке предположениям относительно усиления позиций доллара США, дальнейшего снижения курса евро и британского фунта, существуют большая вероятность образования долгосрочных и среднесрочных свингов. Однако следует учитывать, что текущее движение обладает достаточной инерцией для того, чтобы котировки EUR/USD и GBP/USDсмогли опуститься ниже текущих значений и в результате расформировать разворотные формации. Таким образом, главной задачей для трейдеров, полагающих работать в вероятном свинге, является соблюдать осторожность и не встать против тренда раньше времени. Поспешишь – рынок рассмешишь. При этом рассматривая обе валютные пары с точки зрения покупок, можно констатировать, что пара GBP/USD, в силу политики Банка Англии, при занятии длинных позиций обладает некоторым преимуществом перед европейской валютой, хотя и меньшим запасом хода.

Как рассчитывается Коэффициент Шарпа

Существуют разнообразные способы оценки торговых стратегий на финансовых рынках. Множество инвесторов анализируют эффективность трейдинга по эквити (величине свободных средств на депозите). В случае плавного роста кривой, являющейся результатом бэк-теста и отсутствия резких просадок, торговля считается успешной. Помимо данного способа, применяют такие параметры, как процент прибыльных сделок, максимальную просадку и другие. Однако для более полного анализа требуется учет торговых рисков. Оценить соотношение доходности и риска помогает коэффициент Шарпа (Sharp Ratio).

Единицы расчета коэффициента Шарпа

Большинство инвесторов «попадает на удочку» красивых цифр роста средств на депозите, не учитывая степень риска. Такой инструмент, как коэффициент Шарпа, позволяет определить эффективность инвестиционного портфеля, рассчитываемую отношением среднего дохода от трейдинга к уровню риска. Чем выше коэффициент, тем эффективнее способ торговли.С его помощью можно увидеть, как ранее прибыльность соотносилась с риском, а также спрогнозировать стабильность доходности в будущем.

Стандартная формула для расчета данного показателя выглядит следующим образом:

Sharp Ratio = (Rp ? Rf) / ?p,
где Rp — ожидаемая прибыль за определенный период времени, Rf — безрисковый доход, ?p — риск инвестиционного портфеля. Риск выражается в стандартном отклонении от ожидаемой средней доходности.

Отрицательные значения коэффициента Шарпа отражают слишком высокие риски в торговле. Данную стратегию использовать не рекомендуется. «Хороший показатель» Шарпа должен быть от единицы и выше. Только тогда выбранный способ трейдинга будет признан эффективным. Значение Sharp Ratio, превышающее цифру 3, предполагает, что величина вероятности получения убытка в каждой сделке не превышает 1%. Дальнейший рост коэффициента Шарпа подтверждает возрастающую эффективность торговой стратегии, но слишком завышенные значения сигнализируют о возможной ошибке в расчетах.

В качестве примера можно сравнить эффективность двух способов торговли по прибыльности и стандартному отклонению. Первый способ приносит 6% прибыли на одну торговую операцию при риске инвестиционного портфеля в 5%. Второй дает 3% доходности при отклонении в 2%.
Коэффициент Шарпа в первой стратегии будет равен 1.2, во второй — 1.5. Это свидетельствует о том, что даже доходность вдвое меньших размеров дает лучшее соотношение прибыльности к риску.

Коэффициент Шарпа на рынке Forex

Коэффициент Шарпа очень важен для анализа форекс-счетов. Он с успехом применяется для их мониторинга многими западными инвесторами. Применив данный коэффициент, можно сразу же определить, торгует ли трейдер с фиксацией убытков или нет. Довольно часто встречаются управляющие с увеличивающимся размером средств на счете, но с низким показателем коэффициента Шарпа (в диапазоне 0–0.5). Зачастую такой результат показывает одинаковую вероятность заработка и убытка.

В MetaTrader 4 данный параметр можно увидеть в разделе «Сигналы». Его величина поможет оценить эффективность торговой стратегии выбранного трейдера. В данном разделе представлен ее подробный анализ. На рынке Forex данный показатель отображает избыточную доходность, которую можно получить с удержанием более рискового актива. Естественно, что повышенный риск должен быть компенсирован более значимой прибылью.

В формуле Sharp Ratio = (Rp ? Rf) / ?p параметр Rf = 0, так как на рынке Forex не бывает безрискового дохода. Rf актуален на фондовом или долговом рынках. Там его можно наблюдать в виде дивидентной доходности или начислений по облигациям.

Существует несколько особенностей коэффициента Шарпа:

  • Показатель оценивает волатильность доходности, причем стоимость торговых инструментов не влияет на расчеты.
  • Для исследуемого периода времени расчет не зависит от особенности чередования прибыльных сделок с убыточными.

Доходность актива

Она измеряется с любой периодичностью. В качестве единицы измерения выбирают дни, недели, месяцы или годы. Помимо этого доходностью актива может быть средний прирост на сделку.

Весьма важно нормальное симметричное распределение исходных данных. При наличии на графике анализа актива нескольких резких нестандартных отклонений (значительные пики, впадины) возрастает вероятность ложной оценки.
Когда инвестор тестирует множество различных стратегий, будет весьма полезным сделать таблицу в Excel, разработать формулу расчета и вносить в нее новые данные.

Стандартное отклонение

Расчет стандартного отклонения в торговом терминале производится автоматически. Данный показатель дает возможность определить, каким именно образом изменится (уменьшится или увеличится) доходность выбранного актива в сравнении со средней доходностью за выбранный временной промежуток.

Для наглядности можно оценить риск стратегий, сравнивая две различные выборки данных.

В первом случае прибыльность торговых сделок составила: 3%, 2%, 5%, 0%, 4%. Среднее значение будет равно 2.8%. Результат его вычитания из каждого показателя доходности равен: 0.2%, ?0.8%, 2.2%, ?2.8%, 1.2%. При возведении каждого значения в квадрат нужно вычислить их сумму, затем найти среднее арифметическое и из полученного значения вычислить квадратный корень:

Sqrt((0.4% + 0.64% + 4.84% + 7.84% + 1.44%) / 5) = 3.03%

Во втором случае прибыльность торговых сделок составила: 2%, 1%, 0%, 4%, 6%. Их среднее арифметическое равно 2.6%. Результаты аналогичной предыдущему способу операции: ?0.6%, ?1.6%, ?2.6%, 1.4%, 3.4%. Затем, как и в предыдущем случае:

Sqrt((0.36% + 2.56% + 6.76% + 1.96% + 11.56%) / 5) = 4.64%

Результат сравнения — первая стратегия менее рискованна, чем вторая, поскольку волатильность доходности у нее меньше. Хотя коэффициент Шарпа представляет собой один из важных эталонов доходности с учетом риска, его следует использовать вместе с аналитической информацией.

Нормальное и логнормальное распределение

Нормальным называют распределение вероятностей непрерывной случайной величины, которое описывается плотностью

Нормальное распределение определяется двумя параметрами: математическим ожиданием и средним квадратическим отклонением и на графике представляет собой симметричную колоколообразную кривую Гаусса, имеющую максимум в точке, соответствующей значению , а при и асимптотически приближающуюся к оси абсцисс. Точка перегиба кривой находится на расстоянии от центра распределения. Изменение параметра приводит к изменению степени растяжения кривой: с уменьшением кривая вытягивается в центре и быстрее приближается к оси абсцисс при удалении от центра.

Часто вместо случайной величины Х целесообразно рассматривать нормированную случайную величину , которую определяют как отношение отклонения к среднему квадратическому отклонению . Нормированная величина имеет математическое ожидание, равное нулю и дисперсию, равную единице. При а=0 и нормальную кривую называют нормированной.

Между абсциссами и расположено 68,27% всей площади кривой нормального распределения. Это означает, что 68,27% всех измеренных единиц отклоняется от среднего значения не более чем на , т.е. все они находятся в пределах . Площадь, заключенная между ординатами, проведенными на расстоянии с той и другой стороны от центра, составляет 0,9545, т.е. 95,45% всех единиц совокупности находятся в пределах . И наконец, 0,9973 или 99,73% всех единиц находятся в пределах . Это так называемое правило “трех сигм”, характерное для нормального распределения, согласно которому за пределами отклонения на находится не более 0,27% всех значений величин, иными словами, 27 реализаций на 10 тыс. испытаний. Исходя из принципа невозможности маловероятных событий такие события можно считать практически невозможными. На практике правило трех сигм применяют так: если распределение изучаемой случайной величины неизвестно, но условие, указанное в приведенном правиле, выполняется, то есть основание предполагать, что изучаемая величина распределена нормально; в противном случае она не распределена нормально.

Нормальное распределение

Рассмотрим другой метод исследования, основанный на предположении о том, что большинство результатов хозяйственной деятельности (прибыль, доход и т.д.) как случайные величины подчиняются закону, близкому к нормальному. Этот закон характерен для распределения событий в случае, когда их исход представляет собой результат совместного воздействия большого количества независимых факторов, и ни один из этих факторов не оказывает преобладающего влияния.

Нормальное распределение является основным элементом большинства систем управления риском. На нем целиком основан страховой бизнес, потому что от пожара в Москве не загораются дома в Самаре, а смерть определенного человека в одном месте, как правило, не имеет отношения к смерти другого человека в другом месте и в другое время. Когда страховые компании собирают сведения о миллионах людей обоего пола всех возрастов, значения ожидаемой продолжительности жизни оказываются распределенными по нормальной кривой. В силу этого страховые компании способны с большой степенью надежности оценивать продолжительность жизни разных групп населения. Они могут не только определять ожидаемую среднюю продолжительность жизни, но и диапазоны, в которых она может колебаться из года в год. Уточняя эти оценки на основе дополнительных данных, таких, как истории болезней, число курильщиков, постоянные места проживания, профессиональная деятельность, эти компании повышают точность оценки ожидаемой продолжительности жизни.

Порой нормальное распределение дает гораздо больше важной информации, чем простые оценки представительности выборки. Нормальное распределение менее вероятно, хотя и не исключено, когда наблюдения зависимы друг от друга, то есть когда вероятность события определяется предыдущим событием. Например, если у лучника проблемы со зрением, стрелы будут ложиться слева от яблочка, т.е. центр распределения окажется сдвинутым. В подобных ситуациях распределение относительно среднего значения обычно оказывается асимметричным.

В таких случаях мы можем воспользоваться рассуждением наоборот. Если независимость событий является необходимым условием нормального распределения, можно предположить, что данные, распределение которых представлено нормальной кривой, получены на основе независимых наблюдений. Теперь мы можем поставить несколько интересных вопросов.

Насколько точно изменения курса акций на бирже подчинены законам нормального распределения? Некоторые знатоки рынка утверждают, что курс подвержен случайным колебаниям, напоминающим пошатывающегося пьяного, пытающегося ухватиться за фонарный столб. Они полагают, что у курса не больше памяти, чем у рулетки или пары костей, и что каждое наблюдение здесь независимо от предыдущего наблюдения. Сегодняшнее движение цен не зависит от того, что произошло минуту назад, вчера или позавчера.

Лучший способ решения вопроса о том, являются ли изменения курса акций независимыми событиями, заключается в сравнении колебаний курса с нормальным распределением. У нас есть веские основания утверждать, что эти колебания подчиняются нормальному закону, и в этом нет ничего удивительного. В условиях постоянной изменчивости и конкурентной борьбы на нашем рынке капитала, когда каждый инвестор стремится переиграть других, новая информация мгновенно отражается на котировках. Когда выясняется падение прибыли у General Motors или Merck объявляет о выпуске нового чудодейственного лекарства, котировки не стоят на месте в ожидании, пока инвесторы переварят информацию. Ни один инвестор не станет ждать, пока начнут действовать другие. На рынке действуют сворой, и новая информация немедленно изменит котировки акций General Motors или Merck. При этом сама новая информация поступает в случайном порядке. В силу этого изменения котировок непредсказуемы.

Интересные данные в поддержку этой точки зрения были приведены в 1950-х годах профессором Чикагского университета Гарри Робертсом. Робертс с помощью компьютера брал случайные числа из наборов с тем же средним и тем же средним квадратичным отклонением, какие наблюдались у цен на фондовой бирже. Затем он начертил диаграмму последовательной смены этих случайных чисел. Результаты оказались идентичными с результатами аналитиков рынков ценных бумаг, пытающихся предугадать движение котировок. Реальная динамика цен и динамика случайных чисел, выданных компьютером, оказались практически неразличимыми. Возможно, что и на самом деле биржевые котировки не имеют памяти.

Нормальность распределения — это жесткая проверка гипотезы случайных колебаний рынка. Но нужна одна важная оговорка. Даже если гипотеза случайных колебаний адекватно описывает ситуацию на фондовом рынке, даже если изменения котировок описываются нормальным распределением, среднее значение изменений всегда отлично от нуля. Тенденция к повышению котировок не должна нас удивлять. Состояние владельцев акций со временем растет, как и сбережения, доходы и прибыли корпораций. Поскольку по большей части котировки не падают, а растут, среднее значение их изменений оказывается положительным.

На практике для проверки предположения о нормальном распределении исследуемой совокупности случайных факторов применяются различные критерии согласия, устанавливающие соответствие между эмпирическим (опытным) и теоретическим (нормальным) распределением, и которые для задаваемой надежности (вероятности) позволяют принять или отвергнуть принятую гипотезу о нормальном законе распределения.

Нормальное распределение (распределение Гаусса) представляет собой вид распределения случайных величин, с достаточной точностью описывающий распределение плотности вероятности результатов производственно-хозяйственной, финансовой, инновационной деятельности или изменений условий внешней среды, поскольку показатели, характеризующие их, определяются большим числом независимых случайных величин, каждая из которых в отдельности относительно других играет незначительную роль и непредсказуема. Применение нормального распределения для оценки рисков также связано с тем, что в основе данных, как правило, используется ряд дискретных значений. Эти теоретические предпосылки, а также апробация моделей для анализа рисков на основе нормального распределения доказывают адекватность этого теоретического инструмента реальным процессам экономической деятельности.

Плотность вероятности нормального распределения имеет вид:

где х = а — математическое ожидание,

ст — среднее квадратическое отклонение случайной величины X.

Из курса теории вероятностей известно, что попадание случайной величины X в заданный интервал (а; р) определяется как

где есть интеграл вероятностей или функция Лапласа, ее значения в зависимости от параметра * приводятся в специальных таблицах, эта функция четная и она изменяется от 0 до 0,5.

Если предположить, что ожидаемое значение результата (прибыль, потери и т.д.) должны принадлежать интервалу (а; Р) длиной А = р — а, то вероятность того, что достигаемый результат будет находиться в указанном интервале, определяется из формулы (6.6.4) и пусть равна Рх. На графике рис. 6.9 заштрихованная площадь численно равна Рх. Тогда вероятность попадания рассматриваемого результата за пределы допустимых границ, исходя из того, что вся площадь под кривой нормального распределения равна единице, будет равна Р2 1 — Ру.

Вероятность Р2 оценивает неопределенность результата и отдельные авторы считают непосредственным измерителем риска величину Р2. На наш взгляд, лишь в относительно простых случаях для оценки степени риска можно использовать величину вероятности получения отрицательного результата (Р2), так как при этом не затрагиваются существенные факторы понятия риска, от-

Рис. 6.9. Нормальная кривая

сутствует сравнение возможных выигрышных исходов и обстоятельств, способствующих им, с возможными потерями в случае неудачи.

Средняя арифметическая х = а определяет центр распределения и ее размерность та же, что и размерность случайной величины X. Среднее квадратическое отклонение ст определяет разброс центра распределения и размерность ст совпадает с размерностью случайной величины X. На рис. 6.10 показано, как разница в значениях средней арифметической влияет на положение графика, а на рис. 6.11 показано, как увеличение значения а меняет размах кривой.

Параметр а характеризует не положение, а саму форму кривой распределения. Это есть характеристика рассеивания. Наи-

Рис. 6.10. Изменения в значении средней арифметической

Рис. 6.11. Изменения в значении среднего квадратического отклонения

большая ордината кривой распределения обратно пропорциональна ст, при увеличении ст максимальная ордината уменьшается. Так как площадь кривой распределения всегда должна оставаться равной единице, то при увеличении ст кривая распределения становится более плоской, растягиваясь вдоль оси абсцисс; напротив, при уменьшении ст кривая распределения вытягивается вверх, одновременно сжимаясь с боков, и становится более иглообразной. На рис. 6.11 показаны три нормальные кривые (I, II, III) при а = 0; из них кривая / соответствует самому большому, а кривая III — самому малому значению ст. Изменение параметра ст равносильно изменению масштаба кривой распределения — увеличению масштаба по одной оси и такому же уменьшению по другой.

В процессе принятия управленческих решений предпримате- лю целесообразно различать и выделять определенные области (зоны риска) в зависимости от уровня возможных (ожидаемых) потерь. Для этого разработаны и используются так называемые шкалы риска, позволяющие классифицировать поведение лиц, идущих на хозяйственный риск. В табл. 6.11 приведена эмпирическая шкала риска, которую рекомендуют применять предпринимателям при использовании ими в качестве количественной оценки риска вероятность наступления рискового события авторы книги [50].

Дадим математический анализ этой таблицы.

В практике общеупотребительной характеристикой рассеивания служит не среднее квадратическое отклонение ст, а другая веЭмпирическая шкала допустимого уровня риска

Вероятность нежелательного исхода (величина риска)

Нормальное распределение

Материал из MachineLearning.

Нормальное распределение

Плотность вероятности

Зеленая линия соответствует стандартному нормальному распределению

Функция распределения

Цвета на этом графике соответствуют графику наверху

Параметры — коэффициент сдвига (вещественное число)
0″ alt= «\sigma>0» /> — коэффициент масштаба (вещественный, строго положительный)
Носитель
Плотность вероятности
Функция распределения
Математическое ожидание
Медиана
Мода
Дисперсия
Коэффициент асимметрии
Коэффициент эксцесса
Информационная энтропия
Производящая функция моментов
Характеристическая функция

Нормальное распределение, также называемое распределением Гаусса, — распределение вероятностей, которое играет важнейшую роль во многих областях знаний, особенно в физике. Физическая величина подчиняется нормальному распределению, когда она подвержена влиянию огромного числа случайных помех. Ясно, что такая ситуация крайне распространена, поэтому можно сказать, что из всех распределений в природе чаще всего встречается именно нормальное распределение — отсюда и произошло одно из его названий.

Нормальное распределение зависит от двух параметров — смещения и масштаба, то есть является с математической точки зрения не одним распределением, а целым их семейством. Значения параметров соответствуют значениям среднего (математического ожидания) и разброса (стандартного отклонения).

Стандартным нормальным распределением называется нормальное распределение с математическим ожиданием 0 и стандартным отклонением 1.

Содержание

Моделирование нормальных случайных величин

Простейшие, но неточные методы моделирования основываются на центральной предельной теореме. Именно, если сложить много независимых одинаково распределённых величин с конечной дисперсией, то сумма будет распределена примерно нормально. Например, если сложить 12 независимых базовых случайных величин, получится грубое приближение стандартного нормального распределения. Тем не менее, с увеличением слагаемых распределение суммы стремится к нормальному.

Использование точных методов предпочтительно, поскольку у них практически нет недостатков. В частности, преобразование Бокса — Мюллера является точным, быстрым и простым для реализации методом генерации.

Свойства

Если случайные величины и независимы и имеют нормальное распределение с математическими ожиданиями и и дисперсиями и соответственно, то также имеет нормальное распределение с математическим ожиданием и дисперсией .

Статистическая проверка принадлежности нормальному распределению

Поскольку нормальное распределение часто встречается на практике, то для него разработаны специальные статистические критерии проверки на «нормальность»:

Многомерное нормальное распределение

Многоме́рное норма́льное распределе́ние (или многоме́рное га́уссовское распределе́ние) в теории вероятностей — это обобщение одномерного нормального распределения.

Случайный вектор имеет многомерное нормальное распределение, если выполняется одно из следующих эквивалентных условий:

  • Произвольная линейная комбинация компонентов вектора имеет нормальное распределение или является константой.
  • Существует вектор независимых стандартных нормальных случайных величин , вещественный вектор и матрица размерности , такие что:

.

  • Существует вектор и неотрицательно определённая симметричная матрица размерности , такие что плотность вероятности вектора имеет вид:

,

где — определитель матрицы , а — матрица обратная к .

  • Существует вектор и неотрицательно определённая симметричная матрица размерности , такие что характеристическая функция вектора имеет вид:

.

Замечания

  • Если одно из приведённых выше определений принято в качестве основного, то другие выводятся в качестве теорем.
  • Вектор является вектором средних значений , а — его ковариационная матрица.
  • В случае , многомерное нормальное распределение сводится к обычному нормальному распределению.
  • Если случайный вектор имеет многомерное нормальное распределение, то пишут .

Свойства многомерного нормального распределения

  • Если вектор имеет многомерное нормальное распределение, то его компоненты имеют одномерное нормальное распределение. Обратное, вообще говоря, неверно!
  • Если случайные величины имеют одномерное нормальное распределение и совместно независимы, то случайный вектор имеет многомерное нормальное распределение. Матрица ковариаций такого вектора диагональна.
  • Если имеет многомерное нормальное распределение, и его компоненты попарно некоррелированы, то они независимы. Однако, если только компоненты имеют одномерное нормальное распределение и попарно не коррелируют, то отсюда не следует, что они независимы.

Контрпример. Пусть , а с равными вероятностями. Тогда если , то корреляция и равна нулю. Однако, эти случайные величины зависимы.

  • Многомерное нормальное распределение устойчиво относительно линейных преобразований. Если , а — произвольная матрица размерности , то

.

См. также

Заключение

Нормальное распределение наиболее часто встречается в природе, нормально распределёнными являются следующие случайные величины:

  • отклонение при стрельбе
  • ошибки при измерениях
  • рост человека

Такое широкое распространение закона связано с тем, что он является предельным законом, к которому приближаются многие другие (например, биномиальный). Доказано, что сумма очень большого числа случайных величин, влияние каждой из которых близко к 0, имеет распределение, близкое к нормальному. Этот факт является содержанием предельной теоремы Ляпунова.

Доверительные интервалы

Определение

Доверительные интервалы (англ. Confidence Intervals) одним из типов интервальных оценок используемых в статистике, которые рассчитываются для заданного уровня значимости. Они позволяют сделать утверждение, что истинное значение неизвестного статистического параметра генеральной совокупности находится в полученном диапазоне значений с вероятностью, которая задана выбранным уровнем статистической значимости.

Нормальное распределение

Когда известна вариация (σ 2 ) генеральной совокупности данных, для расчета доверительных пределов (граничных точек доверительного интервала) может быть использована z-оценка. По сравнению с применением t-распределения, использование z-оценки позволит построить не только более узкий доверительный интервал, но и получить более надежные оценки математического ожидания и среднеквадратического (стандартного) отклонения (σ), поскольку Z-оценка основывается на нормальном распределении.

Формула

Для определения граничных точек доверительного интервала, при условии что известно среднеквадратическое отклонение генеральной совокупности данных, используется следующая формула

σ
√ n
σ
√ n

где X – математическое ожидание выборки, α – уровень статистической значимости, Zα/2 – Z-оценка для уровня статистической значимости α/2, σ – среднеквадратическое отклонение генеральной совокупности, n – количество наблюдений в выборке. При этом, σ/√ n является стандартной ошибкой.

Таким образом, доверительный интервал для уровня статистической значимости α можно записать в виде

σ
√ n

Пример

Предположим, что размер выборки насчитывает 25 наблюдений, математическое ожидание выборки равняется 15, а среднеквадратическое отклонение генеральной совокупности составляет 8. Для уровня значимости α=5% Z-оценка равна Zα/2=1,96. В этом случае нижняя и верхняя граница доверительного интервала составят

L = 15 — 1,96 8 = 11,864
√ 25
L = 15 + 1,96 8 = 18,136
√ 25

А сам доверительный интервал может быть записан в виде

Таким образом, мы можем утверждать, что с вероятностью 95% математическое ожидание генеральной совокупности попадет в диапазон от 11,864 до 18,136.

Методы сужения доверительного интервала

Допустим, что диапазон [11,864; 18,136] является слишком широким для целей нашего исследования. Уменьшить диапазон доверительного интервала можно двумя способами.

  1. Снизить уровень статистической значимости α.
  2. Увеличить объем выборки.

Снизив уровень статистической значимости до α=10%, мы получим Z-оценку равную Zα/2=1,64. В этом случае нижняя и верхняя граница интервала составят

L = 15 — 1,64 8 = 12,376
√ 25
L = 15 + 1,64 8 = 17,624
√ 25

А сам доверительный интервал может быть записан в виде

В этом случае, мы можем сделать предположение, что с вероятностью 90% математическое ожидание генеральной совокупности попадет в диапазон [12,376; 17,624].

Если мы хотим не снижать уровень статистической значимости α, то единственной альтернативой остается увеличение объема выборки. Увеличив ее до 144 наблюдений, получим следующие значения доверительных пределов

L = 15 — 1,96 8 = 13,693
√ 144
L = 15 + 1,96 8 = 16,307
√ 144

Сам доверительный интервал станет иметь следующий вид

Таким образом, сужение доверительного интервала без снижения уровня статистической значимости возможно только лишь за счет увеличения объема выборки. Если увеличение объема выборки не представляется возможным, то сужение доверительного интервала может достигаться исключительно за счет снижения уровня статистической значимости.

Построение доверительного интервала при распределении отличном от нормального

В случае если среднеквадратичное отклонение генеральной совокупности не известно или распределение отлично от нормального, для построения доверительного интервала используется t-распределение. Это методика является более консервативной, что выражается в более широких доверительных интервалах, по сравнению с методикой, базирующейся на Z-оценке.

Формула

Для расчета нижнего и верхнего предела доверительного интервала на основании t-распределения применяются следующие формулы

σ
√ n
σ
√ n

где X – математическое ожидание выборки, α – уровень статистической значимости, tα – t-критерий Стьюдента для уровня статистической значимости α и количества степеней свободы (n-1), σ – среднеквадратическое отклонение выборки, n – количество наблюдений в выборке.

Сам доверительный интервал может быть записан в следующем виде

σ
√ n

Распределение Стьюдента или t-распределение зависит только от одного параметра – количества степеней свободы, которое равно количеству индивидуальных значений признака (количество наблюдений в выборке). Значение t-критерия Стьюдента для заданного количества степеней свободы (n) и уровня статистической значимости α можно узнать из справочных таблиц.

Пример

Предположим, что размер выборки составляет 25 индивидуальных значений, математическое ожидание выборки равно 50, а среднеквадратическое отклонение выборки равно 28. Необходимо построить доверительный интервал для уровня статистической значимости α=5%.

В нашем случае количество степеней свободы равно 24 (25-1), следовательно соответствующее табличное значение t-критерия Стьюдента для уровня статистической значимости α=5% составляет 2,064. Следовательно, нижняя и верхняя граница доверительного интервала составят

L = 50 — 2,064 28 = 38,442
√ 25
L = 50 + 2,064 28 = 61,558
√ 25

А сам интервал может быть записан в виде

Таким образом, мы можем утверждать, что с вероятностью 95% математическое ожидание генеральной совокупности окажется в диапазоне [38,442; 61,558].

Использование t-распределения позволяет сузить доверительный интервал либо за счет снижения статистической значимости, либо за счет увеличения размера выборки.

Снизив статистическую значимость с 95% до 90% в условиях нашего примера мы получим соответствующее табличное значение t-критерия Стьюдента 1,711.

L = 50 — 1,711 28 = 40,418
√ 25
L = 50 + 1,711 28 = 59,582
√ 25

В этом случае мы можем утверждать, что с вероятностью 90% математическое ожидание генеральной совокупности окажется в диапазоне [40,418; 59,582].

Если мы не хотим снижать статистическую значимость, то единственной альтернативой будет увеличение объема выборки. Допустим, что он составляет 64 индивидуальных наблюдения, а не 25 как в первоначальном условии примера. Табличное значение t-критерия Стьюдента для 63 степеней свободы (64-1) и уровня статистической значимости α=5% составляет 1,998.

L = 50 — 1,998 28 = 43,007
√ 64
L = 50 + 1,998 28 = 56,993
√ 64

Это дает нам возможность утверждать, что с вероятностью 95% математическое ожидание генеральной совокупности окажется в диапазоне [43,007; 56,993].

Выборки большого объема

К выборкам большого объема относятся выборки из генеральной совокупности данных, количество индивидуальных наблюдений в которых превышает 100. Статистические исследования показали, что выборки большего объема имеют тенденцию быть нормально распределенными, даже если распределение генеральной совокупности отличается от нормального. Кроме того, для таких выборок применение z-оценки и t-распределения дают примерно одинаковые результаты при построении доверительных интервалов. Таким образом, для выборок большого объема допускается применение z-оценки для нормального распределения вместо t-распределения.

Подведем итоги

В таблице собраны рекомендации по выбору методики построения доверительных интервалов для различных ситуаций.

Основы статистики для веб-аналитика

За последние пять лет статистика превратилась в востребованную и набирающую популярность науку. Чтобы при упоминании ее методов не испытывать излишней неловкости, необходимо пройти интенсивный курс по статистике. Правда, далеко не у каждого найдется для этого достаточно времени и выдержки. Если вы хотите использовать статистику в веб-аналитике , вам достаточно разобраться в общих типах распределения вероятностей.

Распределения вероятностей — это такие же основы статистики, как структуры данных в информатике. Существуют сотни типов распределений вероятностей. Однако на практике используются только около 15 из них.

Что такое распределение вероятностей?

Ситуации, за которыми скрывается данное явление, происходят в нашей жизни постоянно: катятся ли по столу игральные кости, идет ли дождь, приезжают ли автобусы. Все эти процессы в конечном итоге имеют определенные результаты: на игральных костях оказались числа 3 и 4, в виде дождя сегодня выпало около 13 мм осадков, автобус приехал через 3 минуты. До этого момента мы могли лишь предполагать о том, какими будут результаты. Распределение вероятностей описывает то, каким, по нашему мнению, может оказаться каждый из результатов. Форм может быть много, но размер всегда один: вероятности всегда сводятся к 1.

Так, подбрасывание монеты вверх приведет к двум результатам: она упадет либо «орлом», либо «решкой» (допустим, она не сможет упасть на ребро). До момента подбрасывания монеты есть 1 шанс из 2, или вероятность в 0.5, что выпадет «орел». Тоже самое верно и для «решки». Это и есть распределение вероятностей, состоящих из двух результатов. Если вы в полной мере понимаете, о чем идет речь в данном примере с монетой, то вы уже овладели распределением Бернулли.

В этой статье мы расскажем о:

Карта взаимосвязей распределений вероятности

Эта карта — ваш справочник по определению типов распределений и отношений между ними.

Каждое из распределений проиллюстрировано соответствующим примером функции плотности распределения вероятностей. В этой статье рассматриваются только те распределения результатов, которые выражаются простыми числами. На каждой клеточке горизонтальной оси отмечено возможное число результатов. Вертикальная ось описывает вероятность результатов.

Некоторые распределения являются дискретными, результаты обозначаются целыми числами, такими, как 0 или 5. На графике они показаны редкими линиями, по одной для каждого результата. Высота линии соответствует вероятности этого результата. Некоторые из линий более плотные. Они отображают результаты, идущие под любым цифровым значением — 1.32 или 0.005. Области под кривыми — это и есть вероятности. Сумма высот линий и областей под кривыми всегда равна 1.

Распределение Бернулли и равномерное распределение

Распределение Бернулли уже упоминалось выше, когда приводился пример с двумя дискретными результатами — «орлом» и «решкой». Представьте его в числах 0 и 1: «решку» обозначаем 0, а «орла» — 1 (или наоборот). Оба результата обладают одинаковой вероятностью, что и показано на графике. Плотность распределения Бернулли характеризуется двумя линиями равной высоты.

Однако распределение Бернулли также может представлять исходы событий с неравной вероятностью, что, к примеру, происходит при нечестном «укладывании» монетки при подбрасывании. В этом случае вероятность того, что выпадет «орел» не 0.5, а некая другая величина p, а вероятность «решки» составляет 1- p.

Данная зацепка позволяет сразу выделить целый ряд распределений с равновероятными исходами: дискретное равномерное распределение отличает плоская функция его плотности. Теперь представьте, что брошены игральные кости (честно). Вероятность, что выпадет или 1, или 6 одинакова. Ее можно определить любым количеством исходов n или даже как непрерывное распределение.

Биномиальное и гипергеометрическое распределения

Биномиальное распределение можно определить как сумму результатов действий, рассматриваемых в рамках распределения Бернулли. Подбросьте монету вверх 20 раз: сколько раз она упадет «орлом»? Подсчет количества требуемых результатов и будет биномиальным распределением.

Здесь параметрами являются величина n — количество испытаний и p — вероятность «успеха» (в данном случае «орла», или 1). Каждый переворот монеты в воздухе — это результат, имеющий отношение к распределению Бернулли, или испытание. Здесь же можно пойти по пути биномиального распределения и подсчитать количество «успешных» результатов таких действий, как все те же перевороты монеты в воздухе, где каждый из переворотов независим и имеет одинаковую вероятность успеха.

Или, представьте лотерейный барабан, в котором находится одинаковое количество белых и черных шариков. Закройте глаза и вытащите шарик. Посмотрите, черный он или нет, а затем положите его обратно. Повторите все сначала. Сколько раз вы вытянули черный шарик? Данная величина также относится к биномиальному распределению.

При гипергеометрическом распределении величина одна и та же, разница будет состоять лишь в том, что шарики не будут складываться обратно в лотерейный барабан. Вероятность успеха здесь отличается от биномиального типа. А все потому, что шариков в барабане с каждым испытанием становится все меньше. Хотя, если количество шариков большое, а число испытаний гораздо меньше, эти распределения будут одинаковы, так как шанс успешного исхода с каждым испытанием почти не меняется.

Распределение Пуассона

Как быть в ситуации, когда нужно посчитать количество звонков, поступающих каждую минуту на телефоны горячей линии службы поддержки? На первый взгляд здесь мы имеем дело с биномиальным распределением, если рассматривать каждую секунду, как действие по Бернулли — отсутствие звонка (0), звонок (1). Но на деле, если, к примеру, в каком-то городском районе отключат свет, на телефон энергетической компании будет поступать по 2, а то и по несколько сотен звонков ежесекундно. Можно разбить минуту на 60 000 миллисекунд и считать звонки, поступающие каждую миллисекунду. Но это не поможет. Все равно звонков будет больше, и вероятность успеха в этом случае будет меньше 1. То есть, технически, это не распределение Бернулли. Давайте рассуждать логически. Пусть n стремится к бесконечности, а p к нулю, чтобы величина np оставалась одной и той же. Это как «нашинковать» время на бесконечно малые промежутки, в которые вероятность звонка представляется бесконечно малой. Предельный результат — это распределение Пуассона.

Как и в случае с биномиальным распределением, Пуассон — это распределение, моделирующее величину, которая отображает количество раз, выпадающих на какое-то событие. В нем используются не только такие параметры, как p (вероятность успеха) и n (одинаковые независимые испытания), но и средний показатель λ, который по данной аналогии представляет собой постоянную величину np. Распределение Пуассона — это то, о чем вы должны подумать при попытке подсчитать количество событий, произошедших за определенное время.

Когда данные поступают на роутеры, или покупатели приходят в магазин, или образуется что-то , похожее на очередь, у вас в голове должно возникать слово «Пуассон».

Геометрическое и отрицательное биномиальное распределения

Простые испытания Бернулли приводят к еще одному распределению. Сколько раз монета повернется «решкой» прежде, чем впервые выпадет «орел»? Количество выпавших до этого «решек» и составит геометрическое распределение. Здесь точно так же, как и в распределении Бернулли, задействован параметр p, использующийся для обозначения вероятности успешного завершения действия. А вот числа испытаний (или переворотов, как в случае с монетой) n нет, потому что количество неудачных испытаний само по себе является результатом.

Если в биномиальном распределении основной вопрос — это «сколько испытаний были успешными?», то в геометрическом он будет звучать так: «сколько было неудачных испытаний, пока не произошло успешное?».

Отрицательное биномиальное распределение представляет собой простую генерализацию. Это количество неудачных испытаний, произошедших до наступления r количества успехов, а не всего одного успеха. То есть, появляется еще один параметр — r. Иногда можно описать данное распределение немного в другом ключе: это число успехов, случившихся до наступления r количества неудач.

Экспоненциальное распределение и распределение Вейбулла

В качестве примера вернемся к звонкам в службу поддержки клиентов: сколько времени пройдет до звонка следующего клиента? Распределение времени ожидания можно было бы отнести к геометрическому типу, так как каждая секунда без звонка может означать неудачу до того момента, когда, наконец, позвонит клиент. Число неудач будет сопоставимо с количеством секунд, в течение которых никто не позвонил, а это, другими словами, почти время ожидания следующего звонка, но, все-таки, не совсем так. Эти секунды времени будут всегда выражаться в целых числах, но в реальности из подсчета будут выпадать некоторые отрезки времени, ведь звонки будут поступать не строго по истечению одной секунды за другой, но и в доли секунд.

И опять, задайте ограничение для геометрического распределения: пусть промежутки времени будут бесконечно малыми и будут стремиться к нулю. Вот тогда это сработает. Вы получите экспоненциальное распределение, которое точно будет описывать распределение времени до момента поступления телефонного звонка. Это непрерывное распределение, первое, с которым мы сталкиваемся в статье, потому что результат, выраженный во времени, не нужно обозначать в целых секундах. Так же, как и в распределении Пуассона, здесь используется параметр λ.

По своей сути распределение Пуассона перекликается с биномиально-геометрическими отношениями. Точно так же, пуассоновский вопрос «сколько событий произошло за определенное время?» соотносится с экспоненциальным вопросом «сколько времени осталось до наступления события?». События, количество которых за определенное время моделируется по распределению Пуассона, и время между событиями, которое моделируется по экспоненциальному распределению, подчиняются одному и тому же параметру λ. Такое соответствие (и одновременно различие) между двумя типами распределений имеет существенное значение.

Нужно вспомнить об экспоненциальном распределении, если кажется, что речь идет о «времени до наступления события», которое может оказаться на самом деле «временем до не наступления события (до отказа)». Чувствовать эту разницу чрезвычайно важно. По этой причине имеются даже более общие типы распределений, которые описывают «наработку до отказа». Например, распределение Вейбулла. Экспоненциальное распределение больше подходит к той ситуации, когда, например, количество износа или отказа техники является постоянной величиной. Распределение Вейбулла моделирует увеличение (или уменьшение) величины отказов в течение какого-то времени. Экспоненциальное распределение — это просто частный случай.

Типы распределений: нормальное, логарифмически-нормальное, Стьюдента и хи-квадрат

Наиболее важным среди распределений остается нормальное распределение, или распределение Гаусса. Его сразу можно узнать по кривой, напоминающей колокол. Как и e, это чрезвычайно интересная, независимая величина, которая появляется из кажущихся простыми источников. Возьмите целый набор параметров из какого-нибудь одного распределения (любого типа) и сложите их вместе. Распределение их сумм имеет нормальное распределение. Чем больше в такой сумме будет слагаемых, тем ближе эта сумма будет к нормальному распределению (важное пояснение, распределение должно быть: а) удобным для анализа, б) независимым, в) должно стремиться к нормальному распределению). Это утверждение верно во всех случаях, не важно какое из распределений имеется в виду.

Теперь мы подошли вплотную к центральной предельной теореме. Важно знать, что это такое, и как это называется, иначе в разговоре вас тут же собьют с толку.

Она соотносится со всеми распределениями. Но, если точнее, то данная теорема имеет отношение к распределениям сумм независимых случайных величин. Сумма испытаний Бернулли имеет биномиальное распределение. Так как число испытаний возрастает, биномиальное распределение становится ближе к нормальному распределению. Это верно и в отношении гипергеометрического распределения. Распределение Пуассона, как крайнее проявление биномиального, также приближается к нормальному распределению при возрастании параметра.

Результат действия, которое попадает под логнормальное распределение, описывается величинами, распределенными логарифмически-нормально. Если суммы величин нормально распределены, то помните о том, что результаты действий с величинами распределены логарифмически-нормально.

Распределение Стьюдента основывается на t-критерии Стьюдента, который изучают многие специалисты, не связанные со статистикой. Оно используется в обосновании среднего значения нормального распределения и так же приближается к нормальному распределению по мере увеличения параметра. Отличительная черта t-распределения заключается в его хвостах — они «толще», чем у нормального распределения.

И, наконец, распределение хи-квадрат , представляющее собой распределение суммы квадратов нормально распределенных величин. Оно построено вокруг критерия согласия хи-квадрат , которое, в свою очередь, базируется на сумме квадратов разностей, которые, как предполагается, должны быть нормально распределены.

Гамма и бета распределения

Гамма распределение — не что иное, как генерализация и экспоненциального, и хи-квадратного распределения. Со стороны экспоненциального распределения оно используется в качестве усложненной модели периодов ожидания. Например, можно говорить о гамма распределении при моделировании времени до момента наступления следующих n-событий .

Ни в коем случае не развивайте эту тему дальше! Однако если вы уже в это влипли, то постарайтесь медленно перевести разговор на бета-распределение, потому что «бета» априори сопряжена практически с любым из распределений, которые упоминаются в этой статье. А вообще, все эти заморочки как раз и созданы специально для того, чтобы статистикам было чем заниматься. Между делом выскажите эту мысль и тут же шагайте к выходу.

Там, где начинается мудрость

Распределения вероятностей — это тема, которую невозможно изучить вдоль и поперек. Если ваш интерес еще не испарился, советуем вам ознакомиться с очень подробной картой всех одномерных распределений. Мы надеемся, что это руководство поможет вам сохранить лицо в суровом технологическом мире и не вызвать шквал критики со стороны продвинутых в вопросах статистики коллег. Или же, прочитав и усвоив материал, изложенный в этой статье, вы, по крайней мере, научитесь с большой степенью вероятности выбирать для себя наименее нудные вечеринки.

Лучшие брокеры с бонусами:
  • Evotrade
    ☆☆☆☆☆
    ★★★★★
    Evotrade

    Бонусы для новых трейдеров до 5000$!

  • BINARIUM
    ☆☆☆☆☆
    ★★★★★
    BINARIUM

    Лучший брокер по бинарным опционам. Огромный раздел по обучению.

Добавить комментарий