Зри в корень!

(К.Прутков)

                                                                                              …и не цепляйся к мелочам

(Путник)

 

 

 

Как построить статистическую МТС

или

«Статистика для домохозяек»

 

 

Вступление (отмазка).

 

            Всем, кто хоть как-то знаком с теорвером и матстатистикой, и особенно тем из них, кто страдает излишней впечатлительностью, перед прочтением сего опуса настоятельно рекомендую напиться валерьянки. Иначе я за последствия не отвечаю. Если же вам повезло в жизни,  и Вы даже не знаете, что такое теорвер, то читайте смело, Вам это ничем не грозит.

 

Глава 1. Понедельник день тяжелый… , а воскресенье еще хуже.

 

            Идея этого небольшого исследования, о котором пойдет речь, посетила меня в один из воскресных вечеров. Странный это день – воскресенье, вечно лезут в голову всякие мысли о том, что будет завтра. Вот ведь ни в пятницу,  ни во вторник не лезут, а в воскресенье  лезут.

Итак, что же будет в понедельник?  Размышляя об этом, я вдруг вспомнил об одном смутном подозрении, терзавшем меня уже довольно долгое время. Подозрение это заключалось в том, что некоторые комбинации свечек, как черт ладана боятся определенных дней недели, а другие наоборот  -  упорно возникают в один и тот же день. Нельзя ли из этого получить что-то полезное в практическом смысле? Что ж, проверим на Евровых дневках.

 

Глава 2. Классификация.

 

            С целью нахождения возможных закономерностей, разобьем  всю историю на кусочки по три бара (триады)  и расклассифицируем их по цвету последней свечки и дню недели, на который она приходится. Для этого каждую триаду закодируем шестью векторами (значимых – всего три), для начала самыми простыми, какие только придут в голову – цвет и размер:

 

                                  

                       

                        Табл.1  Пример кодировки.

 

Дальше берем колоду карт Кохонена и начинаем раскладывать пасьянс (это домохозяйки умеют). Раскладываем на 25 кучек  (ячеек), которые затем сортируем по дням недели. Заодно определим макс. и мин. размер свечек, попадающих в каждую ячейку.

Итого получается следующая таблица:

 

 

 

 

     

Табл. 2 Вероятности формирования различных видов триад в зависимости от дня недели.

            ( Слева – А1, А2,…Е5 – классификационный номер триады)

 

 

Из этой таблицы видно, что мое подозрение имело под собой основания и распределение свечных комбинаций по дням недели отнюдь не равновероятно. На этом с классификацией закончим. Условимся лишь, что в дальнейшем комбинации свечек, соответствующих одной классификационной ячейке мы будем называть «состоянием»,  вероятности из Табл.2 будем обозначать как

 

                                               P(i,j)  , где

 _i  номер состояния ;

 _j  номер дня недели.,

 

            а максимальный и минимальный размер свечки как

 

                                               Min(i)  и Max(i), где

 

_i – номер состояния.

 

 

Глава 3. Таблица переходов (статистика единичных наблюдений).

 

            В предыдущей главе все было бы хорошо, если бы не одно НО…! В ней все посчитано всего лишь на 1100 днях, которые в Табл.2 распределены по 125 ячейкам (в среднем около 9 наблюдений на ячейку) . Как ни крути, а маловато будет. Однако это еще фантики (валерьяночки хлебнули, кому надо?) , сейчас мы будем строить статистику и вовсе по единичным наблюдениям со средним количеством наблюдений на ячейку аж(!) 1.76 (одна целая 76 сотых)!

Готовы?

 

            Итак, мы нашли, что формирование определенных состояний более вероятно в одни дни недели и менее вероятно в другие, но этого мало, ведь хочется получить прогностическую модель, а это значит, что необходимо построить еще одну таблицу, которая даст вероятность, с которой одно состояние может перейти в другое (на этот раз вне зависимости от дня недели)

            Что ж, построим:

 

 

 

Табл.3 Вероятности переходов в %% . (Слева – предыдущее состояние, вверху – последующее состояние).

           

            Договоримся также обозначать вероятности из этой таблицы, как

 

                                                           P1(g,i),   где

 

_g – предыдущее состояние;

_i  последующее состояние.

 

 

Глава 4. Взлетаем!

 

            Ну вот. А теперь, как говорил Крот из  мультфильма про Дюймовочку : «Что если нам посчитать!?»

 

            Прежде чем это сделать, хочу сказать, что внимательный читатель, особенно из тех что пьют валерьянку читая эти строки, мог заметить некоторые глупости, возникшие по ходу дела.

Например, вероятность того, что в определенный день недели может возникнуть любое состояние, должна быть равна единице:

 

Cумма (по i)   (P(i,j)) =1                                                           (1)

           

            На самом же деле она примерно равна 5 (!).

 

Также должна равняться  единице  и вероятность того, что в определенный  день недели при известном предыдущем состоянии может возникнуть любое состояние.

 

 Cумма (по i)   (P1(g,i)*P(i,j) ) =1                                                        (2)

 

            На самом же деле эта величина примерно равна 0.2.

 

            Разрешение этих противоречий оставим тем, кто захочет все сделать по правилам, скажу только, что также как отсутствие аптечки не сильно влияет на скорость автомобиля, так и в нашем случае наличие упомянутых глупостей мало влияет на конечный результат.

 

            Ну все. Теперь наконец-то начнем считать ПРОГНОЗ!

 

Предположим, что сегодня к концу дня у нас сформировалось состояние «g», тогда вероятность возникновения завтра состояния «i» , будет равна произведению вероятности возникновения состояния «i» после  «g», умноженной на вероятность возникновения «i» в завтрашний день недели «j»:

 

                                                           P1(g,i)*P(i,j)                                                   (3)

           

            Далее вспомним о том, что каждому состоянию «i» у нас поставлена в соответствие некоторая свечка с известным цветом и макс(мин.) размером. Тогда, предположив, что прогнозируемый размер свечки должен быть пропорционален вероятности ее возникновения (а как еще должна рассуждать домохозяйка?), можно записать :

 

                                   Аpred = P1(g,i)*P(i,j)* А(i) , где                                             (4)

 

            A(i) – в общем случае равно (Min(i)+Max(i))/2  или что-то в этом роде.

 

            Ну вот. Осталось учесть то, что при всех возможных ухищрениях мы получим несколько возможных вариантов свечек на завтра, значит

 

Аpred = Сумма(по i)  (P1(g,i)*P(i,j)*А(i) )                                 (4)

 

            Вот и все. Полученный знак ( а при желании и величину)Аpred  интерпретируем как прогноз.

           

            По ходу дела можно получить отдельно прогноз для отрицательных свечек и для положительных, которые при определенной сноровке можно использовать как величины S/L и T/P. ( Не проверено).

           

Собственно, можно учитывать только цвет свечки или только размер, а можно расклассифицировать свечки по размеру не на две группы (+ и -), а больше, или сделать все вообще иначе. Суть не в этом, а в том, что….

 

            Глава 5. Рынок можно прогнозировать (и нужно).

 

            Вероятно, я никогда не стал бы торговать, не имея уверенности в правоте утверждения, вынесенного в название этой главы. Поэтому для меня оказалось просто странным, что люди имеющие отношение к рынку, позволяют себе совершенно неуместные в своей категоричности утверждения, что это не так. И пожалуй единственной причиной, побудившей меня написать то что Вы прочитали, было желание привести практический пример прогнозирования, в данном случае статистического. Тем более, что у статистических методов (моделей) есть одно…

 

            Глава 6. Явное преимущество (ИМХО).

             

            А заключается оно в полном отсутствии возможностей переподгонки, поскольку подгонять просто нечего.

 

           

 

С уважением ко всем кто прочитал,

Путник.

 

P.S. Оно конечно «каждый , право, имеет право, на то что слева и то что справа». И возможно одна сделка в год на основе догадок и слухов тоже может приносить прибыль. Некоторое время. Все же статистика, знаете ли, вероятности…

 

 

 

            Приложение. (картинки).

 

            К сожалению, у меня не сохранилось картинок, построенных по этой самой первой и самой простой модели, поэтому привожу то что есть.

            Все картинки нарисованы по модели из 14 значимых векторов, построенной на промежутке с  17.03.1998 по 06.06.2000. На самих же картинках изображен период с 08.08.2000 по 04.07.2002.

            Единица по оси Y равна 10000 пунктов.

 

           

           

Рис.1 Квазиэквити модели (без спреда).

 

 

 

 

Рис.2. То же что на рис.1 с учетом спреда 8 пунктов.

 

 

 

 

Рис.3. То же что на рис.2. с оптимизацией порога срабатывания модели по макс. значению профит-фактора. PF=23. Отношение W/L сделок 34:3. Макс ДД – 62 пункта. Правда сделок маловато.

 

 

           

 

 

Рис.4,5. Без комментариев.

 

 

ОБСУДИТЬ

Хостинг от uCoz