Наверх
Войти на сайт
Регистрация на сайте
Зарегистрироваться
На сайте недоступна
регистрация через Google

Шурик, 49 - 3 апреля 2013 10:45

Все
Ну вот и подходит срок... Завтра на работе выступаю с докладом про теорию вероятностей... Они ещё не знают, какую подлянку я им устроил! Ибо достали уже. Вчера я дважды репетировал выступление, два часа на улице, пока выгуливал детей, и час дома тренировался на жене перед сном (а она всё засыпала)... Надеюсь всё же, что завтра слушатели не заснут.
Итак, первую часть доклада здесь выкладывать нет никакого смысла, действительно строго про теорвер только. Зато вот вторая часть... прелюбопытнейшая. Итак:


Лирическое отступление.

Использование теории вероятностей для решаемых задач в данных примерах носит чисто номинальный характер. То есть, мы здесь конечно оперируем терминами из теории вероятностей, и в начале всех вычислений подводим некоторый базис под правомерность использования тех или иных методов. Но далее вступает в действие просто математический аппарат, которому в общем случае совершенно безразлично, что именно обрабатывается – данные для теории вероятностей, или для дифференциальных уравнений.
К тому же, изначально теория вероятностей разрабатывалась как всего лишь удобный математический аппарат для исследования имеющихся статистических данных.

(Тут стоит вспомнить, что данные бывают трёх основных видов – ложь, наглая ложь и статистика).

В настоящее же время гораздо больше используется другой аппарат для исследования тех же данных – DATA MINING. Суть его вкратце в том, что этот аппарат позволяет исследовать данные, почти ничего не зная о природе и взаимосвязях процессов, и данные при этом могут быть разнородными, а в теории вероятностей обычно исследуют однородные данные. Но конечно же, этот метод массово использует методы обычной теории вероятностей.

К сожалению, большинство пользователей привыкли к тому, что сам DATA MINING изначально позиционируется как обработка очень больших объемов данных. Но это не так, иногда всё необходимое получается из мизерных объёмов исходной информации. Так же, к сожалению, пользователи привыкли к тому, что для использования этого метода (имея в виду закупленный программный продукт), не нужно иметь никакого образования выше маркетингового, но это в корне неверно.
То есть, на самом деле DATA MINING – это комплекс взаимодействий между некоторым объёмом данных, и некоторым объёмом исходных знаний. Чем больше имеется (структурированных) исходных данных, тем меньше знаний необходимо для получения нужной информации. И наоборот, чем меньше исходных данных, тем больше сторонних знаний надо привлечь.


Итак, что может дать этот метод, и как он вообще работает.

продолжение в комментариях
Добавить комментарий Комментарии: 6
Шурик
Шурик , 49 лет3 апреля 2013 10:45
Задача N3.

Имеется:
Из открытых источников можно узнать, что в последние годы на РЖД средняя скорость перевозки грузов падает, и причём существенно. А именно, если в 2010 году средняя скорость составляла 11,35 км/ч, то в 2011году она составила уже 10.3 км/ч, а в 2012 году в первом полугодии 9.5 км/ч, а во втором уже 9.1 км/ч. И конца этому не видно.

Надо:
Понять в чём причина, и предложить пути по исправлению ситуации (как говорил мой научный руководитель “если в исследовании явления не предложено никаких примеров его использования или устранения, то по сути как такового исследования и не было”).


Решение:
Пойдём опять же по открытым источникам, и найдём следующую статью.

26 сентября 2012г в центральном офисе ОАО "РЖД" в Москве состоялось заседание правления компании, на котором, в частности, обсуждались вопросы выполнения сроков доставки грузов и порожних вагонов.

По словам председателя правления, президента ОАО "РЖД" Владимира Якунина, наблюдающаяся тенденция снижения скорости доставки грузовых отправок на сети железных дорог вызывает серьезную обеспокоенность. За 6 месяцев 2012 года средняя скорость отправки составляет 228 км в сутки. Это на 37 км в сутки или на 14% ниже, чем за аналогичный период 2011 года. При этом скорость груженой отправки составляет 254 км в сутки, порожних приватных вагонов – 196 км в сутки.

Глава компании отметил, что основная причина снижения скорости доставки грузов — избыточность подвижного состава. Появление на сети каждых 50 тыс. вагонов ведет к увеличению показателя оборота вагона на 19 часов.

Вице-президент ОАО "РЖД" Анатолий Краснощек обратил внимание на то, что парк грузовых вагонов достиг 1 млн 130 тыс. единиц, увеличившись к уровню прошлого года на 74 тыс. единиц, а к 2007 году – почти на 200 тыс. вагонов или на 21%. При этом, по оперативным данным, на сети железных дорог находится более 78 тыс. вагонов, не выполняющих ни одной технологической операции более 10 суток, то есть, по сути, исключенных собственниками из перевозочного процесса.

Грузооборот (без учета пробега порожних приватных вагонов) в текущем году превысил уровень 2007 года только на 7,4%. Таким образом, темп роста вагонного парка в три раза опережает темпы увеличения объемов перевозочной работы, что указывает на его возрастающий профицит.

По прогнозной оценке, при существующих темпах приобретения подвижного состава более 240 вагонов в сутки, к концу текущего года парк может достигнуть 1 млн 150 тыс. вагонов.

Расчетный оптимальный размер рабочего парка, необходимый для обеспечения перевозок всех предъявляемых грузов, составляет 900 тыс. вагонов.

По оценке ОАО "НИИАС", существующий избыток ограничивает пропускные способности и увеличивают долю отправок, доставляемых с нарушением сроков, на 17%, а скорость доставки снижается в среднем на 66 км в сутки.

"Если 10 лет назад на сети находилось 817 тыс. вагонов и на 1 км пути приходилось всего 9 единиц, то сегодня при наличии на сети 1 млн 130 тыс. вагонов на 1 км пути приходится 13 единиц. Таким образом, нагрузка на инфраструктуру увеличилась на 40%, что, безусловно, не могло не сказаться на пропускных способностях и скоростях доставки грузов и порожних вагонов", - отметил вице-президент ОАО "РЖД" Салман Бабаев.

При этом, по его словам, за последние 10 лет нормативно-правовая база, регулирующая сроки доставки груза и ответственность за их нарушение, осталась без изменений. В связи с этим назрела острейшая необходимость внесения поправок в законодательство в части уменьшения максимального размера неустойки за просрочку доставки груза до 50% от суммы провозной платы; введения дополнительных оснований для увеличения сроков доставки грузов и порожних вагонов при задержке в пути следования по причинам, не зависящим от перевозчика; возмездного нахождения вагонов собственников на инфраструктуре общего пользования; обязательного согласования с грузоотправителем заявки на перевозку груза с собственником подвижного состава до подачи его перевозчику и другие.

Владимир Якунин отметил, что ОАО "РЖД", не имея возможности повлиять на количество вагонов на сети железных дорог, продолжит повышать эффективность перевозочных и логистических технологий.
(http://press.rzd.ru/news/public/press?STRUCTURE_ID=654&layer_id=4069&refererLayerId=3307&id=80682 )

После прочтения всех этих данных, начинаем исследовать конкретные цифры, озвученные непосредственно руководством, а значит. принимаемыми за истину.

Количество вагонов когда-то было 9 штук на километр, а ныне – 13 на км. При полном парке вагонов в 1.13млн штук получаем примерную протяжённость дорог РЖД 86923км. Данная цифра практически идеально совпадает с данными справочника перегонов линий дорог – 85241км. Вот только неувязка – дорог одноколейных нынче осталось глобальное меньшинство, гораздо больше 2 колейных, а местами встречаются и 3-4 колейные. Так что цифру надо бы уменьшить минимум вдвое, а с учётом всех подъездных путей, сортировочных станций, вагоноотстойников и тупиков, может быть и втрое. Либо предположить иное, что в пресс-службе РЖД никто не знает о подробностях перевозочных процессов (увы, далее это оправдывается).

Показать ответы (5)
Мы используем файлы cookies для улучшения навигации пользователей и сбора сведений о посещаемости сайта. Работая с этим сайтом, вы даете согласие на использование cookies.