Как стать автором
Обновить
16
0
Олег @OlegUV

Аналитик

Отправить сообщение
говорю по реальному опыту — может
Как всё запущено, однако… У пациента, похоже, большие проблемы с костами, но это уже далеко вне рамок хабра…
Прочитал и топик и комментарии и не увидел самого главного — понимания и принятия рыночных законов.

Опять ситуация с начала.
Есть компания А такая вся замечательная, пишет масштабируемый беспроблемный софт, всё у низ 24/7/365 и т.д. средний ценник 80 т. И есть Вася Пупкин — пишет что-то похожее левой пяткой за 20 тыс.

В этой ситуации компании А и (и её сотрудникам) нет никаких причин для сетований возмущений. Ведь это 2 разных продукта:

1) Мейд бай кампани А:
Сайт + поддержка 24/7 на 3 года (+разумный ценник на поддержку) + консультации по продвижению + красиво, быстро, удобно
Цена 80 тыр

2) Мейд бай Вася Пупкин:
Сайт шевелящийся, типа рабочий. Ценник 20 тыр.

И у этих 2-х продуктов 2 разные целевые аудитории.
Никто не мешает компании А дополнить своё предложение эконом вариантом за 20 тыс и этим продуктом конкурировать с Васей Пупкиным. Это будет гораздо продуктивнее, чем сетовать, что «не тот нынче клиент пошёл».

PS
Хотя, по человечески людей понятно, конкуренция штука неудобная, неприятная и старым игрокам рынка совершенно не нужная.

Свечи, кстати, нагляднее, чем усатый ящик, как-то проще и «актуальнее» для человеческого восприятия. Хотя, тут дело привычки, наверно.
Красиво.
А чем построены картинки с полосочками?
имеется в виду выборки in samle и out sample. причём неявно предполагается, что обе выборки как бы принадлежат одной генеральной совокупности, если можно так сказать. В случае с монеткой это верно, в реальной жизни — далеко не всегда. Например та же игра в орлянку, но с профи-игроком, который этим зарабатывает на жизнь )))
когда есть нестационарность и процесс периодически «ломается» в числовом виде, но при этом базовые «уравнения» остаются теми-же. Из конкретики сейчас вспоминается только корреляция цен, например нефти Brent и WTI, больше с ходу примеров не вспомню… А, вот ещё — продажи товаров на динамичном рынке, тоже out of sample плохо работает
я понимаю вашу мысль, но я бы не делал такую большую ставку на критей аут оф сэмпл, вы, видимо ещё не сталкивались с ситуациями, когда out of sample совсем не помогает
Потому что неизвестно, что это за характеристики, соответственно, могут они в принципе влиять на конечный результат или нет.
Формально, я не не спорю, можно обойтись и таким полностью обфусцированным набором. Но тогда это превратится в соревнование по фитингу y=f(x1, x1...xn), не более, без претензий на моделирование чего-то.
да, оверфит — самая лучшая формулировка
Именно, что не так.

Пусть есть набор данных (x,y) 100 точек.
Требуется найти взаимосвязь y=f(x), при этом в задаче не говорится о характере взаимосвязи.

Задачу решают 2 участника.
Первый знает, что фундаментально взаимосвязь линейная и строит модель y=ax+b
При этом из-за большой ошибки в исходных данных y=ax+b + N(m,s) точность модели получается очень плохой, скажем 20% ошибки.

Второй участник не знает о фундаментальной взаимосвязи и строит полином 100-й степени y=a100* x^100+ a99* x^99 +…
Модель получается изумительной, ошибка 0,00001%

Вопрос — кто построил лучшую регрессию?
Да, я видел этот конкурс…

Поясню свою мысль:

Допустим устраивается конкурс о игре в орлянку.
Собралось 100 человек, каждый участник подбрасывает монетку 100 раз, и считается рейтинг участника как процент выпадения орла. Что будет в результате? В топе будут игроки с результатами и 60 и 70 и 80%.
Но значит ли это, что они умеют управлять монеткой?

Пример утрирован, но суть понятна.

Я видел довольно много примеров, как ищутся и успешно находится взаимосвязи между тёплым и мягким или между бузиной в огороде и характером дядьки в Киеве. С доверительными интервалами, высоким попаданием и т.д. Понятно, чего это стоит в реальной жизни. Основа — это модель, а только потом идут всякие нейросети, машин-лёнин и т.д. А в основе модели — понимание процесса. А с настолько обфусцированными данными, как в этих конкурсах, ничего хорошего не может получиться в принципе.
С такими данными, когда большинство полей в виде хешей не-пойми-чего — это какая-то угадайка, игра типа «Код Да Винчи» в самом плохом смысле.
Хеши нельзя читать нормальными данными.
Нет данных — нет модели.
Нет модели — нет ничего, копать бессмысленно.
я тоже так думаю, но ребята делают интересную штуку — взгляд с другой точки зрения, не важно какой, важно, что другой и имеющей право быть, а это всегда и полезно и интересно
Вы пропустили стадию составления модели (включая её валидацию), вернее проскочили её так быстро, что даже не понадобилась нормальная нотация. А модель — это минимум 90% (!) всего анализа, остальное — чистая рутина.
Возможно, это будет актуально и в хабе Data Mining.
Механизм формирования цен на золото — не рыночный, поэтому про него речи нет.

Иными словами, реальная доля экспорта нефти в районе 40%, (да хоть все 80), каким образом корелляция на уровне 97% а не 60-70%?


Я доверяю данным, которые вижу лично сам. Кто cказал, что доля экспорта нефти только 40%?
Почему вы, не имея возможности проверить эти данные им доверяете, а тем, которые полностью открыты — не доверяете?

И даже если доля экспорта действительно 40%, какая часть выручки идёт на продажу?
Если продаётся только нефтяная выручка, а остальная остаётся на счетах в долларах, то и влиять будет только нефтяная выручка.

Вот так и получается, что у нас есть то, что мы видим (sad but true).
Вот, уже понятнее! Но всё равно, вопросов масса, просто идём по тексту дальше, и по ходу:

> Здесь для всех, кроме «домика», количество мутаций было 100 в среднем на каждую особь, особей в популяции было 100, при размножении популяция увеличивалась в 4 раза.

Как особи размножаются?
У одной пары родителей одна дочерняя особь или может быть несколько?
Один родитель участвует в нескольких парах или нескольких?
При каких условиях особь выпадает из процессе, т.е. умирает?

и т.д.
В тексте полно мест, вызывающих массу вопросов у людей не знакомых с генетическими алгоритмами…

Обязательно продолжайте писать про генетику — это очень интересно.
Хотелось бы больше деталей, а то получается «Берём песок, старый аккумулятор и немного цветмета — и вот у нас готова хрустальная люстра». Что есть особь, как она записывается на бумаге символами, какой вообще аппарат аналитических выкладок, как происходит мутация — запись формулами и т.д. Всего этого не хватает, а почитал бы с большим удовольствием.
Я бы с удовольствием посмотрел на ваш вариант определения взаимосвязи или доказательства отсутствия связи.

Информация

В рейтинге
Не участвует
Откуда
Москва, Москва и Московская обл., Россия
Зарегистрирован
Активность