Articles / Bookmarks / Profile of vaboretti / Habr

Ivan Fokeev @vaboretti

Программист

Profile Publications 2Comments 94Bookmarks 12

PatientZero Jul 29 2019 at 09:01

Какие факторы могут предсказать успех игры в Steam?

11 min

8.7K

Game development*Games monetization*Sales management*Games promotion*

Translation

На Reddit я видел множество дискуссий, комментариев и вопросов о том, чем определяется успех игры. Насколько важно качество? Действительно ли единственным определяющим аспектом является большая известность игры на рынке до её выпуска? Помогают или вредят демо-версии? Если показатели игры при выпуске оказались плохими, то какова вероятность их исправления? Можно ли хотя бы приблизительно предсказать объёмы продаж игры до её выпуска?

Готовясь к выпуску собственной игры, я потратил много времени на мониторинг выпускаемых релизов в попытке найти ответы на эти вопросы. Я составил электронную таблицу, записал подписчиков, наличие раннего доступа, количество обзоров за первую неделю, месяц и квартал.

Теперь я решил поделиться этими данными в надежде, что они помогут другим разработчикам понять и спрогнозировать продажи их игр.

Сначала примечания по данным:

Один из важнейших источников данных — количество обзоров в Steam. Есть достоверные свидетельства того, что оно сильно коррелирует с количеством проданных копий, часто упоминаются соотношения «50 продаж на один обзор в Steam», но диапазон значений довольно широк. Похоже, большинство игр Steam попадает в интервал от 25 до 120 продаж на один обзор на Steam, но случаются и выбросы. Кроме того, игры с очень малым количеством обзоров с большей вероятностью в этом отношении будут выбросами. Моя игра — единственная, по которой у меня есть чёткие цифры продаж. Можете прочитать мой длинный пост о её релизе на Reddit, но самое важное для нас то, что я продал 1587 копий за первую неделю и 3580 копий за первый квартал.
Общее количество игр в выборке: 115.
Я выбирал игры полуслучайно, из разделов Popular Upcoming и All Upcoming. Это склоняет выборку больше в сторону популярных игр, и я сделал так намеренно: мне хотелось иметь разнообразную выборку, но чтобы в ней не доминировали полностью игры с нулевыми продажами.
Игры упорядочены по дате выпуска, которая находится в интервале от 26.10.18 до 20.12.18.

Читать дальше →

+14

Syurmakov Jul 20 2019 at 19:14

Подборка рабочих примеров обработки данных

4 min

13K

Python*Data Mining*Big Data*Machine learning*

Привет, читатель.

По стопам моего первого поста подборки датасетов для машинного обучения — сделаю подборку относительно свежих датасетов с рабочими примерами по обработке данных. Ведь ни для кого не секрет, что обучение на хороших примерах проходит эффективнее и быстрее. Посмотрим, что интересного нам смогут показать одни из лучших примеров по обработке данных.

Схема работы с текущим постом унаследуется от моего поста про лучшие блокноты по ML и DS, а именно — сохранил в закладки → передал коллеге.

+ бонус в конце статьи — крутой курс от ФПМИ МФТИ.

Итак, давайте приступим.

Подборка датасетов с рабочими примерами обработки данных:

Suicide Rates Overview 1985 to 2016 — сравнение социально-экономической информации с показателями самоубийств по годам и странам.

Примеры обработки:

Читать дальше →

+15

olferuk Jul 9 2019 at 15:08

Организуем ML-проект с помощью Ocean

10 min

5.4K

Data Mining*Machine learning*Surf corporate blog

Вступление

За годы разработки ML- и DL-проектов у студии Surf накопились и большая кодовая база, и много опыта, и интересные инсайты и выводы. При старте нового проекта эти полезные знания помогают увереннее начать исследование, переиспользовать полезные методы и получить первые результаты быстрее.

Очень важно, чтобы все эти материалы были не только в головах разработчиков, но и в читаемом виде на диске. Это позволит эффективнее обучить новых сотрудников, ввести их в курс дела и погрузить в проект.

Конечно, так было не всегда. Мы столкнулись с множеством проблем на первых этапах

Каждый проект был организован по-разному, особенно если их инициировали разные люди.
Недостаточно отслеживали, что делает код, как его запустить и кто его автор.
Не использовали виртуализацию в должной степени, зачастую мешая своим коллегам установкой существующих библиотек другой версии.
Забывались выводы, сделанные по графикам, которые осели и умерли в горé jupyter-тетрадок.
Теряли отчеты по результатам и прогрессу в проекте.

Для того, чтобы эти проблемы решить раз и навсегда, мы решили, что нужно работать как над единой и правильной организаций проекта, так и над виртуализацией, абстракцией отдельных компонентов и переиспользуемостью полезного кода. Постепенно весь наш прогресс в этой области перерос в самостоятельный фреймворк — Ocean.

Вишенка на торте — логи проекта, которые агрегируются и превращаются в красивый сайт, автоматически собранный с помощью выполнения одной команды.

В статье мы расскажем на маленьком искусственном примере, из каких частей состоит Ocean и как его использовать.

Читать дальше →

+21

shurik2533 Jun 24 2019 at 16:13

Автоматическое назначение задач в Jira с помощью ML

12 min

11K

Python*Programming*hh.ru corporate blogMachine learning*Artificial Intelligence

Привет, Хабр! Меня зовут Саша и я backend разработчик. В свободное от работы время я изучаю ML и развлекаюсь с данными hh.ru.

Эта статья о том, как мы с помощью машинного обучения автоматизировали рутинный процесс назначения задач на тестировщиков.

В hh.ru есть внутренняя служба, на которую в Jira создаются задачи (внутри компании их называют HHS), если у кого-то что-то не работает или работает неправильно. Дальше эти задачи вручную обрабатывает руководитель группы QA Алексей и назначает на команду, в чью зону ответственности входит неисправность. Лёша знает, что скучные задачи должны выполнять роботы. Поэтому он обратился ко мне за помощью по части ML.

Читать дальше →

+47

vvzvlad Dec 25 2013 at 06:12

Скрипт Automator, загружающий изображения на Habrastorage

3 min

14K

Habr

Однажды мне надоело тыкать закладку Habrastorage в браузере. И я сделал вот что…

Как?

+64

crowncork Apr 21 2019 at 13:53

Об удалении тренда из экспериментальных данных

3 min

9.6K

Data Mining*Algorithms*Mathematics*

При анализе экспериментально полученных стационарных временных рядов, как правило, при предварительной подготовке (препроцессинге) данных возникает необходимость в подавлении имеющегося в них тренда.

Здесь будет предложен «новый» метод выделения тренда — простой, очевидный и пригодный для очень сложных видов тренда.

Под трендом обычно понимают сверхнизкочастотную негармоническую компоненту, резко нарушающую стационарность процесса. Наиболее частой причиной тренда в экспериментально полученных данных является «дрейф нуля» регистрирующей аппаратуры. Интегрирование данных и некоторые другие виды обработки также могут стать причиной появления тренда. Наличие тренда сильно искажает результаты последующей обработки данных (спектральное оценивание и т.п.), поэтому удаление тренда является необходимым. В ряде случаев сам тренд является ценным источником информации (например, при анализе долгосрочных тенденций в экономических или метео- процессах).

Рис. 1. Выделение и удаление тренда

Читать дальше →

+14

fivelife Feb 5 2016 at 08:07

Построение стакана котировок (FullOrderBook) по историческим данным

4 min

31K

Programming*Java*Algorithms*

From sandbox

Совсем недавно решал задачу построения стакана котировок на основе исторических данных Московской Биржи. В открытых источниках ничего подобного не нашел, пришлось начинать с нуля и копать самому. Есть некоторые нюансы, о которых нужно знать. Про них буду упоминать по ходу.

Про биржевую торговлю, инфраструктуру и тестирование алгоритмов на исторических данных много писал и пишет IT Invest, спасибо ему. От себя добавлю, что на данных OrderLogs мы анализируем глубину рынка, ликвидность, спреды и еще много чего. Результаты используем в наших торговых алгоритмах.

Специально выбрал Фондовый рынок, так как тут больше всего вопросов. Валютный и Срочный рынок имеют свои особенности, но там проще. Реализация алгоритма на Java, код на GitHub.

Цель: Получить стакан котировок на любой момент времени.

Читать дальше →

Mexxis Jun 28 2015 at 01:13

Коммерческий VPN сервис в opensource

1 min

41K

Information Security*Open source*Ruby*Ruby on Rails*

Всем доброго времени суток!

Позвольте представиться.
Я CEO/CTO/CIO/итд VPN сервиса SmartVPN.biz.
Можно называть меня Виктор Иванов, так как таков был мой псевдоним в службе поддержки клиентов SmartVPN.biz.

Пару лет назад я решил создать свой первый стартап — VPN сервис.
Идея нагрянула после того как около 5 друзей попросили у меня VPN на моем личном сервачке.
Естественно, никакого анализа рынка, конкурентов и написания бизнес плана не было. Я просто сел и начал кодить.
Спустя какое-то время проектом стало можно пользоваться — и он увидел свет.

Читать дальше →

+57

Alexey_Korolev Apr 24 2015 at 10:49

Подсчет себестоимости часа разработки программного обеспечения

4 min

148K

IT Standards*

From sandbox

Сегодня я расскажу о больной теме как для покупателей программного обеспечения, так и для провайдера этой услуги – себестоимости разработки. Понятно, что сейчас не самое лучшее время для того, чтобы разбрасываться бюджетами. Только это не значит, что производители должны работать себе в убыток. Многие говорят о жадности предпринимателей, но я вам вот что скажу: нет ничего постыдного в том, чтобы делать честный бизнес и адекватно считать свои косты.

Читать дальше →

+37

maxim_korobtsev Apr 22 2014 at 11:11

Геймификация багфикса. Как мы превратили исправление ошибок в увлекательную многопользовательскую online-игру

4 min

24K

Website development*ОК corporate blog

Автор: maxim_korobtsev, WorkAndPlay.Ru

Совсем недавно в компании Одноклассники прошло интересное и необычное событие. Пять дней разработчики и тестировщики участвовали в Багатлоне, киберспортивном соревновании по багфиксу и прокачке навыков.

Фиксить баги скучно, если не превращать это в игру. Особенно, если речь идет о низкоприоритетных багах, которые не были исправлены в свое время из-за незначительности. Но, обо всем по порядку!

Как все начиналось?

Все началось за несколько месяцев до Багатлона, когда мы, Work&Play, вместе с OK придумывали игровые механики и само соревнование. Родилась достаточно неплохая идея: расфасовать все множество накопившихся низкоприоритетных багов по группам (коробкам с багами). Для каждого бага заранее указать навыки, которые он прокачивает у того, кто его фиксит или проверяет. Далее раз в несколько месяцев устраивать соревнование. Причем, победителем будет не тот, кто больше пофиксил, а тот, кто больше всех прокачался пока багфиксил. Также хотелось, чтобы вся игра проходила без отрыва от работы(в рабочие дни), по тикетам из багтрекера и доступ к ней был прямо из Jira.

Первоначальная идея выглядела интересной и все взялись за реализацию. Пока мы разрабатывали плагин для Jira, ребята из OK отбирали баги для первой коробки, проставляли для них значение навыков, в общем готовили контент для игры. Тут хочется отдельно отметить профессионализм Одноклассников, они достаточно сильно помогли при работе над первой версией и, также как и мы, подошли к работе с душой.

Что у нас получилось в итоге?

В результате, после нескольких месяцев работы над плагином, у нас получилось вот это:
главный экран jira модуля для геймификации багфикса

Читать дальше →

+49

HotWaterMusic Jul 11 2013 at 19:25

Shuttle и Alfred: быстрый доступ к SSH в OS X

1 min

33K

Website development*

Если вам, как и мне, время от времени приходится пользоваться SSH, то вы оцените небольшое дополнение для OS X, разработанное Тревором Фитцжеральдом — Shuttle. Оно позволяет повесить быстрый доступ к нужным хостам на иконку в верхней панели.

Скачать приложение можно по ссылке http://fitztrev.github.io/shuttle/

Читать дальше →

+29

Jeka8 May 13 2013 at 22:58

Как уронить Windows шестью строчками кода

3 min

266K

Information Security*C*

From sandbox

См. также: Microsoft исправила уязвимость с синим экраном

Однажды один знакомый рассказал мне про одну уязвимость в Windows. А именно из-за нее можно легко вызвать синий экран ~~смерти~~ шестью строчками кода на Си. Причем программа не требует никаких прав администратора и вызывает только одну функцию масштабирования окна.

Читать дальше →

+230

256