Pull to refresh
7
Karma
0
Rating
  • Posts
  • Comments

Как правильно «фармить» Kaggle

Open Data SciencePythonData MiningMathematicsMachine learning

image
*фарм — (от англ. farming) — долгое и занудное повторение определенных игровых действий с определенной целью (получение опыта, добыча ресурсов и др.).


Введение


Недавно (1 октября) стартовала новая сессия прекрасного курса по DS/ML (очень рекомендую в качестве начального курса всем, кто хочет, как это теперь называется, "войти" в DS). И, как обычно, после окончания любого курса у выпускников возникает вопрос — а где теперь получить практический опыт, чтобы закрепить пока еще сырые теоретические знания. Если вы зададите этот вопрос на любом профильном форуме, то ответ, скорее всего, будет один — иди решай Kaggle. Kaggle — это да, но с чего начать и как наиболее эффективно использовать эту платформу для прокачки практических навыков? В данной статье автор постарается на своем опыте дать ответы на эти вопросы, а также описать расположение основных грабель на поле соревновательного DS, чтобы ускорить процесс прокачки и получать от этого фан.

проверить глубину этой кроличьей норы
Total votes 87: ↑86 and ↓1 +85
Views106.2K
Comments 15

News

Show more

Как создать Roguelike

Game developmentGame designGames promotion
Translation
image

Я всегда хотел написать подробное руководство для начинающих о том, как создать roguelike, содержащее как общие, так и более специфические советы. Проведённый в этом году очередной праздник Roguelike Celebration показался мне отличной возможностью наконец-то заставить себя это сделать, поэтому я подготовил получасовой доклад по этой теме.

У меня есть довольно большой опыт — в течение последних семи лет я работал только в этом жанре (Cogmind, Cogmind 7DRL, POLYBOT-7, REXPaint, X@COM), и в течение последних пяти эта работа была моей основной. К тому же, все эти годы я помогал превращению r/RoguelikeDev в крупнейшее сетевое сообщество разработчиков roguelike.
Читать дальше →
Total votes 58: ↑58 and ↓0 +58
Views51K
Comments 23

Приватное облако для Интернета Вещей

IBMCloud computingIOT
Tutorial


Приветствую, Хабр!

Мы, команда ИТ архитекторов из IBM, которая занимается созданием и продвижением на рынок индустриальных решений для разных отраслей. В свободное от основной работы время исследуем новые технологии, экспериментируем и пробуем на деле лучшие практики.

Последние годы большой популярностью пользуется тематика Интернета Вещей. Наши клиенты спрашивают об универсальных коробочных решениях и платформах, которые могут располагаться локально в их Центрах Обработки Данных. Самое главное, ожидается, что на базе таких «коробочек», все новые сервисы и приложения должны разрабатываться и запускаться очень быстро, а точнее моментально или «еще вчера».

Мы задались вопросом: «А что если собрать нечто подобное на открытых и общедоступных технологиях?»
Читать дальше →
Total votes 13: ↑12 and ↓1 +11
Views5.5K
Comments 13

+500 бесплатных инструментов для запуска вашего стартапа в 2017 году

Web designTypographyInterfaces
Translation


Сейчас доступно огромное количество отличных бесплатных инструментов. Но используя бесплатный или условно-бесплатный инструмент, вам понадобится больше времени на достижение своей цели, потому что такой инструмент не будет полностью соответствовать вашим потребностям.

С другой стороны, в начале пути важно минимизировать издержки и внимательно следить за своими платными подписками. В конце месяца они могут незаметно вылиться в огромные накладные расходы.

Итак, мы нашли в интернете бесплатные и условно-бесплатные инструменты для роста вашего бизнеса. Когда они дадут вам желаемый результат, вы можете оформить платную подписку.
Читать дальше →
Total votes 74: ↑60 and ↓14 +46
Views148.8K
Comments 26

Размещение веб-приложения на Amazon Web Services. Дёшево. Возможно ли это?

Website developmentAmazon Web ServicesCloud services

Наверняка все слышали про Amazon Web Services (AWS). А некоторые даже заглянули на страницу Pricing. И заметили, что цены там заметно выше, чем на DigitalOcean, Linode, Hetzner Cloud и др. Вот таблица для сравнения цен:


Тип RAM CPUs Диск Трафик Цена
DigitalOcean - 4 GB 2 vCPUs 80 GB 4 TB $20
Linode Linode 4GB 4 GB 2 vCPUs 80 GB 4 TB $20
AWS t2.medium 4 GB 2 vCPUs - - $40

Amazon берёт деньги за трафик, причём цены тоже не низкие:



Так для чего же тогда выбирать Amazon? Вот какие причины вижу я:


  1. Большое количество полезных сервисов.
  2. Free Tier.

О втором и пойдет речь в этой статье.

Читать дальше →
Total votes 34: ↑30 and ↓4 +26
Views26.9K
Comments 58

Регулярные выражения в Python от простого к сложному. Подробности, примеры, картинки, упражнения

Sport programmingPythonPerfect codeRegular expressionsReading room
Tutorial

Регулярные выражения в Python от простого к сложному




Решил я давеча моим школьникам дать задачек на регулярные выражения для изучения. А к задачкам нужна какая-нибудь теория. И стал я искать хорошие тексты на русском. Пяток сносных нашёл, но всё не то. Что-то смято, что-то упущено. У этих текстов был не только фатальный недостаток. Мало картинок, мало примеров. И почти нет разумных задач. Ну неужели поиск IP-адреса — это самая частая задача для регулярных выражений? Вот и я думаю, что нет.
Про разницу (?:...) / (...) фиг найдёшь, а без этого знания в некоторых случаях можно только страдать.

Плюс в питоне есть немало регулярных плюшек. Например, re.split может добавлять тот кусок текста, по которому был разрез, в список частей. А в re.sub можно вместо шаблона для замены передать функцию. Это — реальные вещи, которые прямо очень нужны, но никто про это не пишет.
Так и родился этот достаточно многобуквенный материал с подробностями, тонкостями, картинками и задачами.

Надеюсь, вам удастся из него извлечь что-нибудь новое и полезное, даже если вы уже в ладах с регулярками.
Читать дальше →
Total votes 99: ↑98 and ↓1 +97
Views560.6K
Comments 62

У нас длинные руки: 7 зарубежных площадок, на которых можно найти удалённую работу

ParallelsCommunity managementPersonnel ManagementIT career
Развитие телекоммуникационных технологий — это win-win для работодателей и работников: компании могут находить таланты по всему миру, а люди могут работать откуда угодно, лишь бы был Wi-Fi. И популярность удалённой работы лишь растёт. К примеру, согласно отчёту Gallup, в 2015 году 37% респондентов ответили, что работают удалённо частично или весь рабочий день. Это было на 7 процентных пунктов больше, чем в 2008. И нет причин считать, что эта тенденция сегодня изменилась.

Чем больше людей обращаются к подработке, фрилансу или удалённой работе на полную ставку, тем чаще возникает вопрос: где именно мне найти работу, которая позволит отказаться от поездок в офис? Предлагаем вашему вниманию семь зарубежных площадок, на которых можно найти удалённую работу.
Читать дальше →
Total votes 50: ↑49 and ↓1 +48
Views89.3K
Comments 35

Замена sim-карт. Глава III. Боремся с бюрократией

IT TerminologyLegislation in IT
Эта статья написана по вопросам комментариев к первой и особенно второй части. Интерес есть и, к сожалению, пока поток напасти по замене sim не сильно спал. К тому же, совсем скоро это всё перейдёт в приложения для двухфакторной аутентификации и станет совсем «интересно».

Итак, как минимум с 2012 по 2017 гг. операторы сотовой связи: Мегафон, Билайн, МТС (возможно — другие, не изучал по ним практику) незаконно меняют sim-карты. Допустим, вы следуете советам безопасности, имея отдельный телефон «по типу кирпич» и в целом считаете, что далеки от этой угрозы. Допустим.

Но у всех есть мамы, папы, бабушки и дедушки, дети и множество других родственников, друзей, знакомых, просто хороших людей вокруг. И вот у них, как показывает опыт, не всё так гладко. Конечно, даже для бизнеса суд — не всегда благо, что уж говорить о тех, кого закон называет потребителями. И всё же...


Читать дальше →
Total votes 32: ↑31 and ↓1 +30
Views13.7K
Comments 18

Pygest #9. Релизы, статьи, интересные проекты из мира Python [8 мая 2017 — 22 мая 2017]

PythonProgramming
image Всем привет! Это уже девятый выпуск дайджеста на Хабрахабр о новостях из мира Python.

В сегодняшнем выпуске вы найдёте интересные материалы, касающиеся Django, создания интерпретаторов, алгоритмов и многого другого. Присылайте свои актуальные материалы, а также любые замечания и предложения, которые будут добавлены в ближайший дайджест.

А теперь к делу!
Перейти к дайджесту
Total votes 21: ↑21 and ↓0 +21
Views9.4K
Comments 2

Компьютерная криминалистика (форензика) — обзор инструментария и тренировочных площадок

Information Security

 
Форензика (компьютерная криминалистика, расследование киберпреступлений) — прикладная наука о раскрытии преступлений, связанных с компьютерной информацией, об исследовании цифровых доказательств, методах поиска, получения и закрепления таких доказательств. В этой статье мы рассмотрим популярные инструменты для проведения криминалистического анализа и сбора цифровых доказательств.
Читать дальше →
Total votes 38: ↑36 and ↓2 +34
Views93.6K
Comments 14

Методы обхода защитных средств веб-приложений при эксплуатации SQL-инъекций

OWASPInformation Security
image

 
При разработке современных веб-приложений необходимо использовать защитные средства. Тем не менее, стоит понимать, как они работают, эффективно их применять и осознавать, что они не являются панацеей от хакерских атак. В статье будут рассмотрены способы обхода средств фильтрации и защиты веб-приложений при эксплуатации sql-инъекций.

Читать дальше →
Total votes 50: ↑43 and ↓7 +36
Views37.1K
Comments 59

«До чего дошел прогRесс». Замена «умственного» труда механическим процессом на базе R

Data MiningBig DataR

Каждый новый день зачастую подкидывает новые задачки. Не в смысле их радикальной новизны, а в смысле «еще одного типа задач», которые обычно встречаются в бизнес-окружении.


На этот раз задача оказалась предельно простая и прагматичная, но ее решение дает далеко идущие последствия.


Кейс


Суть задачи в следующем:

Читать дальше →
Total votes 21: ↑18 and ↓3 +15
Views10K
Comments 22

Кому-то многовато или как метод кайдзен на мою работу повлиял

SmartProgressProject managementGTDFreelance
Вы часто себе даете обещания, но не выполняете их. Крупная задача вас страшит и парализует. Вы вкалываете аврально и потом ругаете себя: «Надо было делать помаленьку, но каждый день». Я расскажу вам об эффективном методе, который испытала на себе лично.


Читать дальше →
Total votes 18: ↑17 and ↓1 +16
Views36.3K
Comments 5

Анализ SSL/TLS трафика в Wireshark

NexignInformation Security
Tutorial


Как скрыть от посторонних конфиденциальную информацию?
Самое простое – зашифровать.
В Интернет и Интранет-сетях шифрацией данных управляет протокол SSL/TLS.
Солдат спит, служба идет.
Однако иногда возникает необходимость выполнить обратное – расшифровать перехваченный трафик.
Это может потребоваться как для отладки работы приложений, так и для проверки подозрительной сетевой активности.
Или в целях изучения работы SSL/TLS (очевидные, вредоносные цели не обсуждаются).

Как и при каких условиях можно расшифровать дамп SSL/TLS трафика в Wireshark?
Попробуем разобраться.

Читать дальше →
Total votes 48: ↑45 and ↓3 +42
Views160.8K
Comments 16

Как стать руководителем проектов в IT

Project managementIT career
Привет, друзья!

Так получается, что со мной периодически связываются мои знакомые и знакомые моих знакомых, которым меня порекомендовали, с примерно одним и тем же вопросом: «Как мне стать project manager'ом в IT, если до этого я работал(-а) на похожей позиции, но не в IT?».

Так как подобных запросов накопилось несколько штук за довольно короткое время, я решил написать об этом отдельную статью. Ну вы понимаете — я же ленивый, и теперь смогу сразу давать ссылку на этот текст, вместо очередного повторения уже несколько раз сформулированных ответов. Статья не претендует на универсальность — это только мой взгляд на ситуацию. В то же время скажу, что когда проводишь собеседования, нанимаешь и обучаешь project manager'ов — накапливается довольно много общих критериев, отвечающих на вопрос «А что же на самом деле должен знать и уметь IT project manager?», чтобы успешно работать в IT.

Кстати, знание английского языка в статье даже не обсуждается. Оно просто обязательно.

Поехали?
Читать дальше →
Total votes 18: ↑14 and ↓4 +10
Views71K
Comments 13

11 инструментов, которые правда сделают вашу жизнь проще

icanchoose.ruMedia management
Recovery mode
Решили поделиться с вами нашими находками для планирования времени, борьбы с прокрастинацией, общения с коллегами, сна, творчества. Технологии могут сделать вашу жизнь проще. Иначе зачем они нужны?


Читать дальше →
Total votes 14: ↑10 and ↓4 +6
Views14.3K
Comments 4

Что ж вы делаете, паразиты: распространённый микроб заподозрили в управлении поведением людей

Popular science
image

Паразитическое одноклеточное toxoplasma gondii, принадлежащее к токсоплазмам, известно уже более 100 лет. К концу 20 века учёные более-менее изучили и способы размножения паразита, и то, как люди могут им заразиться. По разным оценкам, этот микроорганизм присутствует в организмах от 50% до 65% всех людей на планете.

Как ни странно, половое размножение у токсоплазм проходит исключительно внутри организмов животных из семейства кошачьих. Внутри всех остальных организмов, которые удаётся заразить, паразит размножается делением. При этом считается, что его присутствие практически не оказывает на организм никакого влияния. После того, как здоровая иммунная система за несколько дней справляется с новыми «гостями», микробы переходят в неактивное состояние. Опасность он представляет только для людей с нарушениями иммунной системы, а также для беременных женщин, которые заразились им впервые – в худшем случае токсиплазмы способны даже привести к летальному исходу у больных и у плода.
Читать дальше →
Total votes 51: ↑41 and ↓10 +31
Views36.2K
Comments 47

Моделирование спринтов Scrum. Решаем проблемы взаимодействия с клиентом и внутри команды

red_mad_robotProject managementAgile
«Мобильное приложение должно быть «живым», пользователь должен видеть, что проект развивается»
image
Мы в Redmadrobot работаем по гибким методологиям Agile и Scrum. Как известно, они предполагают значительную свободу в том, как организуются спринты по проектам, — каждая компания подбирает удобную для себя модель. Кейсов — информации о том, как организуются команды во время выполнения спиринтов — во внешних источниках крайне мало. Раскрываем свою “кухню”.
Читать дальше →
Total votes 12: ↑11 and ↓1 +10
Views8.7K
Comments 4

10 забавных упражнений, которые помогут вам стать более успешным предпринимателем

MBA ConsultProject managementGTD
Translation
image

Решив стать предпринимателем, я, в первую очередь, столкнулся с недостатком навыков и знаний. Я был не в состоянии быстро думать и говорить без подготовки, не умел продавать и плохо взаимодействовал с другими людьми. Этот список можно продолжить бесконечно… В этой статье Neil Patel расскажет, как развить в себе все необходимые навыки для ведения бизнеса.
Читать дальше →
Total votes 15: ↑11 and ↓4 +7
Views26.3K
Comments 3

Мои 3 правила, как не быть хомяком в колесе. Личный опыт GTD

Project managementGTD
Пару дней назад совершенно случайно наткнулся на блог «интернет манимейкера», которого когда-то читал лет 5-6 назад. Судя по датам постов, блог был все еще живым и автор продолжал открыто выкладывать цифры о своем заработке. Я решил пробежаться по постам и оценить успехи этого блоггера. Уже через минуту я был просто поражен!

За последние 5 лет заработок человека не только не вырос, но даже немного уменьшился. Все эти годы он продолжал заниматься все тем же: продажа ссылок с сайтов, контекстная реклама, партнерки и т.п. Для студента в 2008 году заработок в $800/мес вполне был неплохим доходом. Но на дворе уже 2015 год, а у чувака все те же $700-800!

image
Читать дальше →
Total votes 27: ↑21 and ↓6 +15
Views38K
Comments 23

Information

Rating
5,822-nd
Location
Санкт-Петербург и область, Россия
Registered
Activity