Как стать автором
Обновить

Комментарии 66

На счет Дальнего востока — т.к. там меньше деревень и поселков, в основном это большие города или города вокруг сырьевого предприятия где зарплата не маленькая. Плюс на ДВ цены на все выше чем на западе России.
Например в Охотске 1кг гнилых яблок — 500 рублей. Естественно что на зп 20 тыс там делать нечего.
Я тоже хочу такой датасет :)
С ДВ все довольно просто: выше зарплаты в среднем по больничке в сырьевом секторе, соответствущие и цены, и как следствие — выше ожидания по ЗП и в остальных отраслях.
Подскажите пожалуйста, каким инструментом пользовались для визуализации?
Я не автор, но есть подозрения что это Pandas для выборок и matplotlib+seaborn для картинок.
Тоже заглянул в комменты за инструментом визуализации. Боксплоты очень симпатичные.
О, почти как и у меня результаты,
только у меня на он-лайн данных
habrahabr.ru/post/266319
Удивительно, но самые высокие ожидания не в Москве, а на Дальнем Востоке.
Чтобы уговорить специалиста из Москвы переехать на дальний восток, нужно предложить хорошую зарплату.
Ещё вроде бы на буровых станциях специалисты по 200 т.р. получают.
Нужен высокий скилл, опасные условия жизни и т.п.

Ещё вот тут не понял:
Информационные технологии, интернет, телеком —… региональный менеджер по продажам ...
Что тут непонятного — ИТ продукты и услуги тоже нужно продавать…
Насколько я понял, категории созданы по названию профессий, а не деятельности фирм.
Например, должность «системный администратор» тоже есть и в фармацевтических компаниях, однако она только в категории «ИТ».
А иначе в категории «ИТ» были бы и секретари и бухгалтеры.
200 т на буровых это максимум для «главного» человека на буровой (мастера). помбуры или буры от 70 до 150.

Ещё иногда пишут про «200 тыр за месяц работы», умалчивая, что это работа вахтовым методом 30/30, и 200 тыс выплачивают за 2 месяца (1 работы и 1 отдыха).

Но условия работы там… Действительно очень сложные.
Вы заблуждаетесь. На буровых 200 — это где-то ближе к минимуму, чем к потолку. Ведущие специалисты получают ближе к полу-миллиону за вахту. Ваши цифры больше соответствуют картине на «земле».
возможно мои данные устарели, да.
за прошедшие года полтора з/п менялись?
НЛО прилетело и опубликовало эту надпись здесь
Видно написание 1с на русском языке и на английском. :)
Любопытно, что среди данных по вузам нет МФТИ. А ведь он входит в ТОП-N (все считают по-разному, для меня тут N=3) лучших технических вузов страны.
Это по всей России?

По регонам соотношение вакансий и резюме сильно различается.

http://hh.ru/career-stats/index

Например в Москве ИТ специалистов наоборот избыток.
График что-то не грузится.
Например в Москве ИТ специалистов наоборот избыток.

Хм, но все равно почему-то очень сложно найти хорошего специалиста.

«Избыток специалистов» != «наличие хороших».
Вон адвокатов сколько, а найди хорошего =)
Меня смущает ожидаемая зарплата в Москве в 50000 рублей. Маловато будет. Хотя может кризиса я не увидел в своем окружении.
Смущает != не верю. Просто, слегка удивлен я.
зарплаты выше обычно не публикуются
Резюме с указанными зарплатами порядка 80%,
вероятнее всего что оставшиеся 20%, да, с более высокими ожиданиями, чем медианные, но не обязательно (может 15%),
даже если предположить что это так, то да, средняя ЗП конечно увеличится,
но медианная не сильно, она будет порядка 6-7 дециля (даже если все 20% выше медианы, то они сместят медиану на 2 дециля), а там 60-70k.
да и людей на такую проще найти через связи чем через HH
Да а чего «смутительного». Средняя з/п в Мск согласно Росстату в районе этой отметки и крутится. Так что все норм.
Я бы подумал, что 0 это девочка.
Северные. На севере их ожидают потому и ожидание по зарплате выше. Но там и тратят больше.
Затем была сделана попытка сравнить регионы России по ожидаемым зарплатам и популярности индустрий. Удивительно, но самые высокие ожидания не в Москве, а на Дальнем Востоке. Почему так, кто знает?


Однажды, будучи разработчиком среднего уровня отправлен был я в командировку в Ямало-Ненецкий АО (2008-2009 гг.). Вот вам сравнение на тот момент.

Программист в Саратове 15 тыр. (±), а диспетчер на рации на Ямале 150 тыр. (+50 тыр сверху после прохождения тренинга/экзамена по пром. безопасности). Соотношение квалификации и з/пл. между центральной провинцией и северными газо- нефтеродными регионами примерно такое же сейчас.
Самый неожиданный вывод для меня — таки да, элитных вузов нету :(. Может элитные факультеты хоть есть???
есть, но надо искать уже не на HH, а в LinkedIn.
У hh.ru есть особенность — явно декларируются зарплаты только для младшего персонала. Ни в вакансиях, ни в резюме начиная со, скажем, 100-150 тыс. жалованье уже не указывают. Если вы и видите редкое «sales-менеджер, 200К» — это, скорее, очковтирательство со стороны работодателя — и зарплата сложится из 40 тыс. фикса и фантомных комиссионных на остальное.
А с каких пор статистика по 6000000 записей стала гордо именоваться большими данными?
Да вердикт однозначен, против тенденций хабра разумом не попрешь, в тренде большие данные, а значит любая работа над 100+ событий уже большие данные :)
А скажите, какие данные считаются большими?
Ну в данном контексте, статистика реального времени по потоку 6000000 резюме в секунду, была бы мной оценена как большие данные. Но блин статистика 6 миллионов документов, это не биг дата, как ты ее не поворачивай.
Ну ок, там можете четкую или хоть сколько-нибудь определенную грань привести, что такое бигдата? Какие данные надо считать бигдатой, а какие просто «датой»?
Чуваки, да какая разница
Вы резюме со всей галактики планируете обрабатывать?
Причем тут галактика, просто статья в биг дате, где ей делать нечего, объем данных не тот.
Дайте определение, как вы понимаете термин бигдата. А пока ваш пост «с каких пор статистика по 6000000 записей стала гордо именоваться большими данными» заслуживает только минуса.

ЗЫ: 6000001 запись это уже бигдата или еще нет?)
Ну хорошо, хотите определение, будет объем данных который специалист при наличии всех необходимых инструментов и навыков не может обработать на своей рабочей станции в какие либо вменяемые сроки.

А в последнее время, местное население склонное к хипстерству любой объем работы больше помещающегося на лист экселя, называет большими данными.
Дайте определение вменяемому сроку и какими навыками должен обладать человек названный в вашем посте специалистом. Список «необходимых инструментов » тоже в принципе хотелось бы и тогда можно будет продолжить дискуссию в конструктивном русле.
Вменяемый срок — данные не успеют потерять свою актуальность в рамках решаемой задачи.
Специалист — человек имеющий знания и опыт обработки представленных данных.
Инструменты — в данном случае имелись ввиду программные продукты необходимые специалисту для обработки представленных данных.
Вам известно количество данных — 6М. Вменяемый срок пока данные не успеют потерять свою актуальность, я думаю 3 месяца по нашей жизни.
Специалист — человек имеющий знания и опыт обработки представленных данных.

То есть специалист — девочка клерк из того же hh.ru, владеющая Экселем — подойдет, я правильно вас понял?
программные продукты необходимые специалисту для обработки представленных данных

Это Эксель?
Если вам надо сегодня выставить вакансии на рыночных условиях, данные нужны сегодня, ждать три месяца не с руки.
Что вы мне сейчас написали?
Есть задача, на основании 6М записей анкет пользователей выдать аналитические данные в разрезах представленных в этой статье.

Вы упорно не хотите давать вводные данный, по которому можно было бы сделать вывод, что это не относится к биг дате. Я предположил, что вы имели ввиду 6М анкет, с актуальностью 3 месяца и специалиста владеющего неплохо экселем.

Вы согласны что это отвечает вашим водным данным на эту задачу?
Если нет наконец озвучите свои критерии)
Viacheslav01 выше все верно пишет. Точного определения нет, но о больших данных не имеет смысла говорить, если данные могут быть обработаны за один раз на рабочем компьютере специалиста обычным для этого специалиста софтом.
Я могу попробовать дать такое определение, большими следует называть данные, которые обладают всеми этими свойствами:
1) Поступают несколькими независимыми потоками в квазиреальном времени,
2) Структура которых не известна заранее, может быть вариативной, или данные получены с датчиков,
3) Их обработка с помощью массово-параллельной системы целесообразна,
4) Для их обработки требуется специализированное, не «ширпотребное», нишевое решение.
За три месяца девочка с экселем справиться, специалист имеющий доступ к этим данным в реляционном хранилище и владеющий инструментами BI эту работу за день (с запасом) :)
Озвучте наконец что вы подразумеваете в числах и названиях конкретных инструментах)
  • Вменяемый срок
  • Специалист
  • Инструменты

Вы что-то боитесь?) Тут у вас проскочило «за день (с запасом)» и «инструментами BI» озвучте название конкретных инструментов (Эксель в некотором роде, да даже не в некотором а во вполне конкретном — это инструмент Bl))
1) минута на срез
2) MSSQL
3) DBA
И да минуса на хабре заслуживает любой пост, который не следует трендам модной тусовки, проверено не раз :)
Коллективное сознание хабра несомненно забавная штука, сам не раз нарывался «не за шо») Но в данном случае неподкрепленное ничем утверждение. Будет вменяемой обоснование/пояснение мысли — пройдусь все и отминусую, плюс заплюсую чего не минусовал, в том числе и кармы. Ждем.
Да мысль в том, что сейчас любой чих в сторону обработки информации не помещающейся на листе бумаги уже большие данные, где я на адептов только не натыкаюсь. прошел торговый день надо загрузить и обработать сотню тысяч чеков по сети, о… это же большие данные..., блин идет поток событий плотностью пару сотен в секунду, о… большие данные…

Для меня большие данные, это то, что я не смогу обработать без использования распределенных вычислений, а все что можно обработать в адекватный данным срок, на одном компьютере чуть ли не вручную, это не большие данные.
Честно говоря я тоже в сомневаюсь, что 6М анкет — это биг-дата, могу сказать откровенно. Поэтому когда вы так определенно заявили, что это херня а не биг-дата, я пополз в список ваших статей прочитать про эту самую биг-дату)

Что я там увидел, вы и сами знаете) Осюда возникли и следующие мои вопросы. На которых вы вменяемо ответить не смогли.
Для меня большие данные, это то, что я не смогу обработать без использования распределенных вычислений


Вас просят дать количественные оценки и названия конкретных инструментов, что бы любой в теме или интересующийся мог бы сопоставить это со своими представлениями и опытом.
Ну то есть бигдата — это данные, которые требуют для своей обработки суперкомпьютеров или распределенных вычислений?
Конкретных количественных рамок того, что такое бигдата вы назвать не можете, верно?
На самом деле, их похоже, что никто не может назвать, но вы с такой уверенностью объявили, что 6кк — не бигдата, что я грешным делом, понадеялся, что хоть вы из числа просветленных, знающих точный ответ.

Для меня большие данные...

Ну а для автора большие данные это 6кк анкет с HH
При таком подходе резюме со всего земного шара закончатся за 20 минут.
А если запись широкая, то это будет bigdata?
очевиднож, что fatdata!
Спасибо, Александр, за интересную информацию!

Подскажите, а как читать этот тип диаграмм?

Я бы этому дяде с большими ушами…
С ожиданиями на севере всё проще — районный коэффициент. К примеру в ЯНАО, если не ошибаюсь, этот коэф. за счёт «северок», может достигать 2.0 через несколько лет проживания (он накапливаемый) и при окладе 40т.р. фактически зарплата получается 80т.р. и публикуется именно эта цифра.
Зарегистрируйтесь на Хабре , чтобы оставить комментарий

Публикации

Истории