Комментарии / Профиль pro100olga / Хабр

Как стать автором

Olga Makarova @pro100olga

Пользователь

Профиль Публикации 4Комментарии 123Закладки 56

Как различать британскую и американскую литературу с помощью машинного обучения

pro100olga 19 янв 2017 в 09:47

Мне кажется, с прессой должно быть проще, ведь в каждой стране пресса больше пишет про внутренние дела, чем про внешние. Хотя про Трампа пишут все :)

0

Посмотреть

Как различать британскую и американскую литературу с помощью машинного обучения

pro100olga 19 янв 2017 в 09:18

Очень интересно, спасибо! Судя по списку авторов, тексты в основном конца 19го-начала 20го века. Интересно, сохранилось ли это различие в современной литературе :)

0

Посмотреть

Как различать британскую и американскую литературу с помощью машинного обучения

pro100olga 19 янв 2017 в 09:16

Возможно, американские тексты позже написаны? По топ-5 приведенных авторов тяжело оценить.

0

Посмотреть

Отслеживание хода выполнения в R

pro100olga 11 дек 2016 в 12:44

В конце статьи указано, что вывод на экран работает быстрее. Я сталкивалась с тем, что вывод на экран значительно замедляет работу программы — по сравнению с отсутствием вывода (не знаю, как это объяснить). Если так, то получается, предложенные решения будут работать еще медленнее?

0

Посмотреть

Низкоуровневая оптимизация и измерение производительности кода на R

pro100olga 1 дек 2016 в 15:04

Большое спасибо за статью! Я работаю в R, а в университете учила С++, и эти циклы из меня буквально лезут, не могу справиться :)

0

Посмотреть

Кластеризация графов и поиск сообществ. Часть 2: k-medoids и модификации

pro100olga 15 авг 2016 в 12:47

С большим удовольствием читаю ваши статьи. Спасибо за труд и, пожалуйста, пишите еще! )

0

Посмотреть

Что такое деревья поведения и как они используются

pro100olga 26 июл 2016 в 09:27

Интересный материал. Я думала, робототехника уже вовсю движется в сторону reinforcement learning

+1

Посмотреть

Социальное неравенство и зарплаты чиновников

pro100olga 13 апр 2016 в 10:26

Интересно почитать, спасибо. Если интересует тема доходов, то US Census Bureau в своем ACS дает данные по доходам населения, но правда на основе опросов, то есть люди могут занижать.

0

Посмотреть

Анализ результатов выборов в Госдуму. Готовимся к голосованию 2016 года

pro100olga 14 мар 2016 в 12:06

Из ваших комментариев я понимаю, что вероятность использования подобных материалов ненулевая ("суд вправе"), в то время как в первоначальном комментарии sim-dev я вижу нулевую вероятность ("использование… будет нарушением").

Если я вас правильно поняла, вы говорите, что вероятность низкая, но она есть — так я с этим абсолютно согласна. И считаю действия активистов, которые к этому приводят, никак не бесполезными.

+1

Посмотреть

Анализ результатов выборов в Госдуму. Готовимся к голосованию 2016 года

pro100olga 14 мар 2016 в 11:29

iCpu описывает условия, при которых материалы могут быть не использованы, вы же в своем комментарии говорите "использовать собранные ВНЕ следствия данные будет нарушением законной процедуры" — без каких-либо условий.

Не знаю, какие законы действуют в РФ, т.к. я там не проживаю, но в Украине, например, есть прецеденты включения данных журналистских расследований в материалы следствия. Опять же, есть ЦПК, который регулярно обжалует разные околокоррупционные решения в суде.

Поэтому мне странно слышать, что "энтузиазм добровольцев бесполезен". Не говоря уже о том, что распространение такой информации ценно само по себе, даже вне следствий и судов.

+3

Посмотреть

Анализ результатов выборов в Госдуму. Готовимся к голосованию 2016 года

pro100olga 14 мар 2016 в 10:36

Рассмотрим такой пример. В магазине произошла кража. У меня есть видеозапись этой кражи, где видны лица воров и сама кража. Через месяц магазин решает подать заявление о краже и просит меня предоставить эту видеозапись. Вы хотите сказать, что следствие не сможет ее использовать?

+2

Посмотреть

Анализ результатов выборов в Госдуму. Готовимся к голосованию 2016 года

pro100olga 14 мар 2016 в 09:53

Особенно прекрасно это скопление точек за ЕР возле 100% ))
Было бы интересно наложить результаты на результаты прошлых выборов и партийную принадлежность главы/ зам.главы комиссий, чтобы выделить влияние руководства ТИК.

+4

Посмотреть

Анализ результатов выборов в Госдуму. Готовимся к голосованию 2016 года

pro100olga 14 мар 2016 в 09:48

То что преступника нельзя наказать прямо сейчас, не означает, что не нужно собрать доказательства его вины.
Они полезны для информирования прямо сейчас, а для доказательства вины могут быть полезны когда-нибудь потом.

+8

Посмотреть

Введение в практическую аналитику, или что общего у нейронных сетей с таблетками для похудения

pro100olga 12 мар 2016 в 10:30

Переход на личности без аргументации и с попутным перекладыванием задачи доказательства своей правоты на оппонента — это простой, но неэффективный способ ведения дискуссии. До свидания.

0

Посмотреть

Введение в практическую аналитику, или что общего у нейронных сетей с таблетками для похудения

pro100olga 11 мар 2016 в 14:46

Хотелось бы увидеть график

0

Посмотреть

Введение в практическую аналитику, или что общего у нейронных сетей с таблетками для похудения

pro100olga 11 мар 2016 в 12:00

Какой смысл привязываться к всем остальным факторам, если вы в ручном подходе тоже привязываетесь не ко всем? Например, делая вывод о влиянии кол-ва подписчиков, вы берете две компании, у которых зафиксированы только два других фактора (публикации и сотрудники). Вот интересно проверить: если взять график хабраиндекса от кол-ва подписчиков (без оглядки на другие факторы), будет видна логарифмическая зависимость?

0

Посмотреть

Знакомьтесь, линейные модели

pro100olga 11 мар 2016 в 11:53

Статья оставила смешанные впечатления. Называется "знакомьтесь, линейные модели" — ок, но если человек не знаком даже с линейной моделью, не слишком ли много информации дальше на него вываливается?
И далее текст очень неоднородный, то для начинающих, то какие-то специфические вещи.
Удивила регуляризация для борьбы с оверфиттингом — разве линейные модели подвержены оверфиттингу?
В целом такое впечатление, что автор прослушал какой-то курс по машинному обучению, сделал конспект — а потом из конспекта решил сделать статью для хабра )

+2

Посмотреть

Введение в практическую аналитику, или что общего у нейронных сетей с таблетками для похудения

pro100olga 8 мар 2016 в 17:36

Какие именно числа нужно взять и откуда их взять?
Числа из таблички выучат мусор, потому в ней нет ключевых фич

Вы используете показатели из профиля компании, почему бы не взять их?
И еще: почему вы искали единичные примеры, а не построили график зависимости хабраиндекса от каждой переменной?

Модель должна быть time-aware, здесь ключевой компонент зависит от времени, как это учесть в алгоритме обучения?

Собрать данные за несколько периодов времени?

XGBoost — алгоритм из семейства ансамблей, у них не слишком хорошо с interpretability, а здесь это с самого начало предполагалось важным условием

У нейронных сетей тоже с этим "не слишком хорошо", по идее, от этого метода можно отказаться на этапе "Нам нужно, чтобы ты определил ключевые факторы, которые на него влияют"

0

Посмотреть

От действий над матрицами к пониманию их сути…

pro100olga 18 фев 2016 в 11:11

Я когда-то читала интервью с одним из своих преподавателей в университетской газете (он вел случайные процессы), и он там сказал, что его даже немного обижает, когда математическим концепциям пытаются найти практическое применение. Ведь математика красивая и изящная, а всякие приземленные вещи ее опошляют. У меня мнение прямо противоположное, но это интервью многое прояснило в системе преподавания ))) Правда, жаль что я его прочитала уже после выпуска…

+4

Посмотреть

От действий над матрицами к пониманию их сути…

pro100olga 18 фев 2016 в 09:37

Отличная, так сказать, визуализация, спасибо!
Когда читаю такие материалы, становится грустно за бесцельно прожитые годы в универе, где все было строго по букве доказательства, но очень далеко от реального мира.

+2

Посмотреть

2