Открыть список
Как стать автором
Обновить
33
Карма
0
Рейтинг

Пользователь

Как посчитать «похожесть» номеров в паспортах. И найти одинаковые даже с опечатками

Судя по описанию вы построили систему основанную на правилах выведеных вручную. Насколько я понимаю у компании уже есть довольно много данных, на которых можно обучить модель, которая выведет все правила сама. При этом машинные правила могут учитавать больше нюансов в данных, например распространенность ФИО (для фамилии Кузнецов вероятность совпадения будет больше, чем для фамилии Вовк, например)
Пробовали ли вы применять машинное обучение в своей области?

Яндекс.Алгоритм 2018: оптимизационный трек и ML-задача от разработчиков Алисы

Полагаю, «Соревнование (Яндекс.Алгоритм 2018) не закончено. Дорешивание недоступно.» Т.е. сейчас лидерборд показывает состояние на опреденный фиксированный для всех момент времени. Когда Яндекс.Алгоритм 2018 завершится, можно будет в спокойной обстановке дорешать задачи.

Бесплатная GPU Tesla K80 для ваших экспериментов с нейросетями

Можно снова запустить, тот же самый ноутбук, подмонтировать google drive и продолжить обучение из последнего checkpointa.

Мониторинг выполнения задач в IPython Notebook

Нет надобности копировать функцию в каждый notebook, можно сохранить ее в файл

~/.ipython/profile_default/startup/010_log_progress.py

Подборка: Более 70 источников по машинному обучению для начинающих

Идеи по использованию мобильных архитектур в кластере: Jira, новость от Databricks

Вас не смутила подпись [Just in case you didn’t realize – it’s April 1st!]?

Kaggle и Titanic — еще одно решение задачи с помощью Python

Заметил, что для random forest, в первом примере, количество n_estimators было задано 500. Grid search обнаружил более точный результат при n_estimators 350. Может попробовать варьировать n_estimators в более широком диапазоне?

Облачная платформа для чатов в мобильных приложениях

Расскажите, если возможно, как у вас технически организованы аудиочаты / видеочаты? Аудио/видео поток передается p2p или через ваш сервер? Сколько человек может одновременно участвовать в видео чате?

Дизайн и архитектура в ФП. Введение и Часть 1

Pattern matching, это больше про удобный доступ к составным данным, деструктурирование.
Основная идея ФП, в отсутствии состояний и иммутабельности данных, с этой точки зрения ФП и ООП сильно отличаются.

Делаем свой персональный Skype, пошаговая инструкция создания WebRTC приложения

Огорчает здесь то, что на данном этапе развития WebRTC я не могу сказать браузеру «этому сайту я доверяю, всегда давай ему доступ к моей камере и микрофону»

«always allow» доступно, если ваш сайт обслуживается через https.

Делаем свой персональный Skype, пошаговая инструкция создания WebRTC приложения

Да это уже возможно, в Chrome и Firefox, через DataChannel Api.

Защита сайта от спамеров и угона аккаунтов

Кстати, бывают и «брутальные куки на стеройдах» :) http://samy.pl/evercookie/

AngularJS vs. KnockoutJS

Есть один важный момент, databinding в Knockout использует change listeners поэтому необходимо: вызывать обертки типа ko.observable(), ko.computed, создавать custom bindings для нестандарных контролов.
databinding в AngularJS основан на dirty-checking, это позволяет использовать любые объекты в качестве данных и изменять их свойства без необходимости использования сеттеров геттеров.
При близком рассмотрении, Angular и Knockout очень различаются по своей идеологии и предназначению.

Робот-пылесос Neato XV-21: покупка в США, доставка, опыт использования

Про Neato не знаю, но румба хорошо управляется с родного IR пульта. Так что, в «ручном» режиме можно пылесосить тоже. :)

Изучаем Storm Framework. Часть II

Подозреваю, надо копать в сторону триггеров PostgreSQL.
Но, это получается нелогичный пример. SQL база обычно используется как хранилище данных. Если данные нужно обработать в реальном времени, с помощью Storm, зачем их сохранять перед этим в базу? Лучше направить входной поток данных в spout, затем в процессе обработки, в одном из bolt выполнить сохранение в базу.

Изучаем Storm Framework. Часть I

Вы правы, похоже у меня устаревшая информация. В 0.7.0 они зарелизили альфа версию стриминга.

Изучаем Storm Framework. Часть I

Есть различия. Spark производит вычисления на определенном конечном наборе данных, по-сути это сильно ускоренный Hadoop. Storm это streaming обработка, вычисление идет на постоянно приходящих данных.
P.S.: Spark обещает реализацию discretized streams к августу. Возможно это будет быстрее storm-а, за счет пакетной обработки.

Centrifuge — брокер реал-тайм сообщений

Я имею в виду, убрать
tornado.web.url(
                r'/connection/websocket',
                WebsocketConnection,
                name="connection_websocket"
            ),

и класс WebsocketConnection
К SockJS серверу можно подключаться, как через клиентскую библиотеку так и напрямую через raw WebSocket.

Centrifuge — брокер реал-тайм сообщений

Код можно упростить, SockJS умеет подключать напрямую через websocket, в обход механизма детектирования транспорта. Для этого надо url задавать в виде ws://host:port/centrifuge/websoket.
1

Информация

В рейтинге
6,051-й
Откуда
Россия
Работает в
Зарегистрирован
Активность