Pull to refresh
2
0
Send message

LSTM – сети долгой краткосрочной памяти

Reading time8 min
Views208K

Рекуррентные нейронные сети


Люди не начинают думать с чистого листа каждую секунду. Читая этот пост, вы понимаете каждое слово, основываясь на понимании предыдущего слова. Мы не выбрасываем из головы все и не начинаем думать с нуля. Наши мысли обладают постоянством.

Традиционные нейронные сети не обладают этим свойством, и в этом их главный недостаток. Представим, например, что мы хотим классифицировать события, происходящие в фильме. Непонятно, как традиционная нейронная сеть могла бы использовать рассуждения о предыдущих событиях фильма, чтобы получить информацию о последующих.

Решить эту проблемы помогают рекуррентые нейронные сети (Recurrent Neural Networks, RNN). Это сети, содержащие обратные связи и позволяющие сохранять информацию.
Читать дальше →
Total votes 41: ↑39 and ↓2+37
Comments4

Маленький и быстрый BERT для русского языка

Reading time9 min
Views54K

BERT – нейросеть, способная неплохо понимать смысл текстов на человеческом языке. Впервые появившись в 2018 году, эта модель совершила переворот в компьютерной лингвистике. Базовая версия модели долго предобучается, читая миллионы текстов и постепенно осваивая язык, а потом её можно дообучить на собственной прикладной задаче, например, классификации комментариев или выделении в тексте имён, названий и адресов. Стандартная версия BERT довольно толстая: весит больше 600 мегабайт, обрабатывает предложение около 120 миллисекунд (на CPU). В этом посте я предлагаю уменьшенную версию BERT для русского языка – 45 мегабайт, 6 миллисекунд на предложение. Она была получена в результате дистилляции нескольких больших моделей. Уже есть tinybert для английского от Хуавея, есть моя уменьшалка FastText'а, а вот маленький (англо-)русский BERT, кажется, появился впервые. Но насколько он хорош?

Читать далее
Total votes 57: ↑57 and ↓0+57
Comments17

OCR или как мы учимся читать спам на 5+

Reading time12 min
Views20K


Всем привет, меня зовут Михаил Марюфич. Я занимаюсь машинным обучением в команде антиспама в Одноклассниках. И сегодня я расскажу про то, как и зачем мы сделали свою технологию распознавания текстовых символов с изображения OCR (Optical character recognition).
Читать дальше →
Total votes 30: ↑30 and ↓0+30
Comments16

Как открыть ИП и ООО в Армении в 2023 году?

Reading time4 min
Views74K

2022 год стал рекордным по количеству открытых ИП и ООО в Армении в основном благодаря россиянам, и благодаря льготам для IT стартапов со стороны РА, которые полностью освобождают от налога на прибыль (18%) как минимум до 31 декабря 2022 и снижают подоходный налог на зарплаты сотрудников с 21% до 10%. В связи с этим продолжу цикл постов про Армению маленьким гидом о том, куда идти, что открывать и что потом со всем этим делать.

Читать далее
Total votes 11: ↑9 and ↓2+7
Comments20

Ликвидатор велосипедов: часть 2

Reading time3 min
Views34K
Исходя из того, что первая статья насобирала много плюсов и попала в избранное большого количества человек, я понял что тема актуальна и во-первых призываю подтянуться сообщество (ведь я не могу знать абсолютно все библиотеки и решения), а во-вторых буду продолжать своими силами рассказывать о том какие библиотеки можно подтянуть, если необходимо что-то сделать вместо того чтобы делать все новые и новые велосипеды, состоящие из водопроводных труб.

В этом топике я затрону важную для многих тему — тему рисования графиков в платформе .NET. Вспомните: ведь наверняка когда-то было просто необходимо вывести на экран красивый график… И что происходило? Правильно, появлялся новый велосипед.

Часть первая из серии



Читать дальше →
Total votes 85: ↑71 and ↓14+57
Comments36

WPF, WinForms: рисуем Bitmap c >15000 FPS. Хардкорные трюки ч.1

Reading time4 min
Views42K
Сразу уточнение: Bitmap 200x100 на компе с быстрой памятью и i7 3930K на 1366. Но, это честный System.Drawing.Bitmap.
Вводная: приложение типа осциллографа. Ссылка на готовый проект с фронтэндом в конце статьи.
Как же быстро рисовать его на экран? WriteableBitmap хорош, быстр, и он лучшее решение для WP, WinRT, WPF. Но занудного старпёра-кодера также волнует WinForms, .Net 2.0, Win2K (да-да, в некоторых гос.органах до сих пор теплый ламповый Win2K).
Далее, я обратил внимание на DirectX, тем более у нас для WPF появился полезный контрол D3DImage. Я перепробовал много движков, но ни один из них не давал удобного изящного способа рисовать GDI+ Bitmap из памяти. Некоторые работали и вовсе только с DX10-11. Ближе всех к цели оказался SlimDX. В любом случае, фронтэнд для контрола оказывался некрасивым. Все эти движки… мягко говоря избыточны, для моей простой задачи.
Но решение есть
Total votes 48: ↑40 and ↓8+32
Comments39

Как сделали нейросеть для оцифровки паспортов и отправили её в облако

Reading time4 min
Views7.5K

Новая нейросеть захватывает разворот паспорта и выдает результат в течение 2-5 секунд. 95 процентов информации распознаётся с точностью 99 процентов. Случаи неуверенного распознавания отправляются на ручную проверку удаленно подключенному (не на стороне заказчика) оператору верификации данных, информация приходит ему в деперсонализированном виде.

Сеть написана на Python с применением фреймворка PyTorch — одного из самых гибких инструментов, используя который можно глубже исследовать любой предмет. Массив для обучения составил 500 тыс. синтетических паспортных разворотов + провели тест на 20 тысячах реальных документов. Размер сети - около 16 млн. параметров.

Читать далее
Total votes 4: ↑1 and ↓3-2
Comments8

Как я изучаю языки

Reading time14 min
Views19K
image

Привет, хабровчане! Давным-давно, когда динозавры ходили по земле, a автор этих строк училась в шестом классе, на глаза мне попалась небольшая книжечка венгерской переводчицы Като Ломб «Как я изучаю языки». Я прочла её и — пропал калабуховский дом. Передо мной открылся совершенно новый мир, заворожила красота и логика построения разных языковых конструкций. А ещё было ясно с самого начала, что каждый новый язык — это новый шанс. Под катом я расскажу, какие шансы удалось использовать, а какие — нет и почему так вышло.
Читать дальше →
Total votes 34: ↑32 and ↓2+30
Comments13

Python + OpenCV + Keras: делаем распознавалку текста за полчаса

Reading time12 min
Views200K
Привет Хабр.

После экспериментов с многим известной базой из 60000 рукописных цифр MNIST возник логичный вопрос, есть ли что-то похожее, но с поддержкой не только цифр, но и букв. Как оказалось, есть, и называется такая база, как можно догадаться, Extended MNIST (EMNIST).

Если кому интересно, как с помощью этой базы можно сделать несложную распознавалку текста, добро пожаловать под кат.


Читать дальше →
Total votes 37: ↑35 and ↓2+33
Comments27

Глубокое обучение для новичков: тонкая настройка нейронной сети

Reading time21 min
Views100K

Введение


Представляем третью (и последнюю) статью в серии, задуманной, чтобы помочь быстро разобраться в технологии глубокого обучения; мы будем двигаться от базовых принципов к нетривиальным особенностям с целью получить достойную производительность на двух наборах данных: MNIST (классификация рукописных цифр) и CIFAR-10 (классификация небольших изображений по десяти классам: самолет, автомобиль, птица, кошка, олень, собака, лягушка, лошадь, корабль и грузовик).
Читать дальше →
Total votes 22: ↑19 and ↓3+16
Comments1

Распознавание жестов движений на Android используя Tensorflow

Reading time10 min
Views18K
image

Введение


В сегодняшние дни есть много разных способов взаимодействия со смартфонами: тач-скрин, аппаратные кнопки, сканер отпечатков пальцев, видео камера (например система распознавания лиц), D-PAD, кнопки на гарнитуре, и так далее. Но что насчет использования жестов движений?

Например быстрое перемещение телефона вправо или влево держа его в руке может очень точно отражать намерение перейти на следующую или предыдущую песню в плей-листе. Или же вы можете быстро перевернуть телефон верх ногами и потом назад для обновления контента приложения. Внедрение такого взаимодействия выглядит многообещающим и буквально добавляет новое измерение в UX. Эта статья описывает как реализовать подобное используя машинное обучение и библиотеку Tensorflow для Android.
Total votes 29: ↑29 and ↓0+29
Comments5

Осваиваем компьютерное зрение — 8 основных шагов

Reading time3 min
Views100K
Привет, читатель.

Для тебя уже не является новостью тот факт, что все на себе попробовали маски старения через приложение Face App. В свою очередь для компьютерного зрения есть задачи и поинтереснее этой. Ниже представлю 8 шагов, которые помогут освоить принципы компьютерного зрения.

image

Прежде, чем начать с этапов давайте поймём, какие задачи мы с вами сможем решать с помощью компьютерного зрения. Примеры задач могут быть следующими:

Total votes 40: ↑35 and ↓5+30
Comments10

Как стать более востребованным специалистом в сфере Data Science в 2019

Reading time4 min
Views13K
Заголовок этой статьи может показаться немного странным. И вправду: если вы работаете в сфере Data Science в 2019, вы уже востребованы. Спрос на специалистов в этой области неуклонно растет: на момент написания этой статьи, на LinkedIn размещено 144,527 вакансий с ключевым словом «Data Science».

Тем не менее, следить за последними новостями и трендами в индустрии однозначно стоит. Чтобы помочь вам в этом, мы с командой CV Compiler проанализировали несколько сотен вакансий в сфере Data Science за июнь 2019 и определили, какие навыки ожидают от кандидатов работодатели чаще всего.
Читать дальше →
Total votes 18: ↑12 and ↓6+6
Comments6

Как начать писать игры

Reading time9 min
Views348K
Оригинал: Starting out on Game Programming

Путь в индустрию игровых разработок не близок. Эта статья призвана помочь понять с чего лучше начать это путешествие.

Вы только что закончили ваш первый курс по С++ и хотите начать делать игры. Кто-то указал вам на этот сайт и вы, возможно, поэкспериментировали немного с руководством. Вы изучили несколько лаконичных примеров, но не нашли руководства о том, как сделать целую игру. И на то есть причина.

Руководства хороши для обучения чему-то шаг за шагом, например тому, как перемещать изображение точки по экрану. Для того чтобы собрать игру воедино, вам нужны навыки решения возникающих проблем, приобретаемые лишь с опытом. Это не то, чему можно научиться из руководств. Лучший способ научиться делать игры — это начать их делать.
Дальше
Total votes 134: ↑119 and ↓15+104
Comments51

Программирование игр под Android

Reading time3 min
Views61K
image
Автор – Марио Цехнер
Перевод – Егор Сидорович, Евгений Зазноба
Дата выхода – 17/10/2012


Анонс адаптирован по рецензии.

Любой новоиспеченный разработчик Android, твёрдо намеренный создать новую игру, которая не уступит по популярности знаменитым Angry Birds, с энтузиазмом воспримет выход этой книги. Но подойдет ли она вам? Предлагаю мой обзор этой работы. Надеюсь, читатели смогут судить, как лучше всего ее изучать, и для кого она оптимально подходит.

Читать дальше →
Total votes 33: ↑22 and ↓11+11
Comments14

Взгляд из Google на оптимизацию сайтов

Reading time2 min
Views29K
На сайте моей компании я выложил свой перевод интервью Андре Вейера (Andre Weyher), в прошлом — сотрудника отдела качества поиска в Google, которое он дал австралийскому интернет-маркетологу Джеймсу Норкею (James Norquay). Так как весь текст довольно длинный, здесь я перечислю основные (на мой взгляд, новые) моменты. Если кому-то интересен полный текст перевода — адрес в обсуждении ниже, из скромности. Интервью свежее, 16 октября с.г.

Основная мысль интервью — «если вы хотите, чтобы ваш сайт был повыше в результатах поиска, делайте его так, как будто никакого SEO нет. Этого от вас ждет и пользователь, и Google».

Несколько интересных ответов Андрэ, которые мне (и комментаторам оригинального интервью на сайте Джеймса) показались не столь банальными (простите, если вы это уже знаете, вдруг кто-то еще не знает):
Читать дальше →
Total votes 61: ↑52 and ↓9+43
Comments21

Теория цвета

Reading time2 min
Views297K
Первое впечатление — это все. Пословица «По одежке встречают, по уму провожают» актуальна не только в жизни, но и в дизайне. Впечатление от дизайна состоит из множества факторов, и один из важнейших — это цвет.

Понять, какие цвета сочетаются друг с другом не всегда просто, в этой статье описаны основы теории цвета, которые пригодятся при выборе цветовой схемы для дизайна сайта. Начнем с самого простого.

Основные цвета (Primary Colors)




Основные цвета палитры — красный, желтый и синий. Если говорить об основных цветах на экранах различных устройств — это RGB, красный, зеленый и синий.
Читать дальше →
Total votes 186: ↑160 and ↓26+134
Comments84

Поехали

Reading time3 min
Views10K
В жизни любого сервиса наступает торжественный момент, когда всё уже вроде бы готово и пора приглашать пользователей. У нас этот момент как раз только что и наступил. За окном октябрь, а у нас в офисе новый год и пахнет ёлкой. В предвкушении праздника все глуповато улыбаются и с легкой тревогой ждут гостей (а вдруг не придут). Впрочем, хватит о нас, давайте об интересном.

Что собственно за сервис? Что он даёт?


Сервис называется business3.biz. Позволяет любому человеку, чья степень знакомства с интернет-технологиями уже дала ему возможность зарегистрироваться в социальной сети и заполнить профиль (звучит торжественная музыка) … создать полноценный интернет-магазин. Результат выглядит примерно так.


кликабельно

Искушенный критик заметит – «А дизайн то у всех поразительно схож!». «Ваша правда, одинаков подлец» — ответим мы ему.
Дочитать
Total votes 17: ↑9 and ↓8+1
Comments22

AndroidKickstartr — создай современный проект в пять кликов

Reading time2 min
Views40K

На днях появился новый веб-сервис, позволяющий в несколько кликов создавать новый проект для андроид со всеми современными вкусностями сторонних библиотек.
Название AndroidKickstartr.com отлично описывает его задачу — максимально быстро и просто сконфигурировать новый проект, добавив туда все самое необходимое.
Читать дальше →
Total votes 58: ↑50 and ↓8+42
Comments38

Information

Rating
5,080-th
Registered
Activity