Комментарии / Профиль eiennohito / Хабр

Как стать автором

Пользователь

Профиль Публикации Комментарии 43Закладки 3

Искусственный интеллект упёрся в барьер понимания

eiennohito 12 ноя 2018 в 13:00

Я сам занимаюсь текстом, поэтому про картинки знаю по большей части только из статей. Собственно, это информация из одной из первых статей на adversarial examples.

0

Посмотреть

Искусственный интеллект упёрся в барьер понимания

eiennohito 12 ноя 2018 в 08:10

Потому что можно будет найти новые паттерны шума, которые будут так же убивать сеть на картинках. И это не лечится повторением (те так можно играть в кошки-мышки сколько угодно).

0

Посмотреть

С++20 на подходе! Встреча в Рапперсвил-Йона

eiennohito 10 июл 2018 в 10:05

Парсеры на шаблонах: github.com/taocpp/PEGTL
В принципе почти хватает и сейчас, без метапрограммирования

0

Посмотреть

GNMT, epic fail или тонкости машинного перевода

eiennohito 3 июл 2018 в 08:45

А в чём проблема то?

Нейросетевые модели машинного перевода по сути дела — наврорченные языковые модели, которые имеют ещё и некоторый вход и сильно обусловлены им. Гугл, насколько я знаю, собирает свой корпус для обучения моделей полу-автоматически из интернет текстов. Так как английские новости в основном используют слово annex в отношении Крыма и действий России с ним, то языковая модель выберет этот вариант. То же самое про Штаты и Техас. С именами уже сложнее, так как я думаю что такой комбинации слов в примерах для обучения гораздо меньше, поэтому всё начинает плавать при замене одного слова на другое.

0

Посмотреть

FontCode: новый способ стеганографии через форму букв

eiennohito 18 мая 2018 в 10:33

Превращаем глифы в их векторные контуры и всё. Может быть можно правда ещё поделать что-то с трансформациями самих глифов в пдфках.

0

Посмотреть

Почему я не подписываю соглашения о неконкуренции

eiennohito 6 апр 2018 в 03:26

По крайней мере в айти и около этого это уже давно совсем не так. В более традиционных компаниях пожалуй, но тоже немного плавает.

0

Посмотреть

Используем Apple Pay и карту Тройка в качестве пропуска на работу

eiennohito 27 мар 2018 в 14:28

С NFC точки зрения Фелика (NFC-F, проприетарный стандарт от Сони) довольно крутая штука имхо. Там на одной карте может висеть большое количество сервисов, причём каждый со своей аутентификацией. Поддерживается яблофонами начиная с 7 и андродиами с непонятно каких времён, правда железка (секюрный юнит) на андроидах есть только в японских моделях, увы. С секюрным юнитом не нужно не включать телефон, ни разблокировать его.

Правда для доступа к сдк/закрытой части документации нужно дружить с Сони.

0

Посмотреть

Спасибо за память: как дешёвая память меняет вычисления

eiennohito 9 авг 2017 в 16:46

Можно начинать уже сейчас, используя mmap и друзей вместо read/write. Есть конечно оговорки, но для случайного доступа, когда некоторые места могут читаться чаще чем остальные — самое то.

+1

Посмотреть

Диалектика нейронного машинного перевода

eiennohito 14 июн 2017 в 11:12

Проще на мой взгляд как в плане кода (не нужно убиваться с экспоненциальным взрывом количества гипотез в декодере, например), так в плане того, что меньше компонентов. Статистические модели так же гораздо хуже работали для сильно непохожих друг на друга языков без использования всяких безумных моделей типа tree-to-tree/tree-to-string (английский-японский из близкого мне, например). Как пример, у нас в лаборатории группа машинного перевода за пару месяцев написали движок для нейросетевого перевода с нуля за пару месяцев и он работал сильно лучше старого статистического, который разрабатывали много лет.

То, что для нейросетей требуется больше текста — это конечно да. И что у него есть свои болячки — это тоже факт. Гугл же, насколько я понимаю его внутреннюю кухню, смог выпустить нейросетевой перевод в машинное плавание когда у них вычислительные ускорители стали доступны в большом количестве. В железо это дело сильно упирается и на обычных серверах выехать очень тяжело.

Но корпуса-то в любом случае собирать (и открывать) нужно.

0

Посмотреть

Диалектика нейронного машинного перевода

eiennohito 11 июн 2017 в 04:52

В статье никак не отражено, что с приходом NMT системы машинного перевода стали гораздо _проще_ по внутренней структуре. И несмотря на это оно работает и показывает приличные результаты.

А так вообще — был бы корпус внутри домена — будет роскошный перевод.

+1

Посмотреть

Как мы делали краткосрочный прогноз осадков. Лекция в Яндексе

eiennohito 7 мая 2017 в 15:59

Нейросетевая архитектура — интересное обыгрывание seq2seq с использованием конволюций.
Может быть кстати идеи из seq2seq (типа attention) как раз помогут ещё улучшить точность прогноза.

По поводу лосса: а нельзя сделать вычислить карту прогноза выпадения осадков, собрать реальные данные и минимизировать разницу между предсказаниями и фактами, давая приоритет например городу, а не лесу.

0

Посмотреть

Scala: parser combinators на примере парсера формул

eiennohito 4 апр 2017 в 10:12

У встроенных парсер-комбинаторов есть одна проблема — они ужасно тормозные. За этим исключением, почему бы и нет.

0

Посмотреть

Подводные камни для самодельной распределенности «из коробки» в С++ном акторном фреймворке

eiennohito 2 апр 2017 в 05:04

Я могу ошибаться, но TBB умеет представлять вычисления только в виде орграфа, те без циклов. akka-stream умеет в циклы в том числе.

Кроме этого, если использовать много исполнителей, делающих мелкие вычисления, то смен контекста в таком вычислительном графе будет много и ничего хорошего не выйдет. Нужно иметь какой-то баланс между проведением вычислений и передачей данных.

Корутины и continuations — это хорошо, я не спорю, оно мне самому нравится.

Задачи — они разные, решения тоже есть разные, поэтому да, нужно смотреть что лучше подходит в каждом конкретном случае. Но мне кажется, что протокол, когда обработчик говорит, сколько сообщений он может принять и не умереть (плюс возможно что делать с другими сообщениями) вполне имеет право на жизнь почти везде.

0

Посмотреть

Подводные камни для самодельной распределенности «из коробки» в С++ном акторном фреймворке

eiennohito 31 мар 2017 в 19:16

Частично, пожалуй, то, что вы говорите, частично на мой взгляд — это создание API для работы с типизированными данными.

akka-stream — это ведь не только про обработку линейных потоков данных. В akka-stream модель вычислений — граф, с циклами и прочим весельем при желании. Поэтому чисто на потоках например реализован akka-http.

Сами акторы в akka-stream используются только для разруливания проблем с concurrency (по сути единственный актор там — это GraphInterpreter, который исполняет действия над пайплайном обработки).

0

Посмотреть

Подводные камни для самодельной распределенности «из коробки» в С++ном акторном фреймворке

eiennohito 31 мар 2017 в 17:18

Я бы не сказал, что akka-stream это про акторы. Оно просто использует их для реализации процесса обработки однотипных данных и не более того.

0

Посмотреть

Подводные камни для самодельной распределенности «из коробки» в С++ном акторном фреймворке

eiennohito 31 мар 2017 в 17:15

А по поводу протоколов для доставки можете посмотреть на https://github.com/real-logic/Aeron где есть настраиваемая надёжность доставки с приоритетами поверх UDP.

+1

Посмотреть

Подводные камни для самодельной распределенности «из коробки» в С++ном акторном фреймворке

eiennohito 31 мар 2017 в 17:08

Штуки, про которые я рассказывал реализованы вместе с буферизацией на асинхронных границах http://doc.akka.io/docs/akka/2.4.14/scala/stream/stream-rate.html

Правда akka-stream штука достаточно сложная для понимания с наскока, и возможно будет лучше именно что познакомиться получше с документацией и может почитать исходники. Мне в akka-stream очень нравятся примитивы для написания собственной логики обработчиков (GraphStage), которую нельзя описать встроенными комбинаторами. Для обработки потоковых данных на мой взгляд akka-stream гораздо проще и удобнее, чем обычные акторы.

0

Посмотреть

Подводные камни для самодельной распределенности «из коробки» в С++ном акторном фреймворке

eiennohito 31 мар 2017 в 16:53

Да, для вашего юзкейса возможно правильнее дропать какие-то сообщения на получателях если они не успевают обрабатывать весь поток.
ReactiveStreams — это такой минимальный API/протокол для реализации async non-blocking backpressure. Например необязательно посылать следующий сигнал когда обработаны все текущие сообщения, можно сделать это когда есть какое-то место в буфере обработчике например.

Akka Streams например поверх протокола ReactiveStreams реализует много чего. И отбрасывание лишних сообщений, и группировку, и непосылание новых запросов.

0

Посмотреть

Подводные камни для самодельной распределенности «из коробки» в С++ном акторном фреймворке

eiennohito 31 мар 2017 в 15:45

Основная документация с TCK: http://www.reactive-streams.org/
TCK он для джавы, но одним из вдохновителей лежат авторы akka как раз.
API даже войдёт в JDK9.
https://community.oracle.com/docs/DOC-1006738

0

Посмотреть

Подводные камни для самодельной распределенности «из коробки» в С++ном акторном фреймворке

eiennohito 31 мар 2017 в 15:40

А почему нельзя реализовать протокол подобный ReactiveStreams в таком случае?
По-моему весьма удобный инструмент для работы с backpressure, у grpc тоже очень похожее внутреннее API.

0

Посмотреть

1