Pull to refresh
48
0
Пинчук Артем @Anc

User

Send message

Inductive bias и нейронные сети

Reading time17 min
Views17K

В этой статье я расскажу, что такое inductive bias, зачем он нужен и где встречается в машинном обучении. Спойлер: везде. Любая нейросеть имеет inductive bias (даже та, что в человеческом мозге, хе-хе)

Также вы узнаете:

- почему inductive bias — это очень хорошо

- способы внедрить inductive bias в модели машинного обучения

- какой inductive bias в сверточных нейросетях и как успех архитектуры Image Transformer связан с inductive bias

Ну что, поехали:
Total votes 43: ↑42 and ↓1+41
Comments19

Ученые нашли упражнение, позволяющее худеть, сидя по 10 часов в день

Reading time6 min
Views342K


Недавно опять разгорелась дискуссия, как можно похудеть, работая в IT. Так вот, хороший (и научный) способ есть, и он на самом деле проще, чем можно было бы ожидать.


Конечно, если ничего не делать, то будешь только толстеть. Средний офисный сотрудник сегодня сидит больше 10 часов в день. Мы с вами, чувствую, ещё больше, особенно если на досуге играем, читаем Хабр или смотрим ютуб. Лично меня от компьютера вообще не оттащить. Хотя читал полно исследований, говорящих о больших проблемах со здоровьем, возникающих из-за малоподвижного образа жизни.


Например, было доказано, что независимо от уровня физической активности слишком много сидения увеличивает риск сердечных заболеваний, диабета, деменции и серьезных проблем со спиной. Более половины всех людей в мире сегодня уже страдают от этих проблем, и больше 80% людей в возрасте 60+.


Решение, конечно, простое — упражнения, в любой возможной форме. Но если вы такие как я, то тренироваться скучно и тяжело, правда? Большинство из нас ненавидят физкультуру. К тому же, на это нет лишнего времени. Бонусные часы каждый день магически не появятся.


Но похоже, есть способ ускорить обмен веществ в организме, даже сидя за ПК. И точно избежать проблем с метаболизмом и ожирением. Несколько недель назад вышла работа ученых под руководством Марка Гамильтона из Хьюстонского университета. Они разработали технику, позволяющую задействовать неожиданное свойство икроножных мышц, и делать для своего организма полноценную тренировку, не вставая со стула. Оказывается, похудеть, работая в IT, — это не так уж и сложно. Испытываю на себе, полёт нормальный. А какие у вас ноги будут прокачанные!

Читать дальше →
Total votes 179: ↑165 and ↓14+151
Comments296

Проблемы современного машинного обучения

Reading time41 min
Views41K

Во многих популярных курсах машинного и глубокого обучения вас научат классифицировать собак и кошек, предсказывать цены на недвижимость, покажут еще десятки задач, в которых машинное обучение, вроде как, отлично работает. Но вам расскажут намного меньше (или вообще ничего) о тех случаях, когда ML-модели не работают так, как ожидалось.

Частой проблемой в машинном обучении является неспособность ML-моделей корректно работать на большем разнообразии примеров, чем те, что встречались при обучении. Здесь идет речь не просто о других примерах (например, тестовых), а о других типах примеров. Например, сеть обучалась на изображениях коровы, в которых чаще всего корова был на фоне травы, а при тестировании требуется корректное распознавание коровы на любом фоне. Почему ML-модели часто не справляются с такой задачей и что с этим делать – мы рассмотрим далее. Работа над этой проблемой важна не только для решения практических задач, но и в целом для дальнейшего развития ИИ.

Читать далее
Total votes 104: ↑103 and ↓1+102
Comments26

GTD за 15 минут: прагматическое руководство

Reading time14 min
Views31K

GTD (Getting Things Done, Доведение дел до завершения) — это методика организации и отслеживания задач и проектов. Но эта методика, правда, ориентирована на нечто большее, чем только на «доведение дел до завершения». (Ей стоило бы называться «Доведение дел до завершения гораздо лучшим способом, чем просто позволяя чему-то идти своим чередом, что часто получается не так, чтобы очень уж хорошо»). Цель GTD — сделать так, чтобы человек полностью доверял бы системе сбора задач, идей и проектов. Это относится и к туманным задачам, вроде «сделать самое великое изобретение», и к конкретным делам, вроде «позвонить Аде 25 августа чтобы обсудить программу конференции». Речь идёт абсолютно обо всём!

Читать далее
Total votes 29: ↑27 and ↓2+25
Comments12

Краткий обзор результатов взаимодействия между нейронауками  и индустрией искусственного интеллекта. Перевод статьи

Reading time29 min
Views4.3K

Перевод статьи "Natural and Artificial Intelligence: A brief introduction to the interplay between AI and neuroscience research", опубликованной в сентябре 2021 года.

Оригинал статьи

Исходно перевод делался на скорую руку, для собственных прикладных задач и не для открытой публикации, поэтому материал вышел в черновом виде со множеством возможностей для коррекции и адаптации. Прикладные задачи здесь - нейропсихология, психиатрия, психология и решения в области ИИ.

В таком виде его и публикую. Надеюсь, что окажется полезен как для профессионалов, так и для всех интересующихся темой.

Краткий обзор результатов взаимодействия между нейронауками  и индустрией искусственного интеллекта.

Читать далее
Total votes 8: ↑8 and ↓0+8
Comments2

Взлом мозгов. Сбор данных из социальных сетей

Reading time7 min
Views21K

Взлом компьютера, телефона, электроподстанции, беспилотника или даже целого города – кого этим удивишь?

Взлом мозгов сотен миллионов людей – вот это впечатляет! США, Великобритания и граждане стран третьего мира попали под влияние компании SCL Group и ее дочерних организаций, особенно на слуху была и останется теперь навечно Кембридж Аналитика.

Этот цикл рассказывает историю SCL и ее дочерних компаний глазами бывшего директора по исследованиям – Кристофера Уайли. Перед вами третья часть, и посвящена она различным методикам сбора приватных данных и тому, как команда психологов и аналитиков построила невероятно точную модель американского общества. Удивительно, порой, как плотно гуманитарные науки могут смыкаться с сугубо техническими.

Первая и вторая части, напомню, есть на Хабре и доступны также по ссылке внизу, в блоке навигации.

Читать далее
Total votes 42: ↑36 and ↓6+30
Comments2

Как запуститься на Product Hunt (как я получил 300 регистраций в США за одни сутки, бесплатно)

Reading time4 min
Views5.1K

Всегда хотел зарабатывать в Штатах, но не знал, как получить первых клиентов. Через 4 недели, мы запустились на Product Hunt и получили 300 регистраций за одну ночь, бесплатно. Как повторить - читайте пошаговую инструкцию в статье.

Читать далее
Total votes 6: ↑6 and ↓0+6
Comments1

GPT для чайников: от токенизации до файнтюнинга

Reading time13 min
Views90K

К моему удивлению, в открытом доступе оказалось не так уж много подробных и понятных объяснений того как работает модель GPT от OpenAI. Поэтому я решил всё взять в свои руки и написать этот туториал.

Читать далее
Total votes 31: ↑30 and ↓1+29
Comments8

Исчерпывающее руководство Getting Things Done (GTD) метода с примерами

Reading time10 min
Views94K
В данной статье вы узнаете о методе, помогающем привести в порядок все ваши дела от самых крупных и важных, до тех, что еще только появились в голове.

Я и сама не понаслышке знаю, как сложно перейти от мыслей и планирования к реальным действиям, как не только организовать первостепенные задачи, но и не упустить из вида ценные детали информации.

Я подробно разберу на практике все шаги Getting Things Done метода и вы получите четкую инструкцию к действию (Как привести дела в порядок). Вы сможете не только эффективно организовать свои дела, но и найти больше возможностей для создания новых идей, применяя данную инструкцию на практике.


Читать дальше →
Total votes 16: ↑14 and ↓2+12
Comments18

Как переключиться с менталитета нищего на менталитет серийного стартапера из Кремниевой долины

Reading time9 min
Views16K

Почему так «мало успешных основателей стартапов, которые выросли в полной нищете»


image


Рикки Йен (в центре), дважды фаундер Y Combinator: Crowdbooster (S10) и Flow Club (S21)

Всем привет!
Я собрал в одном месте Founders at work: 150+ историй основателей стартапов, которые прошли Y Combinator. Сегодня хочу поделиться переводом про путь Рикки Йена, нищего студента-эмигранта из Тайваня не знающего английского языка с безработным отцом на шее.


Мой кофаундер Дэвид и я оба выросли в нищете и можем назвать себя “закаленными в бою”, когда речь заходит как о жизни, так и о стартапах. Поэтому, когда разговор в Кремниевой Долине зашел о неравенстве доходов, то мы навострили уши. На мгновение наши прошлое и настоящее соприкоснулись. Вот цитата Пола Грэма, которая привлекла наше внимание.

“С бедностью тесно связано отсутствие социальной мобильности. Я сам это видел: вам не нужно расти богатым или даже принадлежать к верхнему среднему классу, чтобы разбогатеть как основатель стартапа, но очень немногие успешные основатели выросли в крайней бедности ”. (Источник)


Грэм был прав, и это правда, которую мы хорошо осознаем как основатели стартапов. Мало того, что все карты против нас, чтобы просто иметь возможность основать стартап, но создать и поддерживать компанию, которая “предназначена для быстрого роста”, особенно сложно, если вы выросли в крайней бедности. Мы с Дэвидом боролись с этой идеей с момента основания нашей компании в 2010 году, и у нас это неплохо получилось. Главная проблема заключается в том, что мы с Дэвидом называем неравенством мировоззрения. Чтобы по-настоящему понять это, вам придется влезть в мою шкуру. Позвольте мне пригласить вас в мою личную историю.
Читать дальше →
Total votes 66: ↑47 and ↓19+28
Comments137

Взлом мозгов. Работа с источниками данных

Reading time7 min
Views5.4K

Взлом компьютера, телефона, электроподстанции, беспилотника или даже целого города – кого этим удивишь?

Взлом мозгов сотен миллионов людей – вот это впечатляет! США, Великобритания и граждане стран третьего мира попали под влияние компании SCL Group и ее дочерних организаций, особенно на слуху была (и останется теперь навечно) Кембридж Аналитика.

Этот цикл рассказывает историю SCL и ее дочерних компаний глазами бывшего директора по исследованиям – Кристофера Уайли. О том, как 24-летний либеральный канадский гей с пирсингом в носу и розовыми волосами оказался в составе британского военного подрядчика, разработал инструменты психологической войны для американских ультра-правых и рассказал об этом всему миру. Это вторая часть, и посвящена она работе с источниками данных о людях и их предпочтениях, а также исследованиям в области применимости этих данных к некоторым манипуляциям. Удивительно, порой, как плотно гуманитарные науки могут смыкаться с техническими.

Первая часть, напомню, есть на Хабре и доступна также по ссылке внизу, в блоке навигации.

Читать далее
Total votes 27: ↑21 and ↓6+15
Comments2

Объяснение фильтра Калмана в картинках

Reading time9 min
Views41K
image

Я обязан рассказать вам о фильтре Калмана, потому что он выполняет просто потрясающую задачу.

Как ни удивительно, о нём, похоже, знают немногие разработчики ПО и учёные, и это печалит меня, потому что это очень обобщённый и мощный инструмент для объединения информации в условиях присутствия неопределённости. Иногда его способность извлечения точной информации кажется почти магической, а если вы думаете, что я слишком много болтаю, то взгляните на это видео, в котором я показываю, как фильтр Калмана определяет ориентацию свободно плавающего тела, посмотрев на его вектор скорости. Потрясающе!
Читать дальше →
Total votes 116: ↑116 and ↓0+116
Comments31

Обзорная экскурсия в криптографически стойкие генераторы псевдослучайных чисел

Reading time14 min
Views7.6K

Случайные числа c давних времен и по сей день используются во множестве отраслей. Это и научные исследования, которым необходима возможность формировать случайные выборки, и компьютерное моделирование физических процессов, и численных анализ, и даже компьютерные и азартные игры. А самое главное - криптография.

Читать далее
Total votes 21: ↑20 and ↓1+19
Comments7

Нейросеть, способная объяснить себе задачу: P-tuning для YaLM

Reading time9 min
Views16K

Мы уже рассказывали о том, как применили семейство генеративных нейросетей YaLM для подготовки ответов в Поиске, Алисе или даже в Балабобе. Главная особенность наших моделей — метод few-shot learning, который позволяет без дополнительного обучения решать большинство задач в области обработки естественного языка. Достаточно лишь подготовить подводку на человеческом языке — и модель сгенерирует текст. Но что, если это не самый оптимальный путь?

Сегодня я расскажу читателям Хабра про апгрейд этого метода под названием P-tuning. Вы узнаете про недостатки оригинального метода few-shot и преимущества нового подхода. Покажу, где он уже применяется на примере покемонов. Добро пожаловать под кат.
Читать дальше →
Total votes 32: ↑32 and ↓0+32
Comments6

Наглядно о том, почему трансформеры работают настолько хорошо

Reading time8 min
Views10K

Трансформеры за последние несколько лет штурмом захватили мир NLP, а сегодня они с успехом применяются в выходящих за рамки NLP приложениях. Они обладают такими возможностями благодаря модулю внимания, который схватывает отношения между всеми словами последовательностей. Но самый важный вопрос — как именно трансформеры делают это? Попытаемся ответить и понять, почему трансформеры способны выполнять такие вычисления. Итак, цель статьи, чуть сокращённым переводом которой мы делимся к старту курса о машинном и глубоком обучении, — разобраться не только с тем, как что-то работает, но и почему работает так. Чтобы понять, что движет трансформерами, мы должны сосредоточиться на модуле внимания. Начнём с входных данных и посмотрим, как они обрабатываются.

Читать далее
Total votes 17: ↑15 and ↓2+13
Comments4

Ася Казанцева: Движение улучшает мозг

Reading time3 min
Views33K
image

У Аси Казанцевой есть три видеозаписи лекции «Как спорт влияет на мозг?» (раз, два, три). Кому лень смотреть, предлагаю глянуть мой опорный конспект на 5-10 минут и понять, почему лучше быть бегуном, чем качком.

  • Кардио влияет на мозг лучше силовых.
  • Даже единоразовая часовая тренировка улучшает работу мозга.
  • Если сильно упарываться, то в мозг поступает меньше кислорода.
  • Человек бегает эффективнее лошади (на длинные/долгие дистанции).
  • Бегать добровольно лучше, чем по принуждению.
  • Если ты тренился 30 лет, а потом бросил — то мозг засыхает.
  • Даже 15 минут ходьбы в день дает +3 года жизни.
Читать дальше →
Total votes 97: ↑85 and ↓12+73
Comments90

Организация памяти в текстовом редакторе

Reading time6 min
Views35K
Каждый, кто пытался запрограммировать хотя бы простейший редактор текста на низком уровне, сталкивался с задачей организации памяти для хранения редактируемого текста. Структура данных для хранения текста должна удовлетворять следующим требованиям:
  1. иметь малые накладные расходы по памяти. Большая часть доступной памяти должна использоваться для хранения текста, а не служебной информации;
  2. допускать эффективную вставку и удаление в произвольном месте текста.

Удовлетворить эти требования одновременно непросто. Если рассмотреть широкоизвестные структуры данных, такие как массивы, списки, деревья, стеки, очереди, кольцевые буфера — то такой структуры, которая бы позволила эффективно выполнить оба требования, не встречается. В случае массива имеем незначительные накладные расходы по памяти, но операция вставки имеет сложность O(n), где n — размер редактируемого текста. В случае списка сложность вставки и удаления составляет O(1), однако накладные расходы по памяти в несколько раз превышают размер собственно текста. Деревья, кучи, кольцевые буфера, ассоциативные массивы и прочие структуры и вовсе неприменимы для хранения текста в редакторе.

Встречаются гибридные решения, когда текст хранится в наборе массивов, которые, в свою очередь, объединены в список. Казалось бы, такой подход позволяет объединить преимущества массивов и списков (быстрая вставка/удаление при низких накладных расходах по памяти). Однако такое решение сложно в реализации. Также оно приводит к фрагментации памяти.

Предлагаю вашему вниманию эффективную структуру данных для хранения редактируемого текста, которая проста в реализации, имеет константные накладные расходы по памяти и быструю вставку/удаление в произвольном месте. Также она позволяет эффективно редактировать файлы, которые целиком не умещаются в оперативную память.

Несмотря на то, что эта структура данных была открыта давно и использовалась в текстовых редакторах на старых ЭВМ в 8-битную эпоху, это тайное знание предков было в значительной мере утеряно и в современных редакторах встречается редко. Попробуйте открыть файл, состоящий из одной строки мегабайт на 10, в Notepad или Far. Вставка и удаление символов будет длиться секундами.
Читать дальше →
Total votes 126: ↑119 and ↓7+112
Comments57

Здоровый сон взрослого человека — это засыпать за 15 минут и не вставать ночью попить и пописать

Reading time13 min
Views162K


Послушала на днях 2х-часовое выступление «Здоровый сон» врача-невролога, сомнолога Елены Царевой. Выдернула самые важные для себя пункты:

  1. Спать регулярно, ложиться и вставать в одно и то же время — самое важное. 
  2. Биоритмы — частично наследуются, частично регулируются стилем жизни. На них можно влиять самому.
  3. Нормальное время отхода ко сну около 22:00. Сова и жаворонок — это отклонение на ±1-2 часа. Больше — это нарушение и сдвиг фазы сна, чаще из-за внешних раздражителей.
  4. Самая частая причина плохого сна и тяжелого засыпания — неправильный свет.
  5. Для сдвига режима на 1 час организму нужен 1 день на адаптацию.
  6. Невозможно «доспать» бессонную ночь. Досыпание устраняет только 30% последствий недосыпа.
  7. Прежде, чем искать причины плохого сна, исключите психологические проблемы (тревожность, депрессию), нарушения щитовидки, дефицит железа, диабеты, сердечно-сосудистые заболевания и патологию почек и мочеполовой системы.
  8. Водителям и пассажирам: 17 часов без сна равны 0,5 промилле, 21 час без сна — 0,8 промилле.
  9. В постели без сна больше 15 минут не находиться — совет при бессоннице. 
  10. Самые физиологичные будильники — те, что светятся. 

Под катом конспект 2х-часового выступления про сон на 15 минут чтения. Еще один поинт в копилку полезных материалов про сон — Sleep Hackers.
Читать дальше →
Total votes 169: ↑149 and ↓20+129
Comments247

Ася Казанцева: как мыслеблуждание и прокрастинация влияют на память и инсайты

Reading time6 min
Views27K
image

Недавно Ася Казанцева выступила с лекцией «Не забудьте побездельничать». Привожу 10-минутный конспект со ссылками на оригинальные исследования, чтобы можно было принять решение, стоит ли тратить 2 часа на полный просмотр лекции.

  • Думать над творческой задачей в ванной так же эффективно, как и на рабочем месте, а в кровати — еще в два раза эффективнее.
  • 47% времени мы думаем не о том, чем заняты.
  • Мыслеблуждание не делает людей счастливее. Фокусируешься на деле = более счастлив.
  • Подсознательное восприятие: когда слепые огибают препятствия или когда мы принимаем решения на основе предпороговых сигналов.
  • Как картинки голых людей влияют на выбор.
  • Польза и вред прокрастинации. Академические исследования.
  • Способы хакнуть прокрастинацию. Новый комп без соцсетей, влюбиться, лайвстримить.

Читать дальше →
Total votes 73: ↑63 and ↓10+53
Comments29

Нейродайджест: главное из области машинного обучения за сентябрь 2021

Reading time4 min
Views4.4K

Первая бестекстовая NLP-модель от FAIR, предсказание погоды от DeepMind, неожиданное применение CLIP в робототехнике и много другое в сентябрьской подборке:

Перейти к обзору
Total votes 19: ↑19 and ↓0+19
Comments0
1
23 ...

Information

Rating
Does not participate
Location
Киев, Киевская обл., Украина
Registered
Activity