Articles / Bookmarks / Profile of Anc / Habr

Пинчук Артем @Anc

User

Profile Publications 9Comments 141Bookmarks 281

Atmyre Nov 26 2021 at 12:21

Inductive bias и нейронные сети

17 min

17K

Image processing*Machine learning*Artificial Intelligence

From sandbox

В этой статье я расскажу, что такое inductive bias, зачем он нужен и где встречается в машинном обучении. Спойлер: везде. Любая нейросеть имеет inductive bias (даже та, что в человеческом мозге, хе-хе)

Также вы узнаете:

- почему inductive bias — это очень хорошо

- способы внедрить inductive bias в модели машинного обучения

- какой inductive bias в сверточных нейросетях и как успех архитектуры Image Transformer связан с inductive bias

Ну что, поехали:

+41

Arnak Oct 18 2022 at 10:04

Ученые нашли упражнение, позволяющее худеть, сидя по 10 часов в день

6 min

342K

Lifehacks for geeksHealthgetmatch corporate blog

Недавно опять разгорелась дискуссия, как можно похудеть, работая в IT. Так вот, хороший (и научный) способ есть, и он на самом деле проще, чем можно было бы ожидать.

Конечно, если ничего не делать, то будешь только толстеть. Средний офисный сотрудник сегодня сидит больше 10 часов в день. Мы с вами, чувствую, ещё больше, особенно если на досуге играем, читаем Хабр или смотрим ютуб. Лично меня от компьютера вообще не оттащить. Хотя читал полно исследований, говорящих о больших проблемах со здоровьем, возникающих из-за малоподвижного образа жизни.

Например, было доказано, что независимо от уровня физической активности слишком много сидения увеличивает риск сердечных заболеваний, диабета, деменции и серьезных проблем со спиной. Более половины всех людей в мире сегодня уже страдают от этих проблем, и больше 80% людей в возрасте 60+.

Решение, конечно, простое — упражнения, в любой возможной форме. Но если вы такие как я, то тренироваться скучно и тяжело, правда? Большинство из нас ненавидят физкультуру. К тому же, на это нет лишнего времени. Бонусные часы каждый день магически не появятся.

Но похоже, есть способ ускорить обмен веществ в организме, даже сидя за ПК. И точно избежать проблем с метаболизмом и ожирением. Несколько недель назад вышла работа ученых под руководством Марка Гамильтона из Хьюстонского университета. Они разработали технику, позволяющую задействовать неожиданное свойство икроножных мышц, и делать для своего организма полноценную тренировку, не вставая со стула. Оказывается, похудеть, работая в IT, — это не так уж и сложно. Испытываю на себе, полёт нормальный. А какие у вас ноги будут прокачанные!

Читать дальше →

+151

296

boygenius Feb 14 2022 at 13:30

Проблемы современного машинного обучения

41 min

41K

Machine learning*Open Data Science corporate blogPopular scienceArtificial IntelligenceNatural Language Processing*

Technotext 2021

Во многих популярных курсах машинного и глубокого обучения вас научат классифицировать собак и кошек, предсказывать цены на недвижимость, покажут еще десятки задач, в которых машинное обучение, вроде как, отлично работает. Но вам расскажут намного меньше (или вообще ничего) о тех случаях, когда ML-модели не работают так, как ожидалось.

Частой проблемой в машинном обучении является неспособность ML-моделей корректно работать на большем разнообразии примеров, чем те, что встречались при обучении. Здесь идет речь не просто о других примерах (например, тестовых), а о других типах примеров. Например, сеть обучалась на изображениях коровы, в которых чаще всего корова был на фоне травы, а при тестировании требуется корректное распознавание коровы на любом фоне. Почему ML-модели часто не справляются с такой задачей и что с этим делать – мы рассмотрим далее. Работа над этой проблемой важна не только для решения практических задач, но и в целом для дальнейшего развития ИИ.

+102

mr-pickles Feb 1 2022 at 15:35

GTD за 15 минут: прагматическое руководство

14 min

31K

Wunder Fund corporate blogProject management*GTD*Product Management*

Translation

GTD (Getting Things Done, Доведение дел до завершения) — это методика организации и отслеживания задач и проектов. Но эта методика, правда, ориентирована на нечто большее, чем только на «доведение дел до завершения». (Ей стоило бы называться «Доведение дел до завершения гораздо лучшим способом, чем просто позволяя чему-то идти своим чередом, что часто получается не так, чтобы очень уж хорошо»). Цель GTD — сделать так, чтобы человек полностью доверял бы системе сбора задач, идей и проектов. Это относится и к туманным задачам, вроде «сделать самое великое изобретение», и к конкретным делам, вроде «позвонить Аде 25 августа чтобы обсудить программу конференции». Речь идёт абсолютно обо всём!

+25

AImbidexter Jan 28 2022 at 15:35

Краткий обзор результатов взаимодействия между нейронауками и индустрией искусственного интеллекта. Перевод статьи

29 min

4.3K

Artificial IntelligenceBrain

From sandbox

Translation

Перевод статьи "Natural and Artificial Intelligence: A brief introduction to the interplay between AI and neuroscience research", опубликованной в сентябре 2021 года.

Оригинал статьи

Исходно перевод делался на скорую руку, для собственных прикладных задач и не для открытой публикации, поэтому материал вышел в черновом виде со множеством возможностей для коррекции и адаптации. Прикладные задачи здесь - нейропсихология, психиатрия, психология и решения в области ИИ.

В таком виде его и публикую. Надеюсь, что окажется полезен как для профессионалов, так и для всех интересующихся темой.

Краткий обзор результатов взаимодействия между нейронауками и индустрией искусственного интеллекта.

Catx2 Jan 28 2022 at 13:50

Взлом мозгов. Сбор данных из социальных сетей

7 min

21K

Information Security*Popular scienceSocial networks and communitiesThe future is here

Взлом компьютера, телефона, электроподстанции, беспилотника или даже целого города – кого этим удивишь?

Взлом мозгов сотен миллионов людей – вот это впечатляет! США, Великобритания и граждане стран третьего мира попали под влияние компании SCL Group и ее дочерних организаций, особенно на слуху была и останется теперь навечно Кембридж Аналитика.

Этот цикл рассказывает историю SCL и ее дочерних компаний глазами бывшего директора по исследованиям – Кристофера Уайли. Перед вами третья часть, и посвящена она различным методикам сбора приватных данных и тому, как команда психологов и аналитиков построила невероятно точную модель американского общества. Удивительно, порой, как плотно гуманитарные науки могут смыкаться с сугубо техническими.

Первая и вторая части, напомню, есть на Хабре и доступны также по ссылке внизу, в блоке навигации.

+30

Ipukhov Jan 26 2022 at 10:18

Как запуститься на Product Hunt (как я получил 300 регистраций в США за одни сутки, бесплатно)

4 min

5.1K

Language localisation*Growth Hacking*Internet marketing*

Tutorial

Всегда хотел зарабатывать в Штатах, но не знал, как получить первых клиентов. Через 4 недели, мы запустились на Product Hunt и получили 300 регистраций за одну ночь, бесплатно. Как повторить - читайте пошаговую инструкцию в статье.

Razant Jan 8 2022 at 17:45

GPT для чайников: от токенизации до файнтюнинга

13 min

90K

Semantics*Programming*Machine learning*Natural Language Processing*

Tutorial

Technotext 2022

К моему удивлению, в открытом доступе оказалось не так уж много подробных и понятных объяснений того как работает модель GPT от OpenAI. Поэтому я решил всё взять в свои руки и написать этот туториал.

+29

abbey Jan 6 2022 at 12:19

Исчерпывающее руководство Getting Things Done (GTD) метода с примерами

10 min

94K

Interfaces*Project management*GTD*Product Management*Reading room

Translation

В данной статье вы узнаете о методе, помогающем привести в порядок все ваши дела от самых крупных и важных, до тех, что еще только появились в голове.

Я и сама не понаслышке знаю, как сложно перейти от мыслей и планирования к реальным действиям, как не только организовать первостепенные задачи, но и не упустить из вида ценные детали информации.

Я подробно разберу на практике все шаги Getting Things Done метода и вы получите четкую инструкцию к действию (Как привести дела в порядок). Вы сможете не только эффективно организовать свои дела, но и найти больше возможностей для создания новых идей, применяя данную инструкцию на практике.

Читать дальше →

+12

MagisterLudi Dec 30 2021 at 18:35

Как переключиться с менталитета нищего на менталитет серийного стартапера из Кремниевой долины

9 min

16K

Studying in ITStart-up developmentIT careerPopular scienceLifehacks for geeks

Translation

Почему так «мало успешных основателей стартапов, которые выросли в полной нищете»

Рикки Йен (в центре), дважды фаундер Y Combinator: Crowdbooster (S10) и Flow Club (S21)

Всем привет!
Я собрал в одном месте Founders at work: 150+ историй основателей стартапов, которые прошли Y Combinator. Сегодня хочу поделиться переводом про путь Рикки Йена, нищего студента-эмигранта из Тайваня не знающего английского языка с безработным отцом на шее.

Мой кофаундер Дэвид и я оба выросли в нищете и можем назвать себя “закаленными в бою”, когда речь заходит как о жизни, так и о стартапах. Поэтому, когда разговор в Кремниевой Долине зашел о неравенстве доходов, то мы навострили уши. На мгновение наши прошлое и настоящее соприкоснулись. Вот цитата Пола Грэма, которая привлекла наше внимание.

“С бедностью тесно связано отсутствие социальной мобильности. Я сам это видел: вам не нужно расти богатым или даже принадлежать к верхнему среднему классу, чтобы разбогатеть как основатель стартапа, но очень немногие успешные основатели выросли в крайней бедности ”. (Источник)

Грэм был прав, и это правда, которую мы хорошо осознаем как основатели стартапов. Мало того, что все карты против нас, чтобы просто иметь возможность основать стартап, но создать и поддерживать компанию, которая “предназначена для быстрого роста”, особенно сложно, если вы выросли в крайней бедности. Мы с Дэвидом боролись с этой идеей с момента основания нашей компании в 2010 году, и у нас это неплохо получилось. Главная проблема заключается в том, что мы с Дэвидом называем неравенством мировоззрения. Чтобы по-настоящему понять это, вам придется влезть в мою шкуру. Позвольте мне пригласить вас в мою личную историю.

Читать дальше →

+28

137

Catx2 Dec 23 2021 at 14:41

Взлом мозгов. Работа с источниками данных

7 min

5.4K

Information Security*Popular scienceSocial networks and communitiesThe future is here

Взлом компьютера, телефона, электроподстанции, беспилотника или даже целого города – кого этим удивишь?

Взлом мозгов сотен миллионов людей – вот это впечатляет! США, Великобритания и граждане стран третьего мира попали под влияние компании SCL Group и ее дочерних организаций, особенно на слуху была (и останется теперь навечно) Кембридж Аналитика.

Этот цикл рассказывает историю SCL и ее дочерних компаний глазами бывшего директора по исследованиям – Кристофера Уайли. О том, как 24-летний либеральный канадский гей с пирсингом в носу и розовыми волосами оказался в составе британского военного подрядчика, разработал инструменты психологической войны для американских ультра-правых и рассказал об этом всему миру. Это вторая часть, и посвящена она работе с источниками данных о людях и их предпочтениях, а также исследованиям в области применимости этих данных к некоторым манипуляциям. Удивительно, порой, как плотно гуманитарные науки могут смыкаться с техническими.

Первая часть, напомню, есть на Хабре и доступна также по ссылке внизу, в блоке навигации.

+15

PatientZero Dec 21 2021 at 11:00

Объяснение фильтра Калмана в картинках

9 min

41K

Algorithms*Mathematics*

Translation

Я обязан рассказать вам о фильтре Калмана, потому что он выполняет просто потрясающую задачу.

Как ни удивительно, о нём, похоже, знают немногие разработчики ПО и учёные, и это печалит меня, потому что это очень обобщённый и мощный инструмент для объединения информации в условиях присутствия неопределённости. Иногда его способность извлечения точной информации кажется почти магической, а если вы думаете, что я слишком много болтаю, то взгляните на это видео, в котором я показываю, как фильтр Калмана определяет ориентацию свободно плавающего тела, посмотрев на его вектор скорости. Потрясающе!

Читать дальше →

+116

kseniyadavydova Dec 16 2021 at 04:53

Обзорная экскурсия в криптографически стойкие генераторы псевдослучайных чисел

14 min

7.6K

Information Security*

Случайные числа c давних времен и по сей день используются во множестве отраслей. Это и научные исследования, которым необходима возможность формировать случайные выборки, и компьютерное моделирование физических процессов, и численных анализ, и даже компьютерные и азартные игры. А самое главное - криптография.

+19

roman-gorb Nov 10 2021 at 11:29

Нейросеть, способная объяснить себе задачу: P-tuning для YaLM

9 min

16K

Search engines*Яндекс corporate blogAlgorithms*Machine learning*Artificial Intelligence

Мы уже рассказывали о том, как применили семейство генеративных нейросетей YaLM для подготовки ответов в Поиске, Алисе или даже в Балабобе. Главная особенность наших моделей — метод few-shot learning, который позволяет без дополнительного обучения решать большинство задач в области обработки естественного языка. Достаточно лишь подготовить подводку на человеческом языке — и модель сгенерирует текст. Но что, если это не самый оптимальный путь?

Сегодня я расскажу читателям Хабра про апгрейд этого метода под названием P-tuning. Вы узнаете про недостатки оригинального метода few-shot и преимущества нового подхода. Покажу, где он уже применяется на примере покемонов. Добро пожаловать под кат.

Читать дальше →

+32

factorial42 Jun 20 2021 at 17:17

Наглядно о том, почему трансформеры работают настолько хорошо

8 min

10K

Entertaining tasksMathematics*Skillfactory corporate blogArtificial IntelligenceNatural Language Processing*

Translation

Трансформеры за последние несколько лет штурмом захватили мир NLP, а сегодня они с успехом применяются в выходящих за рамки NLP приложениях. Они обладают такими возможностями благодаря модулю внимания, который схватывает отношения между всеми словами последовательностей. Но самый важный вопрос — как именно трансформеры делают это? Попытаемся ответить и понять, почему трансформеры способны выполнять такие вычисления. Итак, цель статьи, чуть сокращённым переводом которой мы делимся к старту курса о машинном и глубоком обучении, — разобраться не только с тем, как что-то работает, но и почему работает так. Чтобы понять, что движет трансформерами, мы должны сосредоточиться на модуле внимания. Начнём с входных данных и посмотрим, как они обрабатываются.

+13

MagisterLudi Oct 20 2021 at 17:00

Ася Казанцева: Движение улучшает мозг

3 min

33K

Timeweb Cloud corporate blogPopular scienceBrainHealth

У Аси Казанцевой есть три видеозаписи лекции «Как спорт влияет на мозг?» (раз, два, три). Кому лень смотреть, предлагаю глянуть мой опорный конспект на 5-10 минут и понять, почему лучше быть бегуном, чем качком.

Кардио влияет на мозг лучше силовых.
Даже единоразовая часовая тренировка улучшает работу мозга.
Если сильно упарываться, то в мозг поступает меньше кислорода.
Человек бегает эффективнее лошади (на длинные/долгие дистанции).
Бегать добровольно лучше, чем по принуждению.
Если ты тренился 30 лет, а потом бросил — то мозг засыхает.
Даже 15 минут ходьбы в день дает +3 года жизни.

Читать дальше →

+73

MichaelBorisov Oct 19 2013 at 16:46

Организация памяти в текстовом редакторе

6 min

35K

Programming*Algorithms*

Каждый, кто пытался запрограммировать хотя бы простейший редактор текста на низком уровне, сталкивался с задачей организации памяти для хранения редактируемого текста. Структура данных для хранения текста должна удовлетворять следующим требованиям:

иметь малые накладные расходы по памяти. Большая часть доступной памяти должна использоваться для хранения текста, а не служебной информации;
допускать эффективную вставку и удаление в произвольном месте текста.

Удовлетворить эти требования одновременно непросто. Если рассмотреть широкоизвестные структуры данных, такие как массивы, списки, деревья, стеки, очереди, кольцевые буфера — то такой структуры, которая бы позволила эффективно выполнить оба требования, не встречается. В случае массива имеем незначительные накладные расходы по памяти, но операция вставки имеет сложность O(n), где n — размер редактируемого текста. В случае списка сложность вставки и удаления составляет O(1), однако накладные расходы по памяти в несколько раз превышают размер собственно текста. Деревья, кучи, кольцевые буфера, ассоциативные массивы и прочие структуры и вовсе неприменимы для хранения текста в редакторе.

Встречаются гибридные решения, когда текст хранится в наборе массивов, которые, в свою очередь, объединены в список. Казалось бы, такой подход позволяет объединить преимущества массивов и списков (быстрая вставка/удаление при низких накладных расходах по памяти). Однако такое решение сложно в реализации. Также оно приводит к фрагментации памяти.

Предлагаю вашему вниманию эффективную структуру данных для хранения редактируемого текста, которая проста в реализации, имеет константные накладные расходы по памяти и быструю вставку/удаление в произвольном месте. Также она позволяет эффективно редактировать файлы, которые целиком не умещаются в оперативную память.

Несмотря на то, что эта структура данных была открыта давно и использовалась в текстовых редакторах на старых ЭВМ в 8-битную эпоху, это тайное знание предков было в значительной мере утеряно и в современных редакторах встречается редко. Попробуйте открыть файл, состоящий из одной строки мегабайт на 10, в Notepad или Far. Вставка и удаление символов будет длиться секундами.

Читать дальше →

+112

Asya_Dyu Oct 13 2021 at 17:05

Здоровый сон взрослого человека — это засыпать за 15 минут и не вставать ночью попить и пописать

13 min

162K

Timeweb Cloud corporate blogGTD*Popular scienceHealthBiology

Послушала на днях 2х-часовое выступление «Здоровый сон» врача-невролога, сомнолога Елены Царевой. Выдернула самые важные для себя пункты:

Спать регулярно, ложиться и вставать в одно и то же время — самое важное.
Биоритмы — частично наследуются, частично регулируются стилем жизни. На них можно влиять самому.
Нормальное время отхода ко сну около 22:00. Сова и жаворонок — это отклонение на ±1-2 часа. Больше — это нарушение и сдвиг фазы сна, чаще из-за внешних раздражителей.
Самая частая причина плохого сна и тяжелого засыпания — неправильный свет.
Для сдвига режима на 1 час организму нужен 1 день на адаптацию.
Невозможно «доспать» бессонную ночь. Досыпание устраняет только 30% последствий недосыпа.
Прежде, чем искать причины плохого сна, исключите психологические проблемы (тревожность, депрессию), нарушения щитовидки, дефицит железа, диабеты, сердечно-сосудистые заболевания и патологию почек и мочеполовой системы.
Водителям и пассажирам: 17 часов без сна равны 0,5 промилле, 21 час без сна — 0,8 промилле.
В постели без сна больше 15 минут не находиться — совет при бессоннице.
Самые физиологичные будильники — те, что светятся.

Под катом конспект 2х-часового выступления про сон на 15 минут чтения. Еще один поинт в копилку полезных материалов про сон — Sleep Hackers.

Читать дальше →

+129

247

MagisterLudi Oct 9 2021 at 10:12

Ася Казанцева: как мыслеблуждание и прокрастинация влияют на память и инсайты

6 min

27K

Timeweb Cloud corporate blogGTD*Popular scienceLifehacks for geeksBrain

Недавно Ася Казанцева выступила с лекцией «Не забудьте побездельничать». Привожу 10-минутный конспект со ссылками на оригинальные исследования, чтобы можно было принять решение, стоит ли тратить 2 часа на полный просмотр лекции.

Думать над творческой задачей в ванной так же эффективно, как и на рабочем месте, а в кровати — еще в два раза эффективнее.
47% времени мы думаем не о том, чем заняты.
Мыслеблуждание не делает людей счастливее. Фокусируешься на деле = более счастлив.
Подсознательное восприятие: когда слепые огибают препятствия или когда мы принимаем решения на основе предпороговых сигналов.
Как картинки голых людей влияют на выбор.
Польза и вред прокрастинации. Академические исследования.
Способы хакнуть прокрастинацию. Новый комп без соцсетей, влюбиться, лайвстримить.

Читать дальше →

+53

worksolutions Oct 7 2021 at 08:00

Нейродайджест: главное из области машинного обучения за сентябрь 2021

4 min

4.4K

Python*Machine learning*Artificial IntelligenceTensorFlow*

Первая бестекстовая NLP-модель от FAIR, предсказание погоды от DeepMind, неожиданное применение CLIP в робототехнике и много другое в сентябрьской подборке:

Перейти к обзору

+19

2 3 ...

13 14