Pull to refresh
32
0
Sergey Aganezov @Karde

Genomics Scientist

Send message

5 разных библиотек Python, которые сэкономят ваше время

Reading time 5 min
Views 22K

В этой подборке, переводом которой мы решили поделиться к старту курса о машинном и глубоком обучении, по мнению автора, каждая библиотека заслуживает отдельной статьи. Всё начинается с самого начала: предлагается библиотека, которая сокращает шаблонный код импортирования; заканчивается статья пакетом удобной визуализации данных для исследовательского анализа. Автор также касается работы с картами Google, ускорения и упрощения работы с моделями ML и библиотеки, которая может повысить качество вашего проекта в области обработки естественного языка. Посвящённый подборке блокнот Jupyter вы найдёте в конце.

Читать далее
Total votes 27: ↑20 and ↓7 +13
Comments 12

Как использовать Python для «выпаса» ваших неструктурированных данных

Reading time 8 min
Views 18K
Здравствуйте, уважаемые читатели.

В последнее время мы прорабатываем самые разные темы, связанные с языком Python, в том числе, проблемы извлечения и анализа данных. Например, нас заинтересовала книга «Data Wrangling with Python: Tips and Tools to Make Your Life Easier»:



Поэтому если вы еще не знаете, что такое скрепинг, извлечение неструктурированных данных, и как привести хаос в порядок, предлагаем почитать перевод интересной статьи Пита Тамисина (Pete Tamisin), рассказывающего, как это делается на Python. Поскольку статья открывает целую серию постов автора, а мы решили пока ограничиться только ею, текст немного сокращен.

Если кто-то сам мечтает подготовить и издать книгу на эту тему — пишите, обсудим.
Читать дальше →
Total votes 15: ↑14 and ↓1 +13
Comments 10

JavaScript исполняется 25 лет: краткая история языка и скидка 50% на WebStorm

Reading time 2 min
Views 5.5K

25 лет назад, 4 декабря 1995 года JavaScript был впервые представлен миру. Мы хотим отметить день рождения языка и поблагодарить вас за его поддержку все эти годы, поэтому мы подготовили для вас небольшой сюрприз!


js-25-picture

Читать дальше →
Total votes 14: ↑14 and ↓0 +14
Comments 8

Графическое описание владения и заимствования в Rust

Reading time 2 min
Views 14K

Ниже представлено графическое описание перемещения, копирования и заимствования в языке программирования Rust. В основном, эти понятия специфичны только для Rust, являясь общим камнем преткновения для многих новичков.



Чтобы избежать путаницы, я попытался свести текст к минимуму. Данная заметка не является заменой различных учебных руководств, и лишь сделана для тех, кто считает, что визуально информация воспринимается легче. Если вы только начали изучать Rust и считаете данные графики полезными, то я бы порекомендовал вам отмечать свой код похожими схемами для лучшего закрепления понятий.


Читать дальше →
Total votes 57: ↑57 and ↓0 +57
Comments 36

В Elite: Dangerous все больше странных объектов и сигналов

Reading time 3 min
Views 50K

Секретные коды, неизвестные объекты, пугающие сигналы — все это может быть предвестником грядущего вторжения




Космический симулятор Elite: Dangerous официально доступен на ПК уже около 19 месяцев (на Xbox One — около 9 месяцев). Игроки освоили только небольшую часть огромнейшего игрового пространства с 400 000 000 000 звезд. Разработчики не раз и не два заявляли о том, что в ходе освоения игровой вселенной геймеры будут встречать странные объекты. Больше всего этих объектов в безымянной галактике, которую пока что никто так и не нашел. Но странности уже начали проявляться.

Не идентифицированные артефакты («unknown artifacts») встречаются игрокам в течение нескольких месяцев. Их находят, в основном, около звездной системы Merope, в пределах 50 световых лет от звезды. Эти артефакты передают странные сообщения кораблям, которые подходят поближе для сканирования. Сообщения закодированы, и сейчас группе игроков удалось их раскодировать — оказывается, это изображения космических кораблей самих игроков. Артефакты, насколько можно судить, вызывают проблемы при попытке их собрать — некоторые системы выходят из строя, иногда прекращают работать целые космические станции. Это случается, если артефакт продать на черном рынке станции. Все это более-менее известно. Но сейчас появился второй тип неизвестных объектов.
Читать дальше →
Total votes 41: ↑35 and ↓6 +29
Comments 42

Видео со встречи JUG.ru с разработчиками языка Kotlin Андреем Бреславом и Дмитрием Жемеровым

Reading time 1 min
Views 15K


Неделю назад в Питере прошла встреча JUG.ru с разработчиками языка Kotlin Андреем Бреславом и Дмитрием Жемеровым. Как вы все наверняка знаете, Kotlin зарелизился пару недель назад, и теперь, спустя почти шесть лет разработки, пришла пора поговорить о том, что в итоге получилось.

В пятничный вечер 26 февраля народу в питерский офис Oracle набилось дофига, что очень обрадовало и нас и спикеров.



Встреча состояла из четырех частей:
  • Введение. Что такое Kotlin?
  • Kotlin: к релизу и далее
  • Kotlin: самое сложное — совместимость
  • Сессия вопросов и ответов про Kotlin

Читать дальше →
Total votes 35: ↑31 and ↓4 +27
Comments 45

«…И высосут всю энергию из Солнца»

Reading time 2 min
Views 31K

Городок Вудленд в Северной Каролине запретил устанавливать рядом солнечные панели, потому что они «убьют растения» и «высосут всю энергию из Солнца»


Экологически чистая энергетика иногда сталкивается с неожиданными препятствиями. Кто мог подумать, что против неё выступят простые американцы, а основанием для критики станет вред природе? В такое трудно поверить, но именно это произошло на городском собрании небольшого города Вудленд (шт. Северная Каролина), где недавно прошли общественные слушания по проекту установки солнечной электростанции, пишет местная газета Roanoke Chowan News Herald.

Жители Вудленда, в том числе учительница на пенсии Джейн Манн (Jane Mann), высказались против предложения. Миссис Манн была особенно убедительна, не зря ведь она преподавала физику и химию в школе. Учительница объяснила собравшимся, что установка солнечных батарей угрожает фотосинтезу окружающих растений, который зависит от солнечного света. Если фотосинтез прекратится, то растения перестанут расти.
Читать дальше →
Total votes 65: ↑53 and ↓12 +41
Comments 136

Сравнение Microsoft Office под Windows и Mac c позиции офисного использования: на что обратить внимание

Reading time 10 min
Views 179K
В данной заметке хотел бы поделиться личным опытом непосредственного сравнения Microsoft Office под Windows и Mac; постараюсь обобщить большинство вопросов и нюансов, возникающих при обдумывании как индивидуального перехода, так и перевода организаций и групп.

Свой индивидуальный опыт я считаю достаточно репрезентативным в связи с тем, что являюсь профессиональным пользователем Microsoft Office с 1996 года. Я профессионально как автор, рецензент и редактор с 1996 года ежедневно (может быть, разве что за исключением дня свадьбы) вынужден находиться в Microsoft Office буквально круглосуточно. За день через меня проходят примерно 25-30 файлов Word и 15-20 файлов Powerpoint, содержащих любые возможные функции, т.е. достаточно больших и сложных (Word, как правило, не менее 200 страниц; Powerpoint, как правило, не менее 70 слайдов). За прошедшие 14 лет я попробовал все имевшиеся версии Microsoft Office на всех имевших место версиях Windows. Надеюсь, что обратившие на себя мое внимание особенности будут репрезентативны для более «мягких» сценариев. Хотелось внести некоторую ясность, т.к. с одной стороны сама Microsoft и большинство деловых пользователей в США утверждают о полной совместимости, в то время как в рунете в большинстве случаев можно услышать противоположное.
Читать дальше →
Total votes 80: ↑72 and ↓8 +64
Comments 51

Молекулярный компьютер 3000000 вековой давности

Reading time 5 min
Views 44K
Говорят, что все изобретения человечества были «подмечены» у природы, или хотя бы имеют природные аналоги; например, у самолёта в природе есть аналог — птица. А есть ли аналог компьютера и компьютерных программ?
Это — биологическая клетка, которая и будет рассмотрена в этом посте с точки зрения программиста, как молекулярный компьютер. Вы узнаете, что многие современные способы и алгоритмы обработки информации появились не в 1980-х годах, а на многие миллионы лет раньше.

Читать дальше →
Total votes 125: ↑117 and ↓8 +109
Comments 73

Практическая биоинформатика ч.5. Секвенирование ДНК

Reading time 6 min
Views 12K
    В стремлении рассказать о самом сложном, как можно быстрее, очевидно, забываешь о самом простом. И, в моем случае, не только о простом, но и о важном связывающем звене. Причинно-следственная связь слегка нарушилась. В моих предыдущих статьях (1, 2, 3, 4) описаны математический аспект и программирование, но в них практически нет биологии. Поэтому эта статья о том, какую именно часть молекулярной биологии пытаются раскрыть, предсказать, увидеть и решить описываемые мною программы и алгоритмы.
Читать дальше →
Total votes 34: ↑34 and ↓0 +34
Comments 16

Практическая биоинформатика ч.4. Готовимся работать с ZINBA

Reading time 7 min
Views 7K
bioinformatic    В современном мире анализа данных использовать только один метод или только один подход означает, что рано или поздно ты столкнешься с фактом, как сильно ты ошибался. Для анализа данных комбинируют различные методики, сравнивают результат и на основании сравнения уже делают более точные прогнозы. В программе ZINBA использован именно такой подход. Разработчики объединили разнообразные методы анализа DNA-seq экспериментов в едином пакете. Этот пакет написан для программы статистической обработки данных R. Что же делает ZINBA? Находит различные обогащенные регионы даже в тех случаях, когда некоторые из них были усилены, например, химически или имеют разную степень соотношения сигнал-шум.
Читать дальше →
Total votes 16: ↑16 and ↓0 +16
Comments 6

Практическая биоинформатика ч.3. Оценка значимости экспериментальных данных

Reading time 9 min
Views 6.1K
    На каждом этапе эксперимента, начиная от подготовки материала, продолжая проведением PCR и заканчивая секвенированием, происходит накопление ошибки. Нам нужен механизм оценки значимости результата. Какова вероятность, что риды, оказавшиеся на некотором участке генома, оказались там неслучайно? Подход, представленный в этой статье, применим для данных, полученных с помощью DNA-seq, и рассказывает о возможности применения распределения Пуассона для оценки значимости.
Читать дальше →
Total votes 17: ↑17 and ↓0 +17
Comments 11

Практическая биоинформатика ч. 2

Reading time 8 min
Views 5.3K
    Эта статья расскажет о том, как обработать данные, полученные после pipeline, выходом которого будет sam/bam файл[1], создать несложный bed graph файл (http://genome.ucsc.edu/FAQ/FAQformat.html) и просмотреть его с помощью UCSC genome browser[2]. Очень сложно решиться, на чем писать программы, ибо уже есть огромное количество чужих наработок и совсем не хочется сочинять колесо там, где этот этап уже пройден. Долго мучаясь, я решил остановиться на C++, хотя Python и R рассматривались на равных. Также сохранилась идея, что может понадобиться графика, да ещё и под Linux, поэтому к С++ прибавилось Qt. Надеюсь, в этой статье я расскажу достаточно подробно о всем выше перечисленном, чтобы ответить на вопрос, заданный мне в начале пути и озвученный в первой части повествования.
Читать дальше →
Total votes 45: ↑40 and ↓5 +35
Comments 20

Практическая биоинформатика

Reading time 5 min
Views 10K
    Обнаружил жесткую нехватку информации по биоинформатике в русском сегменте. Не знаю, уж, востребована она или нет, но хочу предоставить на суд читателя вводную часть, которую можно назвать практическая биоинформатика, которой мне очень не хватало для ознакомления с предметом. В этой главе я хочу описать путь, который пришлось пройти мне до настоящего момента, когда я уже не шарахаюсь от фраз: вот вам FASTQ файл и постройте мне bed graph для genome browser. Чтобы в дальнейшем вести разговор об интересном, хочу по диагонали пройтись по определениям и программам первичной обработки данных, без которых трудно говорить на одном языке.
Читать дальше →
Total votes 37: ↑37 and ↓0 +37
Comments 15

У сокращалки ссылок от Google появился полноценный API

Reading time 1 min
Views 8.5K
В сентябре, когда мы запустили сервис сокращения ссылок, для него ещё не было сопутствующего API, чтобы позволить людям интегрировать goo.gl в свои приложения и веб странички. Однако, как мы говорили, что работаем над этим, и сегодня рады вам сообщить, что запустили полноценный goo.gl API доступный в Google Code Labs. Документация расположена на сайте Google Code, с примерами кода в секции Getting Started.

С этим API, разработчики могут программно получить доступ ко всем быстрым, гладким вкусняшкам, которые доступны через веб интерфейс. Вы можете сокращать и разворачивать URLы используя API, а также получать историю и аналитику. Вы сможете использовать эти возможности для широкого спектра приложений, начиная от автоматического сокращения ссылок в Twitter или Google Buzz клиентов запуская процесс мониторинга статистики и данные трафика. Для начала вы можете ознакомится с консолью Google API.

Мы очень рады возможности предоставить вам наш API для доступа к одному из самых быстрых сервисов сокращения ссылок. Мы продолжаем работать над некоторыми улучшениями юзабилити и возможностью автоматического определения спама или вредоносного контента. Мы надеемся, что с новым API, вы найдете место для goo.gl в своей будущей деятельности. Если вы являетесь разработчиком, ознакомьтесь с документацией по goo.gl API и посмотрите как это все работает.
Читать дальше →
Total votes 60: ↑53 and ↓7 +46
Comments 13

Краткая заметка по некоторым дополнительным возможностям Kindle третьего поколения

Reading time 7 min
Views 28K

В заметке я постараюсь начать описание нескольких интересных дополнительных возможностей этой замечательной читалки,. Речь пойдет о вариантах Kindle 3g и Kindle Wi-fi третьего поколения и некоторых штуках, не описаных в мануалах. Хотел бы заметить, что информацию о Киндле найти относительно не сложно, однако собрать все в одной заметке на русском, думаю, неплохая идея.

приступим
Total votes 127: ↑116 and ↓11 +105
Comments 117

Делаем Desire HD из Desire

Reading time 5 min
Views 17K


Буквально пару дней назад я прочитал пост Вторая жизнь HTC HD2 и задумался, а можно ли сделать Desire HD из моего Desire? Как оказалось, можно, и даже не очень сложно. В общем, поразмыслив некоторое время о плюсах и минусах перехода на HD, я приступил к превращению. После всех действий я получил все возможности Desire HD в корпусе Desire. Никаких проблем и ошибок не возникло.
Читать дальше →
Total votes 109: ↑96 and ↓13 +83
Comments 139

OAuth: описание протокола простым и понятным языком

Reading time 16 min
Views 189K
OAuth — популярный протокол, который позволяет социальным сервисам интегрироваться между собой и дает безопасный способ обмена персональной информацией. OAuth может связать между собой 2 сервиса, каждый из которых имеет свою пользовательскую базу — именно их я в данном случае называю «социальными». Когда начинаешь работать с OAuth, первое ощущение — что протокол весьма сложен и избыточен. В этой статье я попытаюсь объяснить основы OAuth человеческим языком.

Пример кросс-авторизации


Вернемся в 2005-й год и представим, что мы пишем социальную сеть. В ней имеется форма импорта контактов из адресной книги GMail. Что нужно для доступа к контактам GMail? Конечно, логин и пароль от ящика. Но если мы попросим ввести их на нашем сайте, пользователь заподозрит неладное. Где гарантия, что мы не сохраняем на сервере введенные пароли? Поэтому нам хочется, чтобы пароль вводился только на сайте GMail, и после этого доступ к контактам через API GMail предоставлялся нашей социальной сети (возможно, на время).
Под катом - повествование с примерами
Total votes 134: ↑124 and ↓10 +114
Comments 34

Немецкое правительство выложило все законы на гитхаб в machine-readable формате

Reading time 1 min
Views 6.7K


github.com/bundestag/gesetze

Все законы можно найти в формате Markdown. Теперь граждане страны могут получать доступ к самым свежим текстам законов и отслеживать изменения.

Можно делать pull-реквесты, но только законы, которые одобрены голосованием в бундестаге, будут приняты…

/via news.ycombinator.com/item?id=4353389
Total votes 106: ↑104 and ↓2 +102
Comments 70

Как обращаться с данными пользователей на платформе Android

Reading time 4 min
Views 864
С ростом использования мобильных приложений люди обращают все больше внимания на то, как эти приложение используют их данные. Несмотря на то, что платформа Android использует различные разрешения разработанные для защиты пользователей, разработчики приложений ответственны за то, как они используют данные пользователей. Немаловажно, чтобы разработчики понимали, какой код они подключают, и хорошенько обдумывали запрашиваемые разрешения, так как в случае неправильного использования можно потерять доверие пользователей.
Построение здравой и доверительной экосистемы является приоритетом каждого разработчика на платформе Android.
Давайте рассмотрим несколько пунктов для написания приложения, которому будут доверять:
1. Используйте соглашение о конфиденциальности (privacy police)
2. Минимизируйте число запрашиваемых разрешений
3. Предоставляйте своим пользователям выбор при сборе информации
4. Не собирайте ненужную информацию
5. Не отправляйте никакой пользовательской информации с устройства
6.… однако, если это действительно необходимо, используйте шифрование и минимизируйте количество передаваемой информации
7. Не используйте код который вы не понимаете
8. Не ведите логов устройств или информации по конкретным пользователям
Читать дальше →
Total votes 21: ↑14 and ↓7 +7
Comments 3

Information

Rating
Does not participate
Location
Cambridge, Massachusetts, США
Date of birth
Registered
Activity