Pull to refresh
10
0
Илья @TommyV888

Пользователь

Send message

Заметки Дата Сайентиста: персональный обзор языков запросов к данным

Reading time9 min
Views12K

Рассказываю из личного опыта, что где и когда пригодилось. Обзорно и тезисно, чтобы понятно было, что и куда можно копать дальше — но тут у меня исключительно субъективный личный опыт, у вас, может быть, все совсем по-другому.

Почему важно знать и уметь обращаться с языками запросов? По своей сути в Data Science есть несколько важнейших этапов работы и самый первый и важнейший (без него уж точно ничего работать не будет!) — это получение или извлечение данных. Чаще всего данные в каком-то виде где-то сидят и их нужно оттуда «достать». 

Языки запросов как раз и позволяют эти самые данные извлечь! И сегодня я расскажу, о тех языках запросов, которые мне пригодились и расскажу-покажу, где и как именно — зачем оно нужно для изучения.

Всего будет три основных блока типов запросов к данным, которые мы разберем в данной статье:

  • «Стандартные» языки запросов — то, что обычно понимают, когда говорят о языке запросов, как, например, реляционная алгебра или SQL.
  • Скриптовые языки запросов: например, питоновские штучки pandas, numpy или shell scripting.
  • Языки запросов к графам знаний и графовым базам данных.

Все написанное здесь — это просто персональный опыт, что пригодилось, с описанием ситуаций и «зачем оно было нужно» — каждый может примерить, насколько подобные ситуации могут встретиться вам и попробовать подготовиться к ним заранее, разобравшись с этими языками до того, как придется их в (срочном порядке) применять на проекте или вообще попасть на проект, где они нужны.
Читать дальше →
Total votes 31: ↑28 and ↓3+39
Comments8

Исследование: создание устойчивого к блокировкам прокси-сервиса с помощью теории игр

Reading time5 min
Views6.6K


Несколько лет назад международная группа ученых из университетов Массачусетса, штата Пенсильвания и немецкого Мюнхена провела исследование эффективности традиционных прокси в качестве инструмента борьбы с цензурой. В результате ученые предложили новый метод обхода блокировок, основанный на теории игр. Мы подготовили адаптированный перевод основных моментов этой работы.
Читать дальше →
Total votes 17: ↑17 and ↓0+17
Comments6

Как понять, когда прокси лгут: верификация физических локаций сетевых прокси с помощью алгоритма активной геолокации

Reading time3 min
Views6.8K


Люди по всему миру используют коммерческие прокси для того, чтобы скрыть свое истинное местоположение или личность. Это может делаться для решения разных задач, включая доступ к заблокированной информации или обеспечение приватности.

Но насколько корректны провайдеры таких прокси, когда заявляют о том, что их серверы расположены в определенной стране? Это принципиально важный вопрос, от ответа на который зависит можно ли вообще пользоваться определенным сервисом тем клиентам, кто озабочен защитой личной информации.

Группа американских ученых из университетов Массачусетса, Carnegie Mellon и Stony Brook опубликовала исследование, в ходе которого проверяли реальное расположение серверов семерых популярных прокси-провайдеров. Мы подготовили краткий пересказ основных результатов.
Читать дальше →
Total votes 19: ↑19 and ↓0+19
Comments7

Information

Rating
Does not participate
Location
Россия
Registered
Activity