Комментарии / Профиль Forbidden / Хабр

Как стать автором

Михаил Юрьевич @Forbidden

CEO, CTO

Профиль Публикации Комментарии 19Закладки 1

Организация разработки крупномасштабных React-приложений

Forbidden 23 авг 2020 в 18:43

20 минут это очень долго, программист просто выпадет из контекста, мы стремимся к 1-2 минуте

cypress можно параллелить из коробки или через sorry-cypress

0

Посмотреть

Web scraping вашего сайта: непрошеные гости и как их встречают

Forbidden 30 июл 2020 в 14:18

Любая защита приводит к деградации UX, например постоянные каптчи или задержка 5с при валидации CF. Всякие фильтры по IP/прокси/VPN приводят к отвалу сразу большого % легитимных юзеров, например множество сайтов блокируют доступ с серверных IP, при этом такое же множество клиентов использует VPN на своих серверах

Не вижу смысла защищаться от парсинга, только от такого, который создает нагрузку(правильной настройкой rate-limit например)

+1

Посмотреть

30+ парсеров для сбора данных с любого сайта

Forbidden 25 мар 2020 в 17:50

Небольшое уточнение, A-Parser не сервис, он standalone, windows/linux(headless)

+3

Посмотреть

Правда про парсинг сайтов, или «все интернет-магазины делают это»

Forbidden 9 апр 2019 в 05:30

привет, мы парсим, яндекс и любые другие поисковые системы

0

Посмотреть

Технологии беспилотных автомобилей. Лекция Яндекса

Forbidden 4 мар 2018 в 23:43

Всегда интересно было какие алгоритмы проектируются для экстремальных ситуаций, помимо банальной экстренной остановки, например когда против правил на тебя летит Камаз по встречке)

0

Посмотреть

Ловкость рук и никакого мошенничества: практические советы по ускоренному обучению дизайну для разработчиков

Forbidden 24 фев 2018 в 23:21

Спасибо, многое прояснилось) Посоветуйте аналогичный материал по правильному расположению элементов на странице

0

Посмотреть

Ускоренный курс по ассемблерам

Forbidden 21 фев 2018 в 21:26

Вывод оказался в неожиданном месте :)

+4

Посмотреть

Визуализация данных для киноманов: скрапим рекомендации фильмов и делаем интерактивный граф

Forbidden 20 фев 2018 в 14:27

Для всех кто хочет упростить себе жизнь и получать данные проще и быстрее — наша команда подготовила статью по сбору данных с IMDB с помощью A-Parser: a-parser.com/resources/269

Мы собрали базу в 182370 фильма за 1.5 часа, база в формате JSON доступна по линку в конце статьи

0

Посмотреть

JavaScript ES6: оператор расширения

Forbidden 15 фев 2018 в 00:19

Привет из Perl'а, где «разворачивание» массивов(и даже хэшей) по ссылке — это конструкция языка уже больше 20 лет

-2

Посмотреть

Новый выпуск Oh, My Code — Облако, Perl и хорошие программисты

Forbidden 17 ноя 2017 в 06:17

Таких возможностей много, например staticperl

0

Посмотреть

Вышел PostgreSQL 10

Forbidden 8 окт 2017 в 06:19

Сидим на pg 10 с 3ей беты на продакшене, в первую очередь из за встроенного партицирования, полет отличный. Печально что логическая репликация не поддерживает репликацию схемы

+1

Посмотреть

Локализацию можно автоматизировать: опыт использования Lokalise в боевых условиях

Forbidden 21 июл 2017 в 18:04

а переводчик как то привязывает фразу к расположению в конкретном элементе программы/сервиса? или он в слепую переводит фразы?

0

Посмотреть

Локализацию можно автоматизировать: опыт использования Lokalise в боевых условиях

Forbidden 21 июл 2017 в 07:32

Отличная идея, есть ли калькулятор чтобы оценить бюджет? Есть ли опция исправления «корявых» исходных фраз на английском? — беда многих команд из СНГ

+1

Посмотреть

DevConf 2017: Эффективное управление WEB-проектами — заканчивается голосование за доклады

Forbidden 28 мая 2017 в 18:26

Можно будет купить запись?

0

Посмотреть

Разработка веб-скрапера для извлечения данных с портала открытых данных России data.gov.ru

Forbidden 5 мар 2017 в 13:20

Однозначно придется покупать :)

0

Посмотреть

Разработка веб-скрапера для извлечения данных с портала открытых данных России data.gov.ru

Forbidden 5 мар 2017 в 10:48

Можно изобретать велосипеды, а можно взять A-Parser и получить из коробки многопоточность, работу с regex и XPath, сложные парсеры можно целиком писать на JavaScript(ES6)

0

Посмотреть

11 неожиданных особенностей языков программирования

Forbidden 26 мар 2016 в 08:09

в Perl модулях необходимость возвращать true связанна с этапом компиляции, на котором выполняется код модуля и есть возможность вернуть false если что то пошло не так. смешные цитаты про бесполезность и раздражение ))

0

Посмотреть

Почти-web-сервер своими руками

Forbidden 13 сен 2009 в 13:58

paste.org.ru/?8jfpe7
Requests per second: 4483.65 [#/sec] (mean)

0

Посмотреть

Почти-web-сервер своими руками

Forbidden 12 сен 2009 в 17:07

#!/usr/bin/perl

use strict;
use warnings;
$|++;


use IO::Socket::INET;
use EV;


my $sock = IO::Socket::INET->new(Listen => 10000, LocalPort => 8882, Blocking => 0, Proto => 'tcp') or die "Can't bind : $@\n";

my @evs;
push(@evs,EV::io $sock,EV::READ,\&accept);

sub accept
{
        my $newsock = $sock->accept;
        $newsock->blocking(0);
        push(@evs,EV::io $newsock,EV::READ,\&request);
        $evs[-1]->data(scalar(@evs)-1);
};

sub request
{
        my $data;
        $_[0]->fh->sysread($data,128);

        my $content = "HTTP/1.1 200 OK\r\n"
                        . "Server: EV/2009-09-12\r\n"
                        . "Content-Type: text/html\r\n"
                        . "Connection: close\r\n\r\n"
                        . "<html><body><h1>Hello from Habr</h1></body></html>";
        $_[0]->fh->syswrite($content);
        $_[0]->fh->close;
        undef $evs[$_[0]->data()];
        undef $_[0];
};


EV::loop();

1 поток:

#ab -n 10000 -c 30 http://localhost:8882/

Requests per second: 7099.00 [#/sec] (mean)

пример очень упрощен, отсутсвуют какие либо проверки, но скорость говорит за себя
если ещё добавить prefork…

+1

Посмотреть