Pull to refresh

Comments 41

UFO just landed and posted this here
Во-первых, вопрос в количестве. Одна страница — не вопрос. Миллион — совсем другое дело.
Во-вторых, индексация и поиск. Аргоритмы сейчас, конечно, на высоте, но смотрим пункт 1.
В-третьих, хранение это же не текстовый файлик на ПК, места нужно больше. Плюс корпоративные стандарты это даже не 2 жестких диска для RAID 1, а, например, 4 жёстких диска RAID 5.
Во-первых, вопрос в количестве. Одна страница — не вопрос. Миллион — совсем другое дело.

Какое другое? На 10 террабайтовом винте поместиться миллиард страниц размером в 10 тыс символов каждая (и это без архивирования). Подозреваю, болшинство аккаунтов в твитере пустые или полупустые. Буквально любой из нас может выкачать весь твитер себе на локальный компьютер.

Во-вторых, индексация и поиск

Отмечаешь все не обновляемые страницы галочкой и не индексируешь и не ишещь по ним (может, если только на активных страницах вообще ничего не нашлось).

В-третьих, хранение это же не текстовый файлик на ПК, места нужно больше

Скорее меньше, так как есть архивирование и дублирование информации. Все равно хранение всего текста твитера можно обеспечить и сейчас на одной единственном сервере. ИМХО.

Вот, то что юристы твитера перестраховываются в связи с GDPR — более вероятно.
Подозреваю, что еще интересные вопросы возникают. К примеру, человек зарегался 10 лет назад, когда еще код писался в гараже, сервером выступал ноутбук с нерабочим экраном, а Privacy policy (РР) помещался на одной странице, и в нем не было пунктов из разряда «мы можем тут все поменять, ничего не говоря, и задним числом», годик свои мысли пописал, куда-то делся (может и здравствует поныне, кто ж знает).
Потом полиси радикально поменялся, и стал противоречить исходному. Теперь надо запустить алгоритм, который, к примеру, читает личные сообщения, и в зависимости от них, таргетирует рекламу друзьям написавшего. И возникает вопрос, что делать?
1) запускать на всех (а что, если владелец аккаунта «проснется», новые правила не примет, но при этом докажет, что его друзьям что-то разгласили о нем)
2) кинуть всем незакрываемую модалку, и запускать только на тех, кто окнет (скорее всего оверкилл, ведь актуальный РР может покрывать большиснтво кейсов и так, да и отдел UX скажет спасибо за порчу их KPI)
3) прочитать всю историю версий РР, выяснить, какая из них не противоречит алгоритму, и потом проверять по каждому аккаунту, при какой из версий он последний раз заходил? (взрыв мозга)
Ну как, хотелось бы на месте ответственного за деливери оказаться?)
А что, 5ый рейд уже стал надежнее 1ого?
Всё же написано в статье, это требование законодательства:
В Twitter разъяснили также, что решение об удалении неактивных аккаунтов касалось лишь пользователей из Евросоюза, так как GDPR — Общий регламент по защите данных — требует, чтобы данные в интернете нельзя хранить дольше, чем это необходимо, а неиспользуемые страницы, в том числе в соцсетях, следует удалять.
Что за бред про неиспользуемые страницы в соцсетях? я в своём паблике что-то написал. Использование этого чего-то это его чтение. Удаление очевидно мешает использованию. И раз я что-то написал и не пометил срок «протухания» то мне необходимо, чтобы эта запись всегда была доступна и я мог на неё сослаться.
Я не буду пытаться оценить бредовость требований. Но полагаю что таковые имеются, и заранее о тонкостях применения GDPR никто из авторов особо не задумывался. Теперь, когда для европейцев за удовольствие нагнуть по GDPR какую нибудь богатую американскую компанию, Твитер просто перестраховался, чтоб не словить штраф.

Возможно сложившая ситуация покажет бредовую часть GDPR законодателям, и те поправят статьи. Думаю что в случае с ЕЭС на это шансы имеются.
Добро пожаловать в новый дивный мир. Вот тут была куча инфы про Windows (и не только).

Из-за требований GDPR снесли к чёртовой бабушке все комментарии. Сам блог чудом уцелел: его владелец сильно сопротивлялся.

Так как получить разрешение у тех, кто оставлял комментарии нельзя (часть — анонимная, часть — сделаны на платформах, которых уже нет с нами), то удалили всё.
Замена ников авторов комментов на хеши тоже не помогла бы?
Нет, конечно. Закон требует, чтобы автор мог попросить информацию удалить… а как это сделать, если сайты, через которые авторизация 10 лет назад осуществлялась уже давно почили в бозе?

Ну вот примерно как если бы Google вдруг GMail закрыл… в соответствии с положениями GDPR всё, что люди, авторизовавшиеся через Google, насоздавали… после этого нужно удалить (ну или обзавестись телепатом, который сможет их после такого катаглизму как-то идентифицировать и проверять подлинность).

Оно то верно, но с другой стороны если человек умер он уже никогда и не сможет задать этот срок протухания и он явно не учитывал вероятность своей смерти, когда публиковал запись.
Это как с квартирой. Если владелец погиб, квартира же не остается бесхозной. Ее либо кто-то наследует, либо она отдается государству. Думаю идея с передачей прав на аккаунт родственникам — самая здравая идея в такой ситуации!

Страница в соцсети (в публичной по крайней мере своей части) это опубликованное литературное произведение. Значит она должна уйти или родственникам или в общественное достояние. Требовать её удалить во имя исполнения закона это то же самое, что требовать сжечь все тексты и видеозаписи выступлений Черчиля. Вдруг он теперь имеет не то мнение, что во время Фултонской речи.
Думаю идея с передачей прав на аккаунт родственникам — самая здравая идея в такой ситуации!
Маленькая группа людей не должна иметь возможности удалить или закрыть чужие записи, или внезапно начать требовать деньги за возможность просмотра.

Уничтожение записей вполне позволит манипулировать общественным мнением и переписывать историю так как будет выгодно правящей партии.

Есть проблема с поиском интересных людей, есть проблема с занятыми никами. Представьте, что будет с Инстаграмом через 50 лет? Все варианты ников будут заняты, новым людям придется регистрироваться с припиской JohnJohn20184747

Что же мы за поколение, всё позанимали. Ники не оставили, IPv4 растратили.
Зачем вообще поддерживать уникальность ников? В реальности же не завется Василием123, хотя все заинтересованные все равно в курсе о конкретном Васе по другим признакам.

Объяснять системе кого имеем в виду? Сложновато (и на выходе всё равно уникальный id нужен, как фконтакте — цифровой, например, лично мне хватает, но многие желают выделиться человекочитаемостью, особенно более знаменитые, у которых это может быть написано на визитке или афише).

В реальности же не завется Василием123, хотя все заинтересованные все равно в курсе о конкретном Васе по другим признакам.

Это Вам повезло не получить имя и фамилию, как у кого-то из широко известных людей просто.
А вот один простой электрик (или сантехник, не помню) из штатов, которого Марк Цукерберг зовут, через суд себе добивался права просто в фейсбуке зарегаться и не поддаться бану в первый день. Сейчас решил нагуглить за него, прояснить, электрик, или сантехник таки, да ссылку вставить, но не тут то было…

Ники еще не скоро закончатся…


Vasya31415926535897932384626433832795028841971693993751058209749445923078164062862089986280348253421170679821480865132823066470938446095505822317253594081284811174502841027019385211055596446229489549303819644288109756659334461284756482337867831652712019091456485669234603486104543266482133936072602491412737245870066063155881748815209209628292540917153643678925903600113305305488204665213841469519415116094330572703657595919530921861173819326117931051185480744623799627495673518857527248912279381830119491298336733624406566430860213949463952247371907021798609437027705392171762931767523846748184676694051320005681271452635608277857713427577896091736371787214684409012249534301465495853710507922796892589235420199561121290219608640344181598136297747713099605187072113499999983729780499510597317328160963185950244594553469083026425223082533446850352619311881710100031378387528865875332083814206171776691473035982534904287554687311595628638823537875937519577818577805321712268066130019278766111959092164201989380952572010654858632788659361533818279682303019520353018529689957736225994138912497217752834791315155748572424541506959508295331168617278558890750983817546374649393192550604009277016711390098488240128583616035637076601047101819429555961989467678374494482553797747268471040475346462080466842590694912933136770289891521047521


3,14
Помню на каком-то лоховском фотохостинге зарегаться хотел, где можно было кириллицу в имени применять. Ну я думаю, чего что-то типа Вася647 или Vasya.the.super.guy, как все местные, городить? Сейчас пару букв одинаково выглядящих впишу кириллических, и норм аккаунт себе сделаю… даже дня попользоваться не дали гады, забанили(
UFO just landed and posted this here
UFO just landed and posted this here
Твиттер ведь еще и медиафайлы поддерживает, не только текст.

Всё тлен. Никто не оставит следов.

Кстати да, недавно читал где-то грустные размышления о том что от нынешнего поколения ничего физического не останется, от предыдущих хотя бы фотографии и черепки глиняной посуды были, а нынешнее все в потерянных бэкапах и биоразлагаемых пластиках сгинет :)

И это нормально. Мы все помним о следах предыдущих поколений, мол, они сохранились. Но это же ошибка выжившего. Сколько всего сгинуло?

Предыдущие поколения, говорите? Попробуйте найти сайты, которые вы читали лет делать назад… на archive.org — жалкие ошмётки, а ничего лучше и нету…
Строго говоря, бумажную газету, которую читал хотя бы год назад, найти не легче.
www.rasl.ru/b_resours/specfonds/gazeta.php

Газетный фонд основного хранения отдела фондов и обслуживания представляет собой большую часть газетного фонда БАН. В его состав входят:

иностранные газеты с 1730 г. по настоящее время
русские дореволюционные газеты с 1825 по 1917 гг.
газеты, изданные на территории России на иностранных языках – «Rossika» (1711–1917)
отечественные газеты с 1917 г. по настоящее время
В результате пожара 1988 г. потери составили по русским дореволюционным газетам – 0,7%, Rossika – 33%, советские газеты в наиболее ценной части этого собрания с 1918 по 1954 гг. – 75%, иностранные — 7% Кроме того, от воды, пара и высокой температуры пострадало свыше 15 тыс. подшивок газет.
Жалкие ошметки, а лучше ничего и нету...
При этом доступность питерской библиотеки, при всем моем уважении, с доступностью archive.org несколько несравнима.

Я не про сайты, лол. А про поколения, века.

А я про то, что если от информации десятилетней давности остаются какие-то проценты, то чего ждать от того, что было 100 или 1000 лет назад? Что-то вообще сохранилось — уже круто.
Сколько-то сгинуло, но что-то и осталось: Мона Лиза в Лувре, ноты Моцарта, записи Пушкина.
А от нынешних инстаграммщиков и цифровых релизов музыки что останется?
Только если в судебные архивы нотариально заверенные скриншоты попадут :)
Статья заставила задуматься о бренности всего сущего.
Фотографии тоже исчезают.
В цифровом мире множество энергии и других ресурсов будет уходить на саморегенерацию огромных массивов данных и их индексацию.
Sign up to leave a comment.

Other news