Pull to refresh

Comments 21

UFO just landed and posted this here
вы понимаете, что в базе данных Gracenote не может быть всей музыки? Да там не может быть и 20% музыки, что люди скробблят, да и 10, думаю.
Вот вам и быстрый ответ, почему нет.
Ничего себе, как поверхностно.
1. Улучшение качества сервиса не обязательно возводить в абсолют.
2. Gracenote нужен не абсолютно полного распознавания (я и написал, что last.fm поможет gracenote пополнить базу, а не наоборот), а для того, чтобы скробблить аудио, независимо от наличия id3-тегов.

Подход с поиском причин и поводов «почему нет» совсем убил, вы наверное успешный человек? ;)
О, вы раскусили меня сразу.
Не принимайте так в штыки. В базе gracenote есть и будет лишь частичка всей музыки, что слушают юзеры ласт.фм. Так что скробблинг по тегам никуда не денется.
Наложить поверх этого скробблинг по отрывку имеет смысл лишь для онлайн плееров. Но, во-первых, проблему выше это не отменит, во-вторых почти для всех популярных онлайн-плееров и станций есть скробблящие плагины для браузера. Это проще, универсальней и менее затратно.
Вот вам чуть подробнее ответ, почему нет. Это не подход с поиском поводов или причин, это анализ с последующим выводом.
И улыбнитесь, утро уже!
Вот база gracenote и может пополниться, благодаря скробблингу и last.fm.

Имеет смысл накладывать сверху скробблинг по отрывку не только для онлайн-плейеров. Это применимо для аудио без тегов во всех плейерах, а также для веб-плейеров без скробблеров (в частности, из крупных это ВКонтакте).

По-моему, выгодно для обеих сторон, а юзеры вообще в шоколаде.
У ласт.фм проблем итак хватает. Научились бы сначала дубли Id3 тегов ассоциировать с одним исполнитеем.
Ну вот корректировка бы и пригодилась.
повторяю, для веб-плееров (вконтакте в том числе) уже давно есть плагины для браузеров, позволяющие скробблить. Плагины легче писать (тем более этим энтузиасты занимаются), чем вводить систему распознавания по отрывку.

во-вторых, как будет пополняться база gracenote? будут целиком грабиться треки, играющие у пользователей? Это не выход, так как
а) При этом может быть неправильный тег, и это огромное пространство для читинга. Да вся их бд забьется фейками, благодаря одной только паре придурков и простом скрипте.
б) Юзеры не согласятся на такой исходящий траффик
в) gracenote не справится с таким входящим

а как еще?
пополнять с треков, которые на серверах ласт.фм? их очень-очень мало. Так что бестолку такое улучшение.
Не забывайте, что плагины пишут одни люди (как правило, волонтёры), а в развитии своих крупных сервисов совсем другие, поэтому одно другому не противоречит, просто разная мотивация.

Gracenote работает не с полной копией файла, а с отпечатками. Трафик отправляется абсолютно минимальный, технология сбора и отправки отпечатка прекрасно работает в самых обычных телефонах Sony Ericsson, называется TrackID. Пятисекундный отрывок моментально обрабатывается и по отпечатку сервис показывает исполнителя, название композиции и альбом.

Повторюсь — ни серьёзные вычислительные мощности, ни какой-то заметный трафик даже для gprs просто не нужны. Кроме того, кэш никто не отменял: незачем сканировать и определять уже определённые ранее треки, например.

Что касается пополнения. Тоже проблемы не вижу, есть несколько способов решения — это и использование более крупных слепков, чем стандартные пятисекундные, в начале интеграции, и просто накопление мелких слепков с композиций — для более-менее популярных песен, которые слушаются ну хотя бы раз 60 (с пяти секунд стандартный слепок, пятиминутный трек) разными юзерами, информация уже сможет появиться.

То есть, id3 с отпечатками перетекает на gracenote, значительно пополняя коллекцию, а last.fm с юзерами взамен получают заметно более точную статистику: файлы без id3 в любых плейерах, любые приложения и веб-сервисы.
Я не очень понимаю, в чем вообще проблема. У вас много музыки без тегов? Ну так пропишите, программ для этого триллион.

Или мобильные устройства и десктопные приложения не умеют читать теги? Умеют, и магнитолы умеют.

И у веб-сервисов тоже с тегами все отлично (файл без тегов просто не будет найден), а главная проблема (на мой взгляд) — в том, что нужно передавать сервису пароль от ластфм. Но ваша идея тут никак не помогает.

Приведите, пожалуйста, пример проблемы, которую решит реализация вашей идеи.
Да, у меня много музыки без тегов — полный интернет с потоковым аудио и АЛАК-и всякие. Слушать музыку онлайн — нормальная тенденция в масштабах интернета, странно закрывать на неё глаза. Речь не про файлы с тегами (которые, кстати, тоже могут быть с ошибками).

Про передачу сервиса пароля от ласт.фм идея как раз помогает. Пароль хранится только в локальном скробблере, от сайта же не нужно ничего, кроме воспроизведения аудио. Скробблер забирает звук из приложения (браузер), скробблит случайные 5 секунд, опознаёт на gracenote и пишет в last.fm.

Пример — пользователь с приложением (скробблером) ласт.фм, который слушает музыку как в привычном плейере в системе, так и во вконтакте, в яндекс.музыке, на простоплейере без авторизации, в блогах на городском или провайдерском портале, по прямым ссылкам в браузере. Это всё проходит мимо last.fm, а может довольно легко в него попасть.
Как скробблер будет определять начало и конец композиции?

Если я решу посмотреть кино, поиграть в игру (все в браузере), мне нужно будет отключать скробблер?
Уже интересные вопросы.

Определения начала и конца композиции добиться, думаю, не получится из-за того, что скробблеру без плагина не отправляются никакие данные, а только берутся им самостоятельно.
Предполагаю, что алгоритм нужен более сложный — случайный/периодический скробблинг, время следующей проверки которого можно уточнять информацией о предполагаемом месте композиции от gracenote.

Допустим, если случайный скробблинг распознал конкретный кусок вступления трека, то, имея данные о длине композиции и времени самого скробблинга, можно предположить время начала следующего. Если юзер будет щёлкать треки, то ничего страшного в том, что они не попадут в статистику нет — они ведь не прослушаны целиком.

Насчёт кино или игр в браузере хочется придумать более изящное решение, чем распознавание сайта/урла во вкладке и вопроса пользователю. Можно попробовать начинать скробблить более мягко — если в каком-то приложении или на каком-то сайте музыка слушается регулярно, то данные скроббла начинают включаться в статистику. Если разово — нет. Вроде вполне себе вариант для крупных сервисов.
1. Я начал слушать 12-минутную прогрессив-рок композицию. На 4-й минуте я ее слушать перестал и прослушал 2 композиции по 3 минуты каждая. Но они не заскробблятся, потому что следующая проверка только через 12 минут.

2. Я начал слушать трек, через 10 секунд бросил, но он успел заскробблится. Опять не то, что надо.

3. Чисто теоретическое приложение в контакте: позволяет смотреть видео и слушать музыку. Регулярно. Скробблить его или не скробблить?

Костылей будет море. И это еще при том, что не факт, что угадает точно.

И самое главное — в 99% случаев теги известны, вопрос не в том, как узнать, что это такое играет, а в том, как передать это в ластфм.
Ух ты, где это? Не нашёл диагностику в скробблере…
Справка->Диагностика
Вам же arestov во втором комментарии указал на musicbrainz.org
то есть сам плагин last.fm использует fingerprinting musicbrainz'a?? o_O
Sign up to leave a comment.

Articles