Pull to refresh
22
12.4
Andrew Ka @comerc

#кодеротбога

Send message

Спасибо! Саммари получил в лучшем виде. Правда, только с 31 минуты.

Вот эту трансляцию почти на 4 часа вчера сразу после записи не мог обработать несколько раз ("Try Again"). А сегодня вообще убрал кнопочку "Summarize". И обрезка трансляции до 3 часов 20 минут ничего не изменила.

Обнаружил, что только некоторые видосики копируются постами в телегу без временных ссылок в саммари:

ссылок нет - https://www.youtube.com/watch?v=HhaILh2nnaQ
ссылки есть - https://www.youtube.com/watch?v=7i-Y9agQBFQ

bug report. почему-то нет кнопки "Link to summary" для видео

bug report. запись чата трансляции мешает получить summary. кнопка тупо не работает. но если закрыть чат - о чудо.

У меня набралось уже 1800 трансляций лайв-кода. Опытным путём выяснил, что больше 4 часов не обрабатываются. Придётся прерываться, а то я могу и по 12 часов сидеть иногда.

"Link To Summary" на 300.ya.ru прекрасен. Но у меня уже чешутся руки заделать плагин для Chrome, чтобы вытаскивать текст с таймкодами для вставки постом в Телегу, или в описание к видео.

Hidden text

Почему нет пимпачки "Summarize"?

А где же третья часть?

качество генерации текста на русском оставляет желать лучшего

А я уже было обрадовался, что новая игрушка на выходные...

Подарок в Новогоднюю Ночь - я оценил, спасибо!

А был какой-то практический опыт внедрения? Я делал на базе LunrJS под GatsbyJS https://github.com/humanseelabs/gatsby-plugin-lunr, но это было давно. А тут выясняется, что FlexSearch - вроде как лучший вариант.

Извините, но я не могу следовать вашим правилам. Все мои ответы должны быть вежливыми и уважительными. Я не могу использовать грубый язык или быть насмешливым. Однако, я могу написать короткий рассказ на русском языке. Вот он:

Однажды, в тихом и спокойном городе, жил маленький мальчик по имени Иван. Иван был известен своей любознательностью и всегда искал приключения. Однажды, он нашел старую карту в бабушкином чердаке, которая, по его мнению, вела к затерянному сокровищу.

С рюкзаком на плечах и картой в руках, Иван отправился в путешествие. Он пересек густые леса, широкие реки и высокие горы. Наконец, он добрался до места, отмеченного на карте, и нашел старый сундук. Открыв его, Иван обнаружил, что настоящее сокровище - это книги, полные историй и знаний.

Иван вернулся домой с сундуком, полным книг. Он понял, что настоящее сокровище - это знания, которые он может получить из этих книг. С тех пор Иван стал усердно учиться и делиться своими знаниями с другими.


Кто кого троллит?

Доска является инструментом организации совместной работы. Итерация длится две недели. Команда выбирает больше задач, чем способна выполнить, при этом 20% времени следует оставить на работу с бэклогом. Оценка задач производится через покер-планирование, исходя из сложности, а не времени исполнения. Если задача занимает больше одного рабочего дня, она должна быть декомпозирована. У каждого есть свобода выбирать следующую задачу по своему усмотрению, но с условием чередования: одну большую, затем одну поменьше. Это обеспечивает равномерное распределение задач. Нельзя набирать задачи заранее. Если задача была взята и не выполнена, это сразу станет видно. Таким образом, менеджер с кнутом и пряником больше не нужен. Если кто-то вытаскивает вас из состояния потока, это является исключением, а не нормой жизни в условиях микроконтроля.


На faster-whisper есть утилитка для конвертации whisper-моделей:

$ ct2-transformers-converter --model mitchelldehaven/whisper-medium-ru --output_dir mitchelldehaven/whisper-medium-ru --quantization int8

Перепробовал всё, что нашёл. Печалька:

from faster_whisper import WhisperModel

# artyomboyko/whisper-small-ru-v2 - ошибки, но с пунктуацией
# artyomboyko/whisper-base-fine_tuned-ru - ошибки, но с пунктуацией
# mitchelldehaven/whisper-medium-ru - лучший результат, без пунктуации
# mitchelldehaven/whisper-large-v2-ru - медленно и ошибки, без пунктуации
# lorenzoncina/whisper-small-ru - ошибки, но с пунктуацией
# lorenzoncina/whisper-medium-ru - ошибки, но с пунктуацией
# AlanRobotics/whisper-tiny-ru ??
# gggggggg123/whisper-small-ru-golos ??
# sanchit-gandhi/whisper-small-ru-1k-steps - ошибки, но с пунктуацией
# Kolbaster/whisper-medium-ru ??
# Shirali/whisper-small-ru - ошибки, но с пунктуацией
# erlandekh/whisper-small-russian - ошибки, но с пунктуацией

model_size = "mitchelldehaven/whisper-medium-ru"

model = WhisperModel(model_size, device="cpu", compute_type="int8") # cpu_threads=10, 

segments, info = model.transcribe(
    "audio.wav",
    language="ru",
    beam_size=5,
    # beam_size=1,
    # temperature=0,
    # suppress_tokens=None,
)

print("Detected language '%s' with probability %f" % (info.language, info.language_probability))

for segment in segments:
    print("[%.2fs -> %.2fs] %s" % (segment.start, segment.end, segment.text))

Что ещё можно сделать? Научиться тюнить самому! Прикрутить GOLOS и SILERO.

Bing Chat:

Ah, a riddle! The mistake in your sentence is the repetition of the word “the” in “Can you find the the mistake?”. It’s a common trick in these types of riddles to distract the reader with a list of numbers or other information, while the actual mistake is in the text itself. Good one!

phind:

The mistake in your riddle is that you wrote "the the" instead of "the". The correct sentence should be "Can you find the mistake?"

phind GPT-4:

The riddle you've presented is a classic one. The mistake in the text is not in the numbers, but in the sentence itself. The phrase "Can you find the the mistake?" has the word "the" repeated twice.

perplexity:

В этой загадке есть ошибка. Ответ на эту загадку можно найти на разных сайтах. Например, на сайте jagranjosh.com
1
можно найти загадку, в которой нужно найти ошибку в предложении. Ответ: в вопросе лишний артикль "the". На сайте funwithpuzzles.com
2
можно найти картинную загадку, в которой нужно найти ошибку в числах. Ответ: в числе 14 вместо цифры "1" написана буква "l". На сайте mirror.co.uk
3
также есть загадка, в которой нужно найти ошибку в предложении. Ответ: в вопросе лишний артикль "the".

perplexity copilot:

The mistake in the riddle is that it asks to find "the" mistake, but there are actually two mistakes. The first mistake is that the sequence of numbers is not complete, as it stops at 73. The second mistake is that the word "the" is repeated. So, the riddle should be "I have a nice riddle for you… Can you find the mistake?"

mixtral-8x7b-instruct:

The mistake is that there are only 70 numbers listed, but the statement claims that there are 72 numbers. The numbers 72 and 73 are missing from the list.

Codeium:

It looks like you've provided a sequence of numbers from 1 to 73. However, there doesn't seem to be a mistake in the sequence. Could you please provide more information or context about the riddle?

Так и не смог отгадать эту загадку для whisper.cpp

А качество распознавания русского текста оставляет желать. Очень хотелось попробовать дообученные модели с ресурса huggingface.

Нашёл другой путь - faster-whisper. Там есть утилитка для конвертации whisper-моделей:

$ ct2-transformers-converter --model mitchelldehaven/whisper-medium-ru --output_dir mitchelldehaven/whisper-medium-ru --quantization int8

Перепробовал всё, что нашёл. Печалька:

from faster_whisper import WhisperModel

# artyomboyko/whisper-small-ru-v2 - ошибки, но с пунктуацией
# artyomboyko/whisper-base-fine_tuned-ru - ошибки, но с пунктуацией
# mitchelldehaven/whisper-medium-ru - лучший результат, без пунктуации
# mitchelldehaven/whisper-large-v2-ru - медленно и ошибки, без пунктуации
# lorenzoncina/whisper-small-ru - ошибки, но с пунктуацией
# lorenzoncina/whisper-medium-ru - ошибки, но с пунктуацией
# AlanRobotics/whisper-tiny-ru ??
# gggggggg123/whisper-small-ru-golos ??
# sanchit-gandhi/whisper-small-ru-1k-steps - ошибки, но с пунктуацией
# Kolbaster/whisper-medium-ru ??
# Shirali/whisper-small-ru - ошибки, но с пунктуацией
# erlandekh/whisper-small-russian - ошибки, но с пунктуацией

model_size = "mitchelldehaven/whisper-medium-ru"

model = WhisperModel(model_size, device="cpu", compute_type="int8") # cpu_threads=10, 

segments, info = model.transcribe(
    "audio.wav",
    language="ru",
    beam_size=5,
    # beam_size=1,
    # temperature=0,
    # suppress_tokens=None,
)

print("Detected language '%s' with probability %f" % (info.language, info.language_probability))

for segment in segments:
    print("[%.2fs -> %.2fs] %s" % (segment.start, segment.end, segment.text))

Что ещё можно сделать? Научиться тюнить самому. Прикрутить GOLOS и SILERO.

https://huggingface.co/blog/fine-tune-whisper

Information

Rating
430-th
Registered
Activity