Pull to refresh

Comments 15

Человек выбрал судьбу. Неадекватными методами клепать вечно сырое приложение. При чем, судя по всему, понимает все это… Ну, да ладно — платят и то хорошо.

Может быть потому что русский рынок очень мал для Гугла? По этому у нас нифига нет не железа не многих сервисов? На английском языке гугл ассистент очень даже торт

Пусть лучше расскажет, почему моя колонка Google Home до сих пор не говорит по-русски.
Татьяна воркает над гугл-ассистантом и заингейджена на проджектах между продакшеном и рисерчем.

Так гораздо лучше. Заодно и понятно, что под русским языком понимают в Гугле.
Было бы здорово, чтобы научили писать «по-русски», а не «по русски»

А Татьяна знакома с «коммуникативным уровнем» русского языка и с перечнем «интонационных конструкций», в нём применяемых? Если нет, то очень рекомендую ознакомиться, это для её работы прям основа, ИМХО.


https://willie-wonka.livejournal.com/tag/%D0%A1%D0%9A%D0%90%D0%AF

Знакома, конечно! Правда системам пока очень далеко до использования таких деталей. Нам бы системы научить простым вещам сначала…

Обычно учёт всяких закономерностей очень упрощает анализ. Если в архитектуру нейросетки закладывать возможность учёта инвариантных значений всяких русских словечек, разбирать компьютером смысл живой речи должно стать проще и эффективнее.

Всё так. Но до таких деталей и такой вариативности данных еще работать и работать.
У нас не везде обучение, даже. Всё еще довольно много ручной работы и правил.
Вы слишком хорошо думаете о состоянии ассистентов!

Ну, в правилах подобные вещи отражать ещё проще

Есть вопрос, давно меня интересующий, и именно лингвистам Google. Но он совершенно не по теме данной статьи — о русском спелл-чекере Гугла. Поскольку те, кто в Гугле ведает этим делом, из норки не показываются, задам-ка я его здесь.
Итак, начнём. Я не раз ловил гугловский спелл-чекер на неточностях и, если так можно выразиться, «нерусскостях». Пробовал обратиться по этим поводам в техподдержку — ответа не получил.
1. Кто и как формирует базу данных спелл-чекера? Ведь что туда попало, в ближайшие 10...20 лет устаканится в нашей устной и письменной речи (в силу массовости общения через комп), а ещё через поколение попадёт в академические словари великорусского языка — просто потому, что «так все говорят». Поэтому на этих людях лежит большая ответственность, причём незаметная постороннему взгляду.
2. В какой мере эта работа поддаётся внешнему контролю — как со стороны простых пользователей, так и академического сообщества?
3. Каков механизм такого контроля и как им воспользоваться?
4. (это уже не вопрос) Если такого механизма нет, его стоило бы создать и и распространить информацию о его существовании.
здесь, похоже, вообще не отвечают
Как ни странно, спелл-чекер — это один из тех продуктов, где лингвисты вообще не задействованы. Так что я не смогу прокомментировать «изнутри».
Но могу сказать, что у нас стараются делать общие алгоритмы, а различаться по языкам будут только данные. Это не идеальный подход для языков с богатой морфологией, типа русского, отсюда и проблемы с качеством.
Исключение необходимости ручной разметки данных, и при этом система сама будет менять свое состояние, т.е. сделать напрямую связку между данными и изменением системы, — это достигается путем замены Архитектуры, всей применяемой системы алгоритмов машинного обучения. Соотвественно для замены архитектуры системы, следует последовательно пройти путем:
Архитектура — Наука — Язык — Смыслы — Мировоззрение — Онтология — Самосознание

(Речь о замене архитектуры, это про эту «новую систему», которая была бы «бомбой»).

Последовательность, на пути к «Архитектуре AGI».

1. «Сознание человека» — это самосознание человека. Сознание человека даётся человеку в форме «недостачи» самого себя, где понятие «недостачи сознания» обретает свой смысл тогда, когда за ним стоит время. Термин «мыслить», как и термин «сознавать», означает не «мыслить о чём», а «мыслить что». Выражение «мыслить что», подразумевает сочетание прямой и обратной временнОй перспективы (миро)видения человеком. Течение времени, как и течение сознания (при функционировании человеческого сознания), предстают в форме циклической смены перспективной и ретроспективной компонент, представленных человеком, с присущими им амплитудами вероятности.
Осознанность и неосознанность – это состояния сознания человека.

2. «Универсальная Онтология» задает (обуславливает) ВСЕ вероятностные «картины мира» каждого человека, ВСЕХ людей в мире.

3. «Картину мира» (мировоззрение) человек сам себе представляет, обосновывая, в первую очередь, смысл своего существования.

4. «Смыслы» (что помыслено) — себе представленные человеком феномены, еще до его (человека) с кем либо коммуникации, путем артикуляции или визуализации. Смыслы себе человек представляет образами, и связывает свою визуализацию с ещё им не артикулированными словами языка, и уже артикулирует в своей речи словами языка.

5. «Язык» (естественный и искусственный) — знаки (символы), как путь передачи человеком, представленного самому себе смысла. Например, в естественном языке знаки в виде слов. Наличие языка обуславливает науку, включая науки о языке (лингвистика, семиотика и др.)

6. «Наука» — осознанная человеческая деятельность, результат которой отображен (представлен) посредством языка (естественного и искусственного), в постулатах, в аксиомах и теоремах, в мнениях и суждениях.
Языком отображается «Архитектура AGI».

UNIVERSAL ONTOLOGY: www.amazon.com/dp/B08GPHV5SS
Sign up to leave a comment.