Comments / Profile of berng / Habr

@berng

User

Profile Publications 1Comments 199Bookmarks 21

Пишем веб-приложение вместе с ChatGPT и Stable Diffusion

berng Jan 7 at 15:40

волшебная кнопка с надписью "сделать все хорошо" в представлении ИИ:

Look

Спутники Starlink испускают радиосигналы, мешающие работе наших самых чувствительных радиотелескопов

berng Oct 24 2023 at 14:01

Это просто у вас радиотелескопы неправильные, вот правильный, с полосой от 704 до 4032 МГц:

https://ui.adsabs.harvard.edu/abs/2020PASA...37...12H/abstract

https://en.wikipedia.org/wiki/Parkes_Observatory

У древнего Аресибо да, была узкая полоса. Но на дворе 21 век, а не 20.

Look

Спутники Starlink испускают радиосигналы, мешающие работе наших самых чувствительных радиотелескопов

berng Oct 21 2023 at 02:08

Пусть закодируют еще пару цифровых фильтров и регистрируют на других частотах. Если разрабатывается широкополосная приемная система, такая как радиотелескоп, существование сосредтотченных помех - это данность разработчика, а не проблема окружающих. Большая часть современного радиодиапазона состоит из помех.

Look

Учёные заявили об открытии «недостающего закона природы», объясняющего эволюцию всего во Вселенной, включая нас с вами

berng Oct 21 2023 at 02:00

Конечно. Когда некто размешивает сахар в чашке кофе, сахар всегда стремится сформировать в чашке все более стабильное и новое состояние, имеющее своей целью более широкое распахивание глаз пьющего. Если не размешивать - эффекта более широкого распахивания скорее всего не будет, и сахар бесцельно потратит свой внутренний потенциал на бессмысленное лежание.

Look

Заключенные в Финляндии тренируют ИИ. Скоро такое может начаться и в других странах

berng Sep 18 2023 at 16:08

А потом на скайнет обижаются

Look

Пробинг моделей низкоресурсных языков с помощью фреймворка AIRI

berng Sep 11 2023 at 16:59

А при чем тут дисбаланс классов? Мне всегда казалось, что матрица ошибок - исходные данные, и по ним можно оценивать метрики при (почти) любых дисбалансах классов. Если у вас что-то не работает при сильном дисбалансе классов - значит для обучения выбраны неверные метрики обучения и функции потерь, неустойчивые к дисбалансу. Обычно замена метрик решает проблему - взвешанную кросс-энтропию, например, вместо кроссэнтропии для логистической регрессии или просто исходно сбалансировать датасет (оверсемплинг/андерсемплинг).

А результаты для турецкого языка у вас не приведены, извините, поэтому непонятно где это можно увидеть.

Look

Пробинг моделей низкоресурсных языков с помощью фреймворка AIRI

berng Sep 11 2023 at 14:06

Похоже у вас вообще ничего не работает (рис.10): чтобы безусловно предсказывать 1 (в последнем случае) и 5 (в предпоследнем случае) даже нейронки не надо - ведь судя по вашим матрицам ошибок у вас выход от входа не зависит.

Look

Создание библиотеки Python: полный гайд

berng Sep 10 2023 at 20:52

Заработало. Только вместо

from mylib import myclass

приходится писать

from mylib.myclass import myclass

Не подскажете, как сделать класс дефолтным?

Look

Учимся распознавать прописные русские буквы на коленке. python/keras

berng Sep 10 2023 at 05:55

Это у вас не точность, это у вас переобучение

Look

Чтобы пережить эпоху искусственного интеллекта, миру нужен новый тест Тьюринга

berng Aug 25 2023 at 16:23

Не нужен. Давно уже изобретены синтетические тесты, более мощные, чем тест Тьюринга, и избавленные от проблем этого теста, типа схемы Винограда, и все большие языковые модели давно тренируются в том числе и на них. Кстати, современные LLMA решают эти синтетические тесты зачастую точнее людей, насколько я помню с "точностью" 80-86% .

Look

Как аугментация помогает нейронным сетям решать уравнения в частных производных

berng Aug 13 2023 at 10:30

Вы же сами говорите, неполный лагранжиан нужно решать точно, а потом говорите о приближенном решениии. Для приближенных методов известно что нужно оценивать расходимость, вводить критерии, проверить их еще до начала решения и т.д., чего с нейронками не всегда делается (потому-что непонятно как, в отличие от численных методов). В технических задачах - да, применение нейронных сетей полезно. А для физики нейронки - это всего-лишь модели, позволяющие какие-то задачи автоматизировать. Продвижения конекретно в теории по-моему мнению, они не дают (даже несмотря на то, что вы написали про Кеплера, читал эту статью). Экспериментаторам жизнь облегчают, сам постоянно пользуюсь.

С численными решениями математики вроде лет 20-30 назад пробовали, потом перестали большинство численных решений считать за доказательство чего-бы то ни было. В физике просто до этого еще не дошли потому-что поздно начали, но фанарики уже зажигаются.

Застоя в физике особо нет, есть застой с решением задач. А объяснять одну сущность миллиардом - по-моему дело наблагодарное, хотя и модное.

Look

Переменные звёзды помогают астрономам в поиске внеземной жизни

berng Aug 13 2023 at 07:35

Обсерватория Гайя Европейского космического агентства (ЕКА) уже почти
десять лет стабильно работает в точке Лагранжа L2 между Землёй и
Солнцем.

Точки L2 между Землей и Солнцем нет.

Look

Как аугментация помогает нейронным сетям решать уравнения в частных производных

berng Aug 12 2023 at 19:13

Задача физики состоит в том, чтобы выявлять закономерности и уменьшать количество неизвестных параметров, а не чтобы увеличивать их. Оккам бы перевернулся в гробу от нейросетевых выкрутасов с физикой.

Это напоминает мне давний спор Птолемеевой схемы мира с Коперниковской. Как показала история, менее точная Коперниковская модель оказалась более правильной для объяснения мира, чем более точная Птолемеевская. И заменять физику на нейронку - делать шаг назад, к Птолемею.

Look

Как аугментация помогает нейронным сетям решать уравнения в частных производных

berng Aug 12 2023 at 07:52

Спасибо за ссылку, интересная работа. Но в той работе решается понятная задача - аппроксимировать результаты численного решения диффура результатами работы нейронной сети. То-есть поиск аппроксимации набора известных численных решений сложной многопараметрической функцией. А что делаете вы? Если я правильно понимаю, с экспериментом тут могут быть неконтроллируемые ошибки - одно дело известный диффур, другое дело реальный эксперимент с его ошибками и неучтенными воздействиями.

А с общей идеей аугментации согласен - если вы учтете симметрию задачи аугментацией (что как я понял вы и делаете), после обучения вы должны получить аппроксимацию, инвариантную по отношению к этой симметрии. В общем для этого аугментация и используется.

Look

Как аугментация помогает нейронным сетям решать уравнения в частных производных

berng Aug 12 2023 at 01:59

Тогда я чего-то не понимаю. Вы-же тренируете сеть на экспериментальных данных? В чем смысл тренировать на экспериментальных данных схему, если можно попробовать найти общее решение (очевидно неаналитическое) или численный алгоритм для нахождения частного (как делают при численных решениях ДУ), тем более непонятно где взять столько экспериментальных данных? Просто чтобы сделать какую-то мат.модель уже известного экспериментального процесса, пригодную для каких-то расчетов, но которую нельзя будет потом обобщить на другие варианты начальных условий и непонятны будут границы ее применимости?

Look

Как аугментация помогает нейронным сетям решать уравнения в частных производных

berng Aug 11 2023 at 16:09

А зачем вам аугментация? Не проще просто фундаментальное решение один раз найти, как по классике, с дельта-функцией в правой части, а потом с любой правой частью проинтегрировать это решение? Сдается, ваша аугментация именно к этому в результате и сведется.

Look

Программистов победит не ИИ, а архитектор + ИИ

berng Aug 10 2023 at 17:32

А что это за вопросы уровня SteckOwerflow? Какой-то новомодный тест на знание английского языка? Интересно просто.

Look

Нейронные сети, графы и эмерджентность

berng Aug 10 2023 at 04:02

Возможно вы правы. В принципе даже есть работа Sonoda&Murata,2017, по которой ваше предложение можно обосновать (использование квадратичной активации), но тогда архитектура должна включать не только внимание, но и skip-connection с какими-то полносвязными слоями ( [a+b]^2=2ab(внимание)+a^2+b^2 (skip с полносвязным слоем)), а их вроде нет в архитектурах со вниманием, хотя я конечно могу ошибаться.

Look

Российские учёные нашли эффективный алгоритм для прогнозирования развития шизофрении

berng Aug 9 2023 at 02:37

Поэтому и публикация в mdpi, а не в nature, cell или lancet.

Look

Как улучшить тексты на русском и английском: 5 советов и полезных инструментов

berng Aug 8 2023 at 04:19

del

Look

2 3 ...

9 10