Блог компании Нетология
Машинное обучение
Комментарии 6
+4
Нет, AI. Это просто делает тебя сексистом. И именно здесь малыши имеют преимущество (и взрослые, давайте будем оптимистичны): никогда не поздно научиться не быть сексистом.


Нет, дорогая Лаи, это просто делает тебя бездумным Social Justice Warrior. И именно здесь инженеры имеют преимущество (и просто люди, обладающие тем самым здравым смыслом, давайте будем реалистичны): никогда не поздно научится не быть бездумным SJW и включить мозг, хотя бы крестцовый.

Алгоритм не понимает смысла используемых фич, в отличие от людей. Для него это абстрактный параметр. Он не видит разницы между фичей пола или «у него есть бородавка». Быть сексистом он не может просто по определению.

Поэтому его корреляция абсолютно честная (верная или нет — это ниже), что у SJW вызывает истерику «да он сексист и расист чертов», а у инженера, ученого или хоть немного мыслящего человека вызывает вопрос «так, есть корреляция, которая нам кажется невозможной, давайте посмотрим, является ли это ошибкой либо корреляция таки есть?»

Мало мальски знакомый с темой человек знает, что правильный выбор данных и feature selection важен не менее, чем выбор модели и гиперпараметров.

Поэтому первое, на что он будет смотреть, так это на выборку данных и на отобранные фичи. И первая же ошибка, которую заметит человек, что если у нас similarity learning, то неверная выборка данных или нерелевантная фича рушит вообще все. Неважно, что это, например рост.

А вот если это регрессионная модель, то нужно копать дальше и смотреть на качество входящих данных. Но это не может обьясняться только дисбалансом полов в записях, т.к. если фича нерелевантна, то корреляции явной не будет. Снизится точность, но не будет корреляции. Но если алгоритм видит корреляцию, то давайте посмотрим на данные дальше?

Первое, что бы смотрел инженер, это актуальность данных и стратификацию.

А умный человек вздохнул бы и сказал следующее, что идея построения модели на исторических данных обречена на провал по причине неактуальности данных. Смотри ниже.

— Теперь минутка того, что SJW называют сексизмом, а нормальные люди — обьективной реальностью.

Давайте перестанем отрицать реальный мир и признаем, что мужчины действительно пока рулят в IT, т.к. это традиционно их поле, куда женщины пришли недавно. Мужчин не просто больше, у них выше success rate. Что определяется исключительно историческими факторами, в отличие от результатов в спорте, где это просто биология.

И что мы это активно меняем и это отлично, но данные стремительно устаревают.

И сделаем две вещи:

1. Волевым решением исключим пол из фич или перестанем пользоваться историческими данными вообще. Мы хотим убрать исторический фактор? Отлично, убираем. А заодно и в топку исторические данные, т.к. данные устаревают непрерывно (ситуация улучшается), быстрее, чем обновляется статистика. Да, корреляция есть и мы ее разрушаем целенаправленно. Поэтому, данные неактуальны, в топку!

2. В личном и профессиональном мире исключим фактор пола из рассмотрения. Да, это противоречит историческим данным. Но если мы хотим видеть текущую картину, а не статистику за периоды давно минувшие, то не нужно ждать пока статистика медленно себя подстроит. Она подстраивается медленнее, чем МЫ меняем реальную картину мира.

Что я в своей жизни и сделал, кстати. Признал, что да, мужчины более успешны. И что это меняется к лучшему быстрее, чем обновляется моя личная статистика. Поэтому в топку фактор пола и в топку мою статистику по полам в инженерии.
0
Мужчин не просто больше, у них выше success rate. Что определяется исключительно историческими факторами, в отличие от результатов в спорте, где это просто биология.

Вот эту мысль не могли бы развернуть?
Почему «просто биология» помогает мужчинам добиваться больших успехов, например, в шахматах, но точно никак не помогает в IT?
0
Могу, конечно.

Ваш вопрос содержит ложную предпосылку изначально, что "«просто биология» помогает мужчинам добиваться больших успехов, например, в шахматах"

Теперь развернуто.

У нас есть четкие доказательства того, что мужчины сильнее и быстрее женщин, обладают лучшей реакцией и большей мышечной массой. И мы знаем часть механизмов — тестостерон и адреналин. Более того, за историю человечества отряды воинов-женщин несколько раз возникали и успеха это не принесло.

Так что в спорте эта разница обусловлена не культурными, а биологическими качествами.

В то же время:
— у нас нет никаких доказательств, что разница в среднем уровне образования и интеллекта и успехах в точных науках обусловлена биологическими, а не социокультурными факторами;
— мы не знаем биологические механизмы, которые могли бы привести к такому эффекту;
— у нас есть достоверные доказательства многовекового влияния социокультурных факторов, которые препятствовали интеллектуальному и профессиональному развитию плюс обширная база стериотипов;
— у нас есть очень положительный опыт работы женщин в IT индустрии, как только мы начали помогать, учить, пускать их в наши неформальные тусовки и т.д.

0
Кроме того, женщины много чаще используют аргументирование не фактами, а выводами (то, что мужчины и называют «женской логикой»). В алгоритмировании такая стратегия, как и в остальной жизни, приводит хоть и к более быстрым результатам вообще (за счёт опускания этапа верификации каждого вывода нужным набором неоспоримых фактов), но ожидаемо к менее качественным в точных науках. Это значит и более быстрое накопление степени критичности ошибок, к чему почти вся работа в сфере ИТ крайне чувствительна. Отсюда и ниже результативность. Пока. Вопрос лишь во времени на подстройку формата своего мышления. Обратите внимание на то, насколько логика аргументирования у ИТ-женщин более близка к традиционной мужской логике (основанной на понятиях ложь-истина).
0

Хорошее замечание, алгоритм правда честно нашел существующую корреляцию. Здесь отлично подходит аналогия алгоритма с ребенком. Если ему нужно было посмотреть на резюме и сказать, будет ли человек принят на работу, то он просто скопировал предвзятость тех, кто просматривал резюме и принимал решения. Научился у "родителей".


Я бы сначала поискал менее радикальное решение, чем полный отказ от исторических данных. Если предположить, что ситуация улучшается, то можно для начала взвесить наблюдения так, чтобы более новые получали больше веса в модели.

0
Отсутствие здравого смысла, вероятно, причина №1, почему машины пока не готовы захватить мир.

<sarcаsm>
Думаю что захватывать им и не нужно, просто уничтожат. С этим и проблемм меньше, и ''мозгов'' надо не так много
</sarcаsm>
Только полноправные пользователи могут оставлять комментарии., пожалуйста.