elmos 15 мая 2020 в 10:56

Что нового ожидается в Python 3.9

6 мин

32K

Python*Программирование*

+56

Комментарии 46

Andy_U 15 мая 2020 в 12:16

Пардон, музыка навеяла: вчера вышел 3.8.3

НЛО прилетело и опубликовало эту надпись здесь

elmos 15 мая 2020 в 14:55

Хорошие вопросы.
В bugs.python.org/issue17005 единственное побуждение положить в functool аргументировано, что топологическая сортировка «is somewhat related to total ordering», но большого обсуждения куда бы лучше положить этот класс судя по всему не было.
Про GIL, если речь про www.python.org/dev/peps/pep-0554, то похоже он перенесен на 3.10 или позднее

blind_oracle 15 мая 2020 в 16:37

Что происходит в выпиливанием GIL?

Да, для меня до сих пор самое большой разочарование в Питоне — картонная многопоточность.
Для I/O всякого подходит, для вычислений — извините, плодите процессы и пиклите данные тудя сюда.

Позор для современного языка… при этом не использовать его вариантов часто нет — тонны библиотек, особенно в сфере работы с данными — только на нём.

Andy_U 15 мая 2020 в 17:19

пиклите данные тудя сюда

Так уже в 3.8 завезли shared memory…

blind_oracle 15 мая 2020 в 17:57

Не отследил, спасибо.

Но мне часто приходится писать для систем вроде RH/CentOS7 где Python 3.6 — предел мечтаний. Можно, конечно, собрать последний и забандлить его в venv, но иногда это не подходит по организационным причинам.

В любом случае — надо изучить насколько оно удобно.

playnet 20 мая 2020 в 05:19

даже в centos8 был 3.6. Поэтому мы просто собрали 3.7 пакетами и положили в локальную репу…

arquolo 15 мая 2020 в 18:06

Который обертка вокруг mmap, существующего с Python 2.x

a0fs 15 мая 2020 в 19:17

GIL — зло. Но с ним, языком может пользоваться любой человек с общими знаниями о программировании (или даже без них). Вокруг меня туча народу струячит код на питоне, и я не уверен, что многие из них готовы к гонкам состояний, а многопоточность они хотят прямо сейчас.

Имхо пусть python остаётся гибким и выразительным языком. А многопоточный счёт лучше делать на golang, там для этого всё есть. Ну а если очень хочется многопоточности — есть асинхронность, что поможет в большинстве задач, типа web-бекенд, либо использовать многопроцессность, где для отстрела себе конечностей нужно приложить специальные усилия…

andreymal 15 мая 2020 в 19:50

Гонки-то и с GIL тоже возможны. GIL позволяет разве что не сломать внутреннее состояние интерпретатора, а записать переменную невовремя из другого потока всё равно никто не мешает (как раз три дня назад дебажил одну гонку)

a0fs 15 мая 2020 в 20:16

Но сильно меньше, не так ли?

blind_oracle 15 мая 2020 в 21:52

Да вроде не особо. Для синхронизации все равно нужны мютексы и прочее. Разве что один объект несколько тредов не смогут поломать внутри записав в него что-то одновременно.

НЛО прилетело и опубликовало эту надпись здесь

a0fs 15 мая 2020 в 20:33

Популярность этого языка в выразительности, универсальности и замечательной способности поддаваться различным изменениям. Мало языков могут быть так неузнаваемо изменены инструментарием не выходящим за пределы стандартной библиотеки. Python — идеальный язык связки различных модулей. Это язык диспетчер. Его задача, в моём идеальном мире, выставить режимы и вызвать скомпилированный на C, C++ или что-нибудь типа golang код, после чего преобразовать результаты в необходимый вид и провести постобработку. Язык который можно расположить посредине между достаточно непростым кодом на вышеупомянутых языках и shell-скриптами (условно, но вот не знаю в ОС где нет shell чего-нибудь адекватного этому). Это язык на котором нужно писать, когда логика, реализованная на shell, уже взрывает мозг или выглядит страшно, но ещё нет таких требований к скорости счёта, чтобы писать на С и подобных. Это явно покрывает больше половины прикладных задач обычных людей. Данная ниша позволит держать язык выразительным и не набивать его костылями. Язык нужно оптимизировать, увеличивать скорость написанных на нём приложений, но нельзя пытаться ворваться в чужую нишу, можно застрять посередине и быть одинаково бесполезным в обеих.

Мне вообще кажется, что попытки построить универсальный язык на все случаи жизни породило море уродов и нанесло в мир ИТ слишком много энтропии… Но это моё мнение.

НЛО прилетело и опубликовало эту надпись здесь

gorodnev 15 мая 2020 в 21:55

Кстати, это причина которая привела к тому, что гугл остался на 2 и будет ее сам патчить.

А где можно об этом почитать? Вроде гугл задеприкейтил python2 и всеми силами мигрирует на python3.

НЛО прилетело и опубликовало эту надпись здесь

netch80 16 мая 2020 в 10:02

Это больше следствие инерции внедрения, чем принципиальных проблем нового языка или кода реализации.

Хотя есть факторы и в пользу старого языка. У меня есть большой проект сетевого общения (не HTTP), так там переход на Py3 замедлил скорость процентов на 10 из-за того, что после первичного парсинга байтового прихода с сети — идёт конверсия в строки и уже дальше работа с str (которая в нём unicode). Конечно, ускорение процессоров снивелирует эту регрессию, но всё равно как-то не очень хорошо…

andreymal 16 мая 2020 в 18:17

Но ведь ничто не мешает продолжать работать с байтами без юникода, не? Почти всё, что можно делать с юникодными строками, можно делать и с байтами

qellex 16 мая 2020 в 08:01

Я не совсем понимаю 3 пункт. Биг дата, ии, моделирование и прочие задачи написаны на си, плюсах, фортране и имеют обертку в виде питона. Они уже используют многопоточность, каким образом «реальная» многопоточность в питоне сможет помочь в этих задачах? Перепишут ли математические библиотеки с си на питон? — нет. Станет ли кто-то использовать го для интерактивной работы с датафреймами вместо питона? — очень сильно сомневаюсь. Сможет ли многопоточный питон противостоять го в микросервисном мире, где нужна условно высокая производительность — нет, да и зачем? Останется ли питон в вебе — да, просто потому, что писать «не хайлоад» на джанге просто приятней чем на го.

НЛО прилетело и опубликовало эту надпись здесь

richman5 15 мая 2020 в 21:23

Думаете, что в ближайшие годы такому «клею» можно обойтись без удобной многопоточности? Вот не думаю честно, что это так.

НЛО прилетело и опубликовало эту надпись здесь

gorodnev 15 мая 2020 в 22:27

Обо всем этом Герб Саттер писал еще в 2005 году. Более того, программисты, ученые и исследователи тоже не сидели на месте все эти годы — языки программирования, библиотеки, подходы и паттерны программирования получили огромное развитие. Все эти средства, при должном использовании, помогают сильно облегчить разработку и уменьшить количество ошибок в коде.

Сейчас есть некоторый хайп вокруг Julia. Кто знает, может это и будет новым «питоном 4 для многопоточности».

НЛО прилетело и опубликовало эту надпись здесь

blind_oracle 15 мая 2020 в 22:07

А многопоточный счёт лучше делать на golang, там для этого всё есть.

Да я бы рад, но вот мне допустим нужно немного ML сделать, искать аномалии в Timeseries данных. Для этого мне надо обучить моделек и гонять forecast по новым данным. А это сильно CPU-bound задача.

В Go полторы библиотеки для этого и те, скорее всего, заброшены. В Питоне — дофигищи. Поэтому пришлось брать его и костылять там всё это в подпроцессах через (де)сериализацию туда-сюда. Потому что за 30 лет питонцы не осилили мультитрединг, не говоря уже о (ко/го)рутинах...

Так что, на мой взгляд, язык определяется его экосистемой — библиотеками и (упаси боже) фреймворками.

midmor 16 мая 2020 в 08:03

Но с ним, языком может пользоваться любой человек с общими знаниями о программировании (или даже без них).

Как обычно, как речь о питоне, так каждый встречный — программист. Будто на других языках "hello world" невозможно осилить...

netch80 16 мая 2020 в 09:50

> Вокруг меня туча народу струячит код на питоне, и я не уверен, что многие из них готовы к гонкам состояний, а многопоточность они хотят прямо сейчас.

1. GIL никак не мешает сделать гонки при некорректной работе, начиная с манипуляцией общими данными за пределами мьютекса. Они реже и менее проблемны, да — segfault не поймаете — но это заслуга языка с AMM, а не GIL.

2. На сейчас планы по выпиливанию GIL состоят в том, что в пределах одного процесса можно создать подпроцесс со своим пучком тредов и взаимодействовать с ним точно так же, как сейчас модуль multiprocessing делает это для отдельных процессов. Поэтому такая реализация ничего вам не сломает — просто для 99% кода можно будет заменить слово multiprocessing на его новый аналог.

iroln 15 мая 2020 в 21:17

Почему TopologicalSorter лежит в functools? Что тут функционального?

На правах шутки: Потому что это свалка для вещей, которые не нужны Гвидо.

Guido:

“I value readability and usefulness for real code. There are some places where map() and filter() make sense, and for other places Python has list comprehensions. I ended up hating reduce() because it was almost exclusively used (a) to implement sum(), or (b) to write unreadable code. So we added built-in sum() at the same time we demoted reduce() from a built-in to something in functools (which is a dumping ground for stuff I don’t really care about :-).”

НЛО прилетело и опубликовало эту надпись здесь

kalbas 15 мая 2020 в 12:56

Ускорены встроенные типы (range, tuple, set, frozenset, list) (PEP-590)

Не смог после прочтения Пепа сделать аналогичный вывод. Не могли бы немного конкретизировать?

elmos 15 мая 2020 в 15:27

Действительно, мне стоило углубиться в этот вопрос, а то не очень понятно, что имелось ввиду в описании релиза под «builtins are now sped up».
Если я правильно понимаю, речь идет о том, что благодаря этому соглашению, ускорится производительность вызова, за счет того, что будет создаваться меньше промежуточных структур в процессе. В любом случае, это больше касается C API, а не разработки на CPython. Однако, это если кто-то лучше вник и может вкратце пояснить, будет круто

Monstrofil 15 мая 2020 в 18:35

2. Использовать lstrip, rstrip:
'foobar'.lstrip(('foo',))

Но есть риск удалить больше чем нужно в случае, когда строка начинается с повторения префикса, а надо удалить только один.

Проблема lstrip даже не в повторениях, а в том, что он работает совсем иначе и использовать его как removeprefix/removesuffix нельзя, так что изменение довольно полезное.

>>> 'fbar'.lstrip('foo')
'bar'
>>> 'oooooobar'.lstrip('foo')
'bar'
>>> 'oofbar'.lstrip('foo')
'bar'

Pavel1114 16 мая 2020 в 07:41

Спасибо за уточнение — возможно сэкономит когда нибудь пару часов дебага. Всегда думал что lstrip ищет/обрезает имеено строку, а не символы ведь я ей передаю строку, а не список символов. По мне так не очень явное поведение. Понятно что теперь из за совместимости не сделать, но если уж расматривать аргумент lstrip как итератор символов для удаления, было бы логичнее вместо добавления removeprefix изменить сигнатуру вызова lstrip: захотел удалить префик — передал ['prefix'], захотел любой из списка символов — передал 'symbols'

Ktulhy 16 мая 2020 в 14:02

У него в объявлении метода стоит всё-же chars, а не prefix

arquolo 15 мая 2020 в 22:27

Самое главно забыли — больше не надо импортировать typing. Теперь можно делать так:

a: list[int] = []

+11

elmos 16 мая 2020 в 08:47

Да отличная штука, добавлено в статью

hd_keeper 15 мая 2020 в 22:29

Главное — чтобы больше не было моржовых операторов.

PiaFraus 16 мая 2020 в 04:00

Новый класс functools.TopologicalSorter для топологической сортировки направленных ациклических графов

О! Здорово, а то мне самому пришлось писать.
Если вы не представляет зачем это — представьте вам нужно загрузить куда-то зависимые друг от друга вещи.
Ну например что-то A не может существовать без B.
что-то C не может существовать без A.
Что-то D не может существовать без A и без C.

Топологическая сортировка вам поможет добыть последовательность загрузки B, A, C, D.

kale 16 мая 2020 в 08:31

Типичный пакетный менеджер)))

netch80 16 мая 2020 в 09:52

У вас непонятный стиль маркирования общения с интерпретатором. Если просто снять с экрана, то получится (CPython, PyPy — почти одинаково):

>>> 2+3
5
>>> 2 == 3
False

а ваши примеры почему-то соответствуют такому:

2+3
>> 5
2 == 3
>> False

Это сурово анноит, прошу исправить примеры.

sarapinit 22 мая 2020 в 08:27

Объясните кто-нибудь, почему в питоне объединение 2х словарей настолько важно что под него целый оператор добавили?

fireSparrow 22 мая 2020 в 11:06

Не то, чтобы прямо очень важно, сколько лет без него нормально обходились.
Но всё-таки:
1. Периодически необходимость объединить два словаря возникает. Сейчас для этого приходится пользоваться костылями типа:

res = dict1.copy()
res.update(dict2)

2. Добавление нового оператора — не такое уж значительное изменение, чтобы для него нужна была очень веская причина.
3. Для множеств подобный оператор уже давно есть, а словари, по сути, просто множества с дополнительными значениями.

sarapinit 22 мая 2020 в 11:14

спасибо

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Показать лучшие за всё время

Что нового ожидается в Python 3.9

Комментарии 46

Публикации

Истории