19 September 2011

Некоторые примеры нестандартных возможностей синтаксиса sql. Часть вторая: форматы дат

Oracle

Введение


Данная статья посвящена форматам дат в Oracle и некоторым особенностям их обработки. В статье приведен обзор нескольких стандартных масок форматирования дат, явная и неявная конвертация строк в даты и дополнительные параметры, влияющие на этот процесс. Как и в первой части статьи, обсуждение материала происходит на основе примеров, демонстрирующих нестандартные возможности форматирования. Детально рассмотрены механизмы Oracle, участвующие в процессе неявного преобразования. Описание большинства возможностей сопровождается ссылками на соответствующие разделы документации.

Изначально я не планировал написание статьи о датах, а собирался остановиться на рассмотрении всего одного вопроса данной тематики. Однако в ходе работы возникла необходимость в освещении различных дополнительных возможностей Oracle, стали появляться новые примеры. Так рассмотрение одного вопроса разрослось в небольшую статью. Надеюсь, получилось нескучно, несмотря на не самую интересную тематику.

Первая часть статьи, посвященная особенностям оператора order by, функционированию not in и примеру неявного преобразования типов, находится здесь.


Функция to_date и форматы даты


Мало кто из программистов любит тематику форматирования. Например, на некоторых курсах темы форматирования дат и региональных стандартов специально ставят на последние часы последнего дня тренинга, т.к. слушателям нудно. Причина в большом количестве существующих форматов при относительно редком их использовании в стандартных задачах. Чаще всего маски используются в трех функциях: to_number, to_char и to_date. Во всех трех случаях маска идет вторым необязательным параметром. И если масок для форматирования чисел еще более-менее вменяемое количество, то масок для форматирования дат до неприличия много, плюс еще суффиксы и модификаторы.

Безусловно, доступность большого количества масок является позитивным моментом, поскольку расширяет возможности, например, проверить является ли 13 сентября 2011 днем программиста, можно с помощью маски 'DDD', которая возвращает номер дня в году:
--Запрос №1
select to_char(to_date('13.09.2011'),'DDD') "Programmers day" from dual; 

Несмотря на явную пользу форматирования, я не планировал включать во вторую часть статьи обзор форматов дат и примеры использования экзотических масок. Во-первых, вряд ли это будет кому-то интересно, во-вторых, автор также не является большим почитателем сложного форматирования, поскольку редко его применяет в жизни. Единственная причина появления данного раздела – некоторые вопросы, возникшие у читателей по поводу использования формата RR.

Перед тем как перейти непосредственно к основной теме раздела, давайте рассмотрим несколько нестандартных примеров работы с датами.

Пример №1. Использование урезанных шаблонов
Начнем со стандартного форматирования. Пускай сегодняшняя дата 16.09.2011, выполнятся ли следующие запросы, и что они вернут?
--Запрос №2
select to_char(sysdate, 'YYYY') from dual;
--Запрос №3
select to_date('03', 'DD') from dual; 

Запрос №2 является типичным примером конвертации даты в строку с приведением ее к нужному формату. Единственное отличие – вместо более привычных масок вида 'DD.MM.YY' или 'DD-MON-YYYY' мы использовали маску, задающую только год. Запрос №2 выполнится успешно и вернет текущий год в четырехзначном формате, т.е. '2011'.

Запрос №3 немного интереснее, он представляет собой типичный пример явного преобразования строки в дату с урезанной маской формата, поэтому, с точки зрения синтаксиса, запрос верный и выполнится успешно. Более важным вопросом является результат его выполнения, т.е. какую дату он вернет, если задан только день? Перед ответом на данный вопрос давайте вспомним, как Oracle устанавливает время, если оно явно не задано:
--Запрос №4
select to_char(to_date('03.02.2011','DD.MM.YYYY'),'DD.MM.YYYY HH24:MI:SS') from dual;
--Запрос №5
select to_char(to_date('03.02.2011 30', 'DD.MM.YYYY MI'),'DD.MM.YYYY HH24:MI:SS') from dual; 

В запросе №4 время не указано, в запросе №5 указано только количество минут, часы и секунды опущены. В Oracle существует правило, согласно которому, если в дате отсутствует временной компонент, то время автоматически устанавливается в значение 00:00:00 (т.е. полночь), если задана только часть элементов времени (как в запросе №5), то пропущенные элементы устанавливаются в 00. Поэтому, запрос №4 вернет строку '03.02.2011 00:00:00', а запрос №5 — '03.02.2011 00:30:00'.

Вернемся к запросу №3, верно ли данное правило для дат, т.е. заменяются ли пропущенные при конвертации элементы даты на 00 или 01? Да заменяются, но не все, точнее, для пропущенных элементов даты используются значения из sysdate (первый день текущего месяца текущего года). Поэтому запрос №3 будет использовать 09 в качестве месяца и 2011 в качестве года, таким образом, результатом выполнения запроса будет дата 03.09.2011.

Пример №2. Порядок параметров форматирования
Выполнится ли следующий запрос, и если да, то какую дату он вернет?
--Запрос №6
select to_date('20092011', 'YYYYDDMM') from dual; 

На первый взгляд, отсутствие разделителей в строке с датой может показаться критическим фактором несовместимым с выполнением запроса, однако маска даты также задана без разделителей и строка для преобразования соответствует указанному шаблону. Поэтому запрос №6 выполнится успешно и вернет 20.11.2009 (формат результата может несколько отличаться в зависимости от настроек сессии). Детальнее вопросы, связанные с разделителями, мы рассмотрим в следующем примере.

Пример №3. Неявная конвертация
Пусть формат даты по умолчанию DD.MON.RR, а язык даты – русский, отработает ли следующий запрос:
--Запрос №7
select months_between('1\сентябрь-9','01$окт/08') from dual; 

В данном запросе указано два строковых параметра, которые должны быть преобразованы в даты с помощью неявной конвертации. Согласно документации, при использовании форматов по умолчанию, строка для неявного преобразования в дату должна удовлетворять шаблону: [D|DD] separator1 [MM|MON|MONTH] separator2 [R|RR|YY|YYYY]. В качестве separator1 и separator2 можно использовать большинство разделительных знаков и специальных символов, в том числе пробелы, табуляцию, а также " и удвоенную одинарную кавычку ''. Более того, если в строке указано не менее двух цифр для задания дней, месяцев и лет, то separator вообще может быть опущен. Например:
--Запрос №8
select to_date('01сентябрь09') from dual;
--Запрос №9
select to_date('01сен09') from dual;
--Запрос №10 для этого запроса формат даты по умолчанию должен быть DD.MM.RR
select to_date('010909') from dual;

Поскольку обе строки указанные в запросе №7 соответствуют приведенному шаблону, то запрос выполнится успешно и вернет число 11.

Пример №4. Параметры функции to_date
Пусть формат даты по умолчанию DD.MON.RR, а язык даты – русский, отработает ли следующий запрос:
--Запрос №11
select to_date(sysdate,'mm/dd/yyyy hh24:mi:ss') from dual; 

Схожий запрос фигурировал в одном из обсуждений на странице ask Tom. Ловушка запроса в том, что мы пытаемся преобразовать дату (sysdate) в дату. Если бы запрос выглядел так:
--Запрос №12
select to_char(sysdate,'mm/dd/yyyy hh24:mi:ss') from dual; 

То выполнение прошло бы успешно, и он вернул строку '09/15/2011 23:00:11'. Однако функция to_date в качестве первого параметра ожидает строку поэтому, вначале происходит неявная конвертация даты в строку (что эквивалентно вызову to_char(sysdate) с маской по умолчанию). Результатом данной конвертации является строка '15.09.11', далее происходит вызов to_date. Таким образом, запрос №11 эквивалентен следующему запросу:
--Запрос №13
select to_date('15.09.11','mm/dd/yyyy hh24:mi:ss') from dual; 

Как не сложно убедиться, запрос №13 не может быть выполнен, поскольку строка '15.09.11' не соответствует установленной маске, соответственно, запрос №11 так же не может быть выполнен.

Установка формата даты по умолчанию
Формат дат по умолчанию задается двумя параметрами: NLS_DATE_FORMAT (отвечает за сам формат как таковой) и NLS_DATE_LANGUAGE (отвечает за язык, который будет использован при написании названий дней, месяцев и т.д.). Если эти параметры не заданы явно, то их значения устанавливаются на основе параметра NLS_LANG.

Существует три уровня, на которых можно задать формат дат:
  1. Уровень БД:
    select * from nls_database_parameters
    where parameter in ('NLS_DATE_FORMAT','NLS_DATE_LANGUAGE'); 
    Параметры этого уровня устанавливаются при создании БД и прописываются в файле init.ora.
  2. Уровень экземпляра:
    select * from nls_instance_parameters 
    where parameter in ('NLS_DATE_FORMAT','NLS_DATE_LANGUAGE'); 
    Параметры этого уровня устанавливаются при старте экземпляра и могут быть изменены с помощью команды ALTER SYSTEM.
  3. Уровень сессии:
    select * from nls_session_parameters
    where parameter in ('NLS_DATE_FORMAT','NLS_DATE_LANGUAGE'); 
    Параметры этого уровня могут быть изменены командой ALTER SESSION. Также значение данных параметров можно проверить с помощью запроса:
     select SYS_CONTEXT ('USERENV', 'NLS_DATE_FORMAT'), 
           SYS_CONTEXT ('USERENV', 'NLS_DATE_LANGUAGE') from dual; 
Параметры каждого следующего уровня «затирают» параметры предыдущего, т.е. если у вас установлены параметры уровня сессии, то параметры остальных уровней на вашу сессию не повлияют. Для установки единого формата даты для всех сессий Том в своей колонке предлагает использовать ON-LOGON триггер:
create or replace trigger data_logon_trigger
    after logon
    ON DATABASE
    begin
        execute immediate
            'alter session set nls_date_format = ''dd/mm/yyyy''';
    end; 

Пример №5. Формат DD.MM.RR vs DD-MON-RR
Уделить внимание форматированию дат по умолчанию меня подвигла некая странность в неявном преобразовании строк в дату. Давайте рассмотрим следующий пример:
--Запрос №14
--Устанавливаем формат даты по умолчанию 
alter session set NLS_DATE_FORMAT='DD.MM.RR'; 
--Устанавливаем язык даты по умолчанию
alter session set NLS_DATE_LANGUAGE='AMERICAN'; 
--Проверяем значение параметров сессии
select * from nls_session_parameters where parameter in ('NLS_DATE_FORMAT','NLS_DATE_LANGUAGE');
--Конвертируем строки в дату
select to_date('11.09.11') from dual;
select to_date('11.SEP.11') from dual; 

Логично предположить, что преобразование строки '11.09.11' в дату пройдет успешно, а строки '11.SEP.11' – нет. Однако это не так, успешно выполнятся оба преобразования. Вначале я предполагал, что в случае невозможности преобразовать строку по маске сессии Oracle пытается задействовать маски других уровней (маска уровня БД у меня установлена в 'DD-MON-RR'). Чтение документации показало, что это не так, и Oracle руководствуется принципами, описанными в предыдущем пункте.

Попробуем другой пример:
--Запрос №15
--Устанавливаем формат даты по умолчанию 
alter session set NLS_DATE_FORMAT='DD.MON.RR'; 
--Устанавливаем язык даты по умолчанию
alter session set NLS_DATE_LANGUAGE='AMERICAN'; 
--Проверяем значение параметров сессии
select * from nls_session_parameters where parameter in ('NLS_DATE_FORMAT','NLS_DATE_LANGUAGE');
--Конвертируем строки в дату
select to_date('11.09.11') from dual;
select to_date('11.SEP.11') from dual; 

Если вы думаете, что результат будет идентичен предыдущему запросу, то вы ошибаетесь. Одно из преобразований не выполнится. В данном случае строка '11.09.11' не удовлетворяет шаблону. Возможно, это мистика?

Увы, нет. Чтение документации показало, что существуют правила автозамены элементов форматирования даты. Ниже привожу таблицу замен.
Original Format Element Additional Format Elements to Try in Place of the Original
'MM' 'MON' and 'MONTH'
'MON 'MONTH'
'MONTH' 'MON'
'YY' 'YYYY'
'RR' 'RRRR'
Глядя на содержимое этой таблицы, становится понятно, что в формате 'DD.MM.RR' неявным образом присутствует формат 'DD.MON.RR' (а также 'DD.MONTH.RR' и другие), а вот в формате 'DD.MON.RR' формат 'DD.MM.RR' не присутствует, что и объясняет поведение запросов №14 и №15.

Пример №6. Формат RR vs YY
Большинству пользователей отличия масок RR и YY хорошо известны, однако есть и те, кому данная информация окажется полезной. Перейдем сразу к рассмотрению примера. Какие данные вернут следующие запросы:
--Запрос №16
select to_date('11','RR') "RR", to_date('11','YY') "YY" from dual;
--Запрос №17
select to_date('99','RR') "RR", to_date('99','YY') "YY" from dual; 

Оба приведенных выше запроса выполнятся успешно и вернут даты в соответствии с правилами, описанными в примере №1 для запроса №3. Таким образом, значение дня во всех полученных датах будет равно 01, а значение месяца 09 (если вы выполняете запрос в сентябре). Главный вопрос, каким будет значение года?

Как несложно предположить, в запросе №16 под '11' я подразумевал 2011 год и обе маски мне его вернули, т.е. результат выполнения запроса №16 это 01.09.2011 и 01.09.2011.

В запросе №17 под '99' я подразумевал 1999 год и тут мнения масок разделились: маска RR вернула ожидаемый 1999 год, а маска YY – 2099, т.е. результат выполнения запроса №17 это 01.09.1999 и 01.09.2099.

Рассмотрим, как работают эти элементы форматирования более детально:
--Запрос №18
select to_date('00','RR') "00", to_date('49','RR') "49", to_date('50','RR') "50", to_date('99','RR') "99"  from dual
union all
select to_date('00','YY') "00", to_date('49','YY') "49", to_date('50','YY') "50", to_date('99','YY') "99"  from dual; 

Как видно из запроса №18, отличия в работе масок начинаются с 50-х годов, т.е. формат YY всегда возвращает год в текущем столетии, а RR – год <50 воспринимает как год текущего столетия, а год >50 – как год прошлого столетия. На самом деле значения to_date('99','RR') = 1999 и to_date('00','RR') = 2000 верны, только если текущая дата менее 2051 года, после него to_date('99','RR') = 2099 и to_date('00','RR') = 2100. Если у вас есть желание поэкспериментировать – можете сменить время сервера на 2051 год и посмотреть, как изменится результат работы запроса №18, только не делайте этого на работающих системах! В случае изменения времени сервера изменится sysdate и лучше даже не думать о том, какую головную боль вы получите во всех отчетах, таблицах логов и т.д. Общие правила преобразования двухциферного года в четырехциферный с помощью формата RR выглядят так:
If the specified two-digit year is 00 to 49, then
  • If the last two digits of the current year are 00 to 49, then the returned year has the same first two digits as the current year.
  • If the last two digits of the current year are 50 to 99, then the first 2 digits of the returned year are 1 greater than the first 2 digits of the current year.
If the specified two-digit year is 50 to 99, then
  • If the last two digits of the current year are 00 to 49, then the first 2 digits of the returned year are 1 less than the first 2 digits of the current year.
  • If the last two digits of the current year are 50 to 99, then the returned year has the same first two digits as the current year.
Обратите внимание, я говорю только о случае задании года с помощью двух цифр, если вы зададите год четырьмя цифрами, то маска YY будет автоматически замещена маской YYYY, а маска RR – RRRR.
--Запрос №19
select to_date('1950','RR') "50RR", to_date('1950','YY') "50YY"  from dual; 

Поэтому запрос №19 вернет 1950 год в обоих случаях.

Пример №7. Некоторые другие примеры
В завершение обзора рассмотрим немного экзотики. Будет ли ошибка в результате выполнения следующего запроса:
--Запрос №20
select DATE '1928-12-25' from dual; 

Если вы решили, что это бессмысленная запись, то вы ошибаетесь – это вполне корректное задание даты в соответствии со стандартом ANSI, запрос №20 выполнится успешно и вернет 25.12.1928.

Какой из запросов не выполнится?
--Запрос №21
select to_date('1998-ЯНВ-25 17:30','YYYY-MON-DD HH24:MI','NLS_DATE_LANGUAGE=AMERICAN') from dual;
--Запрос №21
select to_date('1998-ЯНВАРЬ-25 17:30','YYYY-MON-DD HH24:MI','NLS_DATE_LANGUAGE=RUSSIAN') from dual; 

Данный пример призван продемонстрировать наличие третьего параметра в функции to_date. Данный параметр позволяет установить значение одного из NLS (National Language Support) параметров только для этого вызова функции to_date. Установку NLS параметров для сессии мы рассматривали в примере №5. Ключевая разница запросов №20 и №21 состоит не в названии месяца (маска MON автоматически замещается маской MONTH, как это описано в примере №5), а в указании разных языков даты. Запрос №21 ожидает название месяца на английском и, соответственно, не выполнится, запрос №22 ожидает название месяца на русском и выполнится успешно.

В каком случае следующее объявление таблицы может приводить к возникновению ошибок при вставке данных?
--Запрос №23
create table for_test (a number, b date default to_date('11.09.2011')); 	

Каждый раз, когда сессия с форматом даты по умолчанию 'DD.MON.RR' будет производить вставку с указанием только значения первого столбца
insert into for_test(a) values(1); 
будет возникать ошибка.


Особенности отображения дат в различных приложениях


Что влияет на отображение даты
Этот раздел добавлен после публикации статьи благодаря рекомендациям, указанным в комментариях. Описанное далее верно как для отображения дат, так и для отображения чисел. Возможно, при выполнении некоторых приведенных выше в статье примеров, вы получили даты в отличном от указанного в результатах формате. Если настройки вашей сессии соответствовали указанным в примерах, то это представляется, по меньшей мере, странным.

Правда заключается в том, что при выполнении запроса
--Запрос №24
select sysdate from dual; 
вы получаете дату, но для отображения результата на экран конкретная утилита, с помощью которой вы обращаетесь к БД, должна провести конвертацию даты в строку. Таким образом, для отображения дат (и чисел) неявным образом вызывается to_char, т.е. имеем классический случай неявной конвертации (это конвертация только для вывода на экран, ее результаты не участвуют ни в каких вычислениях и ни на что кроме отображения данных не влияют). Если есть неявная конвертация, значит, существует и маска, по которой она выполняется. В классическом случае это должна быть маска, установленная для сессии, т.е. маска, указанная в параметре NLS_DATE_FORMAT таблицы nls_session_parameters, с которой мы активно работали на протяжении всей статьи.

Давайте проверим работу некоторых приложений. Проверять будем с помощью следующего скрипта:
--Запрос №25
--Проверяем параметры сессии по умолчанию
select * from nls_session_parameters where parameter in ('NLS_DATE_FORMAT','NLS_DATE_LANGUAGE');
--Выводим дату
select sysdate from dual;
--Меняем параметры сессии по умолчанию
alter session set NLS_DATE_FORMAT='DD.MON.RR hh24:mi:ss';
--Выводим дату
select sysdate from dual; 

Проверим, какие параметры для отображения дат использует sqlplus.
image
Рис. 1. Результат выполнения запроса №25 в sqlplus.

Как видно из рис.1, формат отображения даты меняется в зависимости от настроек сессии, т.е. sqlplus использует настройки сессии. Это упрощает понимание процесса преобразования дат в строки и обратно, поскольку и для преобразования и для отображения используются одинаковые маски.

Некоторые продвинутые средства разработки используют свои собственные NLS настройки, не имеющие отношения к настройкам Оракл. В качестве примера проверим, какие параметры для отображения дат использует PL/SQL Developer. Для этого выполним в нем запрос №25.
image
Рис. 2. Результат выполнения запроса №25 в PL/SQL Developer.

Как видно из рис.2, формат отображения даты не меняется при изменении настроек сессии. Более того, если посмотреть внимательно, то видно, что и первый и второй результаты вывода даты на экран не соответствовали параметрам сессии (в первом случае выведенная дата имела год в четырехзначном формате, а маска указывала год в двухзначном формате). Это означает, что утилита использует собственные NLS настройки, в случае PL/SQL Developer’а их расположение указано на рис. 3.
image
Рис. 3. Установка NLS параметров отображения дат в PL/SQL Developer.

Чем могут быть вредны NLS настройки утилит
Отображение даты в формате отличном от формата сессии вредно по одной причине – оно вводит пользователя в заблуждение и может привести к возникновению ошибок. Выполним в sqlplus и PL/SQL Developer следующий запрос:
--Запрос №26
--Меняем параметры сессии по умолчанию
alter session set NLS_DATE_FORMAT='DD.MON.RR hh24:mi:ss';
--Выводим дату
select sysdate from dual;
--Пытаемся преобразовать полученные из предыдущего запроса данные в дату
select to_date(ХХХХХХХХ) from dual; 
В последнюю строку запроса вместо ХХХХХХХХ мы будем вставлять полученные из предыдущей строки данные.

Результаты выполнения запроса представлены на рисунках ниже.
image
Рис. 4. Результат выполнения запроса №26 в sqlplus.


Рис. 5. Результат выполнения запроса №26 в PL/SQL Developer.

Почему в sqlplus выведенные на экран данные были успешно конвертированы в дату, а данные выведенные на экран PL/SQL Developer’ом не смогли сконвертироваться? Потому что для конвертации Оракл использует формат данных указанный в сессии, а данные выведенные PL/SQL Developer’ом были приведены для отображения в свой формат, отличный от формата сессии.


Заключение


В качестве заключения хочу напомнить, что почти в каждом своем посте посвященном работе с датами, Том Кайт говорит о необходимости использования явных преобразований и обязательном указании маски. «При конвертации строки в дату никогда не полагайтесь на формат даты по умолчанию, всегда явно задавайте маску» — примерно так звучат его слова. Дополнительные примеры и возможные ошибки при работе с преобразованием дат вы можете найти, воспользовавшись страничкой ask Tom.

Поскольку работа с датами заняла всю статью, то «за бортом» осталось множество интересных вопросов, которые я хотел бы рассмотреть. Скорее всего, появится и третья часть статьи, как только у меня найдется свободное время.
Tags:oracle sqlнестандартные возможностиto_dateмаски форматирования дат
Hubs: Oracle
+34
103.1k 88
Comments 8
MS SQL Server Developer
March 10, 202135,000 ₽OTUS
Введение в SQL
December 7, 202017,100 ₽Luxoft Training
Apache Spark для дата инженеров
February 16, 202165,000 ₽New Professions Lab
Тренажер product-менеджера
December 3, 202028,900 ₽SkillFactory