Bas1l 26 авг 2014 в 11:56

Как вращается камера в 3D играх или что такое матрица поворота

11 мин

122K

Алгоритмы*Математика*

+97

Комментарии 44

Darthman 26 авг 2014 в 12:02

Шикарно. Давно не видел столь подробного раскладывания материала по полочкам, да еще и с картинками.

Bas1l 27 авг 2014 в 00:13

Спасибо. Рад, что вам понравилось

AterCattus 26 авг 2014 в 12:10

Обстоятельно написано. А теперь можно еще и про кватернионы :)

Gaxx 26 авг 2014 в 12:26

Присоединяюсь к просьбе. Интересно было бы почитать.

daspisch 26 авг 2014 в 13:10

habrahabr.ru/post/183116/
habrahabr.ru/post/183908/

imwode 26 авг 2014 в 18:20

wat.gamedev.ru/articles/quaternions
www.gamedev.ru/code/articles/faq_matrix_quat?page=5

Darthman 26 авг 2014 в 13:06

Да, добавить кватернионы к этом было бы тоже очень полезно.

LordGlue 26 авг 2014 в 12:51

Так это ж аффинные преобразования. Там все матрицы есть: сдвига, поворота, растяжения/сжатия…

Sayonji 26 авг 2014 в 17:00

Есть сомнения по поводу матрицы сдвига.

craimez 26 авг 2014 в 18:51

Если использовать однородные координаты, то будет и матрица сдвига :) Что удобно: все необходимые преобразования в одном виде.

Bas1l 27 авг 2014 в 01:24

Вы правы. Но аффинное пространство по-хорошему строится «поверх» векторного. То есть векторное пространство надо объяснять так или иначе. Поворот—самую сложную из операций (как мне кажется)—можно объяснить сразу в векторном пространстве. После этого расширение до аффинного, переход к четырехмерным матрицам и все остальные матрицы (сдвиг, сжатие/растяжение, даже проекцию) понять очень просто. То есть такая последовательность изложения мне кажется оптимальной. Может быть, я когда-нибудь и напишу продолжение этой статьи.

Loriowar 26 авг 2014 в 13:19

Великолепно! Доходчиво и понятно. Продолжать в том же духе планируете?

Bas1l 27 авг 2014 в 00:42

Спасибо! Вообще, я всего лишь хотел написать краткую заметку о том, почему некоторые звуки гармонируют, некоторые нет (на хабре было несколько статей, но они даже, можно сказать, с ошибками). Для этого нужно писать про преобразование Фурье. На хабре было несколько статей и про него, некоторые очень хорошие, но там нет того объяснения, которое мне нравится. А в этом объяснении используется матрица поворота. Поэтому пришлось писать вначале про матрицу поворота :-) Так что я планирую еще как минимум две статьи. И, может быть, по просьбам благодарных читателей про аффинные преобразования и кватернионы, если будет время.

EighthMayer 27 авг 2014 в 01:39

Будем рады вашим новым статьям! Мне особенно было-бы интересно почитать про звуки. Так-же не будет лишней ещё одна статья про кватернионы в применении к трёхмерной графике (несмотря на обилие информации в своё время убил кучу времени чтобы «въехать» — очень мало информации излагается «на пальцах»).

Bas1l 28 авг 2014 в 20:55

Спасибо!

НЛО прилетело и опубликовало эту надпись здесь

huze 26 авг 2014 в 14:27

У вас первая часть формулы (8) точно правильно написана? Она идентична (9).

Bas1l 27 авг 2014 в 00:38

Действительно, спасибо, там была ошибка (там должен быть случай i=1 из общей формулы (9)). Теперь поправил.

НЛО прилетело и опубликовало эту надпись здесь

Bas1l 31 авг 2014 в 02:00

Большое спасибо—вы правы. Теперь все должно быть правильно.

6opoDuJIo 26 авг 2014 в 18:43

Разве преобразование позиции вершин происходит не по следующему алгоритму?
[экранная позиция вершины] = [vertex pos] * [world matrix] * [projection matrix] * [view matrix]?

Я что-то всерьёз сомневаюсь что в реальных приложениях действительно поворачивается базисный вектор в случае с поворотом.
А саму тему автор вообще даже и не раскрыл: собственно, вращение камеры в 3d-играх, оставив одни лишь домыслы и «матрица поворота из трёх других матриц поворота», что есть профанация, ибо сам поворот камеры задаётся в матрице проекции и собрать ещё можно одним шагом, без перемножения нескольких матриц.
Плюс, на эту тему был куда более информативный пост гораздо ранее: habrahabr.ru/post/126269/

-1

badchemist 26 авг 2014 в 19:15

> [экранная позиция вершины] = [vertex pos] * [world matrix] * [projection matrix] * [view matrix]

Тогда уж world * view * projection. Сначала вам надо внутримодельные координаты точки перенести в общемировые (с учетом того, где модель находится в мире) — это world (хотя чаще все-таки называют model). Потом необходимо сдвинуть / повернуть мир на необходимые расстояния и углы, чтобы камера оказалась в 0/0/0 — это view. Projection, наконец, спроецирует результат на воображаемый экран перед камерой определенным образом (перспективной проекцией, ортогональной, да как угодно).

6opoDuJIo 26 авг 2014 в 19:21

Да, действительно, мог ошибиться с порядком. Несмотря на то, что произведение матриц некоммутативно, суть посыла осталась неизменна.

EighthMayer 26 авг 2014 в 23:06

Со всем этим возюканьем не следует забывать, что этот набор матриц является не чем-то фундаментальным, а просто удобной абстракцией, принятой как стандарт.

В некоторых ситуациях матриц может быть меньше (например если модель изначально построена в координатах мира), или напротив больше (при использовании скелетной анимации). А некоторые операции с матрицами можно (и нужно) заменять операциями с кватернионами.

badchemist 26 авг 2014 в 23:54

Да, само собой. Но этот набор является более-менее стандартным не в последнюю очередь потому, что эти три матрицы в нем получаются сами по себе простые. Ну то есть, например, ячейки матрицы view содержат в себе просто значения x, y, z и углов поворота, а не какие-нибудь адские формулы типа x*sin(a)+y*cos(b). Взял, закинул координаты и угол поворота камеры в матрицу, и всё. Это позволяет избежать лишних расчетов на стадии подготовки к рендеру кадра, оставив все подобные сложения и умножения на совести видеокарты, которая эти матрицы легко и эффективно пощелкает.

Bas1l 27 авг 2014 в 01:17

Попробую ответить по пунктам:

1. вершины в настоящей графике—объекты аффинного пространства, как справедливо заметили выше. И некоторые операции над вершинами присущи только ему. Но аффинное пространство строится «поверх» векторного, так что вначале стоит рассказать про векторное пространство

2. некоторые операции с вершинами и камерой не являются линейными операторами в векторном пространстве (сдвиг, например). То есть трехмерной матрицей их не задать. Но мы уже работаем в четырехмерном пространстве (чтоб разделять векторы и точки), а четырехмерными матрицами можно задать и сдвиг

3. Я не совсем понимаю, что вы имеете в виду под " в реальных приложениях… поворачивается базисный вектор в случае с поворотом". Поворот системы координат (для простоты будем говорить о 2D) на Х градусов против часовой стрелки эквивалентен повороту камеры на Х градусов по часовой стрелке. Который, в свою очередь, эквивалентен повороту наблюдаемых объектов на Х градусов снова против часовой стрелки. То есть формулы из статьи для поворота системы координат—такие же, как и для поворота камеры или объектов (только для камеры угол надо вставить в формулу со знаком минус).

3 а. Давайте посмотрим на пункт «2. Зачем компьютерной графике матрицы?» из ссылки из вашего комментария, на матрицу поворота:

,
Последний столбец и последняя строка проистекают из расширения векторного пространства до аффинного, их можно убрать. Коеффициенты А и B можно найти чуть выше в тексте: «Где A = sin(a), B = cos(a).» То есть оставшаяся двумерная матрица—как раз формула (12) из моей статьи. Собственно, основная цель моей статьи—дать общий вывод этой формулы.

4. Ваша ссылка замечательная, но у нее другой формат (как следует из названия), это FAQ. В нем формулы без определений, особого вывода и объяснения. Как я уже сказал, цель моей статьи—дать самые важные определения и вывод самой сложной и важной, на мой взгляд, формулы.

5. (боже, как много) поворот не задается в матрице проекции. Поворот объектов задается, как указали ниже, в матрице model, поворот камеры—во view. В проекции—только проекция (как следует и из вашего FAQ и собственно из названия матрицы).

6. "«матрица поворота из трёх других матриц поворота»… что есть профанация" Ссылка на википедию из последнего раздела сразу ведет на эти элементарные вращения, а следующий подраздел в статье на википедии—о том, как собрать из них общую матрицу поворота. И конечно, можно задавать вращения по-другому, о чем я и пишу в следующем абзаце.

7. если бы я описывал подробнее трехмерные вращения, статья была бы излишне большой. Мне кажется, если понять весь текст перед последним разделом, то ссылки на википедию понять очень легко. Это оптимальное решение, на мой взгляд.

Спасибо

badchemist 26 авг 2014 в 19:09

Комментарий удален (промахнулся веткой).

Shchvova 26 авг 2014 в 19:29

Я все таки не понял откуда взялось

. Я помню ее со школы но почему она была скалярным произведением в школе было вовсе непонятно.

Eol 26 авг 2014 в 20:28

Во-первых сперва показывается, что это величина инвариантная. Это значит, что если провести произвольный поворот системы координат, то она не изменится. В институте это является определением поворота ака ортогонального преоюразования; в школе же, кажется, это показывалось явно для двумерья (где можно тривиально записать матрицу поворота в общем виде — там только 1 параметр).
А во-вторых, если выбрать систему координат, в которой одну ось направить вдоль, скажем, вектора a, а вторую — так, чтобы оба вектора лежали в одной плоскости с обоими векторами, то тем самым координаты первого вектора будут (a, 0), а второго — (b cos \phi, b sin \phi); тем самым их скалярное произведение — то что нужно.

Shchvova 26 авг 2014 в 20:31

м… А если убрать косинус фи, просто оставить |a|*|b| то разве не будут те же инварианты сохраняться? Мой вопрос больше — откуда взялась эта формула. В чем смысл умножать длину вектора на длину проекции другого вектора на него?

НЛО прилетело и опубликовало эту надпись здесь

Shchvova 26 авг 2014 в 20:51

Я только такую циркуляцию знаю.

НЛО прилетело и опубликовало эту надпись здесь

Shchvova 26 авг 2014 в 21:05

ну блин. Это тяжело назвать определением скалярного произведения. Там просто пытаются найти элементарный вклад в векторную циркуляцию. Это проекция типа

— например для гидродинамики.
Но так определять веркторное произвидение мне кажется очень нелогичным и не отвечает на вопрос — откуда формула.

НЛО прилетело и опубликовало эту надпись здесь

Bas1l 27 авг 2014 в 01:47

Да, я тоже примерно так себе и представляю. Единственное, добавлю, что скалярное произведение в виде |a|*|b|, хоть, кажется, и удовлетворяет нужным аксиомам, но не очень удобно: нулевое значение его из векторов единичной длины (измеренных линейкой) не получить, то есть ортонормированный базис не построить.

Sayonji 28 авг 2014 в 20:25

|a|*|b| не является скалярным произведением, хотя бы потому, что при таком определении не выполняется необходимое свойство (ka, b) = k(a, b)

Bas1l 28 авг 2014 в 20:47

И действительно, точно, при отрицательных k не работает. Тогда все встает на свои места.

Eol 28 авг 2014 в 17:08

Потому что изначально это было как ax*bx + ay*by + az*bz. Это — естественная вещь, много где проявляющаяся, и она является инвариантной.

aevgen 26 авг 2014 в 23:37

Грубо говоря, скалярное поле образует правило (функция), которое каждой паре элементов ставит в соответствие число. Именно такая функция отлично подошла на эту роль для данного множества (эта функция удовлетворяет условиям скалярного произведения для данного множества).

fshp 27 авг 2014 в 00:35

Уж если про игры заговорили, то предупреждали бы неокрепшие умы о Gimbal Lock. Кватернионы не только решают эту проблему, но и легко интерполируются, позволяя описывать плавные анимации.

ankh1989 27 авг 2014 в 10:27

Поставил плюс в карму за этот комментарий :)

MrGobus 28 авг 2014 в 11:37

Статья увлекательная, но вот название подкачало, теперь все ругаются словом кватернион =) Начнем с того, что статья не о камере и ее вращении, а о так называемых «афиновых преобразованиях» (перенос, масштаб, разворот или translate, scale, rotate) и о матричном представлении этих преобразований для трехмерного пространства с упором именно на поворот.
Управление камерой в 3D играх конечно же базируется на матричных преобразованиях, но так как все сводится к функции lookAt(eye, center, up) программисту достаточно поверхностного понимания всего описанного выше и все сводится к поиску вектора куда направлена камера, обычно это вектор движения возможно с вычитанием некоторого расстояние для того чтобы камера оказалась сзади, для стратегических игр можно добавить щепотку синусов и косинусов =) для вращения вокруг объекта.
Кватернионы о которых все говорят в комментариях конечно вещь полезная, но только по причине их безошибочной интерполяции (slerp) и в результате все сводится к тому, что углы поворота конвертируются в кватернион, затем его крутят и преобразуют в матрицу поворота на которую перемножают произведение матриц сдвига и масштаба.

EighthMayer 28 авг 2014 в 21:52

Насчёт «программисту достаточно поверхностного понимания» — не соглашусь. В применении к программисту трёхмерной графики это всё равно что сказать «Химику достаточно поверхностного понимания химии. Всё сводится к поиску нужных пропорций реагентов. Для сложных формул достаточно добавить щепотку учебника по химии для 8 класса».

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Показать лучшие за всё время

Как вращается камера в 3D играх или что такое матрица поворота

Комментарии 44

Публикации

Истории