Как стать автором
Обновить

На мгновение быстрее: измеряем время упаковки и распаковки значимых типов данных

Время на прочтение 5 мин
Количество просмотров 9.4K

Доброго дня, Хабр!



Многие неопытные разработчики не всегда знают и понимают, что же происходит за кулисами их кода. Сейчас речь пойдет об упаковке и распаковке значимых типов данных (по-русски это звучит ужасно, поэтому «boxing and unboxing value types»).
Под катом небольшой пример и измерение времени выполнения.

Что такое упаковка (boxing)?
Коротко. Есть значимые типы данных (value types) и ссылочные (reference types). Переменные значимых типов данных хранят само значение (спасибо, кэп!), переменные ссылочных типов данных — ссылку на участок в памяти, где хранится это значение.

int valType = 15;

Это значимый тип данных. Значение переменной valType будет храниться в стэке. Многие стандартные типы данных — значимые (int, byte, long, bool и т.д.).
Дальше если мы попробуем сделать вот так:

int valType = 15;
Object refType = valType;

И получим в результате переменную ссылочного типа (refType). Тут произойдет следующее: сначала в стэке появится значение переменной valType (значимый тип), потом в памяти будет создан контейнер для хранения значения этой переменной (в нашем случае контейнер для переменной типа int, то есть 4 байта под значение + sync block index (еще 4 байта)), а вот уже указатель на этот контейнер и будет храниться в нашей переменной ссылочного типа (refType). Этот процесс называется упаковка (boxing).
Подробности можно посмотреть тут, а лучше прочитать в книжке Дж.Рихтера «CLR via C#» (Глава 5).

Самое неприятное в этих операциях то, что они происходят неявно.
Например, мы хотим вывести число в консоль. Так:

Console.WriteLine(20);

Или вот так:

Console.WriteLine("{0}", 20);

В чем разница? Давайте посмотрим на результат компиляции в MSIL (сделать это можно утилитой ILdasm.exe):

// Это для вызова Console.WriteLine(20);
  IL_0000:  ldc.i4.s   20
  IL_0002:  call       void [mscorlib]System.Console::WriteLine(int32)

// А это для вызова Console.WriteLine("{0}", 20);
  IL_0007:  ldstr      "{0}"
  IL_000c:  ldc.i4.s   20
  IL_000e:  box        [mscorlib]System.Int32
  IL_0013:  call       void [mscorlib]System.Console::WriteLine(string,
                                                                object)

Во втором случае мы видим команду box, которая и выполняет упаковку.
Чтобы понять откуда она взялась, взглянем на сигнатуру метода Console.WriteLine и заметим, что их есть аж 18 штук.
В первом вызове используется такая сигнатура:

void WriteLine(int value);

Тут все просто — этот метод принимает значимый тип данных int, передаем мы значение типа int, происходит передача параметра по значению. Упаковка тут не нужна.
Во втором случае используется другая сигнатура:

void WriteLine(string format, object arg0);

С передачей форматной строки понятно: требуется строка — мы передаем строку. А с аргументом arg0 чуть сложнее: метод просит от нас объект ссылочного типа данных object, а передаем мы в метод значение типа int. Вот тут и нужна упаковка. В результате чего в памяти создается контейнер для типа int, в него копируется значение 20, и указатель на этот контейнер попадает в аргумент arg0.

Теперь попробуем посчитать, сильно ли замедляют данные операции наш код.
Для этого я написал небольшой кусочек кода:

Простынка кода
static void Main()
{
    // переменная значимого типа, неупакованная
    var val = 15;
    
    // переменная ссылочного типа, уже упакованная
    Object obj = val;
    
    // количество циклов - мильён =)
    const int cycles = 1000000;
    var str = "";

    // временные результаты будем заносить в список
    var results = new List<TimeSpan>();

    // повторяем опыт 20 раз, чтобы получить более достоверное среднее значение
    for (var j = 0; j < 20; j++)
    {
        // засекаем время
        var start = DateTime.Now;
        for (var i = 0; i < cycles; i++)
        {
            // создаем строку из 10 одинаковых чисел
            // тут передаются уже упакованные значения
            str = String.Format("{0}, {1}, {2}, {3}, {4}, {5}, {6}, {7}, {8}, {9}", 
                                obj, obj, obj, obj, obj, obj, obj, obj, obj, obj);
        }
        // останавливаем таймер
        var end = DateTime.Now;
        // и получаем время выполнения цикла без операций упаковки (box)
        var objResult = end.Subtract(start);

        // снова засекаем время
        start = DateTime.Now;
        for (var i = 0; i < cycles; i++)
        {
            // делаем точно такую же строку
            // но за этот вызов происходит 10 операций упаковки (box)
            str = String.Format("{0}, {1}, {2}, {3}, {4}, {5}, {6}, {7}, {8}, {9}", 
                                val, val, val, val, val, val, val, val, val, val);
        }
        // останавливаем таймер
        end = DateTime.Now;
        // и получаем время выполнения цикла, в котором было 10 миллионов операций упаковки
        var valResult = end.Subtract(start);
        
        // разницу во времени между двумя циклами аккуратно заносим в список       
        results.Add(valResult.Subtract(objResult));
    }

    // выводим список результатов
    foreach (var timeDif in results)
    {
        Console.WriteLine(timeDif);
    }

    // и считаем среднюю разницу
    Console.WriteLine();
    Console.Write("Milliseconds need for 10KK boxing operations: ");
    Console.WriteLine(results.Aggregate(TimeSpan.Zero, (sum, current) => sum.Add(current)).TotalMilliseconds / results.Count);
}


Результат выполнения я получил следующий (процессор Intel Core i5 750 2.67GHz, 4 ядра, выполнялось на одном):

00:00:00.0600060
00:00:00.0770077
00:00:00.0570057
00:00:00.0710071
00:00:00.0680068
00:00:00.0650065
00:00:00.0530053
00:00:00.0740074
00:00:00.0570057
00:00:00.0580058
00:00:00.0590059
00:00:00.0500050
00:00:00.0550055
00:00:00.0720072
00:00:00.0800080
00:00:00.0640064
00:00:00.0640064
00:00:00.0670067
00:00:00.0660066
00:00:00.0590059

Milliseconds need for 10KK boxing operations: 63,80638

Итого в среднем почти 64мс на 10млн. операций упаковки.

Вывод


В качестве вывода хочу сказать, что все вышеизложенное вовсе не повод параноидально выискивать дизассемблером boxing'и в своем коде и добиваться лишнего миллиметра в секунду на скорости сто километров в час. Нет, конечно, это полный бред. Но понимать, что на самом деле происходит в вашем коде, важно. И в какой-то момент лишняя операция в цикле, выполняемом миллиарды раз, может стать критичной.

UPD! В комментариях пользователь exmachine подсказывает, что я не совсем корректно проводил измерения. Вот результаты с учетом поправок:
Результаты
Cache warming results:
00:00:00.0505219
00:00:00.0491484
00:00:00.0527804
00:00:00.0586028
00:00:00.0595744
00:00:00.0573599
00:00:00.0678498
00:00:00.0560197
00:00:00.0591139
00:00:00.0382205
00:00:00.0602378
00:00:00.0862110
00:00:00.0632895
00:00:00.0584091
00:00:00.0556713
00:00:00.0572194
00:00:00.0544349
00:00:00.0750407
00:00:00.0579586
00:00:00.0561487

Test results:
00:00:00.0640218
00:00:00.0558972
00:00:00.0612732
00:00:00.0560300
00:00:00.0547193
00:00:00.0556158
00:00:00.0558210
00:00:00.0554421
00:00:00.0632168
00:00:00.0611355
00:00:00.0539173
00:00:00.0594863
00:00:00.0549896
00:00:00.0585462
00:00:00.0598485
00:00:00.0586522
00:00:00.0560457
00:00:00.0568806
00:00:00.0784523
00:00:00.0521756

Milliseconds need for 10KK boxing operations: 58,60835



UPD2! Пользователь mstyura напомнил, что ранее на Хабре подобный вопрос уже освещался. Советую заглянуть и туда для дополнительной информации.
Теги:
Хабы:
+4
Комментарии 8
Комментарии Комментарии 8

Публикации

Истории

Работа

Ближайшие события

Московский туристический хакатон
Дата 23 марта – 7 апреля
Место
Москва Онлайн
Геймтон «DatsEdenSpace» от DatsTeam
Дата 5 – 6 апреля
Время 17:00 – 20:00
Место
Онлайн