Andrey2008 Aug 1 2018 at 12:36

Проверили с помощью PVS-Studio исходные коды Android, или никто не идеален

46 min

33K

PVS-Studio corporate blog Information Security *Open source *C++ *Development for Android *

+82

Comments 88

ogoNEKto Aug 1 2018 at 15:04

Ну вот, пофиксят все баги по подсказке из статьи и бета тестерам в Гугл урежут ЗП…

finlandcoder Aug 1 2018 at 15:50

Тут всё сложнее.
1) Сделать бранч
2) Заасайнить туда парочку лидов, которые знают этот модуль
3) Зафиксить
4) Прогнать тесты, а может и написать свои тесты (с багами, разумеется)
Возможно, пофиксить багу. И надеяться, что расхождения с тестами нет. Темболее этот код может быть в таких дебрях, что юзается только на 1.5 моделях Lenovo, которые уже не выпускаются.

Protos Aug 1 2018 at 15:06

Было бы круто если бы ваш сервис работал над всем кодом в публичном Github и репродукции всем владельцам репозиториев, но увы )

ogoNEKto Aug 1 2018 at 15:09

Было бы круто встроить подобный анализатор во все среды разработки

TimsTims Aug 1 2018 at 15:45

если бы ваш сервис работал над всем кодом в публичном Github

Тогда pvs не сможет зарабатывать, а значит придётся сокращать штат и закрываться, значит продукт перестанет развиваться, значит некому будет делать такие проверки…

Newbilius Aug 1 2018 at 16:23

Ну если встроить в IDE — работу оплатят авторы IDE, если в Github — владельцы гитхаба и т.п.

-1

springimport Aug 1 2018 at 16:43

А что, travis ci уже закрывается?

TimsTims Aug 2 2018 at 18:33

Причем здесь travis ci? Что они сделали хороший продукт, смогли привлечь инвестиции и выжили? А если у PVS так не получится? И зачем тогда PVS, если есть travis?

springimport Aug 2 2018 at 18:39

Я не пойму, вы слышали про github marketplace?

UFO just landed and posted this here

Urvdmih Aug 2 2018 at 10:28

Было бы круто если бы Google выкупил бы PVS-Studio и сделал бы его опенсорс. ))

F376 Aug 1 2018 at 15:21

do {
  ....
  if (x) continue;
  ....
} while (0)

Не исключено что это так и задумывалось, программист хотел избежать использования goto.

Andrey2008 Aug 1 2018 at 15:34

Возможно, но тогда намного лучше написать break. И вообще, зачем тогда цикл? Можно было вообще цикл не писать.

F376 Aug 1 2018 at 16:58

Он цикл не использует как цикл. Он проходит по телу якобы «цикла» один раз, используя его как блок, заранее зная что пост-условие всегда ложно. Но ему как-то нужно не имея метки и goto выйти из тела блока. Вот он и делает continue, тщательно избегая использования goto, который стал «табу». А то что можно было использовать break — это да.
Можно даже понять психологию, почему программист поставил continue. Оно представляется как «стрелка» перехода. А вот break — он мыслится как своего рода exception, return, stop. Так как программист задумывал именно goto-переход — он и написал continue.

А вообще интересно, как часто в разных исходниках используют goto?

Andrey2008 Aug 1 2018 at 17:36

Он цикл не использует как цикл. Он проходит по телу якобы «цикла» один раз, используя его как блок, заранее зная что пост-условие всегда ложно.

Все остальные case заканчиваются на return. Если цикл убрать, ничего не изменится.

А вообще интересно, как часто в разных исходниках используют goto?

Не смогу ответить. Не ведём такую статистику.

nevdokimof Aug 1 2018 at 17:39

Мелкомягкие, видимо, не гнушаются. В доках встречается:

docs.microsoft.com/en-us/windows/desktop/coreaudio/capturing-a-stream

paluke Aug 2 2018 at 10:06

Нет, не так про continue. Там еще switch внутри цикла. break — переход в точку после switch, а continue — в конец цикла. И do используется именно как цикл — в этом if инкрементируется счетчик, который инициализируется перед do. Так что про ошибку все правильно.

Welran Aug 1 2018 at 20:00

А не проще ли тогда было бы написать

....
if (!x) {
....
}

nsmcan Aug 2 2018 at 10:28

Давайте уж тогда весь контекст рассмотрим:

status_t Check(const std::string& source) {
  ....
  int pass = 1;
  ....
  do {
    ....
    switch(rc) {
    ....
    case 4:
      if (pass++ <= 3) {
          SLOGW("Filesystem modified - rechecking (pass %d)",
                  pass);
          continue;                                         // <=
      }
      SLOGE("Failing check after too many rechecks");
      errno = EIO;
      return -1;
    ....
    }
  } while (0);                                              // <=

  return 0;
}

Абсолютно очевидно, что идея continue была выполнить еще одну итерацию цикла, который, все правильно, в нормальных условиях должен иметь только один проход

ApeCoder Aug 6 2018 at 15:05

более читаемо определять условия выхода в заголовке цикла. А то приходится анализировать весь код и догадываться чего хотел автор.

пока(естьОшибки И числоПовторов < МаксимальноеЧисло)
{
   ...
}```

Bronx Aug 15 2018 at 06:02

Или использовать «оператор» "-->" ;-)

int limit = 3;
while (limit --> 0)
{
   ...
}

s_e_t Aug 2 2018 at 10:39

Если выносить Switch case в отдельную функцию и использовать в ней return вместо break, то мир становится проще, приятнее и более читабельным.

BiTHacK Aug 1 2018 at 15:37

Чем закончилась история с Tizen?

Andrey2008 Aug 1 2018 at 15:55

Ничем. Зато со стороны других компаний после этой публикации был всплеск интереса и новые продажи.

datacompboy Aug 2 2018 at 11:39

Не "ничем" а "улучшением анализатора" :))

BiTHacK Aug 2 2018 at 14:00

После такого исхода понятно, почему tizen такая кривая со всех сторон. Пилят «лишь бы было», видимо.

magnimus Aug 1 2018 at 16:40

по поводу проверки после выделения памяти. всё обьясняется просто:
для олд-скульных С пересевших на С++, использовали malloc-free и перенесли проверку на выделение уже в С++ new.
А С++, привыкшие к new, скорее всего придерживались уже устоявшегося malloc-free в старых модулях, ну и не заморачиваются с проверками.
Это всё потому что люди пишут на несуществующем языке С/С++ вместо С или С++.

CycaHuH Aug 1 2018 at 17:41

Правильная проверка должна быть такой:
if (f->mode == O_RDONLY && expect_zeros) {

Думаю так правильнее, т.к. mode скорее всего может содержать дополнительные флаги, вроде O_NOFOLLOW

if (f->mode & O_RDONLY == O_RDONLY && expect_zeros) {

Andrey2008 Aug 1 2018 at 17:55

f->mode & O_RDONLY == O_RDONLY

И получается, что 0 == 0. Т.е. условие всегда истинно. «Отличная» правка :).

CycaHuH Aug 1 2018 at 18:10

Конец рабочего дня даёт о себе знать :) Тем не менее, просто сравнивать с O_RDONLY тоже некорректно из-за возможных дополнительных флагов

multiprogramm Aug 1 2018 at 18:20

А мне почему-то кажется, что имелось в виду что-то такое

#define O_NORIGHTS 0
#define O_READ 1
#define O_WRITE 2
#define O_READWRITE 3

и проверка

f->mode & O_READ

должна была проверять разрешённость именно чтения. Хотя комментарий нам и говорит явно про «read-only», он мог писаться постфактум и быть просто навеян названием константы O_RDONLY. Тут без остального контекста сложно понять. Хотя, конечно, Ваше предположение выглядит проще.

multiprogramm Aug 1 2018 at 18:40

Т.е., оперируя старыми названиями констант, тянет заменить

if (f->mode & O_RDONLY && expect_zeros)

скорее на

if ( (f->mode == O_RDONLY || f->mode == O_RDWR) && expect_zeros)

khim Aug 2 2018 at 00:02

Успокойтесь, всё уже придумано за нас. Имелось в виду

if (f->mode & O_ACCMODE == O_RDONLY && expect_zeros)

Хороший пример для Andrey2008, когда он отбивается на тему: «ошибки мы нашли, а вот как правильно их пофиксить — это уже разработчики думать нужны».

Человеку легко догадаться, что где-то там должна быть маска и найти её посмотрев в .h файл (и то, как видим не всем). А вот роботу…

hdfan2 Aug 2 2018 at 09:01

Вот только у "==" приоритет выше, чем у "&", и выше сравнение распарсится как «f->mode & (O_ACCMODE == O_RDONLY)», т.е. всегда false.

khim Aug 2 2018 at 15:08

А это уже повод запустить ещё раз PVS-Studio и пофиксить.

Впрочем у нас clang и -Werror, так что до PVS-Studio эта ошибка не доживёт…

-1

SergeyMax Aug 1 2018 at 18:07

компилятор вправе удалить вызов функции memset, если после этого буфер больше не используется

Скоро компиляторы научатся определять, какие программы не будут использоваться. Для начала перестанут компилировать «Hello, world».

ElleSolomina Sep 23 2018 at 16:28

Без оптимизатора жить больно. Циклы разворачивать больно. Векторизовать больно. Всё больно.

slavae Aug 1 2018 at 19:21

Интересно, а код pvs-студии прогоняли через неё же? )

-1

Andrey2008 Aug 1 2018 at 19:59

Проверяем исходный код плагина PVS-Studio с помощью PVS-Studio.

iCpu Aug 2 2018 at 06:07

А не пора ли обновить список ошибок в Qt? 4 года прошло!

AlexMal Aug 2 2018 at 10:24

Согласен! Интересно посмотреть на повторный анализ Qt!)

Andrey2008 Aug 2 2018 at 10:27

Ok, пометим себе, но не обещаю.

Paspasuy Aug 1 2018 at 21:56

Мощно!

marat_zh Aug 1 2018 at 22:59

Android работает на linux, а на linux по-умолчанию (когда включён overcommit) malloc никогда не возвращает NULL. Проверять на NULL возвращаемое значение в таком случае бессмысленно. Если память на самом деле «не выделилась» к моменту её использования то система убъёт процесс. Никакого всё равно NULL не будет.

-1

khim Aug 2 2018 at 00:07

А мужики-то и не знают:

$ cat test.c && gcc -O3 test.c -o test && ./test
#include <stdio.h>
#include <stdlib.h>

int main() {
  void* p = malloc(1000000000000);
  if (p == NULL) {
    printf("Ooops\n");
  }
}

Ooops

Да, вы правы, не всегда можно поймать неиспользуемую память на malloc… но говорить, что он вот совсем-совсем никогда не возвращает NULL — всё-таки некорректно.

emusic Aug 1 2018 at 23:38

#if GENERIC_TARGET
Дело в том, что макрос GENERIC_TARGET не определён

А на #if с неопределенным макросом анализатор указывает?

Andrey2008 Aug 1 2018 at 23:40

Нет. Зачем? Неопределённый макрос — это стандартный паттерн программирования. Мы стараемся подобных беспощадных диагностик не делать.

emusic Aug 2 2018 at 00:10

Э-э-э… «Стандартный паттерн» — это #ifdef/#ifndef. Использование в #if макроса, который может быть не определен — явный моветон, ибо легко пропустить/исказить символ в имени, и большинство компиляторов не обратит на это внимания. Слава богу, MS VC++ давно имеет на этот случай отдельное предупреждение.

khim Aug 2 2018 at 02:08

Объясните, пожалуйста, как #ifdef/#ifndef спасёт от того, что вы пропустили/исказили символ в имени.

emusic Aug 2 2018 at 10:09

#ifdef/#ifndef от этого, разумеется, не спасает. Именно поэтому для повышения надежности и применяют #if в сочетании с соответствующим предупреждением.

qw1 Aug 6 2018 at 07:09

С такими ситуациями, к сожалению, ничего нельзя сделать

Вот это неверно. Человек же может распознать, что ошибки нет, значит, можно и анализатор научить.

Но гораздо проще написать «тут ничего нельзя сделать», чем признаться, что для отлова таких ошибок надо полностью переделывать концепцию, обрабатывая исходники до препроцессора.

-3

UFO just landed and posted this here

MadBambula Aug 2 2018 at 09:52

Жаль, не указали версию Android, которую проверяли.

Andrey2008 Aug 2 2018 at 09:52

Версия не имеет значения. Естественно проверялось самое свежее. Статья демонстрирует возможности методологии статического анализа, а не является справочником по конкретным ошибкам в конкретной версии :). Разработчикам рационально самостоятельно проводить анализ и изучать отчёт.

UFO just landed and posted this here

Andrey2008 Aug 2 2018 at 10:03

Анализатор PVS-Studio выполняет анализ потока данных (пример) и символьные вычисления. Символьные вычисления, например, позволяют найти следующее бессмысленное условие:

void F(int a, int b, int c)
{
  if (a > b)
    if (b > c)
      if (a < c)  // V547 Expression 'a < c' is always false.
      {}
}

Также всем желающим предлагаю познакомиться с докладом моего коллеги Павла Беликова "Как работает анализ Data Flow в статическом анализаторе кода".

Что касается, приведённого примера, да здесь пока в PVS-Studio ложное срабатывание. Его избежать можно, но сложно. Со временем сделаем.

UFO just landed and posted this here

Andrey2008 Aug 2 2018 at 14:41

Спасибо за интересный вопрос. Сейчас объясню.

зачем включать это для пользовательских функций?

Это позволяет находить ошибки даже при использовании тех функций, о которых анализатор ничего не знает. Как именно работает эта эмпирическая диагностика, описано в документации: V666.

Здесь представлены примеры ошибок, связанные с неправильным использованием пользовательских функций. Обратите внимание на проекты: Geant4, OpenSSL, Spring Engine, Bind.

По поводу ложных срабатываний. Мы много работаем, чтобы уменьшить их количество. Однако, они были, есть и будут.

В данном случае, для подавления ложных срабатываний я рекомендую использовать рядом с объявлением функции комментарий "//-V:cml_find:666" или полностью отключить диагностику V666. Подробнее о работе с ложными срабатываниями.

emusic Aug 2 2018 at 10:14

когда PVS «разучится» видеть несуществующие проблемы в таком коде

Подобные анализаторы сами по себе никогда не должны «разучаться видеть» любые потенциальные проблемы. Должна быть только возможность динамически отключать предупреждения. Анализатор (как и любой хороший компилятор) должен уметь увидеть все, что хоть как-то способно создать помеху работоспособности.

UFO just landed and posted this here

Andrey2008 Aug 2 2018 at 14:46

Я думаю, у Вас весьма завышенные ожидания, особенно от Cppcheck. Там, где хочется увидеть преимущество, вполне может быть наоборот недоработка и неумение что-то делать. Хороший пример на эту тему: "Почему я не люблю синтетические тесты". Там как раз про PVS-Studio и Cppcheck.

emusic Aug 2 2018 at 18:06

Да, тут действительно нет — это я неверно интерпретировал.

Основной смысл моего высказывания был в том, чтобы анализатор кода мог найти любую потенциальную ошибку, даже весьма нетривиальную. Погасить ложное срабатывание гораздо проще, чем пропустить реальное.

ibes Aug 2 2018 at 10:33

a = b = c = d = e = 0;

Кажется, что b, c, d, e все-таки обнулятся, ведь их значение сразу же используется в следующей операции присваивания как аргумент. В статье указано обратное. К тому же PVS-Studio: V1001 приведена всего один раз и по поводу только 'a' или в логе есть еще сообщения по этому месту.

Andrey2008 Aug 2 2018 at 10:33

Анализатор ругается только на 'a'. Если удалить 'a =', он начнёт ругаться на 'b' и так далее.
Да, теоретически, не используется только 'a'. Но на практике, компилятор удаляет всю цепочку присваиваний. Я даже не поленился составить тестовый пример, чтобы показать здесь ассемблерный код. Но пока я добился, что компилятор в силу оптимизаций не превращал вообще всё в тыкву, пример сильно вырос. Поэтому не буду утомлять читателей, просто поверьте, что компилятор (в моём случае Visual C++) удаляет всю цепочку a = b = c = d = e = 0;.

datacompboy Aug 2 2018 at 11:42

Можно пример в. Ideone или gist виде? Даже большой нетыквенный интересен!

viktprog Aug 2 2018 at 12:08

Как насчет такого?
godbolt.org/g/NzaWG4
Если закомментировать 11 строку результат не меняется

Andrey2008 Aug 2 2018 at 12:14

Я экспериментировал с подобным кодом в Visual C++

__declspec(noinline) void foo(int n)
{
  int a, b, c, d, e;
  a = 1; b = 2; c = 3; d = 4; e = 5;
  for (int i = 0; i != n; ++i)
  {
    a *= 2; b *= 2; c *= 2; d *= 2; e *= 2;
  }
  printf("%d,%d,%d,%d,%d,%d,%d,%d\n", 11, 22, 33, d, a, c, b, e);
  a = b = c = d = e = 0;
}

int main() {
  for (int i = 0; i != 22; ++i)
    foo(i);
  return 0;
}

amarao Aug 2 2018 at 11:41

Интересно, есть ли какая-то польза от подобного рода программ (анализаторов кода) в языках программирования вроде Rust'а, у которых потребность «писать правильно и безопасно» вынесена как идея для самого языка.

Xaliuss Aug 2 2018 at 11:46

Часть ошибок универсальны для любого языка, например ошибки копипаста, ошибки в логических условиях (всегда правда или всегда ложь). Польза всегда будет.

amarao Aug 2 2018 at 13:37

Кстати, удивительно, но rust не ловит тривиальные условия (if a < 1 && a > 1 {}). Пойду зарепорчу фичереквест.

nikitasius Aug 2 2018 at 17:44

На собеседовании в качестве одного из первых вопросов соискателю я задаю следующий: «Что напечатает функция printf и почему?»

Изредка я даже демонстрирую, что этот код, собранный с помощью Visual C++, выводит на экран «6,5», чем ставлю в полный тупик новичков, слабых знанием и духом :).

какая-то наркомания. Хотя каждому свое.

На Java же логичные:

printf("%d,%d", i++, i++) = 5,6
printf("%d,%d", ++i, ++i) = 6,7

khim Aug 2 2018 at 19:10

Java — это язык из совсем другой эпохи и с совсем другим подходом к переносимости.

На самом деле всё логично если вспомнить о том, что cdecl кладёт аргументы в стек именно начиная с последнего. stdcall, кстати, пушит в обратном порядке, но, похоже, MSVC старается оптимизировать именно cdecl…

nikitasius Aug 2 2018 at 19:21

Я же и говорю — каждому свое. Кто-то кактус жрет, кто-то перешел на кофе..

-1

ginkage Aug 2 2018 at 18:33

Кстати, а как давно проводился этот анализ?
Например, ошибка из a2dp_vendor_ldac.cc была исправлена месяц назад (26 июня)…

Andrey2008 Aug 2 2018 at 19:08

Где-то месяца 2 назад. К сожалению, меня всё время что-то отвлекало и процесс работы над статьёй в этот раз сильно затянулся.

А то что ошибка была поправлена, лишний раз свидетельствует в пользу регулярного использования анализатора кода. Если бы использовался анализатор, то ошибка была бы исправлена не 1 месяца назад, а 2 месяца назад (или когда он там появилась...).

ivanrt Aug 3 2018 at 18:19

Интересно, а ваш анализатор учитывает что код может компилироваться с флагом -fno-exeptions? Не будет ли new T выдавать nullptr в таком случае?

khim Aug 3 2018 at 21:07

Нет, к счастью не будет. Программа упадёт с сообщением об ошибке и всё, если памяти не хватит.

Хотите, чтобы работало с -fno-exeptions? Используйте std::nothrow явно.

oleg1977 Aug 4 2018 at 00:51

Аномалия выявляется в этом коде сразу двумя диагностиками:

V501 CWE-570 There are identical sub-expressions to the left and to the right of the '||' operator: ns != 1 || ns != 1 fingerprint.c 126
V560 CWE-570 A part of conditional expression is always false: ns != 1. fingerprint.c 126

oleg1977 Aug 4 2018 at 00:52

Почему возникает V560 ?

Andrey2008 Aug 6 2018 at 16:35

Потому, что правая часть условия всегда будет ложной. Иначе, мы просто не дойдём до этой правой части. См. short-circuit evaluation.

oleg1977 Aug 15 2018 at 06:49

Правильно ли я понимаю, что для "if (x>1 || x>3)" будет создана V560, а для "if (x>3 || x>1)" — не будет?

Andrey2008 Aug 15 2018 at 10:10

Конкретно на эти выражения алгоритм выдаёт вообще другие сообщения:

if (x>1 || x>3) — V590 Consider inspecting the 'x > 1 || x > 3' expression. The expression is excessive or contains a misprint. consoleapplication2017.cpp 40
if (x>3 || x>1) — V590 Consider inspecting the 'x > 3 || x > 1' expression. The expression is excessive or contains a misprint. consoleapplication2017.cpp 47

punksta Aug 6 2018 at 12:42

Как всегда крутая статья. Не хотите проверить c++ части github.com/facebook/react-native и github.com/facebook/yoga. Возможно будет интересно сравнить с xamarin forms или qt.

igormich88 Aug 6 2018 at 13:37

Хотел спросить в контексте статьи Зло живёт в функциях сравнения что вы думаете про автогенерацию функций сравнения средствами IDE и препроцессоров (например Lombok в случае Java)?
В таком случае опечатки полностью исключаются, минусы которые я вижу в этом решении это непотимальный порядок сравнения полей (генератор не знает что поле devTeam большой массив, а qaTeam маленький массив) и риск со стороны программиста включить в сравнение лишние поля — например id объекта.

Andrey2008 Aug 6 2018 at 16:39

Если честно, то ничего не думаю :). Я в силу профессиональной деформации на всё смотрю исключительно с точки зрения паттернов ошибок. :)

pkirill Aug 8 2018 at 11:52

Я всегда использую delete для массивов примитивов (ну и unique_ptr a = new int[10]). По моему единственный смысл в delete[] только в вызове vector_deleting_destructor, что не применимо для базовых типов.

В отсутствие конструкторов и деструкторов new и delete аналогичны вызовам
operator delete(operator new(17));

Исключением может быть гипотетическая система в которой new int; и new int[2] реализованы разными алгоритмами, что, по моему, лишено смысла.

Andrey2008 Aug 8 2018 at 12:10

Очень прошу прекращать заниматься программированием.

ElleSolomina Sep 23 2018 at 16:00

del