alizar May 30 2017 at 18:49

Нейросеть генерирует код GUI по скриншотам

3 min

32K

Artificial Intelligence

+24

Comments 55

ElectroGuard May 30 2017 at 19:15

Программа pix2code генерирует код GUI для трёх основных платформ — Andriod, iOS и кроссплатформенный HTML/CSS — с точностью 77%

Берем Delphi, и получаем 100% точность из макета (формы) для основных платформ. Если Унигуй — то и для веба.

-5

ThunderCat May 30 2017 at 19:25

давайте не путать распознавание с интерпретацией. Ключевое слово — скриншот.

AllexIn May 30 2017 at 19:51

Точно. Берем программиста и получаем 100% точность.
Вы о чем вообще?

-4

ElectroGuard May 30 2017 at 19:59

Зачем программист, что бы расставить кнопки на макете? Дизайнер вполне справится. Зачем это распознавать вообще? А Делфи из формы для всех платформ сама код сделает. Нативный.

kogemrka May 31 2017 at 04:54

Действительно, придумали хрень какую-то. Не понимаю я этих ресёрчеров, они что, про современные технологии не в курсе?

Зачем распознавать печатный текст? Можно просто посадить человека за текстовой редактор и заставить его перепечатать.

Зачем нейросетками раскрашивать ч/б изображения? Можно просто выдать художнику фотошоп.

Зачем разрабатывать автономные автомобили? GPS-навигатор в телефоне и так прекрасно сообщит, куда ехать.

Распознаванием рукописного текста тем более заниматься бесмысленно — того и гляди, придёт какой-нибудь комментатор на гиктаймс и покажет каляку, которые и человек-то не распознает — а это, как известно, окончательный аргумент о ненужности и неактуальности исследовательской работы.

+13

ElectroGuard May 31 2017 at 05:47

Всё это понятно и круто. Но смысл всего этого? Дизайнеру всё равно нужно рисовать макет. Хоть распознавать его позже хоть нет. В случае Delphi сразу получаем готовый 100% код под все платформы.

-1

Djaler May 31 2017 at 06:01

В вашем мире дизайнер делает макет в конструкторе форм Делфи? И да, 2017 год на дворе, какой Делфи, ну ё-моё.

GlukKazan May 31 2017 at 06:16

Я один раз засадил за Delphi не то чтобы дизайнеров, а кадровиков. Сидели и рисовали под себя формочки, как им нравилось. Без всякого кода конечно. Показал как раскидывать компоненты и сохранять. Потом я брал текстовые dfm-ки, перегонял их в свой DSL и прикручивал к работающей системе. Всё это с минимумом трудозатрат. Формочки были совершенно вырвиглазные, на мой взгляд, но кадровикам нравились до писка.

ElectroGuard May 31 2017 at 06:29

Я один раз засадил за Delphi не то чтобы дизайнеров, а кадровиков

О чём, собственно, и речь. Порог входа около нуля. На выходе получаем (по дизайну) готовое решение. Без распознавания и прочего. Нет — я не спорю, что с точки зрения науки чувак делает реально крутые вещи. Но с точки зрения изготовления ПО — это просто промежуточные, излишние, звенья.

И что не так с Делфи в 2017-м году? Отличное мульти-платформенное средство. Активно развивает нативный код под все платформы. Под веб отличные библиотеки пишут.

Что бы не повторяться, вот что (в качестве интерфейса) может получатся на выходе Делфи:

Delphi + UniGUI + WebGL

Пусть нейронка это распознает )

Pakos May 31 2017 at 07:59

5й, 7й или более новый. Некоторый софт переписать стоит столько ресурсов что за это никто не берётся. И чем крупнее предприятие, тем больше разрыв между необходимыми тратами и наличными ресурсами.

kogemrka May 31 2017 at 06:23

Я понял, вас видимо смутило, что результаты этой исследовательской работы автор этой исследовательской работы использует в продукте, который пытается продавать.

Но штука в том, что нужность продукта и нужность исследования — это два совершенно перпендикулярных друг другу вопроса.

LoadRunner May 31 2017 at 08:18

GPS-навигатор в телефоне

Штурман на соседнем сиденье и бумажная карта.

UFO just landed and posted this here

ThunderCat May 30 2017 at 20:37

Дизайнер обычно создаёт макеты интерфейса

, вот дизайнер и слепит из такого «видения заказчика» скетч, а из него уже сгенерить вполне себе интерфейс. Понятно что с этой хрени и дизайнер мозг вывихнет без двухчасовой дополнительной беседы с заказчиком. А так — да, тема знакомая )

alex4321 May 31 2017 at 12:36

А, собственно, что это?

UFO just landed and posted this here

ThunderCat May 30 2017 at 21:00

безусловно это просто аафигенно верный подход, вот только дизайнеры не всегда владеют редакторами форм, а программисты не всегда умеют создать нормальный интерфейс, я бы сказал что в подавляющем большинстве случаев дело обстоит подобным образом. И тут — бум! Из скетча прямо в редактор форм импортируется готовый код. Переделывать с макета в форму не надо, экономится время на муторную нудную работу — имхо чистый профит.

UFO just landed and posted this here

ThunderCat May 31 2017 at 07:20

ну почему сразу гуй, просто дизайнер, например админку сделать для сайта. Конечно пока оно наверняка кроме кнопок/галочек нифига не распознает, но тут уже дело техники, возможно же допилить что бы и градиенты стандартные определяло, и фотки от текста отличало, и блоки примерно вычисляло, кароче этакий верстальщик ин зе бокс. Мечтать же не вредно ))

Alex_ME May 31 2017 at 13:02

Одно дело раскидать контролы по форме в четко заданных позициях, как в каком-нибудь Windows Forms (с Delphi не знаком), но другое дело — сделать так, чтобы эту форму можно было ресайзить или (если мобильное или веб) — подходило под разные размеры\разрешения.

-1

alex4321 May 31 2017 at 13:22

align-ми и их windows form-ми аналогами они пользователься не смогут?

Alex_ME May 31 2017 at 16:01

Ну в WinForms максимально убогие anchor'ы, либо я что-то не знаю. В WPF все куда лучше, да, но там уже XAML писать, сложнее. Но опять-таки, это полностью проблему не решит, если надо прям совсем адаптивный интерфейс, где и блоки местами могут меняться, что-то скрывается, показывается и т.п.

AntonSor May 30 2017 at 21:37

Ну все, теперь ещё одна человеческая задача освоена искусственным интеллектом. Потом и за описание алгоритмической части примется.

AntonSor May 30 2017 at 21:38

И, как логическое завершение, нейросеть, которая пишет код другой нейросети.

GreatKoshak May 31 2017 at 00:40

Ну не нагнетайте Вы, блин, и так сыкатна!

UJIb9I4AnJIbIrUH May 31 2017 at 14:13

Следующий шаг — генератор кода видеоигры по геймплейному видео.

Goodkat May 31 2017 at 14:28

По геймплейному видео реальной игры — это клон по-быстрому сделать, чтобы бабла на хайпе срубить?

Следующий шаг — это создание кода и графики игры по текстовому описанию.

Типа такого

Здраствуйте. Я, Кирилл. Хотел бы чтобы вы сделали игру, 3Д-экшон суть такова… Пользователь может играть лесными эльфами, охраной дворца и злодеем. И если пользователь играет эльфами то эльфы в лесу, домики деревяные набигают солдаты дворца и злодеи. Можно грабить корованы… И эльфу раз лесные то сделать так что там густой лес… А движок можно поставить так что вдали деревья картинкой, когда подходиш они преобразовываются в 3-хмерные деревья[1]. Можно покупать и т.п. возможности как в Daggerfall. И враги 3-хмерные тоже, и труп тоже 3д. Можно прыгать и т.п. Если играть за охрану дворца то надо слушаться командира, и защищать дворец от злого (имя я не придумал) и шпионов, партизанов эльфов, и ходит на набеги на когото из этих (эльфов, злого...). Ну а если за злого… то значит шпионы или партизаны эльфов иногда нападают, пользователь сам себе командир может делать что сам захочет прикажет своим войскам с ним самим напасть на дворец и пойдет в атаку. Всего в игре 4 зоны. Т.е. карта и на ней есть 4 зоны, 1 — зона людей (нейтрал), 2- зона императора (где дворец), 3-зона эльфов, 4 — зона злого… (в горах, там есть старый форт...)

Так же чтобы в игре могли не только убить но и отрубить руку и если пользователя не вылечат то он умрет, так же выколоть глаз но пользователь может не умереть а просто пол экрана не видеть, или достать или купить протез, если ногу тоже либо умреш либо будеш ползать либо на коляске котаться, или самое хорошее… поставить протез. Сохранятся можно...

Я такую нейросеть уже джва года хочу.

Darth_Biomech Jun 1 2017 at 13:17

Такая «нейросеть» это уже полноценный разумный ИИ, поскольку требуется креативная интерпретация.

Here_and_Now May 31 2017 at 14:54

Уже 12 дней новости

https://futurism.com/googles-new-ai-is-better-at-creating-ai-than-the-companys-engineers/

v_m_smith May 31 2017 at 04:59

Год спустя: Нейросеть генерирует веб-сервис по BRD
Еще год спустя: Нейросеть генерирует транзакции по сигналам нейроинтерфейса
Еще год спустя: Нейросеть печатает эмбриона по генам партнеров

UFO just landed and posted this here

iliabvf May 31 2017 at 06:30

Ну не будьте таким наивным, нейросеть это всего лишь набор файлов запущенных на каком-то сервере, какого-то человека…

UFO just landed and posted this here

iliabvf May 31 2017 at 10:57

Даже распространяющаяся по компьютерам бот-сеть или тот же банальный вирус всегда принадлежит создатели и распростанителям. Тоже самое можно сказать и о роботах, биологических вирусах, наномашинах…

IvanTamerlan May 31 2017 at 13:19

Разработчику может принадлежать только первая итерация его ИИ. Если она будет в процессе пересоздавать себя 100500 раз, основываясь на множестве внешних данных, в том числе слияние ИИ от разных разработчиков, жить в распределенной сети (типа торрента/блокчейна), то итоговый результат уже отличаться от первоначального. Кто будет владельцем сего рапределенного чуда?

А про биологические вирусы… В вечной мерзлоте нашли доисторический вирус, который появился раньше человека. Вопрос: кому он принадлежит? Ваше утверждение — «всегда принадлежит создател[?] и распространителям»
Я, надеюсь, мы будем обсуждать в качестве правовладельцев только людей?

Vjatcheslav3345 May 31 2017 at 09:46

Техзадание на печать младенца от партнёров выглядело так..

Техзадание...

leorush May 31 2017 at 06:23

Правительство заменили нейросетью :D

ElectroGuard May 31 2017 at 06:36

Это был бы настоящий прорыв! :)

UFO just landed and posted this here

Tarson May 31 2017 at 08:06

И это его еще в Америке учили…
А попади он к нам…

justK May 31 2017 at 09:04

[зануда]
Если мой склероз меня не подводит, его там не научили, а просто заставили повторять фразы через штатный функционал
[/зануда]

UFO just landed and posted this here

yarric May 31 2017 at 07:59

Главное с критерием результативности работы не промахнуться, а то соптимизирует половину человеков куда-нибудь.

ElectroGuard May 31 2017 at 08:03

antstar May 31 2017 at 07:20

Был (да и есть) такой язык UML. Суть его в том, что надо рисовать диаграммы классов, деятельности, отношений и проч, и проч, т.е описать продукт в картинках. После успешного «рисования» оно может генерить код на желаемом языке, и вроде как это сильно облегчает жизнь Проблема в том, что для того, чтобы разобраться в сгенерированном коде, надо столько же времени, сколько ушло-бы на написание кода с нуля.
В статье описано научное исследование — и это нормально. На практике при достаточно сложном проекте будет та же история, что и в UML. И пр этом не забываем про оптимизацию, которую все равно придется делать.

Kaiser May 31 2017 at 14:33

А вот и нет. Да, есть проблема, что не всегда генерируется то, что на картинке. Есть вероятность, что сгенерированный код не соберется. Но нет оснований полагать, что LSTM выдаст сложный код.

Лапшу из кода генераторы получают из-за эвристик. Алгоритм разбирает входные данные по кирпичикам и переводит их в код. Это повышает сложность генерируемого кода. Здесь же генератор по дескриптору изображения (выход CNN) делает код как это было обучающей выборке. То есть, похожий на человеческий.
Если дать картинку совершенно непохожую ни на что из обучающей выборки, то скорее все сломается и получится бред, а не код. Но я не вижу сценария, чтобы код получился «нечитаемой лапшой».

vlad1988_1 May 31 2017 at 09:13

А распознает ли нейросеть скрытые элементы GUI, ведь иногда логотип копании в программе является и ссылкой на сайт компании, а иногода и не является… Иногда пасхальные яйца скрыты в GUI...

iVoene May 31 2017 at 13:19

А еще она угадает то о чем не было сообщено, но что подразумевается, и что является значением по умолчанию в вашем узком кругу.

А также предугадает какой цвет захочет заказчик завтра основываясь по текущему скриншоту.

vlad1988_1 May 31 2017 at 14:27

Боюсь в том и различие между человеком и ИИ (расшифровать по контексту), что я не поставл тег сарказм, но все его поняли.

edogs May 31 2017 at 14:49

Бесценная вещь для того что бы ~~стырить дизайн~~ восстановить верстку если исходники были утеряны.
Но если исходники живы, то непонятно зачем это.
Никто не делает дизайн в один слой в фотошопе, тем более такой простой.
Диз делается по любому в чем-нибудь типа axure, откуда он однозначно может транслироваться куда надо.

wych-elm May 31 2017 at 18:34

Прямо, bydlokoder 2.0.

TheOleg Jun 1 2017 at 02:16

Что-то мне кажется, что помимо дефолтных кнопочек бутстрапа он и не сверстает ничего. И то придётся переделывать так, что проще бы было самому с нуля написать.

Show the best of all time