Как стать автором
Обновить
  • по релевантности
  • по времени
  • по рейтингу

OCR online

Я пиарюсь
С технологией оптического распознавания текста я познакомился где-то в 1997 года, когда купил свой первый, тогде ещё ручной, чёрно-белый сканер Genius ScanMate 256 (кстати, всё ещё рабочий). К сканеру прилагалась программа Direct OCR на 3х дюймовой дискете (блин, откуда-то из подсознания все эти названия всплывают), которая всеми своими силами пыталась доказать, что можно быстро и почти без ошибок текст из книги ввести в компьютер. Ну, доказательства были не очень. FineReader, с которым я познакомился позже, делал это качественнее. Тема распознавания меня заинтересовала, я потратил довольно много времени на научно-популярные статьи о технологиях OCR.

В 2001 году я готовил дипломную работу по web-технологиям. Долго думал о том, куда приложить знания. Поскольку меня интересовала технология OCR, я задумал совместить WEB и распознавание текстов. За само распознавание у меня должен был отвечать FineReader. С друзьями мы «разобрали» FineReader на отдельные DLL и выяснили, как вызывать отдельные функции этих библиотек, передавая двоичные данные изображений, и как получать обратно распознанный вариант текста. Над этим всем был построен простейший веб-интерфейс, чтобы загружать картинки, запускать распознавание и получать результат.
Читать дальше →
Всего голосов 48: ↑45 и ↓3+42
Просмотры4.4K
Комментарии 31

Gmail — предпросмотр гугл.документов

IT-компании
В gmail.labs появилась новая удобная фича — предпросмотр документов, в дополнении к предпросмотру youtube, picasa, google.voice. Все теснее и теснее становится интеграция между гугл.сервисами, что радует.

Всего голосов 44: ↑34 и ↓10+24
Просмотры402
Комментарии 14

Работа с командой на Google Docs

IT-компании
Данный топик и том, как эффективно и бесплатно организовать работу сотрудников в вашей компании с помощью Google Docs.

Подошел к концу месяц, вам пора платить зарплату сотрудникам. А за что ее платить? Что каждый из ваших сотрудников делал в течении месяца? Чаще всего в компаниях использую форму «ежемесячного отчета», в которой сотрудник произвольно (или в некой форме) пишет выполненные в течении месяца задачи, т.е. показывает начальству, что он не балду гонял, а работал на благо компании.

Сегодня на рынке довольно много инструментов, которые позволяют сотрудникам отчитываться о выполненной работе перед начальством, но я хочу вам предложить реализацию данной затеи на Google Docs. Последний тем хорош, что вы без труда можете переделать его под свои собственные особенности и, естественно, Google бесплатный.
Читать дальше →
Всего голосов 41: ↑34 и ↓7+27
Просмотры7.9K
Комментарии 25

Google Docs индексирует PDF

IT-компании
В Google Docs добавлена фича индексирования текста в PDF-документах, так что они теперь тоже доступны для полнотекстового поиска из интерфейса Docs. Текст индексируется по текстовому полю, в том числе на русском языке.



В будущем Google должен подключить также систему распознавания текста из графических изображений (OCR), которая уже используется базовым индексатором поисковой системы Google, а также доступна через Google Docs API в качестве эксперимента. Тогда станет возможным индексировать любые типы PDF, в том числе отсканированные документы. Правда, русский язык движком Google OCR пока не поддерживается.

via Google Operating System
Всего голосов 14: ↑9 и ↓5+4
Просмотры894
Комментарии 7

Google покупает DocVerse

IT-компании
Почти год назад мы сообщали о появлении интересного стартапа DocVerse, основанного бывшими сотрудниками Microsoft.

«Фирма DocVerse выпустила небольшой плагин размером 1 МБ для Office 2007, дающий этому монстру новую функциональность, в том числе недостающие фичи от Google Docs, то есть способность одновременного редактирования файлов через интернет.

В результате получился, как говорят основатели стартапа, самый простой и эффективный инструмент для совместного редактирования документов. Аналитики напоминают, что аналогичные надстройки для MS Office уже есть на рынке, в том числе нечто подобное делает и сама Microsoft в сервисе Office Live Workspace. Однако основатели DocVerse уверяют, что их разработка гораздо лучше всех существующих. Что ж, подождём и посмотрим».


Вчера стало известно, что для DocVerse нашёлся покупатель. Угадайте, кто.
Читать дальше →
Всего голосов 55: ↑50 и ↓5+45
Просмотры233
Комментарии 41

PodШтучки #110

Чулан
Встречайте 110-й выпуск нашего подкаста!
  • Google представил собственного убийцу iPhone;
  • В Google Docs добавили файловое хранилище;
  • Twitter готовит ответ на Facebook Connect;
  • Интервью с создателем Firstfollower;
  • ГдеРаботаем: расскажите все о своем работодателе;
  • Мое дело: бухгалтерские премудрости для бизнесмена;
  • Dubby: вся социальная активность на одной странице;
  • Mp3ritm: сервис для обмена музыкой.
Подписаться на обновления подкаста.
Всего голосов 30: ↑22 и ↓8+14
Просмотры223
Комментарии 3

Управление портфелем проектов и макросы для Google Spreadsheets

Управление проектами
Привет

Иногда бывает так что обычная задача приводит к необычным находкам. Так все началось с тривиальной задачи — нужно было развернуть за несколько часов систему управления портфелем проектов. Ресурсы на эту задачу не выделялись вследствие некоторого цейтнота по текущим проектам.

Особенности бекграунда задачи — система должна быть очень динамичной и наглядной. Специфику и уклад жизни нашей небольшой команды я коротко описал в недавнем посте. Бизнес кейс задачи таков: у нас в работе много проектов. Пишутся предложения, рисуются оценочные Гантты, обсуждаются вопросы, ведется поддержка Процесса Разработки… В день через обсуждение в команде может проходить до 15 проектов. У проектов могут меняться статус, фаза, владелец. Информации много, она быстро меняется, и она важна. Наступил момент вводить инструмент для управления портфелем проектов.
Читать дальше →
Всего голосов 28: ↑24 и ↓4+20
Просмотры3.6K
Комментарии 17

PodШтучки #111

Чулан
Встречайте 111-й выпуск нашего подкаста!Подписаться на обновления подкаста.
Всего голосов 5: ↑1 и ↓4-3
Просмотры138
Комментарии 0

Круговорот артефактов в Agile

Управление проектами
Доброго времени суток.

В этой статье я хочу продолжить рассказ о «прагматическом» Agile процессе разработки ПО. На суд Читателя предлагается иная перспектива обзора этого процесса — с точки зрения создания и эволюции артефактов (Artifact Flow) в ходе развития проекта. А также мы рассмотрим практический подход для работы с артефактом «Коллекция Требований» с использованием Google Wave и Google Docs.
Читать дальше →
Всего голосов 26: ↑22 и ↓4+18
Просмотры13K
Комментарии 12

Google Docs вместо OpenOffice в Ubuntu Netbook Edition

Настройка Linux
В последнем листе рассылки Ubuntu Netbook Remix Blueprint сообщается странная новость: из следующей версии дистрибутива Ubuntu Netbook Edition 10.04 планируется убрать OpenOffice, а все документы будут по умолчанию открываться в Google Docs.

Обоснованием такого решения было то, что OpenOffice якобы не слишком подходит для нетбуков, которые имеют слишком слабую вычислительную мощность.

В том же дистрибутиве поисковая машина по умолчанию будет изменена с Google на Yahoo.

После того как эту информацию вынесли на публику, данное решение вызвало шквал критики и бурную волну обсуждения в том же листе рассылки. Так что есть вероятность, что его отменят. Впрочем, даже в случае исключения из дистрибутива никто ведь не мешает поставить OpenOffice вручную.

via Digitizor
Всего голосов 18: ↑11 и ↓7+4
Просмотры2.5K
Комментарии 13

Скачиваем Google Docs без браузера

*nix
Скриптик выглядит как-то так:

#!/bin/bash
token=$(curl -s www.google.com/accounts/ClientLogin -d Email=user.name@gmail.com -d Passwd=qwerty -d accountType=GOOGLE -d service=writely -d Gdata-version=3.0 |cut -d "=" -f 2)
set $token
curl --silent --header "Gdata-Version: 3.0" --header "Authorization: GoogleLogin auth=$3" "http://docs.google.com/feeds/user.name@gmail.com/private/full" | tidy -xml -indent -utf8 -quiet > /tmp/gdocs.xml
file=(doc1 doc2 doc3 doc4)
resourceId=(document:0ASpnxqo7zPlfZGQ3Z2Zwc183NWZteDNiM2Y ...) # и ещё 3 resourceId
i=0
while (( i < 4 )) # match num_files
do
wget --header "Gdata-Version: 3.0" --header "Authorization: GoogleLogin auth=$3" "https://docs.google.com/feeds/download/documents/Export?docID=${resourceId[$i]}&exportFormat=txt" -O /tmp/${file[$i]}.txt

sleep 2
i=$i+1
done

А теперь, как принято, разоблачение.
Читать дальше →
Всего голосов 51: ↑35 и ↓16+19
Просмотры6.6K
Комментарии 17

Смерть IE6 назначена на 13 марта

Облачные сервисы
Как известно, Google начал планомерную кампанию по уничтожению браузера IE6. Полгода назад они предупредили, что уберут поддержку на YouTube и Orkut. В конце января 2010 года была названа дата, после которой прекратится поддержка на Google Docs и Google Sites: 1 марта 2010 года. Это будет предсмертный хрип. А настоящая дата смерти устаревшего браузера стала известна сегодня. На сайте YouTube появилось сообщение, что поддержка старых браузеров прекратится 13 марта 2010 года. Для апгрейда предлагают выбрать, в порядке предпочтительности: Google Chrome, Safari 4, Firefox 3.6, Internet Explorer 8 или Opera 10.



В данный момент доля IE6 среди всей мировой аудитории составляет около 20%.
Читать дальше →
Всего голосов 156: ↑137 и ↓19+118
Просмотры472
Комментарии 154

Docsbox

Облачные сервисы
Docsbox Немного облегчил себе жизнь и хочу поделиться этим с вами. Теперь документы создаваемые в Google Docs доступны offline и на всех моих рабочих компьютерах.

Представляю вашему вниманию Python скрипт выполняющий синхронизацию документов между сервисом Google Docs и директорией на диске, которая в моем случае является директорией хранилища сервиcа Dropbox.

Исходник: github.com/k0sh/Docsbox
Далее небольшая инструкция по запуску...
Всего голосов 23: ↑20 и ↓3+17
Просмотры399
Комментарии 13

«Цветные карандаши» — идеальная система учета задач

Управление проектами
Как у любой серьезной команды, у нас есть настоящая система учета задач: с проектами и рабочими группами, с разделением ролей пользователя и прав доступа, с учетом времени и жизненного цикла задачи. Но жизнь, как обычно, штука многогранная, и не всегда бывает удобно вписываться в холодную логику таск-трекера. Особенно это заметно на сверхсрочных проектах, когда надо сделать командный рывок и за несколько дней совершить невозможное ;) Вот в таких ситуациях у нас и родился этот неожиданный подход, которым я хочу поделиться.

Учет задач мы ведем не в солидном таск-трекере, а в… текстовом файле. Точнее не просто текстовом, а в расшаренном документе Google Docs. Происходит это так:
  • Записываем возникающие задачи обычным черным шрифтом в виде обычного ненумерованного списка.
  • Размером шрифта отмечаем приоритет задач — чем крупнее, тем важнее.
  • Цветом помечаем задачи, назначенные на конкретного человека — за каждым разработчиком закреплен свой цвет.

В начале файла обычно помещаем "легенду", чтобы всегда можно было вспомнить, где чей цвет. Вот как это выглядит:



Интересно? Читайте дальше! ...
Всего голосов 105: ↑82 и ↓23+59
Просмотры2.4K
Комментарии 79

Новые Документы Google

IT-компании
Сегодня Google анонсировали новые версии приложений для работы с документами, таблицами и схемами. Они будут доступны в течение ближайших нескольких дней.

Среди особенностей:
  • Правка документов в реальном времени (а-ля Google Wave)
  • Боковая панель чата
  • Линейки полей/выравнивания
  • Улучшена работа с изображениями внутри документов
  • Оптимизация работы с таблицами (повышена скорость загрузки и отклика)
  • Возможность переноса колонок
  • Упрощена навигация между листами
  • Новый инструмент для создания схем (Drawing Editor)

Новые редакторы пока не работают с Gears (планируется ввести позже на основе HTML5). Под хабракатом — видео.
Читать дальше →
Всего голосов 115: ↑108 и ↓7+101
Просмотры1.8K
Комментарии 98

Работа с Google Docs в demo-режиме

IT-компании
image

Google открыл демонстрационный доступ к своему онлайновому пакету офисных приложений Google Docs тем, у кого нет аккаунта на Google. Документы, созданные таким образом, хранятся 24 часа с момента их создания после чего будет предложено создать учетную запись Google для продолжения работы с ними. Поддерживается совместная работа над документами.
Всего голосов 26: ↑24 и ↓2+22
Просмотры406
Комментарии 9

Есть вопрос к знатокам Гугл

Чулан
Ситуация такова: включаю компьютер и не могу зайти на свой гугл аккаунт, просит ввести номер телефона. Ни объяснения причин, ничего нет. Ввел номер, пришел код подтверждения, ввел код, аккаунт стал доступен.
Собственно что смутило помимо самого факта: А где гарантия что это мой телефон? а если враги бы ввели свой?

Через некоторое время обнаруживаю, что мои рабочие документы (коммерческое предложение заказчику и расчет стоимости работ, расшаренные по ссылке на чтение) закрыты с формулировкой:
Опубликованная версия этого объекта отмечена как неприемлемая, совместный доступ невозможен. Запрос на рассмотрение.

Нажатие на ссылку "запрос на расмотрение" ведет меня на страницу с таким содержимым:
При обработке вашего запроса произошла ошибка.
(очень напоминает майкрософт, кстати).

Собственно цель поста: предупредить о неприятном недуге, и возможно выяснить что это такое? какие возможные причины? Если кто сталкивался или знает почему такое может произойти — прошу в коменты и личку
Всего голосов 26: ↑14 и ↓12+2
Просмотры180
Комментарии 23