11 January 2011

Google Docs Viewer

IT-companies
Sandbox
Google Docs ViewerGoogle Docs Viewer — это онлайн-сервис работающий на платформе Google Docs и позволяющий непосредственно в веб-браузере и без авторизации просматривать документы поддерживаемые сервисом Google Docs, например Adobe PDF, Microsoft Word или Microsoft PowerPoint.

Преимуществом такого варианта является возможность просмотра документов множества форматов без загрузки на локальный диск. Другим преимуществом является безопасность — не все PDF и DOC документы безопасны для просмотра через Adobe Reader и MS Word.


Где и как используется


Существует множество способов использования данного сервиса «корпорации зла». Для просмотра документов через Google Docs Viewer можно сгенерировать ссылку на странице сервиса docs.google.com/viewer. Также сервис генерирует html-код для встраивания в сторонние страницы упрощенного приложения просмотра через iframe (подробнее о таких ссылках ниже).

Google Docs Viewer Embedded

Так же Google Docs Viewer используется в Google Search, предлагая пользователю ссылку на быстрый просмотр найденных файлов, формат которых поддерживается Google Docs. Многие браузеры уже обзавелись расширениями быстрого просмотра документов реализованные через сервис Google Docs Viewer: Google Chrome, Mozilla FireFox, Safari.

GET-параметры ссылок


Для получения различного рода материалов от Google Docs Viewer используются GET-параметры. Вот основной, но не весь, список параметров:
  • url — URL источник документа (поддерживаемые форматы файлов);
    Пример:
    http://docs.google.com/viewer?url={URL документа}

  • a — тип возвращаемого документа:
    • “v” — будет отрыто приложение просмотра документа (это значение по умолчанию);
    • “gt” — будет возвращен xml документ с распознанным текстом (пример);
    • “bi” — будет возвращено изображение страницы документа в формате PNG8 (параметр pagenumber обязателен);
  • pagenumber — номер страницы (только при a=bi), может быть равен только существующей странице в документе;
    Пример:
    http://docs.google.com/viewer?url={URL документа}&a=bi&pagenumber=3

  • w — ширина страницы в px (только при a=bi и указанном параметре pagenumber), минимум 1, максимум 2400 (≈A4x300px/inch), по умолчанию 800 (≈A4x100px/inch);
    Пример:
    http://docs.google.com/viewer?url={URL документа}&a=bi&pagenumber=3&w=250

  • q — источник документа в кэш Google Search (замена параметру url) (пример);

  • embedded — включение/выключение (значения соответственно true/false) интерфейса встраиваемого в сторонние html-страницы (по умолчанию false);
    Пример:
    http://docs.google.com/viewer?url={URL документа}&embedded=true

Поддерживаемые форматы и ограничения


Google Docs Viewer поддерживает большее количество форматов файлов, чем задокументировано. Некоторые форматы, неподдерживаемые при GET-параметре &a=v, поддерживаются при других значениях параметра (gt/bi). Так же имеется ограничение на размер файла: до 22Мб (обнаружено экспериментальным методом). Ограничений на количество страниц не было обнаружено.

Таблица поддерживаемых форматов:

Форматы документов С парметром
&a=v
С парметрами
&a=gt или &a=bi
image Текстовые документы
doc, docx, odt, pdf, pages, xps + +
rtf, sxw, sdw 5.0, txt, html (generate OpenOffice 3) +
dotx, ott, psw, prn, stw, vor, uot, xml
image Табличные документы
xls 97/2000/XP, xlsx + +
sdc 5.0 +
csv, chm, dbf, dif, djvu, hlp, ods, ots, pxl, sdc 3.0/4.0, stc, sxc, slk, uos, xlt, xls 5.0/95, xlsm
image Презентации
ppt, pptx + +
sdd 5.0, sxi (только текст) +
odg, odp, otp, pot, pptm, ppsx, sdd 3.0/4.0, sda, sti, uop
image Изображения
dfx, eps, psd, ps, svg, tif, ttf + +
ai 9.0+ +
ai 3.0/8.0, bpm, dwg, emf, eot, fxg, gif, jpg, met, otf, pbm, pct, pgm, png, ppm, pwp, ras,
svm, swf, sxd, svgz, jpf, psb, raw, sct, woff

Возможна работа других, не указанных в таблице, форматов. Указаны только те форматы, которые участвовали в личных экспериментах.

Что же в итоге


Есть, очевидно, и другие сервисы, предлагающие аналогичные функциональные возможности. Например расширение для браузеров OpenITOnline, сервис ViewDocsOnline.com и другие. Но основным отличием и преимуществом Google Docs Viewer является то, что он не ограничивается просто расширением для браузера или веб-приложением для просмотра текстовых или графических документов. Данный сервис предоставляет очень гибкий и удобный интерфейс как для пользователей так и для разработчиков приложений.

С помощью сервиса легко получить тексты из различных источников, которые могут в дальнейшем быть использованы при поиске по документам или для других целей. Так же легко получить превью изображения этих документов. Предоставленный интерфейс по протоколу HTTP даст возможность работать с документами даже в скриптовых языках (JS и др.).

Надеюсь, полезный сервис станет еще полезнее благодаря этой статье.

upd-1 (12.01.2011):
Дополнил таблицу поддерживаемых форматов форматами MS Office 2007 (см. коммент). Спасибо за подсказку MaximKat.
upd-2 (21.02.2011):
Дополнил таблицу поддерживаемых форматов форматами Apple Pages (.pages), Autodesk AutoCad (.DXF), PostScript (.ps), TrueType (.TTF), XML Paper Specification (.XPS) (навеяно хабратопиком-переводом). А также расширил эксперимент следующими форматами: djvu, eot, otf, woff, chm, hlp.
Tags:google docs viewergoogle docsonline viewer
Hubs: IT-companies
+42
40.4k 98
Comments 24
Popular right now
Top of the last 24 hours