Поисковик Google научился различать слова на изображениях

Подробности: 01.11.2008 18:08 — Интернет

Компания Google разработала систему оптического распознавания текста. Она позволяет поисковику различать текст на отсканированных изображениях.
В настоящее время Google способен распознать текст на изображениях, сохраненных в формате PDF. О планах Google по расширению возможностей системы не сообщается.

Поисковик уже начал индексировать PDF-файлы. Наибольшую сложность представляет поиск по старым отсканированным документам, где бумага, например, испачкана следами от чашки с кофе, либо имеются различные пометки, сделанные от руки.

Ранее Google запустил в экспериментальном режиме сервис Google Audio Indexing, распознающий звуковую дорожку в видеоклипах. Он конвертирует звук в текст и индексирует последний.

Кроме того, в начале сентября Google сообщил о планах по размещению в интернете отсканированных страниц старых газет и журналов. Они будут помещены в новостной архив поисковика и появятся в результатах поисковой выдачи.

Читайте также:

Искусство боди-арта в Китае. ФОТО

Евгений Петросян стал жертвой интернет-подонков

Ученые обнаружили, что паразиты, живущие в теле человека, способны влиять на его поведение

Скрипт на PHP, который отображает имя пользователя, имя домена и имя его компьютера

Функци постраничного вывода в PHP

Пример скрипта на PHP для создания уменьшенных копий изображений

Люди были на Луне не первыми!

Как сделать дреды (Dreadlocks) (Советы)

Иисус Христос ходил по льду

Во Вселенной обнаружено море алкоголя