Google
запатентовал технологию поиска по тексту в изображениях - “Recognizing Text In
Images”. И хотя заявление на патент технологии было подано двумя сотрудниками
поисковика еще в конце июня 2007 года, всемирная организация по патентированию
обнародовала эту информацию только на новогодних каникулах.
Новая
технология может как распознавать ключевые слова на изображении, так и выделять
группы связанных слов и сопоставлять их с описанием картинки. Технология уже прошла
тестирование в рамках проекта Google под названием «Street View», который
является расширением Google Maps. По заявлению компании Google, «обкатка»
прошла успешно, система отлично распознаёт тексты на снимках спутников с
указателями улиц больших американских городов.
«Прародителем» этой
технологии стала система Tesseract и ее программный продукт
OCRopus. OCRopus предназначен для автоматизации распознавания
отсканированных или снятых на цифровую камеру документов, включая рукописные. О
том, как может отразиться на поиске новая технология Google, SEONEWS высказал
свое мнение технический директор компании Promodo Александр Лавро: «Да ничего
сверхъестественного не произойдет. Сейчас ведь тоже можно оптимизировать
картинки под поиск, прописывая ALT и ссылаясь на картинку ключевыми словами. А
сильно ли это влияет на основной поиск? Так что оптимизаторам не стоит
волноваться. Теперь Google станет умнее и будет искать даже там, где они забыли
прооптимизировать.
Поясняя механизм работы нового поиска, Александр
добавил, что если человек будет искать, например, адрес какого-то магазина (в
патенте упоминается McDonalds ), то ему, помимо текстовых результатов, покажут
Google Map и подберут подходящие картинки. По его словам, "предполагается,
что Google сможет искать на панорамных фотографиях названия улиц, вывески
магазинов, адреса, телефоны и прочее".
Что касается возможности
внедрения этой технологии в лидирующем поисковике рунета, по словам Олега
Сахно, главного интернет-маркетолога компании InterLabs: "Думаю,
распознавание текста в графических изображениях это вопрос очень далёкой
перспективы. В первую очередь, возрастёт нагрузка на канал передачи данных, так
как роботу поисковой системы придётся выкачивать все графические изображения.
Во-вторых, идентификация текста требует значительного увеличения вычислительных
мощностей. Сомневаюсь, что Яндекс способен на столь революционное обновление
парка серверов".
Более того, Олег усомнился в разумности трат на
внедрение подобной технологии, по его мнению, оно "не сильно скажется на
результатах основного поиска. Сложно представить прикладное применение этого
механизма: очень редко встречается на картинке с машиной надпись «машина»". seonews.ru/news/.info_news/2703/