Friday, April 18, 2008

Встречайте - проект Покупедия.ру

Получается, уже более месяца в этом блоге не появлялось новых записей. Причины - более чем уважительные: уход с места работы под названием РЕДЛАБ, обустройство новой жизни, но главное - работа над новым проектом. Для меня этот проект, конечно, уже давно не нов, но вниманию публики он был представлен впервые.

Мероприятие, где был представлен мой проект, прошло 9 апреля 2008 года в Московской международной высшей школе бизнеса МИРБИС и называлось Первая презентационная сессия инновационных проектов "ИТ Альянса". "ИТ Альянс" - не просто какое-то объединение IT-шников, как можно было бы понять из названия, а на самом деле, это аббревиатура от "Инвестиционно-технологический альянс". Более подробно об этой молодой, но представительной структуре можно прочитать, например, здесь. Пока же замечу, что инициатором ее создания выступило Национальное содружество бизнес-ангелов (СБАР), и кроме него туда входят компании Intel, Microsoft, венчурные фонды ABRT, Oradell Capital и еще большое количество фондов и компаний.

На сессии присутствовали представители всех входящих в "ИТ Альянс" организаций, в том числе, и тех же Intel и Microsoft. Сама сессия являлась, скорее, мероприятием закрытого формата. Хотя после ее проведения в Сети и появились отчеты (например, здесь), я, как человек лучше знакомый и с самими представленными проектами, и с работой СБАР, могу согласиться не со всем, что там написано, а иногда совсем не могу согласиться :) Возможно, я еще напишу обзор этого мероприятия целиком, но сегодня я хочу дать краткую информацию только о своем проекте, так сказать, из первых рук.

Да, и пока я не начал, хотелось бы выразить благодарность всем сотрудникам СБАР, в частности, отдельное спасибо Александру Комарову, начальнику отдела инвестирования и Александру Каширину, председателю правления. Их вклад трудно переоценить, без их усилий путь проекта к инвестиционной стадии был бы трудным и извилистым.

Итак, приступим.

Одним из инициаторов проекта (а именно, вашим покорным слугой) разработан действующий прототип так называемого­­­­ ядра обработки изображения, позволяющего подготовить фотографии текстовых документов к дальнейшей обработке стандартными программами распознавания текста.

Все существующие на сегодняшний момент программы распознавания текста рассчитаны на работу со сканированными документами. С обычными фотографиями текстовых документов такие программы либо справляются очень плохо, либо не справляются вообще. Причинами этого являются как наличие на фотографических изображениях геометрических искажений, связанных с положением фотокамеры, так и неравномерность освещения при фотосъемке.

Одним из вариантов практического использования разработанной технологии обработки изображений является проект Покупедия.ру. Интернет-портал Покупедия.ру включает в себя web-сервис и социальную сеть, работа которых строится вокруг интегрированной в портал технологии ввода данных о покупках пользователей.

С помощью web-сервиса пользователи могут проводить анализ качественного и количественного состава своих покупок, их стоимости и мест приобретения. Пользователи также являются участниками социальной сети, включенной в портал. Центрами общения между ними форумы обсуждения товаров, их производителей и мест покупок.

Для работы web-сервиса и социальной сети каждый пользователь должен регулярно вносить информацию о своих покупках. Ввод этих данных вручную практически нереален, поэтому ключевым фактором здесь является технология ввода информации: фотографирование кассовых чеков. Вот как она будет работать:

  1. Пользователь делает фото чека.
  2. Далее через сайт сервиса пользователь отправляет фото для обработки на сервер.
  3. На серверной стороне из фото чека извлекается текстовая информация.
  4. Результат обработки через сайт демонстрируется пользователю. Если необходимо, пользователь может внести исправления или дополнения.
  5. Информация о покупках пользователя попадает в закрытую базу данных и становится готовой для дальнейшего использования.
Следует подчеркнуть, что вся обработка изображений производится целиком на серверной стороне, что позволят надежно защитить от копирования как сам сервис, так и технологию.

Пользователи Покупедии получают следующие возможности:
  • Становится очевидным объем и состав своих расходов.
  • Наличие истории покупок позволяет спрогнозировать, сколько и на что будет потрачено средств в будущем.
  • Механизм ввода данных через распознавание кассовых чеков позволяет учитывать товары, автоматически снабжая их целым рядом категорий. Кроме анализа структуры расходов, это позволяет реализовать, например, такую полезную функцию, как список покупок, который можно взять с собой в магазин.
  • Пользуясь отзывами и участвуя в обсуждениях, потребитель решает задачу выбора товаров и получения рекомендаций.
  • Данные о покупках других пользователей дают возможность находить наиболее выгодные цены и улучшать качество товаров в личной потребительской корзине.
Несколько слов о том, что послужило предпосылками к созданию проекта. Сегодня в нашей стране наблюдается явление, которое можно назвать "потребительский бум". Поэтому перед потребителями встает ряд проблем:
  • Во-первых, часто задача выбора конкретного товара из товарной категории становится трудно решаемой.
  • Во-вторых, появляется желание четко оценить количественный и качественный состав приобретаемых товаров.
  • И в-третьих. Выбирать товары и магазины помогают рекомендации. Люди, которые могут их дать, существуют, но мы их не знаем.
Важно отметить, что одновременно происходит и будет происходить увеличение числа пользователей Интернет.

Проект Покупедия.ру появился как ответ на такую ситуацию.

Коммерциализация сервиса возможна сразу по нескольким направлениям. Во-первых, это реклама на сайте. Наличие информации о покупках пользователей позволит сделать ее таргетированной.

В результате работы сервиса будет накапливаться информация о приобретенных пользователями товарах. На этом факте основано второе направление коммерциализации - проведение заказных маркетинговых исследований. Для соблюдения морально-этических норм используемые данные будут обезличены.

Также возможна организация рекламных акций совместно с производителями товаров и торговыми предприятиями. Примерами могут послужить программа распространения купонов со скидками или программа розыгрыша призов.

Информация о подробностях и ходе проекта Покупедия.ру будет постоянно появляться на страницах этого блога. Прошу вас, если возникают вопросы или предложения - не стесняйтесь, задавайте и вносите. Замечу заранее, что один вопрос - а именно "зачем все это консультанту по SAP?" (в скобках замечу, вполне успешному и неплохо получавшему) - и еще несколько примыкающих к нему вопросов я в будущем собираюсь обсудить отдельным небольшим постом.

10 comments:

Anonymous said...

С точки зрения покупателя:
1)такой проект нужен для получения информации о качестве тех или иных товарах, ценах, местах продаж
2) ноу-хау проекта имеет весьма сомнительное применение т.к.
а)требует дополнительных затрат времени на сканирование чека(и как НЕМАЛОВАЖНОЕ следствие- наличия сканера у пользователя) и необходимости отправки скана на сервер
б) в чеке не всегда полно и точно отражены названия товара
с) один и тот же товар может иметь различные названия в разных местах продажи
д) получения согласия пользователя разглашать информацию о своих расходах и товарных предпочтениях третьему лицу(проекту)
3)в сети существует немало проектов, предоставляющих тесты и обзоры товаров и услуг, но как показывает практика, такие проекты не являются независимыми,и как следствие не всегда дают объективную оценку.
Наличие возможность зарегистрироваться позволяет компаниям, путем выставления собственных оценок оказывать влияние на объективность подачи информации(onliner.ru,yandex.market.ru и т.д.)

daemon-s said...

Спасибо, всегда приятно получать развернутые комментарии. Однако видно, что вы не слишком внимательно читали пост. Прочтите еще раз, там даются ответы практически на все ваши замечания.

bair said...

Здравствуйте.
Тоже хотел создать такой проект, но Вы меня опередили. Хотелось бы как-то узнать, на какой стадии у Вы сейчас находитесь?
сайт c2scan не доступен, к сожалению.

daemon-s said...

Сайт c2scan.com сейчас доступен (можно сказать, запустил специально для вас ;)), но будет работать только один день и далее недоступен в течение одного месяца в связи с техническими и жизненными обстоятельствами автора проекта (вашего покорного слуги). Можно сказать, что часть c2scan почти готова и уже неплохо работает с различными, даже сложными, фотографиями чеков. Осталось немножко - прикладная надстройка над ядром распознавания чеков :)

Anonymous said...

что-то вы долго реализовываете - может вам помочь? )

daemon-s said...

Долго - не долго, а отвлекаться на дела, связанные с хлебом насущным, приходится ))

Если это предложение о сотрудничестве - как говорится, пишите в личку

Алексей said...

В какой стадии ваш проект находится? Когда релиз?
Мне известно о проекте в котором человек создает почтовый ящик и далее все чеки и выписки по кредиткам присылаемые на него автоматически сохраняются и упорядочиваются. Считаю, что за этим будущее - а не за ненужным и полным ошибок процессом распознавания.

daemon-s said...

Проект в стадии завершения альфа-тестирования технологического ядра распознавания, самого принципиального компонента (www.c2scan.com). Подавляющее число ошибок распознавания будет убираться за счет принципов, аналогичных translation memory. Считаю, что ваш проект, если и пригодится, то как раз в глубоком будущем. Пока же люди не сильно подвязаны на банковские инструменты, да и многие и не собираются начинать их использовать. В некоторых развитых странах даже наоборот - медленно, но верно отказываются в пользу наличных :)

Алексей said...

Отлично, когда точная дата запуска?

daemon-s said...

Тут, как раз, ничего отличного нет (( Пока я разговор вел только о технологическом ядре распознавания. Что же касается интерфейсной части - она еще даже не начата. Ничего сложного, обычный webapp, но работы много и ее надо сделать. Пока ваш покорный слуга работает над проектом один, дедлайн для Покупедии ставить сложно: как я уже писал, нужно заниматься хлебом насущным. Поэтому техядро выделено в отдельный проект c2scan.com, который полезен сам по себе, и для которого уже можно планировать сроки. Считаю реалистичным довести его до публичной беты к лету.