

Как правило, качество сайта оценивается по красочности дизайна. В данном случае, это не так! Портал научно технической информации уникален своей информацией! 25 тысяч книг, 7.5 миллионов документов, тысячи пользователей.
Как все начиналось.
Книги – источник знаний. Научно-техническая литература – особенно. К сожалению, раньше книги были только бумажными. Чтоб получить информацию, нужно было побывать в библиотеке, выбрать нужную книгу, найти в ней нужную информацию. Вспомнили? Да, сейчас намного проще, новое поколение, избалованное Интернетом и доступностью информации, уже не представляет себе ценность знаний.
Давайте разберемся, как информация становится легкодоступной на примере ООО НПЦ «Знание» и их портала электронной библиотеки Нефть и Газ. На протяжении нескольких лет приобретались книги, нет, не по одной, а целыми библиотеками. Естественно, книги были бумажными, а потому занимали объем измеряемый не в мегабайтах, а комнатах. На специальном оборудовании у книг отрезались корешки и они помещались в профессиональные скоростные роботизированные сканеры. На выходе получались электронные изображения страниц книги, что, конечно же, недостаточно для организации электронной библиотеки. Следующим этапом проходило автоматическое распознавание текста книг специализированным программным обеспечением. Тексты книг содержат изображения, фотографии, графики, иногда плохо отсканированный и не распознанный текст, поэтому для каждого документа (страницы книги) необходимо сохранять как текстовый, так и графический варианты. Получаемое при сканировании изображение (формат jpg) не совсем пригодно для книг, поэтому все изображения преобразуются в специальный формат DJVU (смотрим в википедии про DJVU). А общий объем документов – около 10 миллионов, представили объем работ?
Но это еще не все! Для того, чтобы люди могли воспользоваться информацией, ее нужно систематизировать, каталогизировать, обеспечить к ней доступ, организовать поиск и связанное предоставление. Именно на этом этапе компания НПЦ «Знания» и обратился в ООО «Центр информационных технологий» для создания портала информационной библиотеки на базе собранных и подготовленных материалов.
Мы восхитились проделанной работе и решили воздвигнуть коллегам памятник, естественно, не рукотворный, а информационный – интернет портал с поисковой системой.
Портал разработан на JAVA (не путаем с Java Script). Поисковый движок - Apache Lucene. База данных - MySQL.
Почему проект был реализован на Java, а, скажем, не на php? Сначала портал и был разработан на php с использованием порта поисковой системы Zend_Lucene , однако тестовые испытания скорости поиска показали неудовлетворительные результаты. Применение более мощных аппаратных средств кардинально ситуацию не изменило. Переделали на Java...
Дизайн очень простой, чтоб не отвлекать человека от работы в библиотеке.
Модуль регистрации и аутентификации пользователей, биллинговая система, прием платежей – от SMS до банковского перевода. Уникальные алгоритмы, мощный механизм скоростного полнотекстового поиска с учетом морфологии русского языка, профессиональное программирование.
Помимо интернет сайта, НПЦ «Знания» с нашей информационно-технической поддержкой внедрило несколько копий портала в крупные нефтегазовые компании для внутреннего корпоративного использования.
Решили мы оценить, сколько всего интернет компаний в Уфе смогло бы реализовать подобный проект, стали загибать пальцы: Центр Информационных Технологий – это раз, ... Может, Вы еще кого знаете?





























































.jpg)











Разработка сайта –3 грани дизайна