Бумажный интернет с поисковыми запросами в 1910 году

image-loader.svg

На этот раз мы расскажем о событиях далекого прошлого.

А именно про Mundaneum — работающий бумажный интернет Поля Отле. 100 лет назад он уже обрабатывал 1500 поисковых запросов в год со всего мира. Это было за 55 лет до того, как Тед Нельсон представил гипертекст, за 79 лет до рождения Всемирной паутины и на 84 года раньше появления W3Catalog.

Прочитайте несколько принципов работы поисковой системы Поля Отле. Знакомо?

  • Книга — надёжный, но неудобный источник информации, поскольку требует длительного поиска ответа на конкретный вопрос.

  • Документы, содержащие ответы на вопросы пользователей, должны быть небольшими, удобного универсального формата.

  • Документы должны ссылаться друг на друга, раскрывая информацию и дополняя её.

  • Нужно индексировать разные источники. Не только книги и справочники, но и фотографии, прессу и даже открытки. Соответственно, в результатах поиска могут быть не только текстовые документы, но и медийные.

  • Запрос пользователя должен быть вначале обработан до универсального, в виде ключевых слов –, а по ним уже должен идти поиск.

В соответствии с ними и работал Mundaneum. Это проект, опередивший своё время по всем фронтам — и морально, и технологически. Тем удивительнее, что это была не просто идея, а работающая система. Причём проект действовал с разной мощностью целых 29 лет — с 1910 по 1939-й.

Самое обидное, что его нельзя назвать дедушкой интернета и поисковых систем. Mundaneum был заброшен к началу Второй мировой войны, вскоре умер его создатель, а большинство идей не получили дальнейшей жизни и разрабатывались независимо от него другими учеными. Впрочем, обо всём — по порядку.

Кто такой Поль Отле

Утомлять биографическими подробностями не будем, но кое-что важно упомянуть для понимания. Поль родился в 1868 году в Брюсселе. Он не получал классического школьного образования, рос среди книг и учился на дому. Соответственно, и классических установок о границах возможного ему тоже не дали. Впоследствии он выучился на юриста в Брюссельском свободном университете, но работа по специальности была недолгой.

image-loader.svg

В 24 года Поль написал свою первую значимую научную работу. В виде эссе он высказал критику в адрес библиотечной системы и выдвинул тезис о том, что книга в её классическом виде должна перестать быть основным источником знания.

В эти же годы он познакомился с другим юристом, будущим лауреатом Нобелевской премии мира, Анри Лафонтеном. Он также посвятил жизнь не столько юриспруденции, сколько вопросам систематизации больших данных.

С чего началась работа по созданию поисковой системы

Вместе ученые основали первый в мире Международный институт библиографии (Repertoire Bibliographique Universel). Работа в нём ещё раз подтвердила правильность выводов, изложенных в эссе: правильная система классификации данных — залог их успешного использования.

В частности, Отле и Лафонтен разработали систему категоризации, которая и сейчас используется во многих библиотеках — Универсальную десятичную классификацию (УДК). Она не была полностью их разработкой — что-то было позаимствовано из чужих научных работ. В частности, десятичная классификация была взята у американца Мелвила Дьюи, а фасетная — у индийца Ш.Р. Ранганатана. Однако они были первыми, кто собрал это в единую систему и реализовал её на практике.

Система основана на десятичных кодах и специальных знаках для уточнения области знания. Например, вот так выглядит часть оглавления верхнего порядка:

88f66582669425220302debb138d98fb.jpg

Есть также синтаксис запросов, который включает более 20 символов. Например, 1+2 — это объединение: «Философия, психология, религия и теология».

А если углубляться в один из разделов, классификация будет выглядеть вот так:

image-loader.svg

Какую проблему предстояло решить

Введение карточек упростило и ускорило поиск нужной книги в библиотеке, но главный проект был впереди. Предстояло выйти за границы книг и сделать информацию доступной по конкретному запросу.

Отле поставил непомерно амбициозную для своего времени задачу. Она звучала так: наладить быстрый (в рамках существующих технологий) доступ к любой информации для любого жителя планеты. Очевидно, что для этого требовалось изрядное финансирование, и удача улыбнулась учёным в 1910 году.

Идея показалась брюссельскому правительству перспективной, был выделен бюджет и достаточно большое помещение под рабочие офисы и картотеку. В 1910 году Отле и Лафонтен представили миру Mundaneum — архив для хранения уже не книг, а информационных карточек.

Как выглядела реализация

Mundaneum был разделен на 2 части. Самая большая — архив, в котором хранились десятки тонн бумажных носителей в виде карточек. Одна карточка содержала сжатую информацию на одну узкую тему. Для быстрого поиска по всем материалам как раз применялась УДК. В архив регулярно поступала свежая информация — не только для пополнения карточек, но и для хранения справочников, газет, фотографий и даже плакатов.

Вновь пришедшие материалы обрабатывались сотрудниками Mundaneum, на их основе создавались новые карточки и дополнялись старые, а также создавались связи между ними с помощью синтаксиса УДК. К 1920 году в архиве было 12 залов, 12 млн карточек и больше 200 тысяч других материалов.

Запросы от клиентов приходили по почте. Каждый запрос обрабатывали вручную. Его переводили на французский, сокращали до ключевых слов, необходимых для поиска, и передавали для поиска ответа. Далее сотрудники, используя картотеку, находили нужные карточки, копировали их, переводили на язык оригинала запроса и отправляли обратно.

Спрашивать можно было о чем угодно — от рецепта пирога до истории правящей испанской династии. Уже в 1912 году Mundaneum обрабатывал около 1500 запросов в год. Вероятно, Отле был бы искренне удивлён, если бы узнал, что ему удалось на минимальной технологической базе создать все элементы поисковой системы.

image-loader.svg

Пока запросов было немного, система надежно работала. Первые сбои стали появляться с ростом их числа. И неудивительно — вся работа Mundaneum была основана на ручном труде. УДК помогала работе и упрощала её, но не более того. Не сильно помогло даже расширение штата. Проблемы вызывало ещё и то, что количество ежегодно поступающей новой информации увеличивалось, и сотрудникам приходилось заниматься не только обработкой запросов, но и пополнением архива.

Исходя из этого, Отле пришёл к выводу, что бумажные носители информации, как и связь посредством почты, устарели. После чего он приступил к разработке улучшенной системы на базе телекоммуникационных технологий. В 1934 году вышли две его работы: «Monde» («Мир») и «Traité de documentation» («Характеристика документации»).

Стимпанк-версия интернета

Прежде чем читать этот текст, напомним и подчеркнем: это 1934 год. 88 лет назад. До появления первой программируемой цифровой машины Z1 — 4 года. 12 лет до изобретения транзистора.

Всё во вселенной будет описано и задокументировано. В этом виде мы зафиксируем меняющуюся картину мира, настоящее отражение его памяти. Любой человек сможет удаленно, в виде проекции на экране, читать только тот текст, который соответствует его интересам. Из своего кресла каждый сможет видеть весь мир целиком и отдельные его части.

Закон упорядочивания информации, изложенный в «Traité de documentation», говорил о том, что документы нельзя понимать в отдельности от других — его смысл становится понятным только через влияние на другие документы.

В «Monde» была описана сеть для обмена данных. «Телефонокниги» описывались как персональные устройства, соединённые через телефонную сеть. Через неё пользователи могли бы получать доступ к данным Mundaneum, просматривать текст и изображения, создавать и распространять собственные документы, а также общаться друг с другом.

В книгах были описаны также прообразы сканеров, планшетов и даже виртуальной реальности. Однако блестящие задумки не смогли спасти Mundaneum. По мере увеличения числа запросов система всё чаще стала давать сбои. Все идеи Отле, изложенные в его научных трудах, могли бы решить эти проблемы, но для них в мире не было соответствующей материально-технической базы.

Эти сложности, а также растущее напряжение между странами Европы привели к тому, что в 1934 году правительство решило прекратить финансирование Mundaneum. До 1939 года система продолжала работать в меру финансовых возможностей её создателей — и окончательно остановилась после того, как немцы вошли в Брюссель.

Как сейчас выглядит Mundaneum

После смерти Отле в 1944 году остатки Mundaneum несколько лет перемещали из одного помещения в другое, пока они не остались лежать невостребованными в старом здании Свободного университета.

Только в начале 90-х начались работы по восстановлению оригинальной системы. Профессор Рейвард из университета Чикаго, который защищал диссертацию по работе Поля Отле, решил возродить проект в виде музея.

Задумка удалась — незадолго до конца ХХ века он был открыт. А в 2012 году в знак заслуг Отле Google объявил о сотрудничестве с возрожденным Mundaneum.

© Habrahabr.ru