В Сеть выложили 2,1 млн старых постов Usenet и инструменты для их архивации

image

Программист из Канады Джозеф Ярощак опубликовал базу, которая насчитывает 2,1 млн сообщений Usenet, одной из старейших компьютерных сетей для общения и обмена файлами. Она появилась еще в 80-е годы. Сеть используется по сей день.

Ярощак опубликовал сообщения за период с февраля 1981 года по июнь 1991-го. Он брал материалы из архива UTZOO NetNews Archive, записанного на 141 магнитной ленте программистом из Университета Торонто Генри Спенсером.

Автор базы утверждает, что это самые ранние из ныне опубликованных в сети переписок представителей университетов, которым в то время был доступен интернет.

Этот последний дамп архива является частью еще более крупного проекта Ярощака. В прошлом месяце он запустил сайт архива Usenet. Всего там размещено 317 млн записей из 10 тысяч уникальных новостных групп Usenet. Ярощак планирует довести этот показатель до миллиарда.

Программист преобразовал плёночные записи в базу данных PostgreSQL, которую он выгрузил на Usenet Archives. Ярощак также выложил конвертеры для PHP, JavaScript, Java и Python на GitHub.

«Эти посты проливают свет на то, как мыслило интернет-сообщество на заре интернета», — говорит он, отмечая, что в архиве есть важный для историков и исследователей контент.

Сам Ярощак, системный архитектор из Онтарио, впервые познакомился с Usenet в 2000 году, когда нашел постоянную работу в Канаде благодаря размещению вакансии в этой сети.

См. также:

© Habrahabr.ru