Уходим с Mercurial на Git
Кадр из фильма «Красный шар». Режиссер Альбер Ламорис. 1956 год
Так уж случилось, что у меня остался ряд репозиториев на Mercurial, которые захостил на Bitbucket много лет назад. Проекты перешли в полуархивное состояние, поэтому заглядывал в них не так уж и часто. И тут я решил обратиться к материалам, надо было внести правку. С удивлением обнаружил, что репозиториев на битбакете нет, но есть публикация
«Sunsetting Mercurial support in Bitbucket».
Не критично, локальные репозитории сохранились же (а там коммитов за 10+ лет). Попробуем переехать по инструкции и статьи на github/gitlub. И, конечно же, эти инструкции работают только с latin-1, русские буквы либо не дают переехать, либо заменяются на ?
. Извечная проблема кодировок. Можно ли что-то сделать?
Является продолжением серии предыдущих публикаций.
▍ Предпосылки
Философские размышления о действиях Atlassian, огорчения о проигрыше mercurial, глубокое погружение в сравнительную архитектуру и т.д. не особо уместы. Требуется простое работающее пошаговое решение как сохранить репозиторий в git с минимальными потерями. Основой для выбранного мной решения послужили комментарии к публикации «Переход с Mercurial на GIT в Atlassian Bitbucket с сохранением файлов в кириллице», только их также пришлось прогонять через фуганок и нащупывать магическую последовательность.
Если же говорить о работе с существующим репозиторием Mercurial, то есть несколько опций на усмотрение.
▍ Опция 1
Найти подходящий sel-hosted mercurial server, развернуть у себя в сети и продолжить работать с ним. Таких немало, например, Mercurial Server, RhodeCode, HgLab и т.д.
Если вы выбрали по каким-то соображениям mercurial и принципиально хотите оставаться на нем — есть вариант.
▍ Опция 2
Оперативно мигрировать на облачный Mercurail сервер, подумать о стратегии дальнейших действий, потестировать различные способы. Например, HelixTeamHub является неплохим бесплатным вариантом для этой стратегии.
▍ Опция 3
Наплевать на кириллицу и мигрировать, а GitHub залитый в HelixTeamHub репозиторий штатными средствами Github. Для англоязычных репозиториев решение GitHub Importer фактически является «one-click» ответом. При таком способе все киррилические имена файлов и комментарии превращаются в знаки вопроса.
▍ Опция 4
Руками отконвертировать у себя на машине и залить на github. Ни одной рабочей последовательность мне найти в интернете не удалось, поэтому собирал лего самостоятельно. Нет цели сделать идеально красиво, надо просто перетащить репозиторий минимальными усилиями. Пошаговая инструкция следующая.
Целевая стратегия: конвертируем копию локального HG репозиторий и импортируем в https://github.com/
- Ставим именно TortoseHG 5.0.2. Включаем в контекстном меню плагины
hg-git
иconvert
. - Копируем спасаемый Mercurial репозиторий в рабочую папку
c:/temp/hg-repo
. - Прогоняем в ней ниже приведенный питоновский 2.x скрипт для подготовки матчинга имен файлов в разных кодировках.
hg manifest --all | C:...\python.exe rename.py > rename.txt
- Создаем локально bare репозиторий git (в какой-нибудь папке, напримерв в
c:\temp
)git init --bare c:\temp\bare_repo
- В директории с Mercurail репозиторием навешиваем бранч
hg
на репозиторий и делаем коммит в bare git репозиторийhg bookmarks hg
hg push c:\temp\bare_repo
- Делаем обычный клон non-bare репозитория, ключевой момент — вытягиваем бранч hg, чтобы не получить ошибку 'remote HEAD refers to nonexisting ref, unable to checkout'
git clone -b hg git_bare_repo git_regular_repo
, например,git clone -b hg c:\temp\bare_repo c:\temp\bb_import
- Создаем чистый репозиторий в GitHub
- Переносим remote в локальном репозитории на github:
git remote set-url origin https://github.com/
/bb-import.git - Загоняем все ветки в облако
git push -u --all
- Переименуем в облаке бранч hg в master, пользуемся подсказками github для перенастройки локального репозитория тоже:
git branch -m hg master git fetch origin git branch -u origin/master master git remote set-head origin -a
- ВСЁ, победа! Файлы на русском языке, комментарии тоже.
❒ Текст скрипта rename.py
#!/usr/bin/python
# -*- coding: cp1251 -*-
import sys
for path in sys.stdin:
old = path[:-1] # strip newline
new = old.decode("cp1251").encode("utf-8")
print 'rename "%s" "%s"' % (old, new)
Настройки TortoiseHG
Предыдущая публикация — «Разработка (dev) и data science в enterprise — битва за ресурсы или эффективное сотрудничество?».