Генерация стикеров из сообщений через Bot API
Все началось с одной из учебных групп в Telegram. Студенты там очень любят делать стикеры из сообщений своего преподавателя. Я выяснил, что делаются они в полуавтоматическом режиме: сообщение пересылается в бота, который рисует «пузырек» сообщения, а результат пересылается в официального стикер-бота.
Схема рабочая, но напрашивается идея минимизировать количество пересылок. Тем более, что в Telegram существуют боты, создающие пользовательские стикер-паки. Рассказываю, как сделать такого бота без лишних телодвижений, и даю свое творение на тест. Если не хотите запариваться с созданием бота, но не против запечатлеть парочку своих золотых цитат для потомков, — прошу под кат.
Концепт идеи прост: пользователь пересылает сообщение в диалог с ботом, бот создает стикер.
Чтобы было интереснее, введем дополнительные ограничения:
- никаких баз данных, даже встроенных;
- никаких промежуточных файлов, стараемся делать все в памяти.
Такой подход усложняет разработку бота, но значительно упрощает его эксплуатацию:
- вся информация хранится в Telegram, у бота нет данных — не нужно думать о резервном копировании;
- для запуска бота нужен только код и файл конфигурации;
- бот может быть запущен даже на Raspberry Pi (кстати, сервер с этим одноплатником можно получить в Selectel в течение часа).
Для разработки я выбрал язык Python версии 3.8. Сперва сделаем основу бота, которая получает сообщения и выводит доступную информацию.
Основа
Итак, регистрируем нового бота или используем старого. Все операции с ними производятся через официального BotFather. Для начала хватит идентификатора бота (username) и токена для API.
Представленный в статье код адаптирован для объяснения в контексте статьи. Ссылка на оригинальный исходный код будет в конце.
Для Bot API уже есть обертка, названная python-telegram-bot. В статье используется версия 13.4.1. Создаем простой обработчик текстовых сообщений:
def on_message_received(update: Update, context: CallbackContext):
# Игнорируем все события, кроме получения сообщения
if not update.message:
return
# Если идентификатор чата не равен идентификатору отправителя,
# то бота включили в группу. Игнорируем.
if update.message.chat_id != update.message.from_user.id:
return
# Синтетическое ограничение: хотим работать только с пересланными сбщ
if not update.message.forward_from:
update.message.reply_text("Only forwarded messages supported!")
return
print(update.message)
Создаем бота и регистрируем обработчик.
import toml
from telegram.ext import Updater, MessageHandler, Filters
config = toml.load('dsb.toml')
bot = Updater(
token=config["telegram"]["token"]
)
bot.dispatcher.add_handler(
MessageHandler(Filters.update.message, on_message_received)
)
bot.start_polling()
bot.idle()
Теперь боту можно переслать любое сообщение, и он выведет в stdout данные, которые ему доступны.
{
'message_id': 391,
'date': 1640260315,
'chat': {
'id': 00000001,
'type': 'private',
'username': 'someone-s-username',
'first_name': 'Пример',
'last_name': 'Примерыч'
},
'forward_from': {
'id': 0000002,
'first_name': 'Иван',
'is_bot': False,
'last_name': 'Иваныч',
'username': 'totally-not-a-bot',
'language_code': 'en'
},
'forward_date': 1640259241,
'text': 'пример!',
'entities': [],
'caption_entities': [],
'photo': [],
'new_chat_members': [],
'new_chat_photo': [],
'delete_chat_photo': False,
'group_chat_created': False,
'supergroup_chat_created': False,
'channel_chat_created': False,
'from': {
'id': 00000001,
'type': 'private',
'username': 'someone-s-username',
'first_name': 'Пример',
'last_name': 'Примерыч',
'language_code': 'ru'
}
}
В представленном выводе доступна следующая информация:
- forward_from — информация об авторе пересланного сообщения;
- text — текст пересланного сообщения.
Для того, чтобы нарисовать «пузырек» сообщения, не хватает лишь аватарки. Получаем ее парой отдельных вызовов:
# получаем первую (текущую) аватарку пользователя
result = context.bot.get_user_profile_photos(
update.message.forward_from.id,
limit=1
) # type: UserProfilePhotos
# Обрабатываем ситуацию, когда аватарки нет, или она скрыта настройками приватности
if result.total_count > 0:
file = context.bot.get_file(result.photos[0][0].file_id) # type: File
Вызов get_user_profile_photos () возвращает двумерный массив записей типа File. Первое измерение задает количество аватарок у пользователя, но не больше limit. Второе измерение задает аватарку разных размеров. В нашем случае достаточно забрать первую попавшуюся картинку, но для оптимизации стоит сразу выбирать картинку подходящего разрешения.
Объект file имеет метод download_as_bytearray (), что позволяет загрузить аватарку в память без использования промежуточных файлов.
Теперь, когда есть необходимая информация, можно нарисовать «пузырек».
Рисуем стикер
Пример созданного изображения
Для рисования используем библиотеку Pillow версии 8.4.0. Шрифт — OpenSans, такой же используется в официальных приложениях Telegram.
Мессенджер накладывает ограничение на стикеры: как минимум одна сторона должна быть размером 512 пикселей. Так как мы генерируем сообщение, то можно зафиксировать ширину, а высоту рассчитывать в зависимости от количества текста.
# Импортируем шрифт, кегль 26
OPEN_SANS = ImageFont.truetype('OpenSans.ttf', 26)
# Разбиваем сообщение на строки из расчета,
# что в одной строке не больше 30 символов
text = textwrap.wrap(update.message["text"], width=30)
# Получаем высоту шрифта
font_height = OPEN_SANS.getsize(text[0])[1]
# Рассчитываем высоту картинки
height = font_height * (len(text) + 1) + 2*BUBBLE_PADDING
if height > 512:
raise OverflowError("Image too big")
Функция textwrap.wrap () разбивает строку на массив строк, пытаясь сделать перенос по пробелам. Расчет высоты картинки прост:
- отступ от начала — BUBBLE_PADDING, в моем случае 10 px;
- имя отправителя — font_height;
- сообщение — font_height * len (text);
- отступ до конца — BUBBLE_PADDING.
Если сообщение большое, то высота картинки может получиться больше 512 пикселей. В этом случае наши полномочия — лапки, выбрасываем исключение. Если размер меньше, то можем продолжать. Проверяем наличие аватарки у пользователя и адаптируем ее к нашему стикеру.
# Скачиваем аватарку как массив байт
data = file.download_as_bytearray()
# Класс Image из Pillow умеет читать только из потоков,
# создаем виртуальный байтовый поток
avatar = Image.open(BytesIO(data)) # type: Image.Image
# Аватарки в Телеграме квадратные, поэтому просто масштабируем
# до желаемого размера
size = (AVATAR_SIZE, AVATAR_SIZE)
avatar = avatar.resize(size, Image.ANTIALIAS)
# Создаем круглую маску
mask = Image.new('L', size, 0)
draw = ImageDraw.Draw(mask)
draw.ellipse((0, 0) + size, fill=255)
# Заполняем прозрачным по маске
avatar = ImageOps.fit(avatar, mask.size, centering=(0.5, 0.5))
avatar.putalpha(mask)
Теперь у нас есть сообщение и аватарка. Создаем «холст» и начинаем рисовать. Обязательно выбираем цветовой режим RGBA и делаем прозрачный (alpha = 0) основным цветом «холста».
# Создаем изображение
img = Image.new('RGBA', (width, height), color=(255, 255, 255, 0))
# Создаем холст, на котором рисуем
d = ImageDraw.Draw(img)
# Если есть аватарка – вставляем, если нет – рисуем синий круг
if avatar:
img.paste(self.avatar, (0, 0))
else:
d.ellipse((0, 0, AVATAR_SIZE, AVATAR_SIZE), fill="blue")
# Рисуем черный пузырек
d.rounded_rectangle((BUBBLE_X_START, 0, width, height), fill="black", radius=BUBBLE_RADIUS)
# Первая строка – розовый заголовок, имя
d.text(
(TEXT_X_START, BUBBLE_PADDING),
update.message.forward_from.first_name,
fill="pink",
font=OPEN_SANS
)
# Вторая и последующие строки – текст сообщения
offset = BUBBLE_PADDING + font_height
for line in self._text:
d.text((TEXT_X_START, offset), line, fill="white", font=OPEN_SANS)
offset += font_height
Финальный штрих — сохранить изображение. Так как мы все держим в памяти, то сохраняем также в виртуальный байтовый поток.
sticker = BytesIO()
# Для прозрачности сохраняем в PNG
img.save(sticker, 'PNG')
# Отматываем поток на начало, чтобы из него можно было считать
sticker.seek(0);
Осталось совсем немного: загрузить стикер в Telegram и передать его пользователю.
Заполнение набора стикеров
Те, кто создавал собственные наборы, знают, что для всех операций со стикерами необходимо обращаться к боту Stickers. Однако, в Bot API есть набор вызовов для взаимодействия со стикерами, в том числе функция создания набора. Созданный ботом набор стикеров имеет следующие особенности:
- уникальное имя набора (используется в ссылках вида
https://t.me/addstickers/<имя>
) обязательно должно заканчиваться на _by_%BOT_USERNAME%; - набор стикеров принадлежит пользователю и может быть отредактирован через бота Stickers;
- для управления набором стикеров через бота требуется его уникальное имя и идентификатор пользователя.
Как упоминалось ранее, бот должен работать без базы данных. Таким образом, уникальное имя набора должно быть вычисляемым. Самый простой способ — использовать идентификатор пользователя в имени набора. Однако это некорректно: любой пользователь набора стикеров может «вычислить» автора.
Имя бота в уникальном имени набора неявно используется для аутентификации действий бота. Так, зная идентификатор пользователя, произвести деструктивные действия с набором не получится.
Эта «особенность» исправляется хэшированием. Мне показалось подходящим использовать UUIDv5, который использует SHA-1 для хэширования. Правда, UUIDv5 не соответствует сразу двум ограничениям Telegram:
- может начинаться с цифры;
- имеет запрещенные символы — дефисы.
Первая проблема решается префиксом, а вторая — удалением запрещенных символов. Таким образом, UUIDv5 от идентификатора пользователя — отличное вычисляемое решение. А чтобы усложнить угадывание автора, можно добавить «соль» к идентификатору.
# id пользователя + соль
sid = f"{update.message.from_user.id}-{context.bot_data.get('salt', '')}"
# Генерируем uuidv5 и конвертируем в строку
uid = str(uuid.uuid5(uuid.NAMESPACE_X500, sid))
# Удаляем дефисы
uid = uid.replace("-", "")
# В качестве буквенного префикса используем s
sticker_set_name = f"s{uid}_by_{context.bot_data['name']}"
Теперь у нас все есть, создаем набор с первым стикером.
context.bot.add_sticker_to_set(
user_id=update.message.from_user.id,
name=sticker_set_name,
emojis=DEFAULT_EMOJI,
png_sticker=bio
)
Если функция вернула True, то стикерпак создан. Если мы хотим добавить еще один стикер, то сперва набор нужно найти.
# get_sticker_set выбросит исключение, если набора нет.
# Это можно использовать для определения, когда нужно создать набор.
sticker_set = context.bot.get_sticker_set(sticker_set_name) # type: StickerSet
# Наборы ограничены по 120 стикеров
if len(sticker_set.stickers) >= 120:
update.message.reply_text("Sticker set is full")
return
# Добавляем!
context.bot.add_sticker_to_set(
user_id=update.message.from_user.id,
name=sticker_set_name,
emojis=DEFAULT_EMOJI,
png_sticker=bio
)
Стикеры добавляются в набор мгновенно, но у пользователей отображаются в течение нескольких часов. Наиболее оперативный способ обновить набор — удалить из сохраненных наборов и добавить заново.
В качестве ответа бот будет отправлять только что добавленный стикер, подтверждая, что он действительно загружен.
sticker_set = context.bot.get_sticker_set(sticker_set_name) # type: StickerSet
update.message.reply_sticker(sticker_set.stickers[-1])
Вот и все, бот готов.
Конечно, это далеко не продуктовый вариант, так как Emoji не поддерживаются, существует ограничение на 120 стикеров на человека и совершенно нет кастомизации сообщений. Но для начала сойдет.
Заключение
Еще один маленький шажок для автоматизации рутинных процессов. Генерация стикеров — не самый популярный случай, но, если вдруг захочется автоматизировать, теперь вы знаете как.
Для быстрого тестирования можете использовать моего бота: ohmyquotebot (если что, он не будет жить вечно). Бот не отвечает на команду /start, так что не волнуйтесь и просто пересылайте ему сообщение, из которого хотите сделать стикер.
Исходный код доступен на GitHub.