Успешное изобретение для Умного поиска hh.ru

Мы запатентовали собственную разработку для «Умного поиска» и вошли в число финалистов конкурса Роспатента «Успешный патент» где выявляют самые классные изобретения по итогам 2020–2021 годов. В конкурсе приняли участвовали еще 128 российских правообладателей.

83ef2e4549f7207e1717438ebd787601.jpg

Мы постоянно работаем над улучшением нашего сервиса. И стараемся делать так, чтобы дата-сайентистам не предлагали вакансии сантехников. С каждым годом мы все ближе к космическому идеалу. В 2020 году мы получили патент на изобретение автоматизированного поиска релевантных резюме и вакансий для рекомендательной системы »Умный поиск hh.ru» с использованием машинного обучения и понижением размерности многомерных данных. 

Компонент Умного поиска hh.ru был изобретен нашими профи по анализу данных и машинному обучению — Георгием Даньщиным, Виктором Реушкиным и Александром Сидоровым. Наше изобретение позволяет за сотни миллисекунд выбирать из миллионов резюме и сотен тысяч вакансий правильные, и соотносить друг с другом те, у которых похож не только текст, но и смысл. Наша фича проделывает это куда лучше и эффективнее, чем подобранные вручную правила.  

Благодаря этому улучшается качество рекомендаций резюме и вакансий и требуется меньше вычислительных ресурсов — мы экономим память и процессоры серверов.

Чтобы рекомендовать вакансии в последние два года мы применяем более сложные ML-модели с большим количеством признаков. Запатентованные изобретения позволяют ощутимо уменьшать объем данных, сохраняя существенную часть их смысла. Затем эти данные используются для очень быстрого предварительного отбора вакансий и резюме, а затем модели выбирают наиболее подходящие. 

Из больших полноразмерных данных мы получаем сжатые. Однако они должны сохранять определенный смысл, чтобы без потери качества и скорости обработки мы могли рекомендовать подходящие резюме для вакансий и наоборот. Наше изобретение используется и для обработки запросов работодателей при поиске по резюме, и для обработки запросов соискателей при поиске вакансий. 

a31381f51af3a30ab8db61c40e81eba7.jpg

Благодаря hh.ru сотни тысяч работодателей и соискателей находят друг друга в России и за её пределами. Чтобы это происходило быстрее и оптимальнее, наши разработчики используют прикладной искусственный интеллект. Наши решения сильно отличаются от применяемых, например, в веб-поиске. Всё из-за очень большого разнообразия и специфики предметной области наёма и работы, и очень высоких требований к качеству выдачи, которую видят пользователи.  

В 2018 году нам потребовалось сделать рекомендации резюме для вакансий, с учётом географического местоположения и интересов. На тот момент в нашей базе уже было больше 40 млн резюме и 600 тыс. вакансий. Посчитать вероятность, что каждое резюме пригласят на каждую вакансию с помощью сложных математических моделей, подобранных посредством машинного обучения — невозможно. Тем более онлайн, за 50 мс, пока пользователь ждёт отрисовки веб-страницы или экранного мобильного приложения. 

Для решения этой проблемы можно попытаться придумать эвристики и классификаторы резюме и вакансий. Например, оцифровать резюме и вакансию, представить их в виде векторов чисел. Затем снизить размерность этих векторов, представив их в виде хешей. Использовать для вычисления этих хешей нужно такую функцию, которая делала бы их похожими с точки зрения последовательностей отдельных битов информации, если работодатель позвал кандидата на собеседование. Дальше нужно сложить эти хеши в поля базы, и когда приходит работодатель с вакансией — делать запрос «выдать все резюме, хеш которых отличается не более чем на N бит». И уже получив несколько десятков тысяч резюме, применять к ним более сложные и ресурсоёмкие модели. Технические подробности — в нашем патенте. 

В результате мы смогли запустить рекомендации резюме на вакансии. С тех пор их использование выросло настолько, что работодатели приглашают большинство соискателей не благодаря поиску по базе, а из резюме, которые рекомендуются на их вакансии. Это позволяет тратить на поиски подходящих кандидатов примерно в 6 раз меньше времени, а значит делает наем и поиск работы проще и быстрее. 

Мы решили запатентовать это решение не только для его защиты, но и чтобы поделиться им с вами. Мы верим, что подобный подход может пригодиться и в других компаниях, которые применяют искусственный интеллект на практике, чтобы стать удобнее, полезнее и эффективнее для своих клиентов. Особенно это касается многосторонних маркетплейсов. Это сделает жизнь людей немного лучше. 

Мы очень рады и горды, что Российское патентное ведомство удостоило нашу разработку в сфере искусственного интеллекта такого внимания и признания. Надеемся, это изобретение поможет и вам. 

© Habrahabr.ru