Обратно к вакансиям

NLP инженер– AI-агент для обзора научной литературы

Международная лаборатория "Фотопроцессы в мезоскопических системах"

Мы ищем высококвалифицированного специалиста по семантическому поиску для работы в нашей команде разработки AI. Ваша основная задача – разработка и оптимизация интеллектуального агента, способного выполнять комплексные обзоры научных публикаций на платформе ArXiv. Агент будет использовать передовые методы семантического поиска, обработки естественного языка (NLP) и машинного обучения для извлечения, суммирования и синтеза релевантной информации в области материаловедения.

Обязанности

  • проектирование и реализация алгоритмов семантического поиска, адаптированных для поиска научных публикаций на ArXiv;
  • разработка NLP-pipelines для парсинга, понимания и извлечения ключевых понятий, методов, результатов и выводов из научных статей;
  • создание и обучение моделей для классификации документов, распознавания сущностей, извлечения связей и суммирования, специфичных для материаловедения;
  • интеграция семантического поискового агента в архитектуру мультиагентной системы для совместного сбора информации и рассуждений;
  • тесное взаимодействие с экспертами в области материаловедения для обеспечения релевантности и точности извлекаемой информации;
  • оптимизация релевантности поиска, точности, полноты и масштабируемости системы для обработки больших объёмов научных документов;
  • отслеживание современных методов в области семантического поиска, NLP и AI для научного анализа текстов.

Требования

  • степень магистра или кандидата наук в области компьютерных наук, искусственного интеллекта, Data Science или смежных дисциплин;
  • подтверждённый опыт работы с семантическим поиском, информационным поиском и NLP, предпочтительно применительно к научным или техническим документам;
  • уверенные навыки программирования на Python и опыт работы с NLP-библиотеками/фреймворками (spaCy, Hugging Face Transformers, AllenNLP или аналогичные);
  • опыт работы с крупными научными наборами данных и API (например, ArXiv API);
  • знание методов машинного обучения для классификации текстов, распознавания сущностей, суммирования и построения графов знаний;
  • понимание терминологии и концепций материаловедения будет большим плюсом.

Желательные навыки:

  • опыт разработки мультиагентных систем или AI-агентов;
  • знания в области векторных поисковых движков (FAISS, Pinecone) и техник встраивания для семантического поиска;
  • наличие публикаций или вкладов в open-source проекты по семантическому поиску или анализу научных текстов.

Условия

  • уникальную возможность работать над передовым AI-проектом, влияющим на развитие материаловедения во всём мире;
  • конкурентоспособную заработную плату и социальный пакет;
  • гибкий график работы и возможность удалённой работы;
  • коллаборативную и интеллектуально стимулирующую среду с экспертами в AI и материаловедении;
  • возможности профессионального развития: конференции, семинары и обучение.

Хочешь работать в ИТМО
или есть вопросы?