Кого ищем
Ищем специалиста по химическим измерениям, спектральным данным и цифровизации лаборатории. Нам важно, чтобы вы понимали, как устроены реальные экспериментальные данные, и умели превращать сырой сигнал в пригодный для анализа и ML датасет.
Обязательно
- работа со спектрами: IR, Raman, UV-Vis, NMR, MS, XRD или близкие методы
- baseline correction, smoothing, peak detection, нормализация, denoising
- PCA, PLS, PLS-DA, кластеризация, регрессия и классификация для спектров
- Python: NumPy, pandas, scipy, scikit-learn, matplotlib
- понимание лабораторных метаданных: образец, серия, прибор, методика, калибровка
- контроль качества данных: пропуски, выбросы, batch effects, повторяемость измерений
- понимание подходов ELN/LIMS и структуры лабораторных данных
Будет плюсом
- опыт внедрения ELN/LIMS
- работа с приборными форматами данных
- ML/DL для спектров: CNN для 1D-сигналов, автоэнкодеры
- промышленная аналитика или фармконтроль качества
- знание стандартов FAIR data
Инструменты
Python, scipy.signal, scikit-learn, pybaselines, specutils, NumPy, pandas, matplotlib, Jupyter, ELN, LIMS, SQL, Git, Docker.
Что особенно ценим
Ценим реальные спектральные датасеты из лаборатории или производства, модели классификации веществ и предсказания концентраций, автоматизацию ручных отчётов и умение дать обучающемуся практику от сырого спектра до модели.
Менеджер Елена Левина
Похожие вакансии
Уровень знания английского языка от Upper-Intermediate (B2). Высшее профильное образование (желательно). Опыт преподавания английского языка от 1 года.
Практический опыт работы с Google Ads, Meta Ads. Опыт продвижения B2B-проектов. Опыт работы с международными рынками.
Практический опыт SEO-продвижения под Google. Опыт работы с русскоязычными и англоязычными сайтами. Опыт проведения технических SEO-аудитов.
Умеет анализировать информацию и быстро находить суть. Продвинуто использует нейросети в работе. Может сформулировать продуктовую задачу. Сильное продуктово-коммерческое мышление.
PyTorch или TensorFlow/Keras. Основы биоинформатических форматов: FASTA, FASTQ, BAM/SAM, VCF, GTF/GFF. Deep learning для последовательностей: CNN/RNN...
