Data Scientist

  • CLT
  • Período integral
  • Remoto

Sobre Moray

Moray é uma parceria estratégica entre o líder mundial em cultivo de soja, milho e algodão com a SpaceTime Labs. A empresa tem o objetivo de escalar soluções de detecção de ervas daninhas, pragas e doenças e nutrição utilizando soluções de aprendizado de máquina, com a ajuda de drones e robôs autônomos. Estamos buscando profissionais para reforçar nosso time e nos ajudar na nossa missão.

Como Data Scientist, você vai:

  • Organizar e extrair informações de dados tabulares heterogêneos criando modelos explicáveis ​​e precisos;
  • Criar pipelines de dados e criar features;
  • Treinar modelos e ser capaz de avaliar performance;
  • Suportar times de plataforma para colocar modelo em produção;
  • Escrever documentação técnica.

Qualificações requeridas:

  • Licenciatura/Bacharelado em Ciência da Computação, Engenharia, Física, Matemática ou áreas correlatas;
  • Vivência no uso de linguagens de computação estatística (R, Python, numpy etc.) para manipular dados e extrair insights de grandes conjuntos de dados;
  • Experiência em aprendizado de máquina e pesquisa operacional (capacidade de ler, entender e reproduzir soluções dos principais trabalhos de pesquisa da área);
  • Conhecimento de técnicas variadas de aprendizado de máquina (arquiteturas de aprendizado profundo, agrupamento, aprendizado de árvore de decisão, florestas aleatórias, redes neurais artificiais, conjuntos etc.) e suas vantagens/ desvantagens do mundo real;
  • Conhecimento das melhores práticas/ erros mais comuns na concepção e implementação de sistemas de aprendizado de máquina, instinto maduro/intuição para diagnóstico e resolução de problemas reais;
  • Experiência com modelos em produção;
  • Conhecimento de melhores práticas com MLOps e MLEngineering
  • Familiaridade trabalhando dentro de um ambiente de prototipagem ágil e iterativo em startups;
  • Disponibilidade para viagens esporádicas.

Qualificações desejáveis:

  • Conhecimento de complexidade de algoritmo e otimização de desempenho;
  • Processamento de séries temporais;
  • Experiência com visão computacional (opencv, scikit-image) / Processamento de imagens;
  • Familiaridade com uma ou mais estruturas modernas de aprendizado de máquina, como Pytorch ou Tensorflow;
  • Conhecimento de técnicas e conceitos estatísticos avançados e experiência com aplicações;
  • Experiência em SIG/GIS;
  • Experiência em Devops ou implantação de software de produção.