January 1, 2021

#65 - Chat with Mário André de Deus

(English version at the bottom)

Tive o prazer de bater um papo com o Mário André de Deus, engenheiro mecânico que possui uma pós-graduação em Indústria 4.0 (I4.0), além de uma especialização em ciência de dados. Conversamos sobre sua trajetória profissional e, em particular, seu trabalho atual em que aplica conceitos de I4.0 para a prestação de serviços.

A jornada profissional do Mário iniciou em uma multinacional alemã, a qual é uma grande fabricante de peças automobilísticas. Trabalhando quinze anos nessa empresa, ele adquiriu experiência em vários departamentos tais como engenharia de processos, produção, qualidade e pesquisas. Após um período como empreendedor, ele decidiu investir no pilar da I4.0 ligado à ciência de dados. Completando cursos online e presenciais, Mario se inseriu neste novo mercado de trabalho com sucesso, há seis anos.

Para Mário, existem muitas diferenças entre indústria 3.0 e 4.0. Os avanços da última são ligados principalmente a um aumento exponencial da conectividade entre dispositivos e a um sistema que evolui de forma dinâmica, capaz de transformar dados em informação, e esta, em conhecimento, orientando as tomadas de decisões. Nesse cenário, sem dúvidas novos desafios aparecem, particularmente para o nosso país. Para citar alguns exemplos: a infraestrutura de transportes e telecomunicações, que ainda é deficitária em muitas regiões, a burocracia excessiva que torna os processos mais lentos e o risco maior de ataques cibernéticos. Embora hajam desafios, a I4.0 está se tornando uma realidade e pode trazer muitas oportunidades. Mário tem vivido isso em primeira pessoa, trabalhando na interseção entre tecnologia de vanguarda aplicada à melhoria dos serviços aos clientes.

Seu trabalho atual em uma concessionária de veículos comerciais de uma conceituada montadora alemã, incluindo caminhões e vans usadas por alguns sistemas de saúde, se divide em duas vertentes. Uma vertente ligada à ciência de dados onde ele realiza modelos analíticos utilizando técnicas de machine learning para otimizar a predição da demanda do estoque de peças para sua frota de centenas de veículos. A segunda vertente é relacionada ao pilar de qualidade e de melhorias de processos, aplicando técnicas de lean office e robotic process automation (RPA). O ponto em comum entre elas é o trabalho analítico e o foco em resultados.

Os modelos de machine learning desenvolvidos pelo Mário são programados principalmente na linguagem Python, com uso extensivo das bibliotecas Numpy, Matplotlib, Seaborn, Scikit-learn, entre outras. Os dados que alimentam seus modelos são coletados em uma plataforma Enterprise Ressource Planning (ERP) da empresa, e apesar de estarem estruturados, não dispensam a necessidade de uma minuciosa limpeza e exploração.

Uma das aplicações práticas que Mário desenvolve é para a previsão de demanda de estoque. Neste caso, os modelos são divididos em duas etapas. Na primeira, é feita uma análise de classificação para identificar quais dos aproximadamente cinquenta mil itens, stock keeping units (SKUs), possuem maior probabilidade de venda. Na segunda, é realizada uma regressão considerando apenas os SKUs selecionados na etapa anterior, para definir a quantidade de cada SKU a ser providenciada. Esta divisão se faz necessária principalmente em função do forte desbalanceamento da variável alvo que visa maximizar o número de vendas. Dos aproximadamente cinquenta mil SKUs existentes no cadastro, menos de cinco mil serão vendidos cada mês.

Mário destaca que neste exemplo de previsão existe um forte trade-off entre abastecer o estoque com o máximo de peças com potencial de venda, sem deixá-lo superdimensionado, evitando criar estoque desnecessário. Tecnicamente, é importante buscar o equilíbrio entre duas métricas de classificação: Recall e Precision. A grosso modo, o Recall responde a seguinte pergunta: “de tudo do que de fato vendeu, quanto o modelo acertou?”. Já o Precision, responde à pergunta: “de tudo o que o modelou previu que iria vender, quanto de fato vendeu?”. Mário alerta que é importante manter um pragmatismo ao trabalhar com dados e saber que um modelo jamais irá confirmar com certeza uma hipótese.

Nosso bate-papo se concluiu com uma breve reflexão sobre o futuro do mercado de trabalho. Imaginamos um cenário possível de médio e longo prazo, quando uma parte da ciência de dados poderá se tornar mais acessível e automatizada. Neste caso, a ciência de dados poderá se consolidar como uma importante ferramenta para especialistas de vários segmentos. A dica de ouro que o Mário gostaria de deixar aos profissionais de dados é que se mantenham atualizados e saibam usar as diversas técnicas para resolver problemas e agregar valor.

-----

I had the pleasure of having a chat with Mário André de Deusa mechanical engineer who has a postgraduate degree in Industry 4.0 (I4.0), as well as a specialization in data science. Our conversation covered some episodes of his trajectory and, in particular, his current work in which he applies I4.0 concepts to service delivery.

Mario's professional journey began at a German multinational company, which is a large manufacturer of automotive parts. Working fifteen years in this company, he gained experience in various departments such as process engineering, production, quality, and research. After a period as an entrepreneur, he decided to invest in the pillar of I4.0 linked to data science. Completing online and in-person courses, Mario successfully entered this new job market six years ago.

For Mário, there are many differences between Industry 3.0 and 4.0. The advances in the latter are mainly linked to an exponential increase in connectivity between devices and a system that evolves dynamically, capable of transforming data into information, and the latter into knowledge, guiding decision-making. In this scenario, no doubt new challenges appear, particularly for Brazil. To cite some examples: the transport and telecommunications infrastructure, which is still deficient in many regions, the excessive bureaucracy that slows down processes and the increased risk of cyberattacks. Although there are challenges, I4.0 is becoming a reality and can bring many opportunities. Mario has experienced this first-hand, working at the intersection of cutting-edge technology applied to improving customer service.

His current work at a commercial vehicle dealership of a reputable German carmaker, including trucks and vans used by some healthcare systems, is twofold. One strand linked to data science, where he runs analytical models using machine learning techniques to optimize parts inventory demand prediction for their fleet of hundreds of vehicles. The second strand is related to the quality and process improvement pillar, applying lean office and robotic process automation (RPA) techniques. The point in common between them is the analytical work and the focus on results.

The machine learning models developed by Mario are programmed mainly in Python language, with extensive use of the libraries Numpy, Matplotlib, Seaborn, Scikit-learn, among others. The data that feeds his models is collected from a company's Enterprise Resource Planning (ERP) platform, and despite being structured, it does not dispense with the need for thorough cleaning and exploration.

One of the practical applications he develops is for stock demand forecasting. In this case, the models are divided into two stages. In the first, a classification analysis is performed to identify which of the approximately fifty thousand items, stock keeping units (SKUs), have the highest probability of being sold. In the second, a regression is performed considering only the SKUs selected in the previous step, to define the quantity of each SKU to be provided. This division becomes necessary mainly due to the strong unbalancing of the target variable that seeks to maximize the number of sales. Of the approximately fifty thousand SKUs in the register, less than five thousand will be sold each month.

Mário highlights that in this example of forecasting there is a strong trade-off between supplying stock with a maximum of parts with sales potential, without leaving it oversized, avoiding creating unnecessary stock. Technically, it is important to seek a balance between two classification metrics: Recall and Precision. Roughly speaking, Recall answers the following question: “of everything that actually sold, how much did the model get right?”. Precision, on the other hand, answers the question: “of everything that the model predicted it would sell, how much did it actually sell?”. Mário alerts that it is essential to maintain a pragmatism when working with data and to know that a model will never confirm with absolute certainty a hypothesis.

Our chat concluded with a brief reflection on the future of the job market. We imagined a possible scenario in the medium and long term, when part of data science may become more accessible and automated. In this case, data science may consolidate itself as an essential tool for specialists from various segments. The golden tip that Mario would like to leave to data professionals is to keep up to date and know how to use the various techniques to solve problems and add value.

No comments:

Post a Comment