A Ciência de Dados ( Data Science ) caracteriza-se pela obtenção de conhecimento através dos dados. Ela tem como uma de suas principais ferramentas o Aprendizado de Máquina ( Machine Learning ). O Aprendizado de Máquina é um instrumento versátil. Muitas vezes, utilizado para resolver problemas de forma eficiente. Esse livro foi escrito para auxiliar as pessoas interessadas em criar suas próprias aplicações. O objetivo é complementar o conhecimento na área.
Tópicos abordados:
– Planejamento e análise de experimentos em Aprendizado de Máquina (Design and Analysis of Experiments in Machine Learning)
– Valores discrepantes (Outliers)
– Bisbilhotagem de dados (Data Snooping)
– Valores faltantes (Missing values)
– Vazamento de dados (Data Leakage)
– Sobreajustamento (Overfitting)
– Justiça (Fairness)
– Interpretação de modelo (Model interpretation)
e mais. Análise de caso com Python.