O que é Machine Learning?

Um pouco da História

Categorias de Machine Learning

Aprendizado de máquina supervisionado

Aprendizado Supervisionado por https://www.geeksforgeeks.org/

Existem dois tipos principais de aprendizado de máquina supervisionado:

  • Classificação: o modelo aprende a classificar as entradas em diferentes categorias. Por exemplo, um modelo de classificação pode ser treinado para identificar imagens de gatos e cachorros.
  • Regressão: o modelo aprende a prever um valor numérico. Por exemplo, um modelo de regressão pode ser treinado para prever o preço de uma casa com base em suas características.

Caso real de aplicação: Transações com cartão de crédito

Fraudes cartão de crédito

Considerações importantes:

  • Balanceamento de dados: É importante garantir que o conjunto de dados utilizado para treinar o modelo seja balanceado, com uma quantidade suficiente de exemplos para cada categoria da sua base de dados.
  • Pré-processamento de dados: O pré-processamento dos dados, como normalização e limpeza, pode melhorar o desempenho do modelo.
  • Seleção de features: A seleção das features mais relevantes para o problema de detecção de fraude pode melhorar a precisão do modelo e reduzir o tempo de treinamento.
  • Avaliação do modelo: É importante avaliar o desempenho do modelo em um conjunto de dados de teste para garantir sua efetividade.
  • Qualidade dos dados: A qualidade do conjunto de dados usado para treinar o modelo é crucial para sua precisão.
  • Atualização constante: O modelo precisa ser atualizado constantemente com novas informações sobre para manter sua eficácia.

Exemplo de modelos populares:

Regressão Linear
Arvores de Decisão
Support Vector Machines (SVM)
Redes neurais artificiais
K-Nearest Neighbors (KNN)

Aprendizado de máquina não supervisionado

Aprendizado Não Supervisionado

Existem três tipos principais de aprendizado de máquina não supervisionado:

  • Agrupamento (Clustering): O modelo aprende a agrupar dados em clusters com base em similaridades. Por exemplo, um modelo de clustering pode ser usado para agrupar clientes em diferentes segmentos de mercado.
  • Redução de dimensionalidade: O modelo aprende a reduzir a dimensionalidade dos dados, preservando as informações mais importantes. Isso pode ser útil para visualizar dados complexos em um espaço bidimensional ou tridimensional.
  • Detecção de anomalias: O modelo aprende a identificar pontos de dados que são diferentes dos demais. Isso pode ser útil para detectar fraudes ou falhas em sistemas.
  • Análise de mercado: identificar segmentos de mercado e entender o comportamento do consumidor.
  • Descoberta de conhecimento: encontrar padrões e insights em grandes conjuntos de dados.
  • Manutenção preditiva: identificar anomalias que podem indicar falhas em sistemas.

Caso real de aplicação: Varejo

Agrupamento de clientes

Benefícios:

  • Descoberta de insights: O aprendizado de máquina não supervisionado pode ajudar a descobrir insights que não seriam facilmente identificados por humanos.
  • Identificação de padrões: O aprendizado de máquina não supervisionado pode ajudar a identificar padrões nos dados que podem ser úteis para tomar decisões.
  • Redução de custos: O aprendizado de máquina não supervisionado pode ser usado para reduzir custos, automatizando tarefas que de outra forma seriam realizadas por humanos.

Limitações:

  • Interpretação: Os modelos de aprendizado de máquina não supervisionados podem ser difíceis de interpretar.
  • Qualidade dos dados: A qualidade dos dados é crucial para o sucesso do aprendizado de máquina não supervisionado.
  • Tempo de treinamento: O treinamento de modelos de aprendizado de máquina não supervisionados pode ser demorado.

Exemplo de Algorítimos populares:

K-Means Clustering
DBSCAN Algorithm
Principal Component Analysis (PCA)
Independent Component Analysis

Aprendizado de máquina semi supervisionado

Aprendizado de máquina semi supervisionado

Existem diversas técnicas de aprendizado de máquina semi-supervisionado, como:

  • Marcação pseudo-rotulada: O modelo utiliza os dados rotulados para aprender a classificar os dados não rotulados.
  • Propagação de rótulos: O modelo utiliza os dados rotulados para propagar rótulos para os dados não rotulados.
  • Co-treinamento: O modelo utiliza dois ou mais modelos diferentes para aprender com os dados rotulados e não rotulados.

O aprendizado de máquina semi-supervisionado pode ser utilizado em diversas aplicações, como:

  • Classificação de texto: Classificar documentos em diferentes categorias, mesmo quando há um número limitado de documentos rotulados.
  • Segmentação de imagens: Segmentar imagens em diferentes regiões, mesmo quando há um número limitado de imagens rotuladas.
  • Recomendação de sistemas: Recomendar produtos ou serviços aos usuários, mesmo quando há um número limitado de dados sobre as preferências dos usuários.

O aprendizado de máquina semi-supervisionado pode ser uma técnica vantajosa em diversas situações, como:

  • Quando há um número limitado de dados rotulados: O aprendizado de máquina semi-supervisionado pode ser utilizado para melhorar o desempenho do modelo mesmo quando há um número limitado de dados rotulados disponíveis.
  • Quando os dados não rotulados são abundantes: O aprendizado de máquina semi-supervisionado pode ser utilizado para aproveitar a grande quantidade de dados não rotulados que geralmente estão disponíveis.
  • Quando a rotulagem de dados é cara ou demorada: O aprendizado de máquina semi-supervisionado pode reduzir o custo e o tempo da rotulagem de dados.

Aprendizado de máquina por reforço

Aprendizado de Máquina por reforço

O RL pode ser usado para resolver diversos problemas, como:

  • Jogos: Ensinar um agente a jogar um jogo de forma competitiva.
  • Robótica: Controlar um robô para realizar tarefas complexas.
  • Finanças: Gerenciar um portfólio de investimentos.
  • Manufatura: Otimizar o processo de produção.

Alguns dos principais componentes do RL são:

  • Agente: O agente é o “aprendiz” no sistema RL. É o responsável por tomar decisões e interagir com o ambiente.
  • Ambiente: O ambiente é o mundo em que o agente opera. Ele fornece ao agente feedback sobre suas ações.
  • Recompensa: A recompensa é um sinal que o ambiente fornece ao agente para indicar a qualidade de suas ações.
  • Política: A política é a estratégia que o agente usa para tomar decisões.
  • Função de valor: A função de valor é uma estimativa da recompensa que o agente espera receber ao longo do tempo.

O processo de aprendizado no RL geralmente funciona da seguinte maneira:

  1. O agente toma uma ação no ambiente.
  2. O ambiente fornece ao agente uma recompensa.
  3. O agente atualiza sua política com base na recompensa.
  4. O agente repete os passos 1 a 3 até que a política converja para uma solução ótima.

Algumas das vantagens do RL incluem:

  • Flexibilidade: O RL pode ser aplicado a uma ampla variedade de problemas.
  • Eficiência: O RL pode aprender soluções ótimas ou quase ótimas para problemas complexos.
  • Robustez: O RL pode lidar com ambientes incertos e dinâmicos.

Algumas das desvantagens do RL incluem:

  • Complexidade: O RL pode ser um processo desafiador de implementar e entender.
  • Tempo de treinamento: O RL pode levar muito tempo para aprender soluções ótimas.
  • Interpretabilidade: Os modelos de RL podem ser difíceis de interpretar.

Caso real de aplicação: Robô que aprende a andar

Robô aprendendo a andar

Exemplo de modelos populares:

Q-learning
SARSA (State-Action-Reward-State-Action)
Deep Q-learning

Conclusão

Rolar para cima
×