Data Analysis with Python and PySpark, Video Edition

Iniciado por Candidosa2, 06 de Maio de 2024, 14:54

Tópico anterior - Tópico seguinte

0 Membros e 1 Visitante estão a ver este tópico.

Candidosa2


Lançado em 3/2022
MP4 | Vídeo: h264, 1280x720 | Áudio: AAC, 44,1 KHz, 2 canais
Gênero: eLearning | Idioma: Inglês | Duração: 10h 31m | Tamanho: 1,6 GB


Pense grande sobre seus dados! PySpark traz o poderoso mecanismo de processamento de big data Spark para o ecossistema Python, permitindo que você amplie suas tarefas de dados e crie pipelines extremamente rápidos.

Em Análise de Dados com Python e PySpark você aprenderá como
Gerencie seus dados à medida que eles são dimensionados em diversas máquinas
Amplie seus programas de dados com total confiança
Ler e gravar dados de e para diversas fontes e formatos
Lide com dados confusos com a funcionalidade de manipulação de dados do PySpark
Descubra novos conjuntos de dados e realize análises exploratórias de dados
Crie pipelines de dados automatizados que transformam, resumem e obtêm insights dos dados
Solucionar erros comuns do PySpark
Criando trabalhos confiáveis de longa duração
Análise de dados com Python e PySpark é o seu guia para entregar projetos de dados baseados em Python bem-sucedidos. Repleto de exemplos relevantes e técnicas essenciais, este livro prático ensina você a criar pipelines para relatórios, aprendizado de máquina e outras tarefas centradas em dados. Exercícios rápidos em cada capítulo ajudam você a praticar o que aprendeu e a começar rapidamente a implementar o PySpark em seus sistemas de dados. Nenhum conhecimento prévio do Spark é necessário.

Sobre a tecnologia
O mecanismo de processamento de dados Spark é uma incrível fábrica de análises: os dados brutos entram, os insights surgem. PySpark envolve o mecanismo principal do Spark com uma API baseada em Python. Ele ajuda a simplificar a curva de aprendizado acentuada do Spark e disponibiliza essa ferramenta poderosa para qualquer pessoa que trabalhe no ecossistema de dados Python.

Sobre o livro
A análise de dados com Python e PySpark ajuda a resolver os desafios diários da ciência de dados com PySpark. Você aprenderá como dimensionar seus recursos de processamento em várias máquinas enquanto ingere dados de qualquer fonte, sejam clusters Hadoop, armazenamento de dados em nuvem ou arquivos de dados locais. Depois de cobrir os fundamentos, você explorará toda a versatilidade do PySpark criando pipelines de aprendizado de máquina e combinando código Python, pandas e PySpark.

O que há dentro
Organizando seu código PySpark
Gerenciando seus dados, não importa o tamanho
Amplie seus programas de dados com total confiança
Solução de problemas comuns de pipeline de dados
Criando trabalhos confiáveis de longa duração

Sobre o leitor
Escrito para cientistas e engenheiros de dados familiarizados com Python.

Sobre o autor
Como diretor de ML de uma empresa de software baseada em dados, Jonathan Rioux usa o PySpark diariamente. Ele ensina o software para cientistas de dados, engenheiros e analistas de negócios experientes em dados.

Mais informações
Screenshots:




https://rapidgator.net/file/468bb436dfbc29fbe1941bcdee74e850
https://rapidgator.net/file/9d34504e34f28c548f21f3879e340cae

https://ddownload.com/c94aasxt0hfk
https://ddownload.com/o6o6d4uk5qgu