Dicas de eBooks

O profissional de Negócios Digitais mobiliza habilidades comportamentais, técnicas e digitais que o capacitam para agir em contextos complexos contemporâneos. A capacidade de conseguir ampliar suas competências técnicas de forma autônoma pode ajudar.

Montamos uma lista de livros digitais (ebook) gratuitos (ou quase), disponíveis para complementar a formação em Ciência de Dados.

Tem alguma dica de livro que considera importante? Inclua sua dica nos comentários.

Livro

Breve descrição

Link de acesso

Análise fatorial

Autor(es): Daniel Abud Seabra Matos e Erica Castilho Rodrigues

Editora: Escola Nacional de Administração Pública (Enap)

Este livro é uma introdução ao método estatístico conhecido como análise fatorial exploratória (AFE). Com relação ao conteúdo a ser abordado, os principais tópicos são: Noções básicas da análise fatorial, análise de componentes principais e análise fatorial, diferença entre análise fatorial exploratória e confirmatória, tipos de correlação e estimação de parâmetros, rotação de fatores: rotação ortogonal e oblíqua, autovalor, cargas fatoriais e escores fatoriais, análise multivariada de dados: técnicas de dependência e de interdependência, principais aplicações da análise fatorial e combinação com outras técnicas multivariadas, principais limitações da análise fatorial, uso do pacote estatístico R. https://repositorio.enap.gov.br/handle/1/4790

Introdução à Ciência de Dados: Fundamentos e Aplicações

Autor(es): Pedro A. Morettin e Julio M. Singer

Editora: IME/USP

  http://www.ime.usp.br/~jmsinger/MAE0217/cdados2020jun21.pdf

Tópicos em Probabilidade Avançada

Autor(es): Pedro A. Morettin

Editora: ME/USP

  https://www.ime.usp.br/~pam/macro_prob.pdf

METODOLOGIA E TÉCNICAS DE PESQUISA NAS ÁREAS DE CIÊNCIAS HUMANAS

Autor(es): Cézar de Alencar Arnaut de Toledo e Maria Teresa Claro Gonzaga

Editora: EDUEM

1. Metodologia da pesquisa. 2. Projeto de pesquisa. 3. Técnicas de pesquisa. 4. Pesquisa. 5. Artigo científico. 6. Pesquisa bibliográfica. 7. Pesquisa documental. 8. Pesquisa qualitativa. 9. Técnicas de entrevista. 10. Ética na pesquisa http://old.periodicos.uem.br/~eduem/novapagina/?q=node/666

 

Think Stats: Exploratory Data Analysis in Python

Autor(es): Allen B. Downey

Editora: Green Tea Press

Think Stats é uma introdução a Probabilidade e Estatística para programadores Python.  https://greenteapress.com/wp/think-stats-2e/

Inclui códigos e arquivos complementares

Modeling with Data

Autor(es): Ben Klemens

Editora: Princeton University Press

   https://ben.klemens.org/pdfs/gsl_stats.pdf

 

Análise exploratória de dados usando o R

Autor(es): Enio Jelihovschi

Editora: Editus

  http://www.uesc.br/editora/livrosdigitais2/analiseexploratoria_r.pdf

 

R para Cientistas Sociais

Autor(es): Jakson Alves de Aquino

Editora: Editus

  http://www.uesc.br/editora/livrosdigitais_20140513/r_cientistas.pdf

Redes Neurais Artificiais

Autor(es): Fernando C. C. Castro e Maria C. F. Castro

Editora: PUCRS

  http://www.fccdecastro.com.br/pdf/RNA_C1.pdf

http://www.fccdecastro.com.br/pdf/RNA_C2.pdf

http://www.fccdecastro.com.br/pdf/RNA_C3.pdf

http://www.fccdecastro.com.br/pdf/RNA_C4.pdf

http://www.fccdecastro.com.br/pdf/RNA_C5.pdf

http://www.fccdecastro.com.br/pdf/RNA_C6.pdf

Data Science and Machine Learning: Mathematical and Statistical Methods

Autor(es): D.P. Kroese, Z.I. Botev, T. Taimre, R. Vaisman

Editora: CRC Press

O objetivo deste livro é fornecer um livro acessível, mas abrangente, destinado a alunos interessados em obter uma melhor compreensão da matemática e da estatística que sustentam a rica variedade de ideias e algoritmos de aprendizado de máquina em ciência de dados. https://acems.org.au/data-science-machine-learning-book-available-download

Inclui códigos e arquivos complementares

Text Mining with R: A tidy approach

Autor(es): Julia Silge e David Robinson

Editora: O’Reilly

O foco está na implementação prática, o que não deve ser nenhuma surpresa dado o título do livro, e para um novato em R, parece fazer um trabalho muito bom. https://www.tidytextmining.com/index.html

Inclui códigos e arquivos complementares

Causal Inference: What if

Autor(es): Jamie Robins e Miguel Hernan

Editora: CRC Press 

A inferência causal é um tópico complexo e abrangente, mas os autores deste livro fizeram o possível para condensar o que consideram os aspectos fundamentais mais importantes em aproximadamente 300 páginas de texto. Com poucos livros acessíveis dedicados ao assunto, este pode ser sua escolha preferida se você estiver interessado em construir sua própria base conceitual. https://www.hsph.harvard.edu/miguel-hernan/causal-inference-book/

Inclui códigos e arquivos complementares

Statistics with Julia: Fundamentals for Data Science, Machine Learning and Artificial Intelligence

Autor(es): Yoni Nazarathy e Hayden Klok

  https://statisticswithjulia.org/StatisticsWithJuliaDRAFT.pdf

Foundations of Data Science

Autor(es): Avrim Blum, John Hopcroft e Ravindran Kannan

  https://www.cs.cornell.edu/jeh/book%20no%20so;utions%20March%202019.pdf

Understanding Machine Learning: From Theory to Algorithms

Autor(es): Shai Shalev-Shwartz e Shai Ben-David

Editora: Cambridge University Press

O objetivo deste livro é apresentar o aprendizado de máquina e os paradigmas algorítmicos que ele oferece de uma forma baseada em princípios. O livro fornece uma descrição teórica dos fundamentos subjacentes ao aprendizado de máquina e as derivações matemáticas que transformam esses princípios em algoritmos práticos. Após uma apresentação do básico, o livro cobre uma ampla variedade de tópicos centrais não abordados por livros anteriores.  https://www.cs.huji.ac.il/~shais/UnderstandingMachineLearning/index.html

Inclui códigos e arquivos complementares

Natural Language Processing with Python – Analyzing Text with the Natural Language Toolkit

Autor(es): Steven Bird, Ewan Klein e Edward Loper

Editora: O’Reilly

Esta versão do livro foi atualizada para Python 3 e NLTK 3 https://www.nltk.org/book/

Python Para Todos: Explorando Dados com Python 3

Autor(es): Charles R. Severance

O objetivo deste livro é fornecer uma introdução à “programação orientada por informática”. A principal diferença entre uma abordagem de ciência da computação e a abordagem de Informática abordada neste livro é um foco maior no uso de Python para resolver problemas de análise de dados comuns. A versão Python 2 do livro está disponível. https://www.py4e.com/book.php

Inclui códigos e arquivos complementares. Disponível em português e outros 5 idiomas

Deep Learning

Autor(es): Ian Goodfellow, Yoshua Bengio e Aaron Courville

Editora: MIT Press book

O livro de aprendizado profundo é um recurso destinado a ajudar os alunos e profissionais a entrar no campo do aprendizado de máquina em geral e do aprendizado profundo em particular. A versão online do livro está completa e permanecerá disponível online gratuitamente. https://www.deeplearningbook.org/

Inclui códigos e arquivos complementares

Dive into Deep Learning

Autor(es): Aston Zhang, Zack C. Lipton, Mu Li e Alex J. Smola

Livro interativo de aprendizagem profunda com código, matemática e discussões. Implementado com NumPy / MXNet, PyTorch e TensorFlow https://d2l.ai/

Inclui códigos e arquivos complementares

Mathematics for Machine Learning

Autor(es): Marc Peter Deisenroth, A. Aldo Faisal e Cheng Soon Ong

Editora: Cambridge University Press

Um livro sobre Matemática para Aprendizado de Máquina que motiva as pessoas a aprender conceitos matemáticos. O livro não se destina a cobrir técnicas avançadas de aprendizado de máquina porque já existem muitos livros fazendo isso. Em vez disso, fornece as habilidades matemáticas necessárias para ler esses outros livros. https://mml-book.github.io/

Inclui códigos e arquivos complementares

The Elements of Statistical Learning

Autor(es): Trevor Hastie, Robert Tibshirani e Jerome Friedman

Editora: Springer

Seu método parece seguir uma abordagem lógica ordenada sobre o que e quando os leitores devem aprender. No entanto, os capítulos também funcionam individualmente e ir direto para o capítulo sobre modelos de inferência, por exemplo, funcionará, contanto que você já tenha uma compreensão do que vem no livro anterior isto. https://web.stanford.edu/~hastie/Papers/ESLII.pdf

An Introduction to Statistical Learning with Applications in R

Autor(es): Gareth James, Daniela Witten, Trevor Hastie e Robert Tibshirani 

Editora: Springer

https://statlearning.com/ISLR%20Seventh%20Printing.pdf

OpenIntro Statistics

Autor(es): David Diez, Mine Cetinkaya-Rundel  e Christopher Barr

Editora: Leanpub

Uma base completa para Estatística, servindo também como base para Ciência de Dados. https://leanpub.com/openintro-statistics

Preço definido pelo cliente

Introduction to Probability

Autor(es): Joe Blitzstein e William Chen

Editora: CRC Press

Este livro fornece linguagem e ferramentas essenciais para a compreensão de estatísticas, aleatoriedade e incerteza. O livro explora uma ampla variedade de aplicativos e exemplos, desde coincidências e paradoxos até o Google PageRank e a cadeia de Markov Monte Carlo (MCMC). Outras áreas de aplicação exploradas incluem genética, medicina, ciência da computação e teoria da informação. https://drive.google.com/file/d/1VmkAAGOYCTORq1wxSQqy255qLJjTNvBI/view

Inclui códigos e arquivos complementares no link http://www.wzchen.com/probability-cheatsheet

 

Bayesian Methods for Hackers: Probabilistic Programming and Bayesian Inference

Autor(es): Cameron Davidson-Pilon

Uma introdução aos métodos Bayesianos e programação probabilística de um ponto de vista de computação e matemática. http://camdavidsonpilon.github.io/Probabilistic-Programming-and-Bayesian-Methods-for-Hackers/

Inclui códigos e arquivos complementares

Practical Statistics for Data Scientists: 50 Essential Concepts

Autor(es): Peter Bruce e Andrew Bruce

Editora: O’Reilly

Este livro se destina ao cientista de dados com alguma familiaridade com a linguagem de programação R e com alguma exposição anterior às estatísticas. https://math2510.coltongrainger.com/books/2017-bruce-and-bruce-pratical-statistics-for-data-scientists.pdf

 

R Programming for Data Science

Autor(es): Roger D. Peng

Editora: Leanpub

Este livro traz os fundamentos da programação R para você, usando o mesmo material desenvolvido como parte da especialização em ciência de dados Johns Hopkins. As habilidades ensinadas neste livro estabelecerão a base para você começar sua jornada de aprendizado da ciência de dados. https://leanpub.com/rprogramming

Preço definido pelo cliente

Exploratory Data Analysis with R

Autor(es): Roger D. Peng

Editora: Leanpub

Este livro ensina a usar R para visualizar e explorar conjuntos de dados complexos com eficácia. A análise exploratória de dados é uma parte fundamental do processo de ciência de dados porque permite que você apure sua pergunta e refine suas estratégias de modelagem. https://leanpub.com/exdata

Preço definido pelo cliente

Data Science at the Command Line

Autor(es): Jeroen Janssens

Editora: O’Reilly

Este guia prático demonstra como a flexibilidade da linha de comando pode ajudá-lo a se tornar um cientista de dados mais eficiente e produtivo. Você aprenderá como combinar ferramentas de linha de comando pequenas, mas poderosas, para obter, limpar, explorar e modelar seus dados rapidamente. https://www.datascienceatthecommandline.com/1e/

Inclui códigos e arquivos complementares

Python 101

Autor(es): Michael Driscoll

Editora: Leanpub

Aprenda a programar com Python 3 do início ao fim. O Python 101 começa com os fundamentos do Python e, em seguida, desenvolve o que você aprendeu com ele. O público deste livro é principalmente pessoas que já programaram no passado, mas desejam aprender Python. Este livro cobre uma boa quantidade de material de nível intermediário, além do material para iniciantes. https://python101.pythonlibrary.org/

Inclui códigos e arquivos complementares

Mining of Massive Datasets

Autor(es): Anand Rajaraman, Jure Leskovec e Jeffrey D. Ullman

Editora: Cambridge University Press

O livro foi elaborado no nível de graduação em ciência da computação, sem pré-requisitos formais. Para apoiar explorações mais profundas, a maioria dos capítulos é complementada com referências de leitura adicional. http://www.mmds.org/

Inclui códigos e arquivos complementares

Machine Learning Yearning

Autor(es): Andrew Ng

A IA está transformando várias indústrias e o livro ensina como estruturar projetos de aprendizado de máquina. Este livro se concentra não em ensinar algoritmos de ML, mas em como fazer os algoritmos funcionarem. https://www.deeplearning.ai/machine-learning-yearning/

 

Executive Data Science: A Guide to Training and Managing the Best Data Scientists

Autor(es): Brian Caffo, Roger D. Peng  e Jeffrey Leek

Editora: Leanpub

Este livro ensina como montar e liderar uma empresa de ciência de dados para que sua organização possa avançar para a extração de informações de big data. Este livro é baseado na aclamada Johns Hopkins Executive Data Science Specialization. https://leanpub.com/eds

Preço definido pelo cliente

Statistics in Plain English

Autor(es): Timothy C. Urdan

Editora: Routledge

Este livro cobre técnicas estatísticas gerais, e não apenas aquelas destinadas a cientistas de dados ou programadores. No entanto, é escrito em um estilo muito simples e cobre uma ampla gama e profundidade de conceitos estatísticos de uma forma muito simples de entender. O livro foi originalmente escrito para alunos que estudam um curso não baseado em matemática, em que é necessária uma compreensão de estatística, como as ciências sociais. Portanto, cobre teoria suficiente para entender as técnicas, mas não assume uma base matemática existente. É, portanto, um livro ideal para ler se você está entrando na ciência de dados sem um diploma em matemática. https://www.book2look.com/embed/9781317526988

 

 

Computer Age Statistical Inference: Algorithms, Evidence and Data Science

Autor(es): Bradley Efron e Trevor Hastie

Este livro nos leva a uma jornada pela revolução na análise de dados após a introdução da computação eletrônica na década de 1950. Começando com teorias inferenciais clássicas – Bayesiana, frequentista, Fisheriana. Capítulos individuais ocupam uma série de tópicos influentes: análise de sobrevivência, regressão logística, Bayes empírica, bootstrap, random forests, redes neurais, cadeia de Markov Monte Carlo, inferência após modelo de seleção, e outras. O livro integra metodologia e algoritmos com inferência estatística e termina com especulações sobre a direção futura das estatísticas e ciência de dados. https://web.stanford.edu/~hastie/CASI/

Inclui códigos e arquivos complementares

Guia brasileiro de análise de dados: armadilhas & soluções

Autor(es): Claudio D. Shikida, Leonardo Monasterio e Pedro Fernando Nery

Editora: Enap

O guia é dividido em oito capítulos assinados por especialistas nas áreas de saúde, mercado e trabalho, crime e violência, educação, pobreza e desigualdade, macroeconomia, causalidade e opinião pública. “Acreditamos que um pesquisador que se depara com um tema novo, quem escreve uma notícia ou artigo ou qualquer pessoa que já tenha questionado alguma manchete de jornal vai se beneficiar ou se interessar pela obra. Nossa intenção foi criar um guia que, de forma didática, auxilie no uso e interpretação de dados”. https://repositorio.enap.gov.br/handle/1/6039

 

Ciência de Dados com R: Introdução

Autor(es): Paulo Felipe de Oliveira, Saulo Guerra e Robert McDonnell

Editora: IBPAD

https://www.ibpad.com.br/o-que-fazemos/publicacoes/introducao-ciencia-de-dados-com-r

 

Monitoramento e Pesquisa em Mídias Sociais: metodologias, aplicações e inovações

Autor(es): Max Stabile e Tarcízio Silva 

Editora: IBPAD

O livro Monitoramento e Pesquisa em Mídias Sociais: metodologias, aplicações e inovações reúne colaborações de uma rede de profissionais e pesquisadores que atuam em universidades, empresas e agências.  Temas basilares, mas ainda controvertidos, como análise de sentimento, atendimento ao consumidor ou etnografia somam-se a aplicações e inovações que vão de reconhecimento de imagem a estudos sobre memes, compondo contribuição sólida ao campo. https://www.ibpad.com.br/o-que-fazemos/publicacoes/monitoramento-e-pesquisa-em-midias-sociais-metodologias-aplicacoes-e-inovacoes/#olivro

 

HBase: The Definitive Guide

Autor(es): Lars George

Editora: O’Reilly

Se você está procurando uma solução de armazenamento escalável para acomodar uma quantidade virtualmente infinita de dados, este livro mostra como o Apache HBase pode atender às suas necessidades. Como a implementação de código aberto da arquitetura BigTable do Google, o HBase é escalonado para bilhões de linhas e milhões de colunas, garantindo que o desempenho de gravação e leitura permaneça constante. Muitos executivos de TI estão fazendo perguntas pontuais sobre o HBase. Este livro fornece respostas significativas, quer você esteja avaliando este banco de dados não relacional ou planejando colocá-lo em prática imediatamente. https://www.mpam.mp.br/attachments/article/6214/HBase%EF%BC%9AThe%20Definitive%20Guide.pdf

 

A Gentle Introduction to Apache Spark

Editora: Databricks

A Databricks tem o prazer de apresentar este e-book como uma introdução prática ao Spark. Com rápida adoção por empresas em uma ampla gama de setores, o Spark foi implantado em grande escala, processando coletivamente vários petabytes de dados em clusters de mais de 8.000 nós. Se você é um desenvolvedor ou cientista de dados interessado em big data, Spark é a ferramenta para você. https://databricks.com/p/ebook/gentle-intro-to-apache-spark

 

Compartilhar

3 Replies to “Dicas de eBooks”

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *