Python数据科学(數據科學) [Python-Data-Science-Handbook]
Python数据科学(數據科學) [Python-Data-Science-Handbook]
資料來源:
https://github.com/wangyingsm/Python-Data-Science-Handbook/tree/master/notebooks
https://github.com/jakevdp/PythonDataScienceHandbook/tree/master/notebooks
GITHUB: https://github.com/jash-git/Python-Data-Science-Handbook
序言
1. IPython:超越Python解譯器
IPython幫助和⽂檔
IPython Shell中的鍵盤快速鍵
IPython魔術命令
輸⼊輸出歷史
IPython和Shell命令
錯誤和調試
性能測算和計時
更多IPython資源
2. Numpy介紹
理解Python中的資料類型
Numpy陣列基礎
使⽤Numpy計算:通⽤函數
聚合:Min, Max, 以及其他
在陣列上計算:⼴播
比較,遮蓋和布林邏輯
高級索引
陣列排序
格式化資料:NumPy⾥的結構化陣列
3. 使用Pandas進⾏資料處理
Pandas對象簡介
資料索引和選擇
在Pandas中運算元據
處理空缺資料
層次化的索引
組合資料集:Concat 和 Append
組合資料集:Merge 和 Join
聚合與分組
樞紐分析表
向量化的字串操作
在時間序列上操作
高性能Pandas: eval() 和 query()
更多資源
4. 使⽤matplotlib展⽰數據
簡單的折線圖
簡單的散點圖
誤差視覺化
密度和輪廓圖
直方圖, 分桶和密度
自定義圖表圖例
自定義顏色條
多個子圖表
文本和標注
自定義刻度
自定義matplotlib:配置和樣式單
在matplotlib中創建三維圖表
使用Basemap創建地理位置圖表
使用Seaborn進⾏視覺化
更多資源
5. 機器學習
什麼是機器學習?
Scikit-Learn簡介
超參數及模型驗證
特徵⼯程
深入:樸素⻉葉斯分類
深入:線性回歸
深入:⽀持向量機
深入:決策樹和隨機森林
深入:主成分分析
深入:流形學習
深入:k-均值聚類
深入:⾼斯混合模型
深入:核密度估計
應用:臉部識別管道
更多機器學習資源
附錄:生成圖像的代碼
Table of Contents
Preface
1. IPython: Beyond Normal Python
Help and Documentation in IPython
Keyboard Shortcuts in the IPython Shell
IPython Magic Commands
Input and Output History
IPython and Shell Commands
Errors and Debugging
Profiling and Timing Code
More IPython Resources
2. Introduction to NumPy
Understanding Data Types in Python
The Basics of NumPy Arrays
Computation on NumPy Arrays: Universal Functions
Aggregations: Min, Max, and Everything In Between
Computation on Arrays: Broadcasting
Comparisons, Masks, and Boolean Logic
Fancy Indexing
Sorting Arrays
Structured Data: NumPy’s Structured Arrays
3. Data Manipulation with Pandas
Introducing Pandas Objects
Data Indexing and Selection
Operating on Data in Pandas
Handling Missing Data
Hierarchical Indexing
Combining Datasets: Concat and Append
Combining Datasets: Merge and Join
Aggregation and Grouping
Pivot Tables
Vectorized String Operations
Working with Time Series
High-Performance Pandas: eval() and query()
Further Resources
4. Visualization with Matplotlib
Simple Line Plots
Simple Scatter Plots
Visualizing Errors
Density and Contour Plots
Histograms, Binnings, and Density
Customizing Plot Legends
Customizing Colorbars
Multiple Subplots
Text and Annotation
Customizing Ticks
Customizing Matplotlib: Configurations and Stylesheets
Three-Dimensional Plotting in Matplotlib
Geographic Data with Basemap
Visualization with Seaborn
Further Resources
5. Machine Learning
What Is Machine Learning?
Introducing Scikit-Learn
Hyperparameters and Model Validation
Feature Engineering
In Depth: Naive Bayes Classification
In Depth: Linear Regression
In-Depth: Support Vector Machines
In-Depth: Decision Trees and Random Forests
In Depth: Principal Component Analysis
In-Depth: Manifold Learning
In Depth: k-Means Clustering
In Depth: Gaussian Mixture Models
In-Depth: Kernel Density Estimation
Application: A Face Detection Pipeline
Further Machine Learning Resources
Appendix: Figure Code